WO2013039333A1

WO2013039333A1 - 3ｄ 비디오 부호화/복호화 방법 및 그 장치

Info

Publication number: WO2013039333A1
Application number: PCT/KR2012/007342
Authority: WO
Inventors: 성재원; 예세훈; 손은용; 정지욱
Original assignee: 엘지전자 주식회사
Priority date: 2011-09-16
Filing date: 2012-09-13
Publication date: 2013-03-21

Abstract

텍스쳐 영상 및 깊이 영상을 기반으로 3D 영상을 생성하는 3D 비디오 복호화 방법이 제공된다. 본 발명에 따른 3D 비디오 복호화 방법은, 카메라 파라미터 관련 정보를 포함하는 영상 정보를 수신하여 복호화하는 단계, 복호화된 영상 정보를 기반으로, 서로 다른 POC 값에 대응하는 복수의 카메라 파라미터 값을 도출하는 단계 및 복수의 카메라 파라미터 값 중에서 적어도 하나를 기반으로, 텍스쳐 영상 및 깊이 영상을 복원하는 단계를 포함할 수 있다.

Description

3Ｄ 비디오 부호화/복호화 방법 및 그 장치

본 발명은 영상 처리에 관한 것으로서, 보다 상세하게는 카메라 파라미터 부호화/복호화 방법 및 장치에 관한 것이다.

신호 처리 기술 및 네트워크 전송 기술의 향상으로 다양한 멀티미디어 서비스가 가능해지면서 최근 상호 작용(interactive) 멀티미디어 컨텐츠 및 실감미디어 컨텐츠들에 대한 요구가 증가하고 있다. 멀티미디어 컨텐츠 및 실감미디어 컨텐츠들을 생성하기 위해 다양한 기술이 사용될 수 있는데, 그 중 3D 비디오를 제공하기 위한 다시점 비디오(multi view video) 코딩 방법은 시청자들이 다각도의 시점으로 제작된 영상을 시청함으로서 영상 시청시 입체감을 느낄 수 있도록 하는 기술이다.

단일 시점 비디오(single view video)와 달리 다시점 비디오에서는 동일한 POC(Picture Order Count)에서 서로 다른 시점을 갖는 복수의 텍스쳐 영상이 존재할 수 있고, 복수의 텍스쳐 영상뿐만 아니라, 복수의 텍스쳐 영상 각각에 대응하는 깊이 영상 및 카메라 파라미터가 함께 부호화 및/또는 복호화될 수 있다. 여기서, 카메라 파라미터는 3D 비디오의 부호화/복호화 과정에서 필요한 가상 시점 영상 (virtual view image)을 생성하기 위해 사용될 수 있다.

본 발명의 기술적 과제는 부호화/복호화 효율을 향상시킬 수 있는 3D 비디오 부호화 방법 및 장치를 제공함에 있다.

본 발명의 다른 기술적 과제는 부호화/복호화 효율을 향상시킬 수 있는 3D 비디오 복호화 방법 및 장치를 제공함에 있다.

본 발명의 또 다른 기술적 과제는 부호화/복호화 효율을 향상시킬 수 있는 카메라 파라미터 부호화 방법 및 장치를 제공함에 있다.

본 발명의 또 다른 기술적 과제는 부호화/복호화 효율을 향상시킬 수 있는 카메라 파라미터 복호화 방법 및 장치를 제공함에 있다.

본 발명의 또 다른 기술적 과제는 부호화/복호화 효율을 향상시킬 수 있는 카메라 파라미터 정보 전송 방법 및 장치를 제공함에 있다.

본 발명의 일 실시 형태는 텍스쳐 영상(texture image) 및 깊이 영상(depth image)을 기반으로 3D 영상을 생성하는 3D 비디오 복호화 방법이다. 상기 방법은, 카메라 파라미터 관련 정보를 포함하는 영상 정보를 수신하여 복호화하는 단계, 상기 복호화된 영상 정보를 기반으로, 서로 다른 POC(Picture Order Count) 값에 대응하는 복수의 카메라 파라미터 값을 도출하는 단계 및 상기 복수의 카메라 파라미터 값 중에서 적어도 하나를 기반으로, 상기 텍스쳐 영상 및 상기 깊이 영상을 복원하는 단계를 포함하되, 상기 POC 값은 픽쳐의 출력 순서를 나타내는 값이고, 상기 복수의 카메라 파라미터 값 중에서 적어도 하나의 카메라 파라미터 값은, 이전에 도출된 하나 이상의 카메라 파라미터 값을 기반으로 예측을 수행함으로써 도출될 수 있다.

상기 카메라 파라미터 관련 정보는 SPS(Sequence Parameter Set), PPS(Picture Parameter Set) 또는 슬라이스 헤더(slice header)에 포함되어 전송될 수 있다.

상기 복수의 카메라 파라미터 값은, 시간에 따라 변화하는 값을 갖는 시변 파라미터(time varying parameter)에 할당되는 값일 수 있다.

상기 시변 파라미터는 3x1 이동 벡터(translation vector)의 X축 이동 거리, 근접 클리핑 파라미터(near clipping parameter) 및 원거리 클리핑 파라미터(far clipping parameter) 중에서 적어도 하나를 포함할 수 있고, 상기 3x1 이동 벡터는, 공간상에서 카메라의 위치를 지정하기 위해 설정된 기준 좌표계를 기준으로 하여, 상기 카메라의 초점(focal point)을 원점으로 갖는 카메라 좌표계의 위치를 나타내는 카메라 파라미터이고, 상기 근접 클리핑 파라미터는, 상기 카메라가 촬영한 임의의 장면에서 가장 작은 깊이 값을 갖는 카메라 파라미터이고, 상기 원거리 클리핑 파라미터는, 상기 카메라가 촬영한 임의의 장면에서 가장 큰 깊이 값을 갖는 카메라 파라미터일 수 있다.

상기 카메라 파라미터 관련 정보는, 복호화 대상 시퀀스에 상기 시변 파라미터가 존재하는지 여부를 지시하는 시변 파라미터 플래그 정보를 포함할 수 있고, 상기 시변 파라미터 플래그 정보가, 상기 복호화 대상 시퀀스에 상기 시변 파라미터가 존재하지 않음을 지시하는 경우, 상기 복수의 카메라 파라미터 값 도출 단계에서는, 상기 예측을 수행하지 않을 수 있다.

상기 시변 파라미터 플래그 정보가, 상기 복호화 대상 시퀀스에 상기 시변 파라미터가 존재함을 지시하는 경우, 상기 카메라 파라미터 관련 정보는, 상기 시변 파라미터에 대해 예측이 수행되는지 여부를 지시하는 시변 파라미터 예측 플래그 정보를 더 포함할 수 있고, 상기 시변 파라미터 예측 플래그 정보가, 상기 시변 파라미터에 대해 예측이 수행되지 않음을 지시하는 경우, 상기 복수의 카메라 파라미터 값 도출 단계에서는, 상기 예측을 수행하지 않을 수 있다.

상기 시변 파라미터 플래그 정보가, 상기 복호화 대상 시퀀스에 상기 시변 파라미터가 존재함을 지시하는 경우, 상기 카메라 파라미터 관련 정보는, 상기 시변 파라미터가 상기 3x1 이동 벡터의 X축 이동 거리, 상기 근접 클리핑 파라미터 및 상기 원거리 클리핑 파라미터 중에서 어떤 카메라 파라미터 타입에 해당되는지를 지시하는 시변 파라미터 ID 정보를 포함할 수 있고, 상기 복수의 카메라 파라미터 값 도출 단계에서는, 상기 시변 파라미터 ID 정보를 기반으로 상기 복수의 카메라 파라미터 값을 도출할 수 있다.

상기 텍스쳐 영상 및 상기 깊이 영상의 코딩 구조는 계층적 B 구조(hierarchical B structure)일 수 있고, 상기 복수의 카메라 파라미터 값은, 각각 랜덤 억세스 포인트(random access point)의 POC 값에 대응하는 복수의 랜덤 억세스 카메라 파라미터 값을 포함할 수 있으며, 상기 랜덤 억세스 포인트는 복수의 픽쳐가 출력 순서에 따라 배열된 영상 시퀀스 내에서 복호화 프로세스가 시작될 수 있는 지점이고, 상기 복수의 랜덤 억세스 카메라 파라미터 값은, 상기 복수의 랜덤 억세스 카메라 파라미터 값 중에서 POC 순서상 서로 가장 인접하여 위치한 제1 카메라 파라미터 값 및 제2 카메라 파라미터 값을 포함할 수 있다. 이 때, 상기 카메라 파라미터 관련 정보는 상기 제1 카메라 파라미터 값 자체를 나타내는 제1 정보 및 상기 제2 카메라 파라미터 값 자체를 나타내는 제2 정보를 포함할 수 있고, 상기 복수의 카메라 파라미터 값 도출 단계에서는, 상기 제1 정보를 기반으로 상기 제1 카메라 파라미터 값을 도출하고, 상기 제2 정보를 기반으로 상기 제2 카메라 파라미터 값을 도출할 수 있다.

상기 복수의 카메라 파라미터 값은, POC 순서상 상기 제1 카메라 파라미터 값 및 상기 제2 카메라 파라미터 값 사이에 위치한 제3 카메라 파라미터 값을 포함할 수 있고, 상기 카메라 파라미터 관련 정보는, 상기 제3 카메라 파라미터 값에 대응하는 차분 카메라 파라미터 값을 나타내는 제3 정보를 더 포함할 수 있고, 상기 복수의 카메라 파라미터 값 도출 단계는, 상기 제3 정보를 기반으로 상기 차분 카메라 파라미터 값을 도출하는 단계, 상기 제1 카메라 파라미터 값 및 상기 제2 카메라 파라미터 값의 선형 보간(linear interpolation)에 의해, 상기 제3 카메라 파라미터 값에 대응하는 예측 카메라 파라미터 값을 도출하는 단계 및 상기 차분 카메라 파라미터 값 및 상기 예측 카메라 파라미터 값을 더함으로써, 상기 제3 카메라 파라미터 값을 도출하는 단계를 더 포함할 수 있다.

상기 텍스쳐 영상 및 상기 깊이 영상의 코딩 구조는 계층적 B 구조(hierarchical B structure)일 수 있고, 상기 복수의 카메라 파라미터 값은, 랜덤 억세스 포인트(random access point)의 POC 값에 대응하는 복수의 랜덤 억세스 카메라 파라미터 값 중 하나인 제1 카메라 파라미터 값을 포함할 수 있으며, 상기 랜덤 억세스 포인트는 복수의 픽쳐가 출력 순서에 따라 배열된 영상 시퀀스 내에서 복호화 프로세스가 시작될 수 있는 지점일 수 있다. 이 때, 상기 카메라 파라미터 관련 정보는 상기 제1 카메라 파라미터 값 자체를 나타내는 제1 정보를 포함할 수 있, 상기 복수의 카메라 파라미터 값 도출 단계에서는, 상기 제1 정보를 기반으로 상기 제1 카메라 파라미터 값을 도출할 수 있다.

상기 복수의 카메라 파라미터 값은, 상기 제1 카메라 파라미터 값에 대응하는 POC 값보다 높은 POC 값에 대응하는 제2 카메라 파라미터 값을 더 포함할 수 있고, 상기 카메라 파라미터 관련 정보는, 상기 제2 카메라 파라미터 값에 대응하는 제1 차분 카메라 파라미터 값을 나타내는 제2 정보를 더 포함할 수 있으며, 상기 복수의 카메라 파라미터 값 도출 단계는, 상기 제2 정보를 기반으로 상기 제1 차분 카메라 파라미터 값을 도출하는 단계, 상기 제1 카메라 파라미터 값을 상기 제2 카메라 파라미터 값에 대응하는 제1 예측 카메라 파라미터 값으로 결정하는 단계 및 상기 제1 차분 카메라 파라미터 값 및 상기 제1 예측 카메라 파라미터 값을 더함으로써, 상기 제2 카메라 파라미터 값을 도출하는 단계를 더 포함할 수 있다.

상기 복수의 카메라 파라미터 값은, POC 순서상 상기 제1 카메라 파라미터 값 및 상기 제2 카메라 파라미터 값 사이에 위치한 제3 카메라 파라미터 값을 더 포함할 수 있고, 상기 카메라 파라미터 관련 정보는, 상기 제3 카메라 파라미터 값에 대응하는 제2 차분 카메라 파라미터 값을 나타내는 제3 정보를 더 포함할 수 있으며, 상기 복수의 카메라 파라미터 값 도출 단계는, 상기 제3 정보를 기반으로 상기 제2 차분 카메라 파라미터 값을 도출하는 단계, 상기 제1 카메라 파라미터 값 및 상기 제2 카메라 파라미터 값의 선형 보간(linear interpolation)에 의해, 상기 제3 카메라 파라미터 값에 대응하는 제2 예측 카메라 파라미터 값을 도출하는 단계 및 상기 제2 차분 카메라 파라미터 값 및 상기 제2 예측 카메라 파라미터 값을 더함으로써, 상기 제3 카메라 파라미터 값을 도출하는 단계를 더 포함할 수 있다.

상기 텍스쳐 영상 및 상기 깊이 영상의 코딩 구조는, I 슬라이스 및 P 슬라이스로 구성되는 로우 딜레이 구조(low delay structure)일 수 있고, 상기 복수의 카메라 파라미터 값은, 하나의 인트라 주기(intra period)에 POC 순서로 포함된 N개의 카메라 파라미터 값 {p_kN, p_kN+1, p_kN+2, …, p_n, …, p_(k+1)N-1}을 포함할 수 있으며, 상기 k는 0 이상의 정수이고, 상기 N은 양의 정수이고, 상기 n은 kN 이상 (k+1)N-1 이하의 정수이고, 상기 카메라 파라미터 값 p_kN은 랜덤 억세스 포인트(random access point)의 POC 값에 대응하는 복수의 랜덤 억세스 카메라 파라미터 값 중에서 하나일 수 있고, 상기 랜덤 억세스 포인트는 복수의 픽쳐가 출력 순서에 따라 배열된 영상 시퀀스 내에서 복호화 프로세스가 시작될 수 있는 지점이고, 상기 인트라 주기는 상기 영상 시퀀스에 상기 복수의 랜덤 억세스 카메라 파라미터 값에 대응되는 픽쳐가 삽입되는 주기에 해당될 수 있다. 이 때, 상기 카메라 파라미터 관련 정보는 상기 카메라 파라미터 값 p_kN 자체를 나타내는 제1 정보를 포함할 수 있고, 상기 복수의 카메라 파라미터 값 도출 단계에서는, 상기 제1 정보를 기반으로 상기 카메라 파라미터 값 p_kN을 도출할 수 있다.

상기 카메라 파라미터 관련 정보는, 상기 카메라 파라미터 값 p_kN+1에 대응하는 제1 차분 카메라 파라미터 값을 나타내는 제2 정보를 더 포함할 수 있고, 상기 복수의 카메라 파라미터 값 도출 단계는, 상기 제2 정보를 기반으로 상기 제1 차분 카메라 파라미터 값을 도출하는 단계, 상기 카메라 파라미터 값 p_kN을 상기 카메라 파라미터 값 p_kN+1에 대응하는 제1 예측 카메라 파라미터 값으로 결정하는 단계 및 상기 제1 차분 카메라 파라미터 값 및 상기 제1 예측 카메라 파라미터 값을 더함으로써, 상기 카메라 파라미터 값 p_kN+1을 도출하는 단계를 더 포함할 수 있다.

상기 카메라 파라미터 관련 정보는, 카메라 파라미터 값 p_m에 대응하는 제2 차분 카메라 파라미터 값을 나타내는 제3 정보를 더 포함할 수 있고, 여기서 상기 m은 kN+2 이상 (k+1)N-1 이하의 정수이고, 상기 복수의 카메라 파라미터 값 도출 단계는, 상기 제3 정보를 기반으로 상기 제2 차분 카메라 파라미터 값을 도출하는 단계, 카메라 파라미터 값 p_m-2 및 카메라 파라미터 값 p_m-1의 선형 보간에 의해, 상기 카메라 파라미터 값 p_m에 대응하는 제2 예측 카메라 파라미터 값을 도출하는 단계 및 상기 제2 차분 카메라 파라미터 값 및 상기 제2 예측 카메라 파라미터 값을 더함으로써, 상기 카메라 파라미터 값 p_m을 도출하는 단계를 더 포함할 수 있다.

본 발명의 다른 실시 형태는, 텍스쳐 영상(texture image) 및 깊이 영상(depth image)을 기반으로 3D 영상을 생성하는 3D 비디오 복호화 장치이다. 상기 장치는, 카메라 파라미터 관련 정보를 포함하는 영상 정보를 수신하여 복호화하는 엔트로피 복호화부, 상기 복호화된 영상 정보를 기반으로, 서로 다른 POC(Picture Order Count) 값에 대응하는 복수의 카메라 파라미터 값을 도출하는 카메라 파라미터 복원부 및 상기 복수의 카메라 파라미터 값 중에서 적어도 하나를 기반으로, 상기 텍스쳐 영상 및 상기 깊이 영상을 복원하는 영상 복원부를 포함할 수 있고, 상기 POC 값은 픽쳐의 출력 순서를 나타내는 값이고, 상기 복수의 카메라 파라미터 값 중에서 적어도 하나의 카메라 파라미터 값은, 이전에 도출된 하나 이상의 카메라 파라미터 값을 기반으로 예측을 수행함으로써 도출될 수 있다.

본 발명의 또 다른 실시 형태는 카메라 파라미터 복호화 방법이다. 상기 방법은, 카메라 파라미터 관련 정보를 포함하는 영상 정보를 수신하여 복호화하는 단계 및 상기 복호화된 영상 정보를 기반으로, 서로 다른 POC(Picture Order Count) 값에 대응하는 복수의 카메라 파라미터 값을 도출하는 단계를 포함하되, 상기 POC 값은 픽쳐의 출력 순서를 나타내는 값이고, 상기 복수의 카메라 파라미터 값 중에서 적어도 하나의 카메라 파라미터 값은, 이전에 도출된 하나 이상의 카메라 파라미터 값을 기반으로 예측을 수행함으로써 도출될 수 있다.

본 발명의 또 다른 실시 형태는, 카메라 파라미터 복호화 장치이다. 상기 장치는, 카메라 파라미터 관련 정보를 포함하는 영상 정보를 수신하여 복호화하는 엔트로피 복호화부 및 상기 복호화된 영상 정보를 기반으로, 서로 다른 POC(Picture Order Count) 값에 대응하는 복수의 카메라 파라미터 값을 도출하는 카메라 파라미터 복원부를 포함할 수 있고, 상기 POC 값은 픽쳐의 출력 순서를 나타내는 값이고, 상기 복수의 카메라 파라미터 값 중에서 적어도 하나의 카메라 파라미터 값은, 이전에 도출된 하나 이상의 카메라 파라미터 값을 기반으로 예측을 수행함으로써 도출될 수 있다.

본 발명에 따른 3D 비디오 부호화 방법에 의하면, 부호화/복호화 효율이 향상될 수 있다.

본 발명에 따른 3D 비디오 복호화 방법에 의하면, 부호화/복호화 효율이 향상될 수 있다.

본 발명에 따른 카메라 파라미터 부호화 방법에 의하면, 부호화/복호화 효율이 향상될 수 있다.

본 발명에 따른 카메라 파라미터 복호화 방법에 의하면, 부호화/복호화 효율이 향상될 수 있다.

본 발명에 따른 카메라 파라미터 정보 전송 방법에 의하면, 부호화/복호화 효율이 향상될 수 있다.

도 1은 본 발명의 일 실시예에 따른 3D 비디오 부호화 장치를 개략적으로 도시한 블록도이다.

도 2는 도 1의 3D 비디오 부호화 장치에 포함된 영상 부호화부 구성의 일 실시예를 개략적으로 나타내는 블록도이다.

도 3은 본 발명의 일 실시예에 따른 3D 비디오 복호화 장치를 개략적으로 도시한 블록도이다.

도 4는 도 3의 3D 비디오 복호화 장치에 포함된 영상 복호화부 구성의 일 실시예를 개략적으로 나타내는 블록도이다.

도 5a 및 도 5b는 DIBR을 위해 사용되는 카메라 파라미터의 실시예를 개략적으로 나타내는 도면이다.

도 6은 영상 부호화/복호화를 위해 사용되는 계층적 코딩 구조의 일 실시예를 개략적으로 나타내는 도면이다.

도 7은 영상의 코딩 구조가 계층적 B 구조인 경우, 카메라 파라미터에 대해 예측 차분 코딩을 수행하는 방법의 일 실시예를 개략적으로 나타내는 도면이다.

도 8은 영상의 코딩 구조가 로우 딜레이 구조인 경우, 카메라 파라미터에 대해 예측 차분 코딩을 수행하는 방법의 일 실시예를 개략적으로 나타내는 도면이다.

도 9는 예측 잔차 코딩 방식을 기반으로 한 카메라 파라미터 부호화 방법의 일 실시예를 개략적으로 나타내는 흐름도이다.

도 10은 예측 잔차 코딩 방식을 기반으로 한 카메라 파라미터 복호화 방법의 일 실시예를 개략적으로 나타내는 흐름도이다.

도 11은 본 발명에 따른 카메라 파라미터 부호화기 구성의 일 실시예를 개략적으로 나타내는 블록도이다.

도 12는 본 발명에 따른 카메라 파라미터 복호화기 구성의 일 실시예를 개략적으로 나타내는 블록도이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니다. 본 명세서에서 사용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

한편, 본 발명에서 설명되는 도면상의 각 구성들은 영상 부호화/복호화 장치에서 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.

또한, 일부의 구성 요소는 본 발명에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 발명은 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 발명의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 발명의 권리 범위에 포함된다.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성 요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성 요소에 대해서 중복된 설명은 생략한다.

도 1은 본 발명의 일 실시예에 따른 3D 비디오 부호화 장치를 개략적으로 도시한 블록도이다. 도 1의 실시예에 따른 3D 비디오 부호화 장치는 영상 부호화부(110), 카메라 파라미터 부호화부(120) 및 다중화부(130)를 포함할 수 있다.

3D 비디오에서는 동일한 POC(Picture Order Count)에 서로 다른 시점을 갖는 복수 개의 텍스쳐 영상이 존재할 수 있으며, 상기 복수 개의 텍스쳐 영상 각각에 대응하는 깊이 영상이 존재할 수 있다. 또한, 상기 복수 개의 텍스쳐 영상은 서로 다른 시점을 갖는 복수의 카메라로부터 획득될 수 있다. 따라서 3D 비디오에서는 복수 개의 시점 각각에 대응하는 카메라 파라미터가 텍스쳐 영상 및 깊이 영상과 함께 부호화 및/또는 복호화될 수 있다.

도 1의 실시예에서, 영상 부호화부(110)는 텍스쳐 영상 및 깊이 영상에 대한 부호화를 수행함으로써, 텍스쳐 영상에 대응하는 비트 스트림 및 깊이 영상에 대응하는 비트 스트림을 출력할 수 있다.

이 때, 영상 부호화부(110)는 픽쳐의 처리 단위에 대해 예측을 수행하고 예측된 값을 기반으로 잔차 신호만을 부호화함으로써, 영상 부호화 효율을 향상시킬 수 있다. 특히, 인터 예측이 수행되는 경우, 영상 부호화부(110)는 예측 대상 처리 단위가 속한 현재 픽쳐와 다른 POC 값을 갖는 이전 픽쳐 및/또는 이후 픽쳐를 기반으로 예측을 수행할 수 있다. 여기서, 예측 대상 처리 단위는 하나의 블록에 해당될 수 있으므로, 예측 대상 블록으로도 불릴 수 있다. 이하, 본 명세서에서는 예측 대상 처리 단위를 예측하는데 사용되는 픽쳐는 참조 픽쳐라 정의한다.

영상 부호화부(110)는 예측을 수행함에 있어, 현재 픽쳐와 다른 POC 값을 갖는 픽쳐 외에, DIBR(Depth Image Based Rendering) 방식을 기반으로 생성된, 가상의 시점을 갖는 픽쳐를 참조 픽쳐로 사용할 수도 있다. 여기서, DIBR은 텍스쳐 영상(및/또는 상기 텍스쳐 영상에 속한 텍스쳐 픽쳐) 및 깊이 정보를 기반으로 가상의 시점을 나타내는 영상(및/또는 픽쳐)을 합성하는 것을 의미한다. 이하, 본 명세서에서는 DIBR에 의해 생성된 합성 영상은 가상 시점 영상(및/또는 가상 시점 픽쳐)이라 한다.

DIBR에 의해 생성된 합성 영상(가장 시점 영상)은 인덱스화되어 참조 픽쳐 리스트에 추가될 수 있다. 여기서, 상기 참조 픽쳐 리스트는 가상 시점 영상뿐만 아니라, 다른 참조 픽쳐(예를 들어, 다른 POC 값을 가지는 이전 픽쳐 및/또는 이후 픽쳐 등)도 포함할 수 있다. 이 때, 영상 부호화부(110)는 상기 생성된 참조 픽쳐 리스트를 기반으로 예측을 수행함으로써 영상 부호화 효율을 향상시킬 수 있다.

예를 들어, 3D 비디오에서는 동일한 POC를 갖는 제1 시점의 영상 및 제2 시점의 영상이 존재할 수 있다. 동일한 POC를 갖는 영상은 동일한 영상 출력 순서를 갖는 영상에 해당될 수 있다. 제1 시점 영상은 제1 텍스쳐 픽쳐 및 제1 깊이 픽쳐를 포함할 수 있고, 제2 시점 영상은 제2 텍스쳐 픽쳐 및 제2 깊이 픽쳐를 포함할 수 있다. 이 경우, 영상 부호화부(110)는 제1 시점 영상을 기반으로 제2 시점에 해당되는 가상 시점 영상을 생성할 수 있으며, 생성된 가상 시점 영상은 제2 시점 영상의 예측을 위해 참조 픽쳐로서 사용될 수 있다. 이와 같이, DIBR을 기반으로 생성된 합성 영상을 참조 픽쳐로 이용하는 예측 방식은 VSP(View Synthesis Prediction)로 불릴 수 있다.

가상 시점 영상을 생성하기 위해서는, 실제 카메라로부터 획득된 원본 시점 영상 내의 픽셀이 상기 가상 시점 영상 내의 어느 위치로 이동되어야 하는지 계산되어야 한다. 따라서, 이를 계산하기 위해 영상 부호화부(110)는 상술한 카메라 파라미터를 이용할 수 있다. 즉, 참조 픽쳐로 사용되는 가상 시점 영상은 카메라 파라미터를 기반으로 생성될 수 있다.

3D 비디오 복호화 장치는 3D 비디오 부호화 장치에서와 동일한 방식으로 예측을 수행할 필요가 있으므로, 상기 카메라 파라미터는 텍스쳐 영상 및 깊이 영상과 함께 부호화되어 복호화기로 전송되어야 한다. 따라서, 카메라 파라미터 부호화부(120)는 카메라 파라미터에 대한 부호화를 수행함으로써, 카메라 파라미터에 대응하는 비트 스트림을 생성할 수 있다. 3D 비디오를 구현하기 위해 사용되는 복수의 시점들은 각각 이에 대응하는 카메라 파라미터를 가질 수 있으므로, 카메라 파라미터는 각 시점 별로 부호화되어 복호화기로 전송될 수 있다. 카메라 파라미터의 종류 및 부호화 방식의 구체적인 실시예는 후술하기로 한다.

다중화부(130)는 텍스쳐 영상에 대응하는 비트 스트림, 깊이 영상에 대응하는 비트 스트림 및 카메라 파라미터에 대응하는 비트 스트림에 대한 다중화를 수행함으로써 단일 비트 스트림을 생성할 수 있다. 생성된 단일 비트 스트림은 채널 부호화, 변조 등의 과정을 거쳐 3D 비디오 복호화 장치로 전송될 수 있다.

상술한 바와 같이, 3D 비디오의 경우 종래의 2D 비디오 달리, 텍스쳐 영상 뿐만 아니라, 깊이 영상이 함께 부호화 및/또는 복호화될 수 있다. 종래의 비디오 압축 표준 대상인 텍스쳐 영상과 달리, 깊이 영상은 화면 내의 객체들에 대한 깊이 정보를 포함할 수 있다. 3D 비디오의 경우, 입체감은 상술한 깊이 정보에 의해 나타내어질 수 있다. 도 2의 실시예에 따른 영상 부호화 장치는 텍스쳐 영상 및 깊이 영상 각각에 적용될 수 있다.

도 2를 참조하면, 영상 부호화부(110)는 픽쳐 분할부(205), 예측부(210), 변환부(215), 양자화부(220), 재정렬부(225), 엔트로피 부호화부(230), 역양자화부(235), 역변환부(240), 필터부(245) 및 메모리(250)를 포함한다.

픽쳐 분할부(205)는 입력된 픽쳐를 적어도 하나의 처리 단위로 분할할 수 있다. 상기 입력된 픽쳐는 텍스쳐 영상에 속한 텍스쳐 픽쳐이거나 깊이 영상에 속한 깊이 픽쳐일 수 있다. 이때, 처리 단위는 예측 유닛(Prediction Unit: PU)일 수도 있고, 변환 유닛(Transform Unit: TU)일 수도 있으며, 부호화 유닛(Coding Unit: CU)일 수도 있다.

이하, 후술되는 실시예들은 부호화/복호화 대상 픽쳐(또는 현재 픽쳐)가 분할됨으로써 생성된 처리 단위를 기준으로 서술될 수 있으며, 유닛은 경우에 따라 블록으로 불릴 수도 있다. 또한 이하, 텍스쳐 픽쳐의 분할에 의해 획득된 블록은 텍스쳐 블록, 깊이 픽쳐의 분할에 의해 획득된 블록은 깊이 블록이라 한다.

깊이 영상, 깊이 픽쳐 및/또는 깊이 블록은 화면 내의 객체들에 대한 깊이 정보를 나타낸다는 점에서, 깊이 맵(depth map)으로도 불릴 수 있다. 이하, 본 명세서에서 깊이 영상, 깊이 픽쳐, 깊이 블록 및/또는 깊이 맵 내의 픽셀 값들은 깊이 픽셀 값으로도 불릴 수 있다.

예측부(210)는 인터 예측을 수행하거나 및/또는 인트라 예측을 수행할 수 있다. 인터 예측이 수행되는 경우, 예측부(210)는 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐의 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다. 인트라 예측이 수행되는 경우, 예측부(210)는 현재 픽쳐 내의 픽셀 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다. 이 때, 예측을 위해 사용된 예측 모드 정보, 움직임 벡터(motion vector) 정보 등은 잔차값과 함께 엔트로피 부호화부(130)에서 부호화되어 복호화기에 전달될 수 있다.

한편, 도 1에서 상술한 바와 같이, 예측부(210)는 예측을 수행함에 있어, DIBR 방식을 기반으로 생성된, 가상의 시점을 갖는 픽쳐를 참조 픽쳐로 사용할 수 있다. 여기서, 상기 가상 시점 픽쳐는 예측 대상 블록의 시점에 해당되는 가상 시점 픽쳐일 수 있다. 가상 시점 픽쳐는 예측 대상 블록과 동일한 POC 값을 갖는 다른 시점의 영상 및 카메라 파라미터를 기반으로 생성될 수 있으며, 예측부(210)는 생성된 가상 시점 픽쳐를 참조 픽쳐로 사용함으로써, 부호화 효율을 높일 수 있다. 이와 같은 예측 방식은 VSP(View Synthesis Prediction)으로 불릴 수 있으며, VSP에 사용되는 카메라 파라미터의 구체적인 실시예들은 후술하기로 한다.

변환부(215)는 변환 단위로 잔차 블록에 대한 변환(transform)을 수행하고 변환 계수를 생성한다. 변환부(215)에서의 변환 단위는 변환 유닛일 수 있으며, 쿼드 트리(quad tree) 구조를 가질 수 있다. 이때, 변환 단위의 크기는 소정의 최대 및 최소 크기의 범위 내에서 정해질 수 있다. 변환부(215)는 잔차 블록을 DCT(Discrete Cosine Transform) 및/또는 DST(Discrete Sine Transform)를 이용하여 변환할 수 있다.

양자화부(220)는 변환부(215)에서 변환된 잔차값들을 양자화하여 양자화 계수를 생성할 수 있다. 양자화부(220)에서 산출된 값은 역양자화부(235)와 재정렬부(225)에 제공될 수 있다.

재정렬부(225)는 양자화부(220)로부터 제공된 양자화 계수를 재정렬할 수 있다. 양자화 계수를 재정렬함으로써 엔트로피 부호화부(230)에서의 부호화의 효율을 높일 수 있다. 재정렬부(225)는 계수 스캐닝(Coefficient Scanning) 방법을 통해 2차원 블록 형태의 양자화 계수들을 1차원의 벡터 형태로 재정렬할 수 있다. 재정렬부(225)에서는 양자화부에서 전송된 계수들의 확률적인 통계를 기반으로 계수 스캔닝의 순서를 변경함으로써 엔트로피 부호화부(230)에서의 엔트로피 부호화 효율을 높일 수도 있다.

엔트로피 부호화부(230)는 재정렬부(225)에 의해 재정렬된 양자화 계수들에 대한 엔트로피 부호화를 수행할 수 있다. 엔트로피 부호화부(230)는 재정렬부(225) 및 예측부(210)로부터 전달받은 부호화 유닛의 양자화 계수 정보 및 블록 타입 정보, 예측 모드 정보, 분할 단위 정보, 예측 유닛 정보 및 전송 단위 정보, 움직임 벡터 정보, 참조 픽쳐 정보, 블록의 보간 정보, 필터링 정보 등 다양한 정보를 부호화할 수 있다. 엔트로피 부호화에는 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding) 및/또는 CABAC(Context-Adaptive Binary Arithmetic Coding) 등과 같은 부호화 방법들이 사용될 수 있다. 역양자화부(235)는 양자화부(220)에서 양자화된 값들을 역양자화하고, 역변환부(240)는 역양자화부(235)에서 역양자화된 값들을 역변환할 수 있다. 역양자화부(235) 및 역변환부(240)에서 생성된 잔차값(Residual)은 예측부(210)에서 예측된 예측 블록과 합쳐져 복원 블록(Reconstructed Block)이 생성될 수 있다.

필터부(245)는 복원된 블록 및/또는 픽쳐에 인 루프 필터(In-loop filter)를 적용할 수 있다. 인 루프 필터는 디블록킹 필터(deblocking filter), SAO(Sample Adaptive Offset) 및/또는 적응적 루프 필터(ALF) 등을 포함할 수 있다.

메모리(250)는 필터부(245)를 통해 산출된 복원 블록 또는 픽쳐를 저장할 수 있다. 메모리(250)에 저장된 복원 블록 또는 픽쳐는 인터 예측을 수행하는 예측부(210)에 제공될 수 있다.

도 3은 본 발명의 일 실시예에 따른 3D 비디오 복호화 장치를 개략적으로 도시한 블록도이다. 도 3의 실시예에 따른 3D 비디오 복호화 장치는 역 다중화부(310), 영상 복호화부(320), 카메라 파라미터 복호화부(320) 및 3D 영상 생성부(340)를 포함할 수 있다.

역 다중화부(310)는 전송망을 통해 전송된 단일 비트스트림을 수신할 수 있다. 역다중화부(310)는 수신된 단일 비트스트림에 대해 역 다중화 등의 프로세스를 수행함으로써 텍스쳐 영상에 대응하는 비트 스트림, 깊이 영상에 대응하는 비트 스트림 및 카메라 파라미터에 대응하는 비트 스트림을 추출할 수 있다.

영상 복호화부(320)는 텍스쳐 영상에 대응하는 비트 스트림 및 깊이 영상에 대응하는 비트 스트림에 대해 복호화를 수행함으로써, 복원된 텍스쳐 영상 및 복원된 깊이 영상을 출력할 수 있다. 이 때, 영상 복호화부(320)는 픽쳐의 처리 단위에 대해 예측을 수행하고, 예측된 값 및 복호화된 잔차 값을 기반으로 복원 영상을 생성할 수 있다.

영상 복호화부(320)는 영상 부호화부(110)와 마찬가지로 예측을 수행함에 있어, DIBR 방식을 기반으로 생성된, 가상의 시점을 갖는 픽쳐를 참조 픽쳐로 사용할 수 있다. DIBR에 의해 생성된 합성 영상(가장 시점 영상)은 인덱스화되어 참조 픽쳐 리스트에 추가될 수 있다. 여기서, 상기 참조 픽쳐 리스트는 가상 시점 영상뿐만 아니라, 다른 참조 픽쳐(예를 들어, 다른 POC 값을 가지는 이전 픽쳐 및/또는 이후 픽쳐 등)도 포함할 수 있다. 이 때, 영상 복호화부(320)는 상기 생성된 참조 픽쳐 리스트를 기반으로 예측을 수행함으로써 영상 복호화 효율을 향상시킬 수 있다. 이와 같이, DIBR을 기반으로 생성된 합성 영상을 참조 픽쳐로 이용하는 예측 방식은 VSP로 불릴 수 있다.

한편, 도 1에서 상술한 바와 같이, 가상 시점 영상을 생성하기 위해서는, 실제 카메라로부터 획득된 원본 시점 영상 내의 픽셀이 상기 가상 시점 영상 내의 어느 위치로 이동되어야 하는지 계산되어야 한다. 따라서, 이를 계산하기 위해 영상 복호화부(320)는 카메라 파라미터 복호화부(330)에서 복호화된 카메라 파라미터를 이용할 수 있다. 즉, 참조 픽쳐로 사용되는 가상 시점 영상은 카메라 파라미터를 기반으로 생성될 수 있다.

카메라 파라미터 복호화부(330)는 역 다중화부로부터 카메라 파라미터에 대응하는 비트스트림을 수신하여 복호화함으로써, 카메라 파라미터를 출력할 수 있다. 출력된 카메라 파라미터는 영상 복호화부(320)에서 VSP를 위해 사용될 수 있으며, 3D 영상 생성부(330)에 제공될 수도 있다. 카메라 파라미터의 종류 및 복호화 방식의 구체적인 실시예는 후술하기로 한다.

3D 영상 생성부(340)는 DIBR을 기반으로, 복원된 영상 및 카메라 파라미터를 이용하여 3D 워핑(warping)을 수행함으로써, 실제 카메라에 의해 획득된 영상들의 시점이 아닌 다른 가상의 시점에서의 영상을 생성할 수 있다. 이 때, 상기 생성된 영상은 중간 시점 영상(intermediate view image)으로 불릴 수 있다. 3D 영상 생성부(340)는 복호화 과정에서 복원된 영상 및 중간 시점 영상을 디스플레이 방식에 맞게 포맷팅하여, 디스플레이 면을 통해 3D 영상이 표시되도록 할 수 있다.

도 4는 도 3의 3D 비디오 복호화 장치에 포함된 영상 복호화부 구성의 일 실시예를 개략적으로 나타내는 블록도이다. 도 4를 참조하면, 영상 복호화부(320)는 엔트로피 복호화부(410), 재정렬부(415), 역양자화부(420), 역변환부(425), 예측부(430), 필터부(435) 및 메모리(440)를 포함할 수 있다. 도 4의 실시예에 따른 영상 복호화 장치는 영상 부호화 장치와 마찬가지로 텍스쳐 영상 및 깊이 영상 각각에 적용될 수 있다.

영상 복호화기에 영상 비트 스트림이 입력된 경우, 입력된 비트 스트림은 영상 부호화기에서 영상 정보가 처리된 절차에 따라서 복호화될 수 있다. 이 때, 상기 입력된 비트 스트림은 텍스쳐 영상에 대응하는 비트 스트림이거나 깊이 영상에 대응하는 비트 스트림일 수 있다.

엔트로피 복호화부(410)는 입력된 비트스트림에 대하여 엔트로피 복호화를 수행할 수 있으며, 엔트로피 복호화 방법은 상술한 엔트로피 부호화 방법과 유사하다. 엔트로피 복호화가 적용되는 경우, 높은 발생 확률을 갖는 심볼(symbol)에 낮은 값의 인덱스(index) 및 이에 대응하는 짧은 코드워드(codeword)가 할당되고, 낮은 발생 확률을 갖는 심볼에 높은 값의 인덱스 및 이에 대응하는 긴 코드워드가 할당될 수 있다. 따라서 부호화 대상 심볼들에 대한 비트량이 감소될 수 있고, 엔트로피 부호화에 의해 영상 압축 성능이 향상될 수 있다.

엔트로피 복호화부(410)에서 복호화된 정보 중 예측 블록을 생성하기 위한 정보는 예측부(430)로 제공되고 엔트로피 복호화부에서 엔트로피 복호화가 수행된 잔차값은 재정렬부(415)로 입력될 수 있다.

재정렬부(415)는, 엔트로피 복호화부(410)에서 엔트로피 복호화된 비트 스트림을 영상 부호화기에서 재정렬한 방법을 기초로 재정렬할 수 있다. 재정렬부(415)는 1차원 벡터 형태로 표현된 계수들을 다시 2차원의 블록 형태의 계수로 복원하여 재정렬할 수 있다. 재정렬부(415)는 부호화기에서 수행된 계수 스캐닝에 관련된 정보를 제공받고 해당 부호화부에서 수행된 스캐닝 순서에 기초하여 역으로 스캐닝하는 방법을 통해 재정렬을 수행할 수 있다.

역양자화부(420)는 부호화기에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다. 역변환부(425)는, 영상 부호화기에서 수행된 양자화 결과에 대해 부호화기의 변환부가 수행한 DCT 및 DST에 대해, 역DCT 및/또는 역DST를 수행할 수 있다. 역변환은 부호화기에서 결정된 전송 단위 또는 영상의 분할 단위를 기초로 수행될 수 있다.

예측부(430)는 엔트로피 복호화부(410)에서 제공된 예측 블록 생성 관련 정보와 메모리(440)에서 제공된 이전에 복호화된 블록 및/또는 픽쳐 정보를 기초로 예측 블록을 생성할 수 있다. 이 때, 예측부(430)는 영상 부호화기에서 제공된 예측 관련 정보를 기반으로 예측을 수행할 수 있다.

또한, 도 3에서 상술한 바와 같이, 예측부(430)는 예측을 수행함에 있어, DIBR 방식을 기반으로 생성된, 가상의 시점을 갖는 픽쳐를 참조 픽쳐로 사용할 수 있다. 여기서, 상기 가상 시점 픽쳐는 예측 대상 블록의 시점에 해당되는 가상 시점 픽쳐일 수 있다. 가상 시점 픽쳐는 예측 대상 블록과 동일한 POC 값을 갖는 다른 시점의 영상 및 카메라 파라미터를 기반으로 생성될 수 있으며, 예측부(210)는 생성된 가상 시점 픽쳐를 참조 픽쳐로 사용함으로써, 부호화 효율을 높일 수 있다. 상술한 바와 같이, 이와 같은 예측 방식은 VSP(View Synthesis Prediction)로 불릴 수 있으며, VSP에 사용되는 카메라 파라미터의 구체적인 실시예들은 후술하기로 한다.

복원 블록은 예측부(430)에서 생성된 예측 블록과 역변환부(425)에서 제공된 잔차 블록을 이용해 생성될 수 있다.

복원된 블록 및/또는 픽쳐는 필터부(435)로 제공될 수 있다. 필터부(435)는 복원된 블록 및/또는 픽쳐에 인 루프 필터(In-loop filter)를 적용할 수 있다. 상기 인 루프 필터는 디블록킹 필터, SAO(Sample Adaptive Offset) 및/또는 적응적 루프 필터(ALF) 등을 포함할 수 있다.

메모리(440)는 복원된 픽쳐 또는 블록을 저장하여 참조 픽쳐 또는 참조 블록으로 사용할 수 있도록 할 수 있고 또한 복원된 픽쳐를 출력부로 제공할 수 있다.

도 5a 및 도 5b는 DIBR을 위해 사용되는 카메라 파라미터의 실시예를 개략적으로 나타내는 도면이다. 도 5a 및 도 5b는 3D 비디오에서 사용될 수 있는 카메라 모델의 실시예를 도시한다.

상술한 바와 같이, 카메라 파라미터는 DIBR을 기반으로 한 가상 시점 영상의 생성에 사용될 수 있다. 즉, 카메라 파라미터는 VSP를 위해 사용되는 참조 픽쳐를 합성하기 위해 사용될 수 있으며, 수신 단말(예를 들어, 도 3의 3D 비디오 복호화 장치)에서 중간 시점 영상을 생성하기 위해 사용될 수도 있다. 따라서, 3D 비디오 부호화기는 각각의 시점 별로 카메라 파라미터를 부호화하여 복호화기로 전송할 수 있다. 도 5a 및 도 5b는 부호화기에서 복호화기로 전송되는 카메라 파라미터들을 도시한다.

도 5a를 참조하면, W로 표시된 좌표계는 공간상에서 카메라의 위치를 지정하기 위해 사용되는 ‘기준 좌표계’를 의미할 수 있다. 또한, C로 표시된 좌표계는, 도 5a에 도시된 카메라 파라미터들에 대응되는 카메라의 초점(focal point, 510)을 원점으로 갖는, ‘카메라 좌표계’를 의미할 수 있다. 또한, 도 5a의 520은 카메라에 의해 획득된 영상이 표시되는 이미지 평면(image plane)을 나타낸다.

도 5a의 실시예에서, f, u₀, v₀는 각각 카메라 파라미터를 나타낸다. 여기서, f는 카메라의 초점(510)에서 이미지 평면(520)까지의 거리(Z축 상의 거리), 즉 초점 거리(focal length)를 의미한다. 또한, (u₀,v₀)는 카메라의 광축(optical axis)이 상기 이미지 평면(520)과 만나는 지점의 좌표, 즉, 주점의 좌표(coordinate of a principal point)를 나타낼 수 있다. 상기 광축은 카메라 좌표계에서 이미지 평면(520)에 수직인 좌표 축을 의미할 수 있으며, 도 5a에서는 z 축으로 나타내어지고 있다. 따라서 카메라의 초점(510)에서 주점(a principal point)까지의 거리는 초점 거리에 해당될 수 있다. 상술한 세 개의 파라미터(f, u₀, v₀)는 내부 카메라 파라미터(intrinsic camera parameter)로 불릴 수 있다.

한편, 카메라 파라미터에는 기준 좌표계(W)를 기준으로 카메라 좌표계(C)를 나타내기 위해 사용되는, 3x3 회전 매트릭스(3x3 rotation matrix, R) 및 3x1 이동 벡터 (3x1 translation vector, T)도 있을 수 있다. 여기서, 상기 3x3 회전 매트릭스(R)는 기준 좌표계를 기준으로 카메라 좌표계가 3차원 공간에서 회전한 정도를 나타낸다. 즉, 상기 3x3 회전 매트릭스(R)는 기준 좌표계를 기준으로 하는 카메라 좌표계의 3차원 회전을 나타낸다. 또한, 상기 3x1 이동 벡터(T)는 기준 좌표계를 기준으로 한 카메라 좌표계의 위치를 나타내는 벡터이다. 이 때, 상기 벡터는 다음 수학식 1과 같이 나타내어질 수 있다.

[수학식 1]

여기서, Tx, Ty 및 Tz는 각각 기준 좌표계에서 카메라 좌표계까지의 x축 이동 거리, y축 이동 거리 및 z축 이동 거리를 나타낼 수 있다.

상술한 3x3 회전 매트릭스(R) 및 3x1 이동 벡터(T) ([R,T])는 기준 좌표계와 카메라 좌표계의 기하학적 관계를 나타낼 수 있다. 따라서, 상기 두 파라미터는 외부 카메라 파라미터(extrinsic camera parameter)로 불릴 수 있다.

도 5a에서 M^c는 카메라에 의해 촬영되는 객체 또는 물체의 위치를 나타낼 수 있다. 카메라 좌표계를 기준으로 상기 위치의 좌표가 (X,Y,Z)라 하면, 카메라 좌표계의 원점(초점, 510)에서 상기 위치까지의 Z축 거리는 Z에 해당될 수 있다. 이 때, 상기 객체 또는 물체가 이미지 평면(520) 상에 표시되는 위치(m)의 좌표는 다음 수학식 2에 의해 계산될 수 있다.

[수학식 2]

도 5b는 카메라의 광축(optical axis)에 수직으로 위치한 세 개의 평면을 도시한다. 도 5b의 510은 카메라의 초점, 즉 카메라 좌표계의 원점을 나타내고, 도 5b의 520은 이미지 평면을 나타낸다.

하나의 카메라가 촬영한 장면은 다양한 깊이 값을 가질 수 있다. 이 때, 가장 작은 깊이 값을 갖는 지점은 카메라에 가장 가까이 위치한 지점일 수 있고, 가장 큰 깊이 값을 갖는 지점은 카메라에서 가장 멀리 위치한 지점일 수 있다. 도 5b의 530은 510의 초점을 갖는 카메라가 촬영한 장면에서 가장 작은 값을 갖는 깊이 값에 해당되는 평면을 나타내고, 이는 근접 클리핑 평면(near clipping plane)으로 불릴 수 있다. 또한, 도 5b의 540은 510의 초점을 갖는 카메라가 촬영한 장면에서 가장 큰 값을 갖는 깊이 값에 해당되는 평면을 나타내고, 이는 원거리 클리핑 평면(far clipping plane)으로 불릴 수 있다.

하나의 카메라가 촬영한 임의의 장면에서, 가장 작은 깊이 값은 Zn(Znear)으로 나타내어질 수 있고, 이는 도 5b에서 근접 클리핑 평면(530)이 갖는 깊이 값에 해당될 수 있다. 가장 큰 깊이 값은 Zf(Zfar)로 나타내어질 수 있고, 이는 도 5b에서 원거리 클리핑 평면(540)이 갖는 깊이 값에 해당될 수 있다. 상기 Zn 및 Zf는 카메라 파라미터에 해당하며, Z-클리핑 파라미터(Z-clipping parameter)로 불릴수 있다. 이하, 본 명세서에서 Zn은 근접 클리핑 파라미터(near clipping parameter)로 불릴 수 있고, Zf는 원거리 클리핑 파라미터(far clipping parameter)로 불릴 수 있다.

부호화기에서 처리되어 복호화기로 전송되는 깊이 데이터는 0 내지 255의 값을 가질 수 있다. 즉, 깊이 픽쳐 내의 깊이 픽셀 값들은 0 내지 255의 값을 가질 수 있다. 이 때, 상기 깊이 픽셀 값들은 Z-클리핑 파라미터 Zn 및 Zf 사이의 깊이 값들이 각각 256 레벨로 양자화된 값에 해당될 수 있다. 따라서, 양자화된 깊이 픽셀 값들은 Z-클리핑 파라미터 Zn 및 Zf 를 기반으로 실제 깊이 값으로 변환될 수 있다. 이는 일 실시예로, 다음 수학식 3과 같이 나타내어질 수 있다.

[수학식 3]

수학식 3의 실시예에서, Z_near는 근접 클리핑 파라미터를 나타내고, Z_far는 원거리 클리핑 파라미터를 나타낸다. 또한, z는 실제 깊이 값을 나타내고, v는 깊이 맵에 포함된 깊이 픽셀 값의 강도(intensity)를 나타낸다.

이하, 본 명세서에서 “카메라 파라미터”는, 상술한 내부 카메라 파라미터, 외부 카메라 파라미터 및 Z-클리핑 파라미터를 모두 포함하는 개념으로 사용될 수 있다.

한편, 일반적으로 3D 비디오 부호화/복호화 과정에서 상술한 카메라 파라미터들은, 하나의 시퀀스에 대해 마지막까지 고정된(static) 값을 갖는 것으로 간주될 수 있다. 즉, 3D 비디오 부호화기 및 3D 비디오 복호화기는 각각 카메라 파라미터들이 고정된 값을 갖는 것을 전제로 부호화 및 복호화를 수행할 수 있다.

그러나, 3D 비디오 부호화/복호화 과정에서 사용되는 모든 파라미터들이 항상 고정된 값을 갖는 것은 아니다. 상술한 바와 같이, 3D 비디오의 경우, 서로 다른 시점을 갖는 복수의 영상을 획득하기 위해 복수 개의 카메라가 사용될 수 있다. 이 때, 복수의 카메라의 광축이 모두 평행하고 복수의 카메라 간에 수직 방향의 변이(disparity)가 존재하지 않도록 조정된(rectified) 경우에는, 상술한 초점 거리(f), 주점 좌표(u₀, v₀), 3x3 회전 매트릭스(R) 및 Ty, Tz (3x1 이동 벡터(T)에서 Y축 이동 거리 및 Z축 이동 거리)가 고정된 값을 가질 수 있다. 하지만, 이러한 경우에도 3x1 이동 벡터(T)에서 X축 이동 거리(Tx) 및 Z-클리핑 파라미터(Zn 및 Zf)의 값은, 장면의 컨텐츠 변화 및 카메라의 이동 등에 의해 시간에 따라 변할 수 있다. 이와 같이, 시간에 따라 변화하는 값을 갖는 카메라 파라미터는 ‘시변 파라미터(time varying parameter)’로 불릴 수 있다.

상술한 시변 파라미터의 경우, 대개 점진적으로(smoothly) 변화하는 특성을 가진다. 또한, 카메라 파라미터에 작은 왜곡(distortion)이 발생하는 경우에도 DIBR을 기반으로 생성된 가상 시점 영상의 품질에는 큰 영향을 미치지 않을 수 있다. 하지만, 시변 파라미터의 값은 시간에 따라 계속 변화하므로, 정확한 값이 전송될 필요가 있고, 시간에 따라 변하는 값들이 계속 전송되어야 한다.

이 때, 3D 비디오 부호화기는 시변 파라미터를 효율적으로 전송하기 위해, 카메라 파라미터 값을 예측하고 실제 카메라 파라미터 값과 예측된 카메라 파라미터 값의 잔차(residual)를 부호화하는 예측 차분 코딩 방식(prediction and differential coding method)을 이용할 수 있다. 따라서, 상술한 카메라 파라미터 Tx, Zn 및 Zf 중에서 시간에 따라 변화하는 시변 파라미터가 존재하는 경우, 해당 시변 파라미터는 예측 차분 코딩 방식을 기반으로 부호화되거나 및/또는 복호화될 수 있다.

3D 비디오 부호화기는 예측 대상 카메라 파라미터와는 다른 POC 값에 대응하는 카메라 파라미터를 기반으로, 상기 예측 대상 카메라 파라미터에 대한 예측을 수행함으로써 예측된 카메라 파라미터 값을 도출할 수 있다. 그리고 예측 대상 카메라 파라미터 값에서 예측된 카메라 파라미터 값을 감산하여 잔차 카메라 파라미터(residual camera parameter) 값을 도출할 수 있다. 이 때, 3D 비디오 부호화기는 잔차 카메라 파라미터에 대한 엔트로피 부호화를 수행함으로써, 카메라 파라미터에 대응하는 비트스트림을 생성할 수 있다.

3D 비디오 복호화기는 카메라 파라미터에 대응하는 비트스트림에 대해 엔트로피 복호화를 수행함으로써, 잔차 카메라 파라미터 값을 도출할 수 있다. 그리고, 이미 복호화되거나 및/또는 이미 복원된 카메라 파라미터를 기반으로 예측을 수행함으로써, 부호화기에서와 동일한 예측된 카메라 파라미터 값을 도출할 수 있다. 이 때, 3D 비디오 복호화기는 잔차 카메라 파라미터 값을 예측된 카메라 파라미터 값에 더함으로써, 복원된 카메라 파라미터 값을 도출할 수 있다.

상술한 카메라 파라미터 예측 차분 코딩 방식은 3D 비디오를 구성하는 텍스쳐 영상 및 깊이 영상의 코딩 구조에 따라 달라질 수 있다. 따라서, 카메라 파라미터 코딩 방식의 구체적인 실시예를 서술하기에 앞서, 영상의 코딩 구조에 대해 서술하기로 한다.

영상 부호화/복호화에 사용되는 픽쳐에는 I 픽쳐 P 픽쳐, B 픽쳐가 있을 수 있다. 후술되는 실시예들은 픽쳐 단위를 기준으로 서술되지만, 슬라이스 단위에도 동일하거나 유사한 방식으로 적용될 수 있다.

I 픽쳐는 전후의 픽쳐와는 관계 없이 당해 픽쳐 내에서 독립적으로 부호화되는 픽쳐일 수 있다. I 픽쳐에는 시간 방향의 예측이 적용되지 않으며, 당해 픽쳐 내의 정보만이 부호화 처리에 사용될 수 있다. P 픽쳐는 하나의 참조 픽쳐를 이용한 픽쳐 간의 단방향 예측에 의해 부호화될 수 있는 픽쳐일 수 있다. P 픽쳐에서는 한 개의 참조 픽쳐 리스트를 필요로 하며, 이는 L0(참조 픽쳐 리스트 0)로 나타내어질 수 있다. L0로부터 선택된 참조 픽쳐를 기반으로 하는 인터 예측은 L0 예측이라 하며, L0 예측은 주로 순방향 예측에 사용될 수 있다. P 픽쳐에서는 인트라 예측 및/또는 L0 예측이 수행될 수 있다. B 픽쳐에서는 두 개의 참조 픽쳐 리스트를 기반으로 픽쳐 간의 순방향, 역방향 및/또는 양방향 예측이 수행될 수 있다. B 픽쳐에서 사용되는 두 개의 참조 픽쳐 리스트는 각각 L0(참조 픽쳐 리스트 0) 및 L1(참조 픽쳐 리스트 1)으로 나타내어질 수 있다. L1으로부터 선택된 참조 픽쳐를 기반으로 하는 인터 예측은 L1 예측이라 하며, L1 예측은 주로 순방향 예측에 사용될 수 있다. B 픽쳐에서는 인트라 예측, L0 예측, L1 예측 및/또는 쌍예측(bi prediction)이 수행될 수 있다. 여기서, 쌍예측은 L0와 L1으로부터 선택된 두 개의 참조 픽쳐를 사용하는 인트 예측을 의미할 수 있다.

도 6의 실시예에 따른 계층적 코딩 구조(hierarchical coding structure)에서는 템포럴 레벨(temporal level)에 따라 시간적 계층(temporal layer)이 구성될 수 있다. 도 6에 도시된 코딩 구조는 B 픽쳐를 사용하므로, 계층적 B 구조(hierarchical B structure)로도 불릴 수 있다. 도 6의 실시예에서 GOP(Group of Picture)의 크기는 8이라 가정한다.

도 6을 참조하면, 계층적 코딩 구조는 복수의 계층 단계를 가질 수 있다. 여기서, 계층 단계의 개수는 일례로 4개일 수 있다. 이 때, 서로 다른 계층의 픽쳐들은 서로 다른 시간적 레벨을 가질 수 있다. 도 6에서는 상단에 위치한 픽쳐일 수록 높은 시간적 레벨을 갖는다고 가정한다.

도 6에서 각 픽쳐 하단에 표시된 숫자는 해당 픽쳐에 할당된 POC 값을 나타낸다. 여기서, POC에 할당된 값은 픽쳐의 출력 순서를 나타낼 수 있다. 계층적 B 구조에서는 도 6에 도시된 바와 같이 하나의 픽쳐가 더 높은 템포럴 레벨을 갖는 두 개의 픽쳐를 기반으로 부호화될 수 있다. 이 때, 부호화/복호화 대상 픽쳐가 참조하는 참조 픽쳐는 부호화/복호화 대상 픽쳐보다 높은 POC 값을 가질 수도 있다. 이는 더 높은 POC 값을 갖는 픽쳐가 먼저 부호화되거나 및/또는 복호화될 수 있음을 의미한다. 따라서, 계층적 B 구조에서는 픽쳐의 부호화/복호화 순서가 픽쳐의 출력 순서와 다를 수 있으며, 이로 인한 딜레이(delay)가 발생할 수 있다.

한편, 비트 스트림의 시작 지점이 아닌 다른 지점에서 복호화 프로세스가 시작되는 동작은 랜덤 억세스(random access)로 불릴 수 있다. 계층적 B 구조에서는, 랜덤 억세스가 수행될 수 있는 지점(이하, 랜덤 억세스 포인트라 함)에, 랜덤 억세스 픽쳐가 위치할 수 있다. 즉, 상기 랜덤 억세스 픽쳐는 복수의 픽쳐가 출력 순서에 따라 배열되는 영상 시퀀스 내에서 랜덤 억세스 포인트를 지시할 수 있다.

일례로, 상기 랜덤 억세스 픽쳐는 IDR(Instantaneous Decoding Refresh) 픽쳐일 수 있다. 여기서, 상기 IDR 픽쳐는 복호화 순서상 상기 IDR 픽쳐 이후에 위치하는 픽쳐들이 상기 IDR 픽쳐 이전에 위치하는 픽쳐를 참조하지 않도록 함으로써, 랜덤 억세스가 가능해지도록 할 수 있다. 도 6의 실시예에서, 픽쳐 610 이후에 복호화되는 픽쳐들은 픽쳐 610 이전에 복호화된 픽쳐를 참조하지 않으므로, 픽쳐 610이 IDR 픽쳐에 해당될 수 있다. 또한, 픽쳐 620도 동일한 이유로 IDR 픽쳐에 해당될 수 있다.

또한, 복수의 픽쳐가 출력 순서에 따라 배열되는 영상 시퀀스에 랜덤 억세스 픽쳐가 삽입되는 주기는 ‘인트라 주기(intra period)’로 불릴 수 있다. 이 때, 상기 인트라 주기는 픽쳐의 출력 순서(POC)에 따라 하나의 랜덤 억세스 픽쳐로부터 다음 랜덤 억세스 픽쳐 바로 이전에 위치한 픽쳐까지의 픽쳐 개수를 나타낼 수 있다. 따라서, 하나의 인트라 주기에서 POC 순서상 가장 첫 번째에 위치한 픽쳐는 랜덤 억세스 픽쳐일 수 있다. 예를 들어, 영상 시퀀스의 프레임 레이트(frame rate)가 24fps(frames per second)이고 랜덤 억세스 픽쳐가 1초마다 삽입되는 경우, 인트라 주기는 24가 되고 1초 단위로 랜덤 억세스가 가능하게 된다. 도 6의 실시예에서는, 픽쳐 610 및 픽쳐 620이 랜덤 억세스 픽쳐에 해당될 수 있으므로, 일례로‘인트라 주기’는 8일 수 있다.

한편, 영상의 코딩 구조에는 상술한 계층적 B 구조뿐만 아니라, I 픽쳐 및 P 픽쳐만을 기반으로 하는 코딩 구조가 있을 수 있다. 이러한 코딩 구조에서 영상 시퀀스는 일례로, {I, P, P, P, P, P,…}와 같이 구성될 수 있다. 여기서, I는 I 픽쳐를, P는 P 픽쳐를 의미할 수 있다. I 픽쳐 및 P 픽쳐만을 기반으로 하는 코딩 구조에서는 픽쳐의 출력 순서와 부호화/복호화 순서가 동일하므로, 모든 픽쳐가 복호화되자마자 출력될 수 있다. 따라서, 상술한 코딩 구조에서는 계층적 B 구조에 비해 딜레이가 적게 발생할 수 있다. 이하, 본 명세서에서는 상술한 바와 같이 I 픽쳐 및 P 픽쳐만을 기반으로 하는 코딩 구조를 ‘로우 딜레이 구조(low delay structure)’라 지칭하기로 한다.

로우 딜레이 구조에서는, 계층적 B 구조에서와 유사하게 랜덤 억세스가 수행될 수 있는 지점에, 랜덤 억세스 픽쳐가 위치할 수 있다. 또한, 상술한 바와 같이, 복수의 픽쳐가 출력 순서에 따라 배열되는 영상 시퀀스에 랜덤 억세스 픽쳐가 삽입되는 주기는 ‘인트라 주기(intra period)’로 불릴 수 있다.

상술한 바와 같이, 시변 파라미터의 값은 시간에 따라 변화할 수 있으므로, 영상에 할당된 POC 값에 따라 상기 영상에 대응하는 시변 파라미터의 값도 달라질 수 있다. 도 7은 0에서 8까지의 POC 값 각각에 대응하는 시변 파라미터의 값을 도시한다. 도 7의 실시예에서는 전송되는 시변 파라미터가 근접 클리핑 파라미터(Zn)인 경우에 대해 서술되나, 본 발명은 이에 한정되지 않는다. 즉, 도 7의 실시예에 따른 예측 차분 코딩 방식은 근접 클리핑 파라미터(Zn)가 아닌 다른 시변 파라미터에도 동일한 방식으로 적용될 수 있다.

한편, 도 7의 실시예에서 픽쳐의 인트라 주기는 8이라 가정한다. 즉, 도 7에서는 복수의 픽쳐가 출력 순서에 따라 배열된 영상 시퀀스 내에서 8개의 픽쳐마다 한 개의 랜덤 억세스 픽쳐가 위치할 수 있다. 따라서, 도 7에서와 같은 계층적 B 구조는 랜덤 억세스 구조로도 불릴 수 있다.

또한, 도 7의 실시예에서 POC 값이 0인 픽쳐는 영상 시퀀스의 시작 지점에 위치하는 픽쳐일 수 있고, 랜덤 억세스 픽쳐에 해당될 수 있다. 여기서, 인트라 주기는 8이므로, 상기 랜덤 억세스 픽쳐에 가장 가까이 위치한 다음 랜덤 억세스 픽쳐는, POC 값이 8인 픽쳐일 수 있다. 도 7에서 인트라 주기는 8이고 POC 값이 0인 픽쳐는 랜덤 억세스 픽쳐에 해당되므로, (할당된 POC값 % 8)의 값이 0인 픽쳐는 랜덤 억세스 픽쳐로 볼 수 있다. 여기서, x%y는 x를 y로 나눈 나머지 값을 의미할 수 있다. POC 값이 0인 경우 (POC 값(0) % 8)의 값이 0이고, POC 값이 8인 경우 (POC 값(8) % 8)의 값이 0이므로, POC 값이 0인 픽쳐 및 POC 값이 8인 픽쳐는 랜덤 억세스 픽쳐에 해당될 수 있다.

도 6에서 상술한 바와 같이, 계층적 B 구조에서는 픽쳐의 출력 순서 및 부호화/복호화 순서가 서로 다를 수 있다. 따라서, 일례로 POC 순서상 서로 가장 인접한 두 개의 랜덤 억세스 픽쳐가 POC 순서상 상기 두 개의 랜덤 억세스 픽쳐 사이에 위치하는 픽쳐들보다 먼저 부호화되거나 및/또는 복호화될 수 있다.

POC 순서상 하나의 인트라 주기의 첫 번째에 위치한 픽쳐는 랜덤 억세스 픽쳐에 해당될 수 있다. 이 때, 3D 비디오 부호화기는 랜덤 억세스 픽쳐에 대응하는 카메라 파라미터(이하, 랜덤 억세스 카메라 파라미터라 함)에 예측 차분 코딩 방식을 적용하지 않을 수 있다. 즉, POC 순서상 하나의 인트라 주기의 첫 번째에 위치한 카메라 파라미터(랜덤 억세스 카메라 파라미터)의 경우에는, 그 값 자체가 부호화되어 전송될 수 있다. 이는 랜덤 억세스 카메라 파라미터가 POC 순서상 상기 카메라 파라미터 이전에 위치하는 카메라 파라미터를 참조하지 않도록 함으로써, 랜덤 억세스가 가능하도록 하기 위함이다.

POC 순서상 서로 가장 인접한 두 개의 랜덤 억세스 카메라 파라미터가 부호화된 후, 3D 비디오 부호화기는 상기 두 개의 랜덤 억세스 카메라 파라미터 사이에 위치한 다른 부호화 대상 카메라 파라미터들 각각에 대해, 예측 차분 코딩 방식을 기반으로 부호화를 수행할 수 있다.

3D 비디오 부호화기는 상기 두 개의 랜덤 억세스 카메라 파라미터를 기반으로, 부호화 대상 카메라 파라미터에 대한 예측을 수행할 수 있다. 이 때, 각 부호화 대상 카메라 파라미터의 값은, 상기 두 개의 랜덤 억세스 카메라 파라미터 값의 선형 보간(linear interpolation)에 의해 예측될 수 있다. 즉, 3D 비디오 부호화기는 두 개의 랜덤 억세스 카메라 파라미터 값의 선형 보간에 의해 부호화 대상 카메라 파라미터의 예측 값을 도출할 수 있다. 이 때, 3D 비디오 부호화기는 부호화 대상 카메라 파라미터 값 및 예측된 카메라 파라미터 값의 차분에 의해 잔차 카메라 파라미터 값을 도출할 수 있다. 이 경우에는 잔차 카메라 파라미터가 부호화되어 3D 비디오 복호화기로 전송될 수 있다.

3D 비디오 복호화기는 부호화된 랜덤 억세스 카메라 파라미터를 수신하여 복호화함으로써, 랜덤 억세스 카메라 파라미터 값을 도출할 수 있다. 상술한 바와 같이 랜덤 억세스 카메라 파라미터에는 예측 차분 코딩 방식이 적용되지 않으므로, 3D 비디오 복호화기는 예측 과정 수행 없이도 랜덤 억세스 카메라 파라미터 값을 도출할 수 있다.

POC 순서상 서로 가장 인접한 두 개의 랜덤 억세스 카메라 파라미터가 복호화된 후, 3D 비디오 복호화기는 상기 두 개의 랜덤 억세스 카메라 파라미터 사이에 위치한 다른 복호화 대상 카메라 파라미터들 각각에 대해, 예측 차분 코딩 방식을 기반으로 복호화를 수행할 수 있다.

3D 비디오 복호화기는 상기 두 개의 랜덤 억세스 카메라 파라미터를 기반으로, 복호화 대상 파라미터에 대한 예측을 수행할 수 있다. 이 때, 각 복호화 대상 파라미터의 값은, 상기 두 개의 랜덤 억세스 카메라 파라미터 값의 선형 보간에 의해 예측될 수 있다. 즉, 3D 비디오 복호화기는 두 개의 랜덤 억세스 카메라 파라미터 값의 선형 보간에 의해 복호화 대상 카메라 파라미터의 예측 값을 도출할 수 있다. 한편, 상술한 바와 같이, 3D 비디오 부호화기는 부호화된 잔차 카메라 파라미터를 복호화기로 전송할 수 있다. 3D 비디오 복호화기는 전송된 정보를 수신하여 복호화함으로써, 잔차 카메라 파라미터 값을 도출할 수 있다. 이 때, 3D 비디오 복호화기는 예측된 카메라 파라미터 값에 잔차 카메라 파라미터 값을 더함으로써, 복호화 대상 카메라 파라미터에 대응하는 실제 카메라 파라미터 값을 도출할 수 있다.

한편, 상술한 실시예서는 서로 인접한 두 개의 랜덤 억세스 카메라 파라미터를 기반으로, POC 순서상 상기 두 개의 랜덤 억세스 카메라 파라미터 사이에 위치한 카메라 파라미터의 값이 예측되는 경우의 실시예가 서술되고 있으나, 본 발명은 이에 한정되지 않는다. 예를 들어, 하나의 랜덤 억세스 카메라 파라미터가 부호화(및/또는 복호화)된 후에 바로 부호화(및/또는 복호화)되는 카메라 파라미터는 랜덤 억세스 카메라 파라미터가 아닐 수도 있다.

일 실시예로, 랜덤 억세스 카메라 파라미터를 제1 카메라 파라미터라 하고, 상기 랜덤 억세스 카메라 파라미터가 부호화(및/또는 복호화)된 후에 바로 부호화(및/또는 복호화)되는 카메라 파라미터를 제2 카메라 파라미터라 하고, POC 순서상 제1 카메라 파라미터와 제2 카메라 파라미터 사이에 위치하는 카메라 파라미터는 제3 카메라 파라미터라 한다. 이 때, 제2 카메라 파라미터에 대응하는 POC 값은 제1 카메라 파라미터에 대응하는 POC 값보다 클 수 있다.

상술한 바와 같이 제1 카메라 파라미터(랜덤 억세스 카메라 파라미터)에는 예측 차분 코딩 방식이 적용되지 않을 수 있다. 즉, 제1 카메라 파라미터의 경우에는, 그 값 자체가 부호화되어 전송될 수 있다.

이 때, 제2 카메라 파라미터는 상기 제1 카메라 파라미터를 기반으로 부호화/복호화될 수 있다. 일례로, 3D 비디오 부호화기 및 3D 비디오 복호화기는 제1 카메라 파라미터의 값을 제2 카메라 파라미터의 예측 값으로 결정할 수 있다. 예측 값을 기반으로 제2 카메라 파라미터를 부호화/복호화하는 과정은 상술한 실시예에서와 동일하므로, 여기서는 생략하기로 한다.

또한, 제3 카메라 파라미터는 제1 카메라 파라미터 및 제2 카메라 파라미터를 기반으로 부호화/복호화될 수 있다. 일례로, 3D 비디오 부호화기 및 3D 비디오 복호화기는 제1 카메라 파라미터 값 및 제2 카메라 파라미터 값의 선형 보간에 의해 제3 카메라 파라미터의 예측 값을 도출할 수 있다. 예측 값을 기반으로 제3 카메라 파라미터를 부호화/복호화하는 과정은 상술한 실시예에서와 동일하므로, 여기서는 생략하기로 한다.

도 7은 서로 인접한 두 개의 랜덤 억세스 카메라 파라미터를 기반으로, POC 순서상 상기 두 개의 랜덤 억세스 카메라 파라미터 사이에 위치한 카메라 파라미터의 값이 예측되는 경우의 실시예를 도시한다.

도 7을 참조하면, POC 값이 0인 카메라 파라미터(Z_n,poc=0, 710) 및 POC 값이 8인 카메라 (Z_n,poc=8, 720) 파라미터는 랜덤 억세스 카메라 파라미터에 해당될 수 있다. 일례로, 3D 비디오 부호화기는 POC 값이 0인 카메라 파라미터(710)를 부호화한 후에 POC 값이 8인 카메라 파라미터(720)를 부호화할 수 있다. 이 경우에는, 예측 차분 코딩 방식이 적용되지 않을 수 있으며, 상기 두 개의 랜덤 억세스 카메라 파라미터는 그 값 자체로 부호화될 수 있다.

또한, 도 7의 실시예에서는, 상기 두 개의 랜덤 억세스 카메라 파라미터(710, 720)의 부호화 후에, POC 값이 4인 카메라 파라미터(Z_n,poc=4, 730)가 부호화될 수 있다. 이 때, 상기 카메라 파라미터(730)의 예측 값(Z_n,poc=4’, 740)은 두 개의 랜덤 억세스 카메라 파라미터 값(710, 720)의 선형 보간에 의해 도출될 수 있다. 3D 비디오 부호화기는 실제 카메라 파라미터 값(730) 및 예측된 카메라 파라미터 값(740) 간의 차이 값에 해당하는 잔차 카메라 파라미터 값(Z_n,poc=4,diff)을 부호화하여 복호화기로 전송할 수 있다. POC 값이 4인 카메라 파라미터(730)에 대한 잔차 카메라 파라미터 값은 다음 수학식 4에 의해 계산될 수 있다.

[수학식 4]

Z_n,poc=4,diff = Z_n,poc=4 - Z_n,poc=4’

3D 비디오 복호화기는 부호화된 랜덤 억세스 카메라 파라미터를 수신하여 복호화함으로써, 랜덤 억세스 카메라 파라미터 값을 도출할 수 있다. 일례로, 도 7의 실시예에서 3D 비디오 복호화기는 0의 POC 값에 대응하는 랜덤 억세스 카메라 파라미터(710)를 복호화한 후에 8의 POC 값에 대응하는 랜덤 억세스 카메라 파라미터(720)를 복호화할 수 있다. 이 경우에는, 예측 차분 코딩 방식이 적용되지 않을 수 있으며, 상기 두 개의 랜덤 억세스 카메라 파라미터 값(710, 720)은 예측 과정 없이도 도출될 수 있다.

또한, 도 7의 실시예에서는, 두 개의 랜덤 억세스 카메라 파라미터(710, 720)가 복호화된 후에, 4의 POC 값에 대응하는 카메라 파라미터(730)가 복호화될 수 있다. 이 때, 상기 카메라 파라미터(730)의 예측 값(740)은 두 개의 랜덤 억세스 카메라 파라미터 값(710, 720)의 선형 보간에 의해 도출될 수 있다. 한편, 상술한 바와 같이, 3D 비디오 부호화기는 부호화된 잔차 카메라 파라미터(Z_n,poc=4,diff)를 복호화기로 전송할 수 있다. 3D 비디오 복호화기는 전송된 정보를 수신하여 복호화함으로써, 잔차 카메라 파라미터 값(Z_n,poc=4,diff)을 도출할 수 있다. 이 때, 3D 비디오 복호화기는 예측된 카메라 파라미터 값(740)에 잔차 카메라 파라미터 값을 더함으로써, 복호화 대상 카메라 파라미터에 대응하는 실제 카메라 파라미터 값(730)을 도출할 수 있다. 이는 다음 수학식 5와 같이 나타내어질 수 있다.

[수학식 5]

Z_n,poc=4 = Z_n,poc=4’+ Z_n,poc=4,diff

상술한 카메라 파라미터 부호화/복호화 방식은 POC 값이 4인 카메라 파라미터 뿐만 아니라, 1, 2, 3, 5, 6 및 7의 POC 값에 대응하는 카메라 파라미터에도 동일한 방식으로 적용될 수 있다.

한편, 상술한 실시예에서는 랜덤 억세스 카메라 파라미터들이 모두 그 값 자체로 부호화되지만, 본 발명은 이에 한정되는 것은 아니다. 일례로, POC가 0이 아닌 랜덤 억세스 카메라 파라미터들은 예측 차분 코딩 방식을 기반으로 부호화될 수도 있다. 이 때, 상기 랜덤 억세스 카메라 파라미터에 대한 예측은 POC 순서상 상기 랜덤 억세스 카메라 파라미터에 가장 가까이 위치한 이전 랜덤 억세스 카메라 파라미터를 기반으로 수행될 수 있다.

상술한 바와 같이, 시변 파라미터의 값은 시간에 따라 변화할 수 있으므로, 영상에 할당된 POC 값에 따라 상기 영상에 대응하는 시변 파라미터의 값도 달라질 수 있다. 도 8은 0에서 8까지의 POC 값 각각에 대응하는 시변 파라미터의 값을 도시한다. 도 8의 실시예에서는 전송되는 시변 파라미터가 근접 클리핑 파라미터(Zn)인 경우에 대해 서술되나, 본 발명은 이에 한정되지 않는다. 즉, 도 8의 실시예에 따른 예측 차분 코딩 방식은 근접 클리핑 파라미터(Zn)가 아닌 다른 시변 파라미터에도 동일한 방식으로 적용될 수 있다.

한편, 도 8의 실시예에서 픽쳐의 인트라 주기는 8이라 가정한다. 즉, 도 8에서는 복수의 픽쳐가 출력 순서에 따라 배열된 영상 시퀀스 내에서 8개의 픽쳐마다 한 개의 랜덤 억세스 픽쳐가 위치할 수 있다.

또한, 도 8의 실시예에서 POC 값이 0인 픽쳐는 영상 시퀀스의 시작 시점에 위치하는 픽쳐일 수 있고, 랜덤 억세스 픽쳐에 해당될 수 있다. 여기서, 인트라 주기는 8이므로, 상기 랜덤 억세스 픽쳐에 가장 가까이 위치한 다음 랜덤 억세스 픽쳐는, POC 값이 8인 픽쳐일 수 있다. 도 8에서 인트라 주기는 8이고 POC 값이 0인 픽쳐는 랜덤 억세스 픽쳐에 해당되므로, (할당된 POC값 % 8)의 값이 0인 픽쳐는 랜덤 억세스 픽쳐로 볼 수 있다. POC 값이 0인 경우 (POC 값(0) % 8)의 값이 0이고, POC 값이 8인 경우 (POC 값(8) % 8)의 값이 0이므로, POC 값이 0인 픽쳐 및 POC 값이 8인 픽쳐는 랜덤 억세스 픽쳐에 해당될 수 있다.

도 6에서 상술한 바와 같이, 로우 딜레이 구조에서는 픽쳐의 출력 순서 및 부호화/복호화 순서가 서로 동일할 수 있다. 따라서, 로우 딜레이 구조에서는 일례로, 픽쳐의 출력 순서와 동일한 순서로 픽쳐들이 부호화되거나 및/또는 복호화될 수 있다. 이 경우, 모든 픽쳐가 복호화 후에 바로 출력될 수 있으므로 계층적 B 구조에 비해 딜레이가 적게 발생할 수 있다.

로우 딜레이 구조에서, 3D 비디오 부호화기는 0의 POC 값에 대응하는 카메라 파라미터에 예측 차분 코딩 방식을 적용하지 않을 수 있다. 즉, 복수의 픽쳐가 출력 순서에 따라 배열된 영상 시퀀스의 첫 번째 픽쳐에 대응하는 카메라 파라미터에는, 예측 차분 코딩 방식이 적용되지 않을 수 있다. 따라서, 0의 POC 값에 대응하는 카메라 파라미터의 경우에는, 그 값 자체가 부호화되어 전송될 수 있다. 또한, 로우 딜레이 구조에서는 계층적 B 구조에서와 마찬가지로 모든 랜덤 억세스 픽쳐에 대해 예측 차분 코딩 방식이 적용되지 않을 수도 있다. 이는 랜덤 억세스 카메라 파라미터가 POC 순서상 상기 카메라 파라미터 이전에 위치하는 카메라 파라미터를 참조하지 않도록 함으로써, 랜덤 억세스가 가능하도록 하기 위함이다.

POC 값 0에 대응하는 카메라 파라미터가 부호화된 후, 3D 비디오 부호화기는 POC 순서상 상기 카메라 파라미터 다음에 위치하는 카메라 파라미터들 각각에 대해, 예측 차분 코딩 방식을 기반으로 부호화를 수행할 수 있다.

일 실시예로, 하나의 인트라 주기에 포함되는 N개의 카메라 파라미터들은 {p₀, p₁, …, p_n,…, p_N-1}을 포함할 수 있다(N은 양의 정수이고, n은 0 이상 N-1 이하의 정수임). 여기서, p_n은 POC 값 n에 대응되는 카메라 파라미터를 의미할 수 있으며, p₀는 랜덤 억세스 카메라 파라미터에 해당될 수 있다. 후술되는 실시예들은 랜덤 억세스 카메라 파라미터가 0의 POC 값을 갖는 경우를 기준으로 서술되지만, 본 발명은 이에 한정되지 않는다. 예를 들어, 후술되는 실시예들은 0이 아닌 다른 POC 값(예를 들어, N, 2N 등)을 갖는 랜덤 억세스 카메라 파라미터를 포함하는 인트라 주기에 대해서도, 동일하거나 유사한 방식으로 적용될 수 있다. 이 경우, 상기 인트라 주기에 포함되는 N개의 카메라 파라미터들은 {p_kN, p_kN+1, …, p_m,…, p_(k+1)N-1}로 나타내어질 수 있고(N은 양의 정수이고, k는 0 이상의 정수이고, m은 kN 이상 (k+1)N-1 이하의 정수임), p_kN은 랜덤 억세스 카메라 파라미터에 해당될 수 있다. 여기서, m은 kN+n에 해당되므로, 후술되는 실시예들이 p_n에 적용되는 경우에는 p_n+kN에 대해서도 동일한 방식으로 적용될 수 있다.

POC 값 1에 대응되는 카메라 파라미터(p₁)에 대한 부호화 과정은 POC 값 0을 갖는 카메라 파라미터(p₀)를 기반으로 수행될 수 있다. 이 때, 3D 비디오 부호화기는 카메라 파라미터 p₀의 값을, 카메라 파라미터 p₁의 예측 값으로 결정할 수 있다. 카메라 파라미터 p₁의 예측 값이 결정되면, 3D 비디오 부호화기는 카메라 파라미터 p₁의 원본 값 및 카메라 파라미터 p₁의 예측 값의 차분에 의해, 카메라 파라미터 p₁에 대응하는 잔차 카메라 파라미터 값을 도출할 수 있다. 이 경우, 3D 비디오 부호화기는 상기 잔차 카메라 파라미터를 부호화하여 복호화기로 전송할 수 있다.

또한, 2 이상의 POC 값을 갖는 카메라 파라미터(p_n, 여기서, n은 2 이상의 정수임)에 대한 부호화 과정은 상기 카메라 파라미터(p_n)보다 작은 POC 값을 갖는 복수의 카메라 파라미터를 기반으로 수행될 수 있다. 즉, 카메라 파라미터 p_n의 값은 카메라 파라미터 p_n 보다 작은 POC 값을 갖는 복수의 카메라 파라미터를 기반으로 예측될 수 있다.

일례로, 카메라 파라미터 p_n의 예측 값은 카메라 파라미터 p_n-2및 카메라 파라미터 p_n-1의 선형 보간에 의해 결정될 수 있다. 다른 예로, 카메라 파라미터 p_n의 예측 값은 카메라 파라미터 p₀(카메라 파라미터 p_n 에 대응하는 POC 값에 관계 없이 POC 값 0을 갖는 카메라 파라미터가 사용됨) 및 카메라 파라미터 p_n-1의 선형 보간에 의해 결정될 수 있다. 또 다른 예로, 카메라 파라미터 p_n의 예측 값은 카메라 파라미터 p₀ 및 카메라 파라미터 p₁의 선형 보간에 의해 결정될 수 있다. 이 경우에는, 카메라 파라미터 p_n에 대응하는 POC 값에 관계 없이, 카메라 파라미터 p₀ 및 카메라 파라미터 p₁이 카메라 파라미터 p_n의 예측에 사용될 수 있다.

카메라 파라미터 p_n의 예측 값이 결정되면, 3D 비디오 부호화기는 카메라 파라미터 p₁의 원본 값 및 카메라 파라미터 p₁의 예측 값의 차분에 의해, 카메라 파라미터 p₁에 대응하는 잔차 카메라 파라미터 값을 도출할 수 있다. 이 경우, 3D 비디오 부호화기는 상기 잔차 카메라 파라미터를 부호화하여 복호화기로 전송할 수 있다.

3D 비디오 복호화기는 부호화된 카메라 파라미터 p₀를 수신하여 복호화함으로써, 카메라 파라미터 p₀의 값을 도출할 수 있다. 상술한 바와 같이, 카메라 파라미터 p₀에는 예측 차분 코딩 방식이 적용되지 않으므로, 3D 비디오 복호화기는 예측 과정 수행 없이도 카메라 파라미터 p₀의 값을 복원할 수 있다.

카메라 파라미터 p₀가 복호화된 후, 3D 비디오 복호화기는 POC 순서상 상기 카메라 파라미터 p₀ 다음에 위치하는 카메라 파라미터들 각각에 대해, 예측 차분 코딩 방식을 기반으로 복호화를 수행할 수 있다.

카메라 파라미터 p₁에 대한 복호화 과정은 이미 복호화된 카메라 파라미터 p₀를 기반으로 수행될 수 있다. 이 때, 3D 비디오 복호화기는 카메라 파라미터 p₀의 값을, 카메라 파라미터 p₁의 예측 값으로 결정할 수 있다. 한편, 3D 비디오 복호화기는 부호화기로부터 부호화된 잔차 카메라 파라미터 정보를 수신할 수 있다. 3D 비디오 복호화기는 수신된 정보를 복호화함으로써, 카메라 파라미터 p₁에 대응하는 잔차 카메라 파라미터 값을 도출할 수 있다. 이 때, 3D 비디오 복호화기는 카메라 파라미터 p₁의 예측 값 및 카메라 파라미터 p₁에 대응하는 잔차 카메라 파라미터 값을 더함으로써, 카메라 파라미터 p₁의 값을 결정할 수 있다.

또한, 2 이상의 POC 값을 갖는 카메라 파라미터(p_n, 여기서, n은 2 이상의 정수임)에 대한 복호화 과정은 상기 카메라 파라미터(p_n)보다 작은 POC 값을 갖는 이미 복호화된 복수의 카메라 파라미터를 기반으로 수행될 수 있다. 즉, 카메라 파라미터 p_n의 값은 카메라 파라미터 p_n 보다 작은 POC 값을 갖는 복수의 카메라 파라미터를 기반으로 예측될 수 있다. 이 때, 3D 비디오 복호화기는 부호화기에서와 동일한 방식으로 예측을 수행함으로써, 카메라 파라미터 p_n의 예측 값을 결정할 수 있다. 카메라 파라미터 p_n의 예측 방식의 실시예들은 상술한 바 있으므로, 여기서는 생략하기로 한다.

한편, 상술한 바와 같이, 3D 비디오 복호화기는 부호화기로부터 부호화된 잔차 카메라 파라미터 정보를 수신할 수 있다. 3D 비디오 복호화기는 수신된 정보를 복호화함으로써, 카메라 파라미터 p_n에 대응하는 잔차 카메라 파라미터 값을 도출할 수 있다. 이 때, 3D 비디오 복호화기는 카메라 파라미터 p_n의 예측 값 및 카메라 파라미터 p_n에 대응하는 잔차 카메라 파라미터 값을 더함으로써, 카메라 파라미터 p_n의 값을 결정할 수 있다.

도 8을 참조하면, 3D 비디오 부호화기는 POC 값 0에 대응하는 카메라 파라미터(Z_n,poc=0, 810)를 부호화할 수 있다. 이 경우에는, 예측 차분 코딩 방식이 적용되지 않을 수 있으며, 상기 카메라 파라미터(810)는 그 값 자체로 부호화되어 전송될 수 있다.

또한, 도 8의 실시예에서는, POC 값 0에 대응하는 카메라 파라미터(810)가 부호화된 후에, POC 값 1에 대응하는 카메라 파라미터(Z_n,poc=1, 820)가 부호화될 수 있다. 이 때, 3D 비디오 부호화기는 POC 값 0에 대응하는 카메라 파라미터(810)의 값을 POC 값 1에 대응하는 카메라 파라미터의 예측 값(Z_n,poc=1’, 830)으로 결정할 수 있다. 또한, 3D 비디오 부호화기는 POC 값 1에 대응하는 카메라 파라미터(820)의 원본 값 및 예측된 카메라 파라미터 값(830) 간의 차이 값에 해당하는 잔차 카메라 파라미터 값(Z_n,poc=1,diff)을 부호화하여 복호화기로 전송할 수 있다. POC 값 1을 갖는 카메라 파라미터(820)에 대응하는 잔차 카메라 파라미터 값은, 다음 수학식 6에 의해 계산될 수 있다.

[수학식 6]

Z_n,poc=1,diff = Z_n,poc=1 - Z_n,poc=1’

또한, 도 8의 실시예에서는, POC 값 1에 대응하는 카메라 파라미터(820)가 부호화된 후에, POC 값 2에 대응하는 카메라 파라미터(Z_n,poc=2, 840)가 부호화될 수 있다. 이 때, 상기 카메라 파라미터의 예측 값(Z_n,poc=2’, 850)은 POC 값 0을 갖는 카메라 파라미터(810) 및 POC 값 1을 갖는 카메라 파라미터(820)의 선형 보간에 의해 도출될 수 있다. 3D 비디오 부호화기는 POC 값 2에 대응하는 카메라 파라미터(840)의 원본 값 및 예측된 카메라 파라미터 값(850) 간의 차이 값에 해당하는 잔차 카메라 파라미터 값(Z_n,poc=2,diff)을 부호화하여 복호화기로 전송할 수 있다. POC 값 2를 갖는 카메라 파라미터(840)에 대응하는 잔차 카메라 파라미터 값은, 다음 수학식 7에 의해 계산될 수 있다.

[수학식 7]

Z_n,poc=2,diff = Z_n,poc=2 - Z_n,poc=2’

3D 비디오 복호화기는 부호화된 카메라 파라미터를 수신하여 복호화함으로써, 카메라 파라미터의 값을 도출할 수 있다. 일례로, 도 8의 실시예에서 3D 비디오 복호화기는 POC 값 0에 대응하는 카메라 파라미터(810)를 복호화할 수 있다. 이 경우에는, 예측 차분 코딩 방식이 적용되지 않을 수 있으며, POC 값 0에 대응하는 카메라 파라미터(810)의 값은 예측 과정 없이도 도출될 수 있다.

또한, 도 8의 실시예에서는, POC 값 0을 갖는 카메라 파라미터(810)가 복호화된 후에, POC 값 1을 갖는 카메라 파라미터(820)가 복호화될 수 있다. 이 경우에는, 이미 복호화된 카메라 파라미터 Z_n,poc=0(810)만이 예측에 사용될 수 있다. 이 때, 3D 비디오 복호화기는 상기 복호화된 카메라 파라미터(810)의 값을 POC 값 1에 대응하는 카메라 파라미터의 예측 값(Z_n,poc=1’, 830)으로 결정할 수 있다. 한편, 상술한 바와 같이, 3D 비디오 부호화기는 부호화된 잔차 카메라 파라미터(Z_n,poc=1,diff)를 복호화기로 전송할 수 있다. 3D 비디오 복호화기는 전송된 정보를 수신하여 복호화함으로써, 잔차 카메라 파라미터 값(Z_n,poc=1,diff)을 도출할 수 있다. 이 때, 3D 비디오 복호화기는 예측된 카메라 파라미터 값(830)에 잔차 카메라 파라미터 값을 더함으로써, POC 값 1에 대응하는 실제 카메라 파라미터(820)의 값을 도출할 수 있다. 이는 다음 수학식 8과 같이 나타내어질 수 있다.

[수학식 8]

Z_n,poc=1 = Z_n,poc=1’+ Z_n,poc=1,diff

또한, 도 8의 실시예에서는, POC 값 1을 갖는 카메라 파라미터(820)가 복호화된 후에, POC 값 2를 갖는 카메라 파라미터(840)가 복호화될 수 있다. 이 때, 상기 카메라 파라미터의 예측 값(Z_n,poc=2’, 850)은 POC 값 0을 갖는 카메라 파라미터(810) 및 POC 값 1을 갖는 카메라 파라미터(820)의 선형 보간에 의해 도출될 수 있다. 한편, 상술한 바와 같이, 3D 비디오 부호화기는 부호화된 잔차 카메라 파라미터(Z_n,poc=2,diff)를 복호화기로 전송할 수 있다. 3D 비디오 복호화기는 전송된 정보를 수신하여 복호화함으로써, POC 값 2에 대응되는 잔차 카메라 파라미터 값(Z_n,poc=2,diff)을 도출할 수 있다. 이 때, 3D 비디오 복호화기는 예측된 카메라 파라미터 값(850)에 잔차 카메라 파라미터 값을 더함으로써, POC 값 2에 대응하는 실제 카메라 파라미터(840)의 값을 도출할 수 있다. 이는 다음 수학식 9과 같이 나타내어질 수 있다.

[수학식 9]

Z_n,poc=2 = Z_n,poc=2’+ Z_n,poc=2,diff

상술한 카메라 파라미터 부호화/복호화 방식은 POC 값이 2보다 큰 다른 시변 파라미터에 대해서도 동일하거나 유사한 방식으로 적용될 수 있다.

한편, 상술한 실시예들에서와 같이, 카메라 파라미터(시변 파라미터) 부호화/복호화에 예측 차분 코딩 방식이 적용되는 경우, 3D 비디오 부호화기는 시변 파라미터에 관련된 정보를 복호화기로 전송할 필요가 있다. 시변 파라미터에 관련된 정보는 SPS(Sequence Parameter set), PPS(Picture Parameter set) 및/또는 슬라이스 헤더(slice header)에 포함되어 비트 스트림을 통해 3D 비디오 복호화기로 전송될 수 있다.

3D 비디오 부호화기에서 3D 비디오 복호화기로 전송되는 시변 파라미터 관련 정보에는, 예를 들어 시변 파라미터 플래그 정보, 시변 파라미터 예측 플래그 정보, 제1 개수 정보, 시변 파라미터 ID 정보, 제2 개수 정보 및 전송 값 정보 등이 있을 수 있다. 이하, 상술한 각각의 정보에 대한 구체적인 실시예들이 서술된다.

시변 파라미터 플래그 정보는 현재 시퀀스에 시간에 따라 변화하는 시변 파라미터가 존재하는지 여부를 지시할 수 있다. 일례로, 상기 시변 파라미터 플래그 정보는 varying_camera_parameter_flag로 나타내어질 수 있다. 여기서, varying_camera_parameter_flag에 0이 할당되면, 상기 플래그는 현재 시퀀스에 시변 파라미터가 존재함을 나타낼 수 있다. 또한, varying_camera_parameter_flag에 1이 할당되면, 상기 플래그는 현재 시퀀스에 시변 파라미터가 존재하지 않음을 나타낼 수 있다.

시변 파라미터 예측 플래그 정보는, 시변 파라미터에 대해 예측이 수행되는지 여부를 지시할 수 있다. 시변 파라미터에 대해 예측이 수행되지 않는 경우, 3D 비디오 부호화기는 상기 시변 파라미터의 값이 변할 때마다 변화된 시변 파라미터 값 자체를 3D 비디오 복호화기로 전송할 수 있다. 그러나, 3D 비디오 부호화기는 시변 파라미터의 값이 바로 이전에 전송된 시변 파라미터와 동일할 때에는, 즉 시변 파라미터의 값이 변하지 않을 때에는 해당 시변 파라미터의 값을 전송하지 않을 수도 있다. 슬라이스 및/또는 픽쳐에 대응하는 시변 파라미터의 값이 전송되지 않는 경우, 3D 비디오 복호화기는 이전에 전송된 시변 파라미터 값 중에서 가장 최근에 전송된 값을 상기 슬라이스 및/또는 상기 픽쳐에 대응하는 시변 파라미터 값으로 사용할 수 있다. 시변 파라미터에 대해 예측이 수행되는 경우에는, 상기 시변 파라미터에 대해 상술한 예측 차분 코딩 방식을 기반으로 부호화/복호화가 수행될 수 있다. 시변 파라미터에 대해 예측 차분 코딩 방식 기반의 부호화/복호화가 수행되는 경우, 복원된 파라미터 값이 예측을 위해 저장되어야 하므로, 참조 픽쳐 리스트에서 사용되는 것과 같은 메모리 구조가 사용될 수 있다.

일례로, 상기 시변 파라미터 예측 플래그는 predict_varying_camera_parameter_flag로 나타내어질 수 있다. 여기서, predict_varying_camera_parameter_flag에 0이 할당되면, 상기 플래그는 시변 파라미터에 대해 예측이 수행됨을 나타낼 수 있다. 또한, varying_camera_parameter_flag에 1이 할당되면, 상기 플래그는 시변 파라미터에 대해 예측이 수행되지 않음을 나타낼 수 있다.

시변 파라미터 관련 정보 중에서 제1 개수 정보는, 시변 파라미터에 해당되는 카메라 파라미터 타입이 몇 개인지를 지시할 수 있다. 여기서, 시변 파라미터에 해당될 수 있는 카메라 파라미터 타입에는, 3x1 이동 벡터(T)에서 X축 이동 거리(Tx), 근접 클리핑 파라미터(Zn) 및 원거리 클리핑 파라미터(Zf) 등이 있을 수 있다. 일 실시예로, 상기 제1 개수 정보는 num_varying_camera_parameter로 나타내어질 수 있다. 예를 들어, 카메라 파라미터 중에서 근접 클리핑 파라미터(Zn)만이 시변 파라미터에 해당되는 경우, num_varying_camera_parameter에는 1이 할당될 수 있다.

또한, 시변 파라미터 관련 정보 중에서 시변 파라미터 ID 정보는 시변 파라미터가 어떤 카메라 파라미터 타입에 해당되는지를 지시할 수 있다. 일례로, 상기 시변 파라미터 ID 정보는 varying_camera_parameter_id로 나타내어질 수 있다. 이 때, 카메라 파라미터 타입에 따라 상기 varying_camera_parameter_id에 할당되는 값은, 일 실시예로 다음 표 1과 같이 정해질 수 있다.

[표 1]

표 1의 실시예를 참조하면, 시변 파라미터가 근접 클리핑 파라미터(Zn)에 해당되는 경우, 상기 시변 파라미터에 대응하는 시변 파라미터 ID에는 0이 할당될 수 있다. 또한, 시변 파라미터가 원거리 클리핑 파라미터(Zf)에 해당되는 경우, 상기 시변 파라미터에 대응하는 시변 파라미터 ID에는 1이 할당될 수 있다. 그리고, 시변 파라미터가 3x1 이동 벡터의 X축 이동 거리(Tx)에 해당되는 경우, 상기 시변 파라미터에 대응하는 시변 파라미터 ID에는 2가 할당될 수 있다.

상술한 시변 파라미터 플래그 정보, 시변 파라미터 예측 플래그 정보, 제1 개수 정보 및 시변 파라미터 ID 정보는 일 실시예로, SPS에 포함되어 3D 비디오 부호화기에서 3D 비디오 복호화기로 전송될 수 있다. SPS에서 정의되는 카메라 관련 정보의 실시예는 다음 표 2와 같이 나타내어질 수 있다.

[표 2]

표 2의 실시예를 참조하면, SPS에 포함된 시변 파라미터 플래그 정보가 현재 시퀀스에 시변 파라미터가 존재함을 지시하는 경우, 시변 파라미터 예측 플래그 정보, 제1 개수 정보 및 시변 파라미터 ID 정보가 추가로 SPS에 포함되어 복호화기로 전송될 수 있다. 따라서, 시변 파라미터 플래그 정보가 현재 시퀀스에 시변 파라미터가 존재함을 지시하는 경우, 시변 파라미터 관련 정보는 시변 파라미터 예측 플래그 정보, 제1 개수 정보 및 시변 파라미터 ID 정보를 더 포함할 수 있다. 반면, 시변 파라미터 플래그 정보가 현재 시퀀스에 시변 파라미터가 존재하지 않음을 지시하는 경우, 시변 파라미터 예측 플래그 정보, 제1 개수 정보 및 시변 파라미터 ID 정보는 복호화기로 전송되지 않을 수 있다.

한편, 상술한 시변 파라미터 관련 정보 중에서 제2 개수 정보는 현재 슬라이스(또는 현재 픽쳐)에서 전송되는 시변 파라미터(및/또는 상기 시변 파라미터에 대응하는 전송 값)의 개수를 지시할 수 있다. 여기서, 상기 현재 슬라이스(또는 현재 픽쳐)는 상술한 현재 시퀀스에 속한 슬라이스(또는 픽쳐)일 수 있다.

또한, 상술한 시변 파라미터 관련 정보 중에서 전송 값 정보는 부호화기에서 복호화기로 전송되는 전송 값을 지시할 수 있다. 이 때, 상기 전송 값은 시변 파라미터의 값 자체에 해당될 수도 있고, 상기 시변 파라미터에 대응하는 차분 카메라 파라미터의 값일 수도 있다. 예를 들어, 도 7 및 도 8에서 상술한 바와 같이 시변 파라미터가 랜덤 억세스 카메라 파라미터에 해당되는 경우(예를 들어, ‘시변 파라미터에 대응하는 POC값 % 8’이 0인 경우)에는 예측 차분 코딩 방식이 적용되지 않을 수 있으므로, 상기 시변 파라미터 값 자체가 그대로 부호화되어 전송될 수 있다. 또한, 시변 파라미터가 랜덤 억세스 카메라 파라미터에 해당되지 않는 경우(예를 들어, ‘시변 파라미터에 대응하는 POC값 % 8’이 0이 아닌 경우)에는, 예측 차분 코딩 방식이 적용될 수 있으므로, 시변 파라미터에 대응하는 차분 카메라 파라미터 값이 부호화되어 전송될 수 있다.

상기 전송 값 정보는, 일례로 precision, sign, exponent, mantissa 네 개의 신택스(syntax)에 의해 나타내어질 수 있다. 상기 네 개의 신택스는 전송 값을 부동 소수점(floating point) 형태로 나타낼 수 있다.

여기서, precision은 부호화기에서 복호화기로 전송되는 전송 값의 정확도를 지시할 수 있다. 예를 들어, precision에 할당된 값이 x인 경우에는 ‘2^(-x)’이 에러의 최대값에 해당될 수 있다. 또한, sign은 상기 전송 값이 양수인지 또는 음수인지를 지시할 수 있다. 그리고 상기 신택스 exponent 및 mantissa는 각각 부동 소수점 형태로 나타내어진 값에서, 지수부 및 가수부를 나타낼 수 있다.

상술한 제2 개수 정보 및 전송 값 정보는 일 실시예로, 슬라이스 헤더에 포함되어 3D 비디오 부호화기에서 3D 비디오 복호화기로 전송될 수 있다. 슬라이스 헤더에서 정의되는 카메라 관련 정보의 실시예는 다음 표 3과 같이 나타내어질 수 있다.

[표 3]

표 3의 실시예에서, parameter_id는 전송 값에 대응하는 카메라 파라미터 타입을 지시할 수 있다. 카메라 파라미터 타입에 따라 상기 parameter_id에 할당되는 값은, 일례로 상술한 표 1의 실시예에서 varying_camera_parameter_id에 할당되는 값과 동일하게 정해질 수 있다.

상술한 시변 파라미터 관련 정보의 실시예에서, 각각의 정보의 명칭 및 각각의 정보에 할당되는 값들은 임의적인 것으로서 변할 수 있으며, 변형된 실시예들도 상술한 실시예에서 서술된 내용과 실질적으로 동일한 기술적 사상에 해당되는 것이라면, 본 발명의 권리 범위에 포함된다 할 것이다.

도 9를 참조하면, 3D 비디오 부호화기는 카메라 파라미터에 대응하는 전송 값을 도출할 수 있다(S910). 카메라 파라미터가 시간에 따라 변하는 값을 갖는 시변 파라미터인 경우, 3D 비디오 부호화기는 예측 차분 코딩 방식을 기반으로 상기 카메라 파라미터에 대응하는 전송 값을 도출할 수 있다.

일례로, 상기 카메라 파라미터가 랜덤 억세스 카메라 파라미터에 해당되는 경우, 3D 비디오 부호화기는 상기 카메라 파라미터 값 자체를 전송 값으로 결정할 수 있다. 또한, 상기 카메라 파라미터가 랜덤 억세스 카메라 파라미터에 해당되지 않는 경우, 3D 비디오 부호화기는 상기 카메라 파라미터에 대한 예측을 수행함으로써, 카메라 파라미터의 예측 값을 도출할 수 있다. 이 때, 3D 비디오 부호화기는 카메라 파라미터의 원본 값 및 예측된 카메라 파라미터 값의 차이 값에 해당되는 잔차 카메라 파라미터 값을 도출할 수 있고, 상기 도출된 잔차 카메라 파라미터 값을 전송 값으로 결정할 수 있다. 이 때, 전송 값 도출 방식은 상기 카메라 파라미터에 대응하는 영상의 코딩 구조에 따라 달라질 수 있다.

전송 값 도출 방식에 대한 구체적인 실시예는 도 7 및 도 8에서 상술한 바 있으므로, 여기서는 생략하기로 한다.

다시 도 9를 참조하면, 3D 비디오 부호화기는 카메라 파라미터에 대응하는 시변 파라미터 관련 정보를 생성할 수 있다(S920). 시변 파라미터 관련 정보에는, 예를 들어 시변 파라미터 플래그 정보, 시변 파라미터 예측 플래그 정보, 제1 개수 정보, 시변 파라미터 ID 정보 및 제2 개수 정보 등이 있을 수 있다. 또한, 시변 파라미터 관련 정보는 카메라 파라미터에 대해 도출된 전송 값을 나타내는 정보도 포함할 수 있다. 시변 파라미터 관련 정보에 대한 구체적인 실시예는 상술하였으므로, 여기서는 생략하기로 한다.

시변 파라미터 관련 정보가 생성되면, 3D 비디오 부호화기는 생성된 정보를 부호화하여, 3D 비디오 복호화기로 전송할 수 있다(S930).

도 10을 참조하면, 3D 비디오 복호화기는 부호화된 시변 파라미터 관련 정보를 수신하여 복호화할 수 있다(S1010). 여기서 시변 파라미터 관련 정보는 복호화 대상 카메라 파라미터에 대응하는 전송 값 정보 등을 포함할 수 있다. 시변 파라미터 관련 정보의 구체적인 실시예는 상술한 바 있으므로, 여기서는 생략하기로 한다.

다시 도 10을 참조하면, 3D 비디오 복호화기는 복호화된 시변 파라미터 관련 정보를 기반으로 복호화 대상 카메라 파라미터에 대응하는 카메라 파라미터 값(복원된 카메라 파라미터 값)을 도출할 수 있다(S1020). 상기 복호화 대상 카메라 파라미터가 시간에 따라 변하는 값을 갖는 시변 파라미터인 경우, 3D 비디오 복호화기는 예측 차분 코딩 방식을 기반으로 상기 복호화 대상 카메라 파라미터에 대응하는 카메라 파라미터 값을 도출할 수 있다.

일례로, 복호화 대상 카메라 파라미터가 랜덤 억세스 카메라 파라미터에 해당되는 경우, 복호화된 전송 값 자체가 카메라 파라미터의 복원 값으로 결정될 수 있다. 또한, 복호화 대상 카메라 파라미터가 랜덤 억세스 카메라 파라미터에 해당되지 않는 경우, 복호화된 전송 값은 카메라 파라미터의 잔차 값에 해당될 수 있다. 이 때, 3D 비디오 복호화기는 복호화 대상 카메라 파라미터에 대한 예측을 수행하여 카메라 파라미터의 예측 값을 도출할 수 있고, 카메라 파라미터의 잔차 값과 카메라 파라미터의 예측 값을 더하여 카메라 파라미터의 복원 값을 도출할 수 있다. 이 때, 복원 값 도출 방식은 상기 카메라 파라미터에 대응하는 영상의 코딩 구조에 따라 달라질 수 있다.

복호화 대상 카메라 파라미터에 대응하는 복원 값 도출 방식의 구체적인 실시예는 도 7 및 도 8에서 상술한 바 있으므로, 여기서는 생략하기로 한다.

도 11은 본 발명에 따른 카메라 파라미터 부호화기 구성의 일 실시예를 개략적으로 나타내는 블록도이다. 도 11의 카메라 파라미터 부호화기(1100)는 카메라 파라미터 관련 정보 생성부(1110) 및 엔트로피 부호화부(1120)를 포함할 수 있다.

카메라 파라미터 관련 정보 생성부(1110)는 카메라 파라미터를 기반으로, 상기 카메라 파라미터에 대응하는 전송 값을 도출할 수 있다. 이 때, 상기 카메라 파라미터가 시변 파라미터에 해당되는 경우, 카메라 파라미터 관련 정보 생성부(1110)는 예측 차분 코딩 방식을 기반으로 상기 카메라 파라미터에 대응하는 전송 값을 도출할 수 있다. 예측 차분 코딩 방식의 구체적인 실시예는 상술한 바 있으므로, 여기서는 생략하기로 한다.

또한, 카메라 파라미터 관련 정보 생성부(1110)는 카메라 파라미터 관련 정보를 생성할 수 있다. 여기서, 카메라 파라미터 관련 정보는 상기 도출된 전송 값을 나타내는 정보를 포함할 수 있다. 또한, 상기 카메라 파라미터가 시변 파라미터에 해당되는 경우, 상기 카메라 파라미터 관련 정보는 상술한 시변 파라미터 플래그 정보, 시변 파라미터 예측 플래그 정보, 제1 개수 정보, 시변 파라미터 ID 정보 및 제2 개수 정보 등을 포함할 수 있다. 각각의 카메라 파라미터 관련 정보에 대한 구체적인 실시예는 상술한 바 있으므로, 여기서는 생략하기로 한다.

엔트로피 부호화부(1120)는 생성된 카메라 파라미터 관련 정보에 대한 엔트로피 부호화를 수행함으로써, 상기 카메라 파라미터에 대응하는 비트 스트림을 생성하여 출력할 수 있다.

도 12는 본 발명에 따른 카메라 파라미터 복호화기 구성의 일 실시예를 개략적으로 나타내는 블록도이다. 도 12의 카메라 파라미터 복호화기(1200)는 엔트로피 복호화부(1210) 및 카메라 파라미터 복원부(1220)를 포함할 수 있다.

엔트로피 복호화부(1210)는 카메라 파라미터에 대응하는 비트 스트림을 수신하여 엔트로피 복호화를 수행함으로써, 카메라 파라미터 관련 정보를 도출할 수 있다. 또한, 상기 카메라 파라미터가 시변 파라미터에 해당되는 경우, 상기 카메라 파라미터 관련 정보는 상술한 시변 파라미터 플래그 정보, 시변 파라미터 예측 플래그 정보, 제1 개수 정보, 시변 파라미터 ID 정보 및 제2 개수 정보 등을 포함할 수 있다. 각각의 카메라 파라미터 관련 정보에 대한 구체적인 실시예는 상술한 바 있으므로, 여기서는 생략한다.

카메라 파라미터 관련 정보는 카메라 파라미터 복원부(1220)에 입력되어, 카메라 파라미터의 복원에 사용될 수 있다. 카메라 파라미터 복원부(1220)는 카메라 파라미터 관련 정보를 기반으로, 복원된 카메라 파라미터 값을 도출할 수 있다. 이 때, 복호화 대상 카메라 파라미터가 시변 카메라 파라미터에 해당되는 경우, 카메라 파라미터 복원부(1220)는 예측 차분 코딩 방식을 기반으로 상기 복원된 카메라 파라미터 값을 도출할 수 있다. 예측 차분 코딩 방식의 구체적인 실시예는 상술한 바 있으므로, 여기서는 생략하기로 한다.

상술한 실시예에서, 방법들은 일련의 단계 또는 블록으로써 순서도를 기초로 설명되고 있지만, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 당업자라면 순서도에 나타낸 단계들이 배타적이지 않고, 다른 단계가 포함되거나 순서도의 하나 또는 그 이상의 단계가 본 발명의 범위에 영향을 미치지 않고 삭제될 수 있음을 이해할 수 있을 것이다.

상술한 실시예는 다양한 양태의 예시들을 포함한다. 다양한 양태들을 나타내기 위한 모든 가능한 조합을 기술할 수는 없지만, 해당 기술 분야의 통상의 지식을 가진 자는 다른 조합이 가능함을 인식할 수 있을 것이다. 따라서, 본 발명은 이하의 특허청구범위 내에 속하는 모든 다른 교체, 수정 및 변경을 포함한다고 할 것이다.

Claims

텍스쳐 영상(texture image) 및 깊이 영상(depth image)을 기반으로 3D 영상을 생성하는 3D 비디오 복호화 방법으로서,
카메라 파라미터 관련 정보를 포함하는 영상 정보를 수신하여 복호화하는 단계;
상기 복호화된 영상 정보를 기반으로, 서로 다른 POC(Picture Order Count) 값에 대응하는 복수의 카메라 파라미터 값을 도출하는 단계; 및
상기 복수의 카메라 파라미터 값 중에서 적어도 하나를 기반으로, 상기 텍스쳐 영상 및 상기 깊이 영상을 복원하는 단계를 포함하되,
상기 POC 값은 픽쳐의 출력 순서를 나타내는 값이고,
상기 복수의 카메라 파라미터 값 중에서 적어도 하나의 카메라 파라미터 값은, 이전에 도출된 하나 이상의 카메라 파라미터 값을 기반으로 예측을 수행함으로써 도출되는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 1항에 있어서,
상기 카메라 파라미터 관련 정보는 SPS(Sequence Parameter Set), PPS(Picture Parameter Set) 또는 슬라이스 헤더(slice header)에 포함되어 전송되는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 1항에 있어서,
상기 복수의 카메라 파라미터 값은, 시간에 따라 변화하는 값을 갖는 시변 파라미터(time varying parameter)에 할당되는 값인 것을 특징으로 하는 3D 비디오 복호화 방법.
제 3항에 있어서,
상기 시변 파라미터는 3x1 이동 벡터(translation vector)의 X축 이동 거리, 근접 클리핑 파라미터(near clipping parameter) 및 원거리 클리핑 파라미터(far clipping parameter) 중에서 적어도 하나를 포함하고,
상기 3x1 이동 벡터는, 공간상에서 카메라의 위치를 지정하기 위해 설정된 기준 좌표계를 기준으로 하여, 상기 카메라의 초점(focal point)을 원점으로 갖는 카메라 좌표계의 위치를 나타내는 카메라 파라미터이고,
상기 근접 클리핑 파라미터는, 상기 카메라가 촬영한 임의의 장면에서 가장 작은 깊이 값을 갖는 카메라 파라미터이고,
상기 원거리 클리핑 파라미터는, 상기 카메라가 촬영한 임의의 장면에서 가장 큰 깊이 값을 갖는 카메라 파라미터인 것을 특징으로 하는 3D 비디오 복호화 방법.
제 4항에 있어서,
상기 카메라 파라미터 관련 정보는, 복호화 대상 시퀀스에 상기 시변 파라미터가 존재하는지 여부를 지시하는 시변 파라미터 플래그 정보를 포함하고,
상기 시변 파라미터 플래그 정보가, 상기 복호화 대상 시퀀스에 상기 시변 파라미터가 존재하지 않음을 지시하는 경우,
상기 복수의 카메라 파라미터 값 도출 단계에서는,
상기 예측을 수행하지 않는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 5항에 있어서,
상기 시변 파라미터 플래그 정보가, 상기 복호화 대상 시퀀스에 상기 시변 파라미터가 존재함을 지시하는 경우,
상기 카메라 파라미터 관련 정보는, 상기 시변 파라미터에 대해 예측이 수행되는지 여부를 지시하는 시변 파라미터 예측 플래그 정보를 더 포함하고,
상기 시변 파라미터 예측 플래그 정보가, 상기 시변 파라미터에 대해 예측이 수행되지 않음을 지시하는 경우,
상기 복수의 카메라 파라미터 값 도출 단계에서는,
상기 예측을 수행하지 않는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 5항에 있어서,
상기 시변 파라미터 플래그 정보가, 상기 복호화 대상 시퀀스에 상기 시변 파라미터가 존재함을 지시하는 경우,
상기 카메라 파라미터 관련 정보는,
상기 시변 파라미터가 상기 3x1 이동 벡터의 X축 이동 거리, 상기 근접 클리핑 파라미터 및 상기 원거리 클리핑 파라미터 중에서 어떤 카메라 파라미터 타입에 해당되는지를 지시하는 시변 파라미터 ID 정보를 포함하고,
상기 복수의 카메라 파라미터 값 도출 단계에서는,
상기 시변 파라미터 ID 정보를 기반으로 상기 복수의 카메라 파라미터 값을 도출하는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 1항에 있어서,
상기 텍스쳐 영상 및 상기 깊이 영상의 코딩 구조는 계층적 B 구조(hierarchical B structure)이고,
상기 복수의 카메라 파라미터 값은, 각각 랜덤 억세스 포인트(random access point)의 POC 값에 대응하는 복수의 랜덤 억세스 카메라 파라미터 값을 포함하고, 상기 랜덤 억세스 포인트는 복수의 픽쳐가 출력 순서에 따라 배열된 영상 시퀀스 내에서 복호화 프로세스가 시작될 수 있는 지점이고,
상기 복수의 랜덤 억세스 카메라 파라미터 값은, 상기 복수의 랜덤 억세스 카메라 파라미터 값 중에서 POC 순서상 서로 가장 인접하여 위치한 제1 카메라 파라미터 값 및 제2 카메라 파라미터 값을 포함하고,
상기 카메라 파라미터 관련 정보는 상기 제1 카메라 파라미터 값 자체를 나타내는 제1 정보 및 상기 제2 카메라 파라미터 값 자체를 나타내는 제2 정보를 포함하고,
상기 복수의 카메라 파라미터 값 도출 단계에서는,
상기 제1 정보를 기반으로 상기 제1 카메라 파라미터 값을 도출하고, 상기 제2 정보를 기반으로 상기 제2 카메라 파라미터 값을 도출하는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 8항에 있어서,
상기 복수의 카메라 파라미터 값은, POC 순서상 상기 제1 카메라 파라미터 값 및 상기 제2 카메라 파라미터 값 사이에 위치한 제3 카메라 파라미터 값을 포함하고,
상기 카메라 파라미터 관련 정보는, 상기 제3 카메라 파라미터 값에 대응하는 차분 카메라 파라미터 값을 나타내는 제3 정보를 더 포함하고,
상기 복수의 카메라 파라미터 값 도출 단계는,
상기 제3 정보를 기반으로 상기 차분 카메라 파라미터 값을 도출하는 단계;
상기 제1 카메라 파라미터 값 및 상기 제2 카메라 파라미터 값의 선형 보간(linear interpolation)에 의해, 상기 제3 카메라 파라미터 값에 대응하는 예측 카메라 파라미터 값을 도출하는 단계; 및
상기 차분 카메라 파라미터 값 및 상기 예측 카메라 파라미터 값을 더함으로써, 상기 제3 카메라 파라미터 값을 도출하는 단계를 더 포함하는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 1항에 있어서,
상기 텍스쳐 영상 및 상기 깊이 영상의 코딩 구조는 계층적 B 구조(hierarchical B structure)이고,
상기 복수의 카메라 파라미터 값은, 랜덤 억세스 포인트(random access point)의 POC 값에 대응하는 복수의 랜덤 억세스 카메라 파라미터 값 중 하나인 제1 카메라 파라미터 값을 포함하고, 상기 랜덤 억세스 포인트는 복수의 픽쳐가 출력 순서에 따라 배열된 영상 시퀀스 내에서 복호화 프로세스가 시작될 수 있는 지점이고,
상기 카메라 파라미터 관련 정보는 상기 제1 카메라 파라미터 값 자체를 나타내는 제1 정보를 포함하고,
상기 복수의 카메라 파라미터 값 도출 단계에서는,
상기 제1 정보를 기반으로 상기 제1 카메라 파라미터 값을 도출하는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 10항에 있어서,
상기 복수의 카메라 파라미터 값은, 상기 제1 카메라 파라미터 값에 대응하는 POC 값보다 높은 POC 값에 대응하는 제2 카메라 파라미터 값을 더 포함하고,
상기 카메라 파라미터 관련 정보는, 상기 제2 카메라 파라미터 값에 대응하는 제1 차분 카메라 파라미터 값을 나타내는 제2 정보를 더 포함하고,
상기 복수의 카메라 파라미터 값 도출 단계는,
상기 제2 정보를 기반으로 상기 제1 차분 카메라 파라미터 값을 도출하는 단계;
상기 제1 카메라 파라미터 값을 상기 제2 카메라 파라미터 값에 대응하는 제1 예측 카메라 파라미터 값으로 결정하는 단계; 및
상기 제1 차분 카메라 파라미터 값 및 상기 제1 예측 카메라 파라미터 값을 더함으로써, 상기 제2 카메라 파라미터 값을 도출하는 단계를 더 포함하는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 11항에 있어서,
상기 복수의 카메라 파라미터 값은, POC 순서상 상기 제1 카메라 파라미터 값 및 상기 제2 카메라 파라미터 값 사이에 위치한 제3 카메라 파라미터 값을 더 포함하고,
상기 카메라 파라미터 관련 정보는, 상기 제3 카메라 파라미터 값에 대응하는 제2 차분 카메라 파라미터 값을 나타내는 제3 정보를 더 포함하고,
상기 복수의 카메라 파라미터 값 도출 단계는,
상기 제3 정보를 기반으로 상기 제2 차분 카메라 파라미터 값을 도출하는 단계;
상기 제1 카메라 파라미터 값 및 상기 제2 카메라 파라미터 값의 선형 보간(linear interpolation)에 의해, 상기 제3 카메라 파라미터 값에 대응하는 제2 예측 카메라 파라미터 값을 도출하는 단계; 및
상기 제2 차분 카메라 파라미터 값 및 상기 제2 예측 카메라 파라미터 값을 더함으로써, 상기 제3 카메라 파라미터 값을 도출하는 단계를 더 포함하는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 1항에 있어서,
상기 텍스쳐 영상 및 상기 깊이 영상의 코딩 구조는, I 슬라이스 및 P 슬라이스로 구성되는 로우 딜레이 구조(low delay structure)이고,
상기 복수의 카메라 파라미터 값은, 하나의 인트라 주기(intra period)에 POC 순서로 포함된 N개의 카메라 파라미터 값 {p_kN, p_kN+1, p_kN+2, …, p_n, …, p_(k+1)N-1}을 포함하고, 상기 k는 0 이상의 정수이고, 상기 N은 양의 정수이고, 상기 n은 kN 이상 (k+1)N-1 이하의 정수이고,
상기 카메라 파라미터 값 p_kN은 랜덤 억세스 포인트(random access point)의 POC 값에 대응하는 복수의 랜덤 억세스 카메라 파라미터 값 중에서 하나이고, 상기 랜덤 억세스 포인트는 복수의 픽쳐가 출력 순서에 따라 배열된 영상 시퀀스 내에서 복호화 프로세스가 시작될 수 있는 지점이고,
상기 인트라 주기는 상기 영상 시퀀스에 상기 복수의 랜덤 억세스 카메라 파라미터 값에 대응되는 픽쳐가 삽입되는 주기이고,
상기 카메라 파라미터 관련 정보는 상기 카메라 파라미터 값 p_kN 자체를 나타내는 제1 정보를 포함하고,
상기 복수의 카메라 파라미터 값 도출 단계에서는,
상기 제1 정보를 기반으로 상기 카메라 파라미터 값 p_kN을 도출하는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 13항에 있어서,
상기 카메라 파라미터 관련 정보는, 상기 카메라 파라미터 값 p_kN+1에 대응하는 제1 차분 카메라 파라미터 값을 나타내는 제2 정보를 더 포함하고,
상기 복수의 카메라 파라미터 값 도출 단계는,
상기 제2 정보를 기반으로 상기 제1 차분 카메라 파라미터 값을 도출하는 단계;
상기 카메라 파라미터 값 p_kN을 상기 카메라 파라미터 값 p_kN+1에 대응하는 제1 예측 카메라 파라미터 값으로 결정하는 단계; 및
상기 제1 차분 카메라 파라미터 값 및 상기 제1 예측 카메라 파라미터 값을 더함으로써, 상기 카메라 파라미터 값 p_kN+1을 도출하는 단계를 더 포함하는 것을 특징으로 하는 3D 비디오 복호화 방법.
제 14항에 있어서,
상기 카메라 파라미터 관련 정보는, 카메라 파라미터 값 p_m에 대응하는 제2 차분 카메라 파라미터 값을 나타내는 제3 정보를 더 포함하고, 상기 m은 kN+2 이상 (k+1)N-1 이하의 정수이고,
상기 복수의 카메라 파라미터 값 도출 단계는,
상기 제3 정보를 기반으로 상기 제2 차분 카메라 파라미터 값을 도출하는 단계;
카메라 파라미터 값 p_m-2 및 카메라 파라미터 값 p_m-1의 선형 보간에 의해, 상기 카메라 파라미터 값 p_m에 대응하는 제2 예측 카메라 파라미터 값을 도출하는 단계; 및
상기 제2 차분 카메라 파라미터 값 및 상기 제2 예측 카메라 파라미터 값을 더함으로써, 상기 카메라 파라미터 값 p_m을 도출하는 단계를 더 포함하는 것을 특징으로 하는 3D 비디오 복호화 방법.
텍스쳐 영상(texture image) 및 깊이 영상(depth image)을 기반으로 3D 영상을 생성하는 3D 비디오 복호화 장치로서,
카메라 파라미터 관련 정보를 포함하는 영상 정보를 수신하여 복호화하는 엔트로피 복호화부;
상기 복호화된 영상 정보를 기반으로, 서로 다른 POC(Picture Order Count) 값에 대응하는 복수의 카메라 파라미터 값을 도출하는 카메라 파라미터 복원부; 및
상기 복수의 카메라 파라미터 값 중에서 적어도 하나를 기반으로, 상기 텍스쳐 영상 및 상기 깊이 영상을 복원하는 영상 복원부를 포함하되,
상기 POC 값은 픽쳐의 출력 순서를 나타내는 값이고,
상기 복수의 카메라 파라미터 값 중에서 적어도 하나의 카메라 파라미터 값은, 이전에 도출된 하나 이상의 카메라 파라미터 값을 기반으로 예측을 수행함으로써 도출되는 것을 특징으로 하는 3D 비디오 복호화 장치.
카메라 파라미터 관련 정보를 포함하는 영상 정보를 수신하여 복호화하는 단계; 및
상기 복호화된 영상 정보를 기반으로, 서로 다른 POC(Picture Order Count) 값에 대응하는 복수의 카메라 파라미터 값을 도출하는 단계를 포함하되,
상기 POC 값은 픽쳐의 출력 순서를 나타내는 값이고,
상기 복수의 카메라 파라미터 값 중에서 적어도 하나의 카메라 파라미터 값은, 이전에 도출된 하나 이상의 카메라 파라미터 값을 기반으로 예측을 수행함으로써 도출되는 것을 특징으로 하는 카메라 파라미터 복호화 방법.
카메라 파라미터 관련 정보를 포함하는 영상 정보를 수신하여 복호화하는 엔트로피 복호화부; 및
상기 복호화된 영상 정보를 기반으로, 서로 다른 POC(Picture Order Count) 값에 대응하는 복수의 카메라 파라미터 값을 도출하는 카메라 파라미터 복원부를 포함하되,
상기 POC 값은 픽쳐의 출력 순서를 나타내는 값이고,
상기 복수의 카메라 파라미터 값 중에서 적어도 하나의 카메라 파라미터 값은, 이전에 도출된 하나 이상의 카메라 파라미터 값을 기반으로 예측을 수행함으로써 도출되는 것을 특징으로 하는 카메라 파라미터 복호화 장치.