KR20150026924A - 3차원 비디오에서의 깊이 쿼드트리 예측 방법 및 장치 - Google Patents

3차원 비디오에서의 깊이 쿼드트리 예측 방법 및 장치 Download PDF

Info

Publication number
KR20150026924A
KR20150026924A KR20140112614A KR20140112614A KR20150026924A KR 20150026924 A KR20150026924 A KR 20150026924A KR 20140112614 A KR20140112614 A KR 20140112614A KR 20140112614 A KR20140112614 A KR 20140112614A KR 20150026924 A KR20150026924 A KR 20150026924A
Authority
KR
South Korea
Prior art keywords
texture
depth
view video
coding unit
video picture
Prior art date
Application number
KR20140112614A
Other languages
English (en)
Inventor
이충구
이용재
김휘
Original Assignee
(주)휴맥스 홀딩스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)휴맥스 홀딩스 filed Critical (주)휴맥스 홀딩스
Priority to US14/471,311 priority Critical patent/US20150063455A1/en
Priority to EP20140183166 priority patent/EP2843952A1/en
Priority to CN201410442930.2A priority patent/CN104427346A/zh
Publication of KR20150026924A publication Critical patent/KR20150026924A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

다시점 비디오에서 깊이 정보를 예측하여 부호화하는 방법은 현재의 다시점 비디오 픽춰의 텍스처(texture)의 쿼드 트리 구조의 코딩 유닛의 분할(split) 정보에 연계(linked)하여 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 대응하는 깊이 정보를 부호화하는 단계를 포함한다. 현재의 다시점 비디오 픽춰의 텍스처(texture)의 쿼드 트리 구조를 가지는 코딩 유닛의 분할(split) 정보에 연계(linked)하여 상기 텍스처(texture)에 대응하는 깊이 정보를 예측 부호화함으로써 전송되는 깊이 정보의 부호화 데이터를 줄일 수 있고 부호화 및 복호화 복잡도를 줄일 수 있다.

Description

3차원 비디오에서의 깊이 쿼드트리 예측 방법 및 장치{Methods and Apparatus for depth quadtree prediction}
본 발명은 3D 영상 부복호화 방법, 부복호화 장치에 관한 것으로, 보다 상세하게는 3차원 비디오에서의 깊이 쿼드트리 예측 방법 및 장치에 관한 것이다.
일반적으로 영상 압축 방법에서는 압축 효율을 높이기 위해 픽쳐들의 중복도를 제거하는 화면간 예측(inter prediction) 및 화면내 예측(intra prediction) 기술을 이용한다.
화면간 예측을 이용해 영상을 부호화하는 방법은 픽처들 사이의 시간적인 중복성(spatial redundancy)을 제거하여 영상을 압축하는 방법으로서 대표적으로 움직임 보상 예측 부호화 방법이 있다.
움직임 보상 예측 부호화는 현재 부호화되는 픽처의 앞 및/또는 뒤에 위치하는 적어도 하나의 참조 픽처에서 현재 부호화되는 블록과 유사한 영역을 검색하여 움직임 벡터(MV: Motion Vector)를 생성하고, 생성된 움직임 벡터를 이용하여 움직임 보상을 수행하여 얻어지는 예측 블록과 현재 예측 유닛의 잔여값(residue)을 DCT(Discrete Cosine Transform) 변환하고 양자화한 후 엔트로피 부호화하여 전송한다.
움직임 보상 화면간 예측의 경우, 하나의 픽처를 소정 크기를 가지는 복수의 블록(block)으로 구분하여 움직임 벡터(MV)를 생성하고, 생성된 움직임 벡터를 이용하여 움직임 보상을 수행한다. 움직임 보상을 수행하여 얻어지는 각각의 예측 블록에 대한 개별적인 움직임 파라미터는 디코더로 전송된다.
3차원 영상의 경우, 영상의 특성상 각 픽셀이 화소 정보뿐만 아니라 깊이(depth) 정보를 포함하고 있으며, 인코더에서 깊이 정보를 구해 디코더로 다시점 비디오 영상 정보 및 깊이 정보를 전송할 수 있다.
1. 일본 특허 출원 JP2008-292306(발명의 명칭 "DEVICE AND METHOD FOR ESTIMATING DEPTH MAP, METHOD FOR GENERATING INTERMEDIATE IMAGE, AND METHOD FOR ENCODING MULTI-VIEW VIDEO USING THE SAME" 공개일 2009.06.04일) 2. 한국 특허 출원 KR2007-0117404(발명의 명칭 "깊이맵 추정장치와 방법, 이를 이용한 중간 영상 생성 방법및 다시점 비디오의 인코딩 방법", 공개일 2009.05.20)
본 발명의 목적은 3차원 다시점 영상의 경우 깊이 정보를 예측하여 부호화할 경우 전송되는 부호화 데이터를 줄이기 위한 방법 및 장치를 제공하는 것이다.
상기한 목적을 달성하기 위한 본 발명의 일측면에 따르면, 다시점 비디오에서 깊이 정보를 예측하여 부호화하는 방법은 현재의 다시점 비디오 픽춰의 텍스처(texture)의 쿼드 트리 구조의 코딩 유닛의 분할 정보에 연계(linked)하여 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 상응하는 깊이 정보를 부호화하는 단계를 포함한다.
현재의 다시점 비디오 픽춰의 텍스처의 전경과 배경을 구분하여 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 상응하는 깊이 정보에 대한 분할 여부를 지시하는 비트 정보 전송 여부를 다르게 설정할 수 있다.
현재의 다시점 비디오 픽춰의 텍스처(texture)의 쿼드 트리 구조의 코딩 유닛의 분할(split) 정보에 연계(linked)하여 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 상응하는 깊이 정보를 예측 부호화함으로써 전송되는 깊이 정보의 부호화 데이터를 줄일 수 있다.
또한, 현재의 다시점 비디오 픽춰의 텍스처의 전경과 배경을 구분하여 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 연계된 깊이 정보에 대한 분할 여부를 지시하는 비트 정보 전송 여부를 다르게 설정함으로써 전송되는 깊이 정보의 부호화 데이터를 줄일 수 있고 부호화 및 복호화 복잡도를 줄일 수 있다.
도 1 및 도 2는 3차원 다시점 비디오 픽춰의 텍스처(texture)의 쿼드 트리 코딩 유닛의 분할(split) 정보에 연계(linked)하여 상기 텍스처(texture)에 연계된 깊이 정보를 예측 부호화하는 과정을 설명하기 위한 개념도이다.
도 3은 본 발명의 일 실시예에 따른 코딩 유닛(CU)의 순환적 코딩 유닛 구조를 나타낸 개념도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다.
그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제 1, 제 2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소도 제 1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
이하, 코딩 유닛(Coding Unit; CU)은 정방형의 픽셀 크기를 가지며, 2N2N(단위: 픽셀) 크기의 가변적인 크기를 가질 수 있다. 코딩 유닛(Coding Unit; CU)은 순환적(recursive) 코딩 유닛 구조를 가질 수 있다. 화면간 예측(inter prediction), 화면내 예측(intra prediction), 변환(Transform), 양자화(Quantization), 디블록킹 필터링(Deblocking filtering) 및 엔트로피 부호화(Entropy encoding)는 코딩 유닛(CU) 단위로 이루어질 수 있다.
예측 유닛(PU: Prediction Unit)이라 함은 화면간 예측(inter prediction) 또는 화면내 예측(intra prediction)을 수행하는 기본 단위이다.
이하, 블록(block)은 코딩 유닛(CU) 또는 예측 유닛(prediction unit; PU)을 포함할 수 있다.
도 1 및 도 2는 3차원 다시점 비디오 픽춰의 텍스처(texture)의 쿼드 트리 코딩 유닛의 분할(split) 정보에 연계(linked)하여 상기 텍스처(texture)에 연계된 깊이 정보를 예측 부호화하는 과정을 설명하기 위한 개념도이며, 도 3은 본 발명의 일 실시예에 따른 코딩 유닛(CU)의 순환적 코딩 유닛 구조를 나타낸 개념도이다.
먼저, 도 3를 참조하면, 각 코딩 유닛(CU)은 정사각형 모양을 가지며, 각 코딩 유닛(CU)은 2N X 2N(단위 pixel) 크기의 가변적인 크기를 가질 수 있다. 인터 예측, 인트라 예측, 변환, 양자화 및 엔트로피 부호화는 코딩 유닛(CU) 단위로 이루어질 수 있다. 코딩 유닛(CU)은 최대 코딩 유닛(LCU), 최소 코딩 유닛(SCU)를 포함할 수 있으며, 최대 코딩 유닛(LCU), 최소 코딩 유닛(SCU)의 크기는 8이상의 크기를 가지는 2의 거듭제곱 값으로 나타낼 수 있다.
본 발명의 일 실시예에 따른 코딩 유닛(CU)은 순환적인 트리 구조를 가질 수 있다. 도 3은 최대 코딩 유닛(LCU)인 CU0의 한변의 크기(2N0)가 128(N0=64)이고, 최대 계층 레벨(level) 또는 계층 깊이(depth)가 5인 경우를 나타낸다. 순환적인 구조는 일련의 플래그(flag)를 통하여 표현될 수 있다. 예를들어, 계층 레벨(level) 또는 계층 깊이(depth)가 k인 코딩 유닛(CUk)의 플래그(flag)값이 0인 경우, 코딩 유닛(CUk)에 대한 코딩(coding)은 현재의 계층 레벨(level) 또는 계층 깊이(depth)에 대해 이루어지며, 플래그(flag)값이 1인 경우, 현재의 계층 레벨(level) 또는 계층 깊이(depth)가 k인 코딩 유닛(CUk)은 4개의 독립적인 코딩 유닛(CUk+1)으로 분할되며, 분할된 코딩 유닛(CUk+1)은 계층 레벨(level) 또는 계층 깊이(depth)가 k+1이 되며, 크기는 Nk+1 X Nk+1가 된다. 이 경우 코딩 유닛(CUk+1)은 코딩 유닛(CUk)의 서브 코딩 유닛으로 나타낼 수 있다. 코딩 유닛(CUk+1)의 계층 레벨(level) 또는 계층 깊이(depth)가 최대 허용 가능한 계층 레벨(level) 또는 계층 깊이(depth)에 도달할 때까지 코딩 유닛(CUk+1)은 순환적으로(recursive) 처리될 수 있다. 코딩 유닛(CUk+1)의 계층 레벨(level) 또는 계층 깊이(depth)가 최대 허용 가능한 계층 레벨(level) 또는 계층 깊이(depth)-도 2에서는 4인 경우를 예로 들었음-과 동일한 경우에는 더 이상의 분할은 허용되지 않는다.
최대 코딩 유닛(LCU)의 크기 및 최소 코딩 유닛(SCU)의 크기는 시퀀스 파라미터 셋(Sequence Parameter Set; SPS)에 포함될 수 있다. 시퀀스 파라미터 셋(SPS)는 최대 코딩 유닛(LCU)의 최대 허용 가능한 계층 레벨(level) 또는 계층 깊이(depth)를 포함할 수 있다. 예를 들어, 도 3의 경우는 최대 허용 가능한 계층 레벨(level) 또는 계층 깊이(depth)는 5이고, 최대 코딩 유닛(LCU)의 한변의 크기가 128(단위 pixel)인 경우, 128 X 128(LCU), 64 X 64, 32 X 32, 16 X 16 및 8 X 8(SCU)의 5가지 종류의 코딩 유닛 크기가 가능하다. 즉, 최대 코딩 유닛(LCU)의 크기 및 최대 허용 가능한 계층 레벨(level) 또는 계층 깊이(depth)가 주어지면 허용가능한 코딩 유닛의 크기가 결정될 수 있다. 상기 코딩 유닛의 크기는 울트라 HD(Ultra High Definition)급 이상의 해상도를 가지는 고해상도의 경우 인코더 및 디코더 복잡도를 고려하여 최대 64x64 픽셀 크기 이하로 제한될 수도 있다.
상기와 같은 본 발명의 일 실시예에 따른 순환적 코딩 유닛 구조를 사용할 경우의 장점은 다음과 같다.
첫째, 기존의 16 X 16 매크로블록보다 큰 사이즈를 지원할 수 있다. 만약 관심 이미지 영역이 균일(homogeneous)하다면, 큰 코딩 유닛(LCU)은 여러 개의 작은 블록들을 사용하는 경우보다 관심 이미지 영역을 더 적은 개수의 심볼들로 표시할 수 있다.
둘째, 고정된 크기의 매크로블록을 사용하는 경우에 비하여 임의의 다양한 크기를 가지는 최대 코딩 유닛(LCU)을 지원함으로써 코덱은 다양한 콘텐츠, 애플리케이션 및 장치에 용이하게 최적화될 수 있다. 즉, 최대 코딩 유닛(LCU) 크기 및 최대 계층 레벨(level) 또는 최대 계층 깊이(depth)를 적절히 선택함으로써, 상기 계층적 블록 구조는 목표로 하는 애플리케이션에 보다 더 최적화 될 수 있다.
셋째, 매크로블록, 서브-매크로블록등 매크로 블록의 크기를 구분하지 않고 코딩 유닛(CU)이라는 한 개의 단일 유닛 형태를 사용함으로써, 멀티레벨 계층적 구조를 최대 코딩 유닛(LCU) 크기, 최대 계층 레벨(level)(또는 최대 계층 깊이(depth)) 및 일련의 플래그를 이용하여 매우 간단하게 나타낼 수 있다. 크기 독립적(size-independent)인 신택스 표현(syntax representation)과 함께 사용될 경우 나머지 코딩 툴들에 대한 하나의 일반화된 크기의 신택스 아이템을 명시하는데 충분하게 되며, 이러한 일관성이 실제 파싱 과정등을 단순화 시킬 수 있다. 계층 레벨(level)(또는 최대 계층 깊이(depth))의 최대값은 임의값을 가질 수 있으며 기존의 H.264/AVC 부호화 방식에서 혀용된 값보다 더 큰 값을 가질 수 있다. 크기 독립적 신택스 표현을 사용하여 코딩 유닛(CU)의 크기에 독립적으로 일관된 방식으로 모든 신택스 엘리먼트(syntax elements)를 명시할 수 있다. 코딩 유닛(CU)에 대한 분할 과정(splitting process)은 순환적으로 명시될 수 있고, 말단 코딩 유닛(leaf coding unit)-계층 레벨의 마지막 코딩 유닛-에 대한 다른 신택스 엘리먼트들은 코딩 유닛 크기에 무관하게 동일한 크기로 정의될 수 있다. 상기와 같은 표현법은 파싱 복잡도를 줄이는 데 매우 효과적이며, 큰 계층 레벨 또는 계층 깊이가 허용되는 경우 표현의 명료성이 향상될 수 있다.
상기와 같은 계층적인 분할 과정이 완료되면 더 이상의 분할 없이 코딩 유닛 계층 트리의 말단 노드에 대해 인터 예측 또는 인트라 예측을 수행할 수 있으며, 이러한 말단 코딩 유닛이 인터 예측 또는 인트라 예측의 기본 단위인 예측 유닛(Prediction Unit; PU)으로 사용된다.
인터 예측 또는 인트라 예측을 위하여 상기 말단 코딩 유닛에 대해 파티션(partition) 분할이 수행 된다. 즉, 파티션 분할은 예측 유닛(PU)에 대해 수행된다. 여기서, 에측 유닛(PU)는 인터 예측 또는 인트라 예측을 위한 기본 단위의 의미이며, 기존의 매크로 블록 단위 또는 서브-매크로 블록 단위가 될 수도 있고, 32 X 32 픽셀 크기 이상의 블록 단위가 될 수도 있다.
상기 인터 예측 또는 인트라 예측을 위한 파티션 분할은 비대칭적 파티션 분할(asymmetric partitioning) 방식으로 이루어질 수도 있고, 정사각형이외의 임의의 모양을 가지는 기하학적 파티션 분할(geometrical partitioning) 방식으로 이루어질 수도 있다.
도 1은, 3차원 다시점 비디오 픽춰의 주어진 texture(color)의 코딩 유닛(Coding Unit; CU)의 분할 과정을 나타내며, 도 1을 참조하면, 가운데 배치된 깊이(depth) 영상은 상기 3차원 다시점 비디오 픽춰의 주어진 texture(color)의 코딩 유닛(Coding Unit; CU)에 연계된 깊이(depth) 영상을 나타낸다.
3차원 다시점 비디오의 경우 3차원 다시점 비디오 픽춰의 주어진 texture(color)의 코딩 유닛(Coding Unit; CU)는 도 1에 도시된 바와 같이 상기 주어진 texture(color)의 코딩 유닛에 연계된 깊이 영상(collocated depth image)에 비하여 더 자주 파티션(partition)되는 것으로 알려져 있다.
본 발명의 일실시예에서는, 상기 CU는 도 3에 도시된 바와 같은 쿼드 트리 구조를 가질 수 있다.
본 발명의 일실시예에서는, 상기 주어진 텍스처(texture)의 CU가 더 이상 분할(split)되지 않되면 상기 주어진 텍스춰에 연계된 깊이 영상(collocated depth image)은 깊이 영상에 대한 분할 여부를 나타내는 지시자(indicator)를 디코더로 전송하지 않는다.
또한, 상기 주어진 텍스처(texture)의 CU가 다음 레벨(level) 또는 깊이(depth)로 추가적으로 더 분할(split)되면 상기 주어진 텍스춰에 연계된 깊이 영상(collocated depth image)은 깊이 영상에 대한 분할 여부를 나타내는 지시자(indicator)를 디코더로 전송한다.
따라서, 깊이(depth) 영상의 주어진 CU는 연계된 텍스처(collocated texture)의 CU보다 더 많이 분할(split) 될 수 없도록 동작한다.
이 경우, 1 비트의 indicator를 디코더로 전송하여 해당 깊이(depth)가 분할(split)되는지 또는 않되는지를 지시(indicate)하여 부호화하고, 복호화시에는 텍스춰(texture)가 분할(split)되면, 잔여 깊이(residual depth)는 상기 부호화기로부터 전송된 지시자(indicator)가 지시하는 분할(split)되었는지 여부에 정보에 따라 분할되었으면 1, 분할 않되었으면 0으로 디코딩한다.
3차원 다시점 비디오 픽춰의 텍스처(texture)의 코딩 유닛이 순환적 쿼드 트리 구조를 가지는 경우, 3차원 다시점 비디오 픽춰의 깊이(depth)에 대해서도 굳이 복잡한 쿼드트리(quadtree) 구조를 이용하여 별도로 깊이(depth) 정보를 부호화하여 전송할 경우 3차원 다시점 비디오의 경우 전송되는 부호화 데이터가 증가되는 문제점이 있다.
따라서, 전술한 바와 같이 현재의 3차원 다시점 비디오 픽춰의 텍스처(texture)의 쿼드 트리 코딩 유닛의 분할(split) 정보에 연계(linked)하여 상기 현재의 3차원 다시점 비디오 픽춰의 텍스처(texture)에 연계된 깊이 정보를 예측 부호화한다.
본 발명의 다른 실시예에서는, 현재의 3차원 다시점 비디오 픽춰의 텍스처의 전경과 배경을 구분하여 상기 현재의 3차원 다시점 비디오 픽춰의 텍스처(texture)의 텍스처(texture)에 연계된 깊이 정보에 대한 분할 여부를 지시하는 비트 정보 전송 여부를 다르게 설정함으로써 전송되는 깊이 정보의 부호화 데이터를 줄일 수 있고 부호화 및 복호화 복잡도를 줄일 수 있다.
구체적으로, 전경과 배경을 구분하여 깊이(depth) 차이가 있는지 여부를 체크해서,
a) 깊이(depth) 차이가 소정치 이상 있는 경우(배경 또는 먼거리 객체)에는 정확성을 희생해도 되므로 텍스춰(texture)의 CU가 분할(split) 않되면 별도의 지시자를 디코더로 전송하지 않는다.
b) 깊이(depth) 차이가 소정치 이하인 경우(전경 또는 가까운 객체)에는 1 bit의 지시자(indicator)를 보내 깊이(depth)가 분할(split)되는지 또는 분할 않되는지를 지시(indicate)하여 부호화하고, 복호화시에는 텍스춰(texture)가 분할(split)되면, 잔여 깊이(residual depth)는 상기 부호화기로부터 전송된 지시자(indicator)가 지시하는 분할(split)되었는지 여부에 정보에 따라 분할되었으면 1, 분할 않되었으면 0으로 디코딩한다.
즉 깊이(depth)의 주어진 CU는 연계된 텍스춰(collocated texture)의 CU보다 더 많이 split될 수 없도록 한다.
이상 도면 및 실시예를 참조하여 설명하였지만, 본 발명의 보호범위가 상기 도면 또는 실시예에 의해 한정되는 것을 의미하지는 않으며 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (10)

  1. 다시점 비디오에서 깊이(depth) 정보를 예측하여 부호화하는 부호화 방법에 있어서,
    부호화 장치에서 현재의 다시점 비디오 픽춰의 텍스처(texture)의 쿼드 트리 구조의 코딩 유닛의 분할(split) 정보에 연계(linked)하여 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 상응하는 깊이 정보를 부호화하는 것을 특징으로 하는 다시점 비디오에서의 깊이 정보 부호화 방법.
  2. 제1항에 있어서, 상기 부호화 장치에서 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)의 코딩 유닛이 더 이상 분할(split)되지 않되면 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 상응하는 깊이 영상(collocated depth image)은 상기 깊이 영상에 대한 분할 여부를 나타내는 지시자(indicator)를 디코더로 전송하지 않는 것을 특징으로 하는 다시점 비디오에서의 깊이 정보 부호화 방법.
  3. 제1항에 있어서, 상기 부호화 장치에서 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)의 코딩 유닛이 다음 레벨(level) 또는 깊이(depth)로 추가적으로 더 분할(split)되면 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 상응하는 깊이 영상(collocated depth image)은 상기 깊이 영상에 대한 분할 여부를 나타내는 지시자(indicator)를 디코더로 전송하는 것을 특징으로 하는 다시점 비디오에서의 깊이 정보 부호화 방법.
  4. 제1항에 있어서, 상기 부호화 장치에서 1 비트의 지시자(indicator)를 디코더로 전송하여 상기 깊이 영상이 분할(split)되는지 또는 않되는지를 지시(indicate)하는 것을 특징으로 하는 다시점 비디오에서의 깊이 정보 부호화 방법.
  5. 제1항에 있어서,
    상기 현재의 다시점 비디오 픽춰의 텍스처의 전경(foreground)과 배경(background)을 구분하여 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 상응하는 깊이 정보에 대한 분할 여부를 지시하는 비트 정보 전송 여부를 다르게 하는 것을 특징으로 하는 다시점 비디오에서의 깊이 정보 부호화 방법.
  6. 다시점 비디오에서 깊이(depth) 정보를 예측하여 부호화하는 부호화 장치에 있어서,
    상기 부호화 장치는 현재의 다시점 비디오 픽춰의 텍스처(texture)의 쿼드 트리 구조의 코딩 유닛의 분할(split) 정보에 연계(linked)하여 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 상응하는 깊이 정보가 부호화하는 것을 특징으로 하는 다시점 비디오에서의 깊이 정보 부호화 장치.
  7. 제6항에 있어서, 상기 부호화 장치에서 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)의 코딩 유닛이 더 이상 분할(split)되지 않되면 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 상응하는 깊이 영상(collocated depth image)은 상기 깊이 영상에 대한 분할 여부를 나타내는 지시자(indicator)를 디코더로 전송하지 않는 것을 특징으로 하는 다시점 비디오에서의 깊이 정보 부호화 장치.
  8. 제6항에 있어서, 상기 부호화 장치에서 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)의 코딩 유닛이 다음 레벨(level) 또는 깊이(depth)로 추가적으로 더 분할(split)되면 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 상응하는 깊이 영상(collocated depth image)은 상기 깊이 영상에 대한 분할 여부를 나타내는 지시자(indicator)를 디코더로 전송하는 것을 특징으로 하는 다시점 비디오에서의 깊이 정보 부호화 장치.
  9. 제6항에 있어서, 상기 부호화 장치에서 1 비트의 지시자(indicator)를 디코더로 전송하여 상기 깊이 영상이 분할(split)되는지 또는 않되는지를 지시(indicate)하는 것을 특징으로 하는 다시점 비디오에서의 깊이 정보 부호화 장치.
  10. 제6항에 있어서,
    상기 부호화 장치에서 상기 현재의 다시점 비디오 픽춰의 텍스처의 전경(foreground)과 배경(background)을 구분하여 상기 현재의 다시점 비디오 픽춰의 텍스처(texture)에 상응하는 깊이 정보에 대한 분할 여부를 지시하는 비트 정보 전송 여부를 다르게 하는 것을 특징으로 하는 다시점 비디오에서의 깊이 정보 부호화 장치.
KR20140112614A 2013-09-02 2014-08-27 3차원 비디오에서의 깊이 쿼드트리 예측 방법 및 장치 KR20150026924A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US14/471,311 US20150063455A1 (en) 2013-09-02 2014-08-28 Methods and apparatuses for predicting depth quadtree in three-dimensional video
EP20140183166 EP2843952A1 (en) 2013-09-02 2014-09-02 Methods and apparatuses for predicting depth quadtree in three-dimensional video
CN201410442930.2A CN104427346A (zh) 2013-09-02 2014-09-02 用于预测三维视频中的深度四叉树的方法和装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020130104694 2013-09-02
KR20130104694 2013-09-02

Publications (1)

Publication Number Publication Date
KR20150026924A true KR20150026924A (ko) 2015-03-11

Family

ID=53022640

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20140112614A KR20150026924A (ko) 2013-09-02 2014-08-27 3차원 비디오에서의 깊이 쿼드트리 예측 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20150026924A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113785585A (zh) * 2019-03-15 2021-12-10 奥兰治 用于编码和解码多视图视频序列的方法和设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113785585A (zh) * 2019-03-15 2021-12-10 奥兰治 用于编码和解码多视图视频序列的方法和设备
CN113785585B (zh) * 2019-03-15 2024-04-09 奥兰治 用于编码和解码多视图视频序列的方法和设备

Similar Documents

Publication Publication Date Title
US20200228797A1 (en) Method for processing video signal and device for same
JP2022050614A (ja) ビデオコード化のためのマルチタイプツリーフレームワーク
CN110249627B (zh) 视频编解码的方法、装置及非暂时性计算机可读介质
US10015515B2 (en) Intra prediction from a predictive block
JP6370898B2 (ja) レイヤを横切るピクチャパーティションに対するビットストリームの制限
US9826244B2 (en) Device and method for scalable coding of video information based on high efficiency video coding
JP6700193B2 (ja) マルチレイヤコーディングにおける適合ウィンドウ情報
KR102140359B1 (ko) 비디오 정보의 스케일러블 코딩을 위한 디바이스 및 방법
WO2018129322A1 (en) Multi-type-tree framework for video coding
CN111971960B (zh) 用于基于帧间预测模式处理图像的方法及其装置
WO2017165509A1 (en) Constrained block-level optimization and signaling for video coding tools
WO2017091776A9 (en) Flexible transform tree structure in video coding
JP2017508345A (ja) 予測ブロックからのイントラ予測
KR20160024960A (ko) 심도 지향 인터-뷰 모션 벡터 예측
JP2017512032A (ja) 3dビデオコーディングのための制限付き深度イントラモードコーディング
CN104704833A (zh) 多视图或3维视频译码中的高级视图间残差预测
KR102600727B1 (ko) 파라미터화된 확률 추정 유한 상태 머신들을 이용한 이진 산술 코딩
JP2015532552A (ja) スケーラブルビデオコーディングのための予測モード情報アップサンプリング
WO2014130630A1 (en) Device and method for scalable coding of video information
CN111602395A (zh) 用于视频译码的量化组
CN104956676A (zh) 层间语法预测控制
EP2843952A1 (en) Methods and apparatuses for predicting depth quadtree in three-dimensional video
KR102025413B1 (ko) 복수의 레이어를 지원하는 영상의 부호화 및 복호화 방법 및 이를 이용하는 장치
KR20150026924A (ko) 3차원 비디오에서의 깊이 쿼드트리 예측 방법 및 장치
KR20130122566A (ko) 깊이 정보를 이용한 움직임 벡터 예측을 위한 3차원 영상의 부호화 방법 및 장치, 및 복호화 방법 및 장치

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Withdrawal due to no request for examination