KR101741940B1 - 3d 비디오 코딩을 위한 예측 파라미터 상속 - Google Patents

3d 비디오 코딩을 위한 예측 파라미터 상속 Download PDF

Info

Publication number
KR101741940B1
KR101741940B1 KR1020157030487A KR20157030487A KR101741940B1 KR 101741940 B1 KR101741940 B1 KR 101741940B1 KR 1020157030487 A KR1020157030487 A KR 1020157030487A KR 20157030487 A KR20157030487 A KR 20157030487A KR 101741940 B1 KR101741940 B1 KR 101741940B1
Authority
KR
South Korea
Prior art keywords
view
block
video
depth
inherited
Prior art date
Application number
KR1020157030487A
Other languages
English (en)
Other versions
KR20150126713A (ko
Inventor
지핀 뎅
이-젠 치우
리동 수
웬하오 장
유 한
시아오시아 카이
Original Assignee
인텔 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인텔 코포레이션 filed Critical 인텔 코포레이션
Publication of KR20150126713A publication Critical patent/KR20150126713A/ko
Application granted granted Critical
Publication of KR101741940B1 publication Critical patent/KR101741940B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N13/0048
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)

Abstract

삼차원(3D) 비디오 코덱은 3D 비디오의 다수의 뷰를 인코딩하고, 각각의 뷰는 텍스처 및 깊이 성분들을 포함한다. 코덱의 인코더들은 쿼드트리 분할 플래그들, 예측 모드들, 파티션 크기들, 모션 필드들, 인터 방향들, 기준 인덱스들, 루마 인트라 모드들 및 크로마 인트라 모드들과 같은 예측 파라미터들의 세트에 기초하여 그들 각각의 뷰들의 비디오 블록을 인코딩한다. 예측 파라미터들은 상이한 뷰들, 및 텍스처 및 깊이 성분들 중 상이한 성분들에 걸쳐 상속될 수 있다.

Description

3D 비디오 코딩을 위한 예측 파라미터 상속{PREDICTION PARAMETER INHERITANCE FOR 3D VIDEO CODING}
관련 출원의 상호 참조
본원은 2012년 10월 4일자로 출원된 미국 가출원 제61/709,688호의 우선권을 주장한다.
삼차원(3D) 비디오는 다수의 뷰를 포함하며, 각각의 뷰는 상이한 카메라 시각 또는 각도로부터 촬영된다. 각각의 뷰는 ("텍스처 뷰"라고도 하는) 텍스처 성분 및 깊이 맵 성분을 포함한다. 3D 비디오 인코딩은 다수의 텍스처 뷰 및 그들의 관련 깊이 맵들을 인코딩한 후에 다수의 인코딩된 텍스처 뷰 및 깊이 맵을 비트스트림으로 멀티플렉싱하는 것을 포함한다. 그러한 3D 비디오 인코딩(또는 압축)은 인터 또는 인트라 예측과 같은 상이한 타입의 비디오 예측을 이용하여 텍스처 및 깊이 맵 성분들에서의 중복성을 제거한다. 그러한 예측은 예측을 제어하기 위한 한 세트의 예측 파라미터들을 이용하여 수행된다. 현재의 3D 코딩 표준들 및 관련 기술들은 더 효율적인 인코딩 및 디코딩 프로세스들을 촉진하기 위해 상이한 뷰들 및 그들의 대응하는 텍스처/깊이 맵 성분들과 같은 상이한 상황들 사이에서 그러한 예측 파라미터들을 상속하거나 전달할 수 있는 조건들과 관련하여 유연하지 못하고 제한적이다.
도 1은 최대 코딩 단위(LCU), 코딩 단위들(CU들), 예측 단위들(PU들) 및 변환 단위들(TU들) 사이의 예시적인 관계의 도면이다.
도 2는 예측 파라미터 상속(PPI)을 이용하여 3D 비디오를 인코딩 및 디코딩할 수 있는 예시적인 삼차원(3D) 비디오 코딩(3DVC) 코덱 시스템의 블록도이다.
도 3은 일 실시예에 따른, 멀티-뷰 인코더를 포함하는 도 2의 코덱 시스템의 송신기 측의 확대 블록도이다.
도 4a는 일 실시예에 따른, 도 3의 인코더들을 포함하는 2-뷰 인코더의 상세 블록도이다.
도 4b는 일 실시예에 따른 인코딩된 비트스트림 내에 삽입될 수 있는 PPI 신택스의 도면이다.
도 5는 도 4a의 2-뷰 인코더 시스템에 대응하는 예시적인 2-뷰 디코더 시스템의 상세 블록도이다.
도 6은 뷰간(inter-view) PPI에서 디코딩될 현재 블록에 대응하는 기준 블록을 결정하기 위해 도 5의 디코더에 의해 생성된 예시적인 생성된 변이 벡터의 도면이다.
도 7a는 도 3 및 4의 상이한 인코더들과 도 5의 디코더들 사이의 상이한 방향들에서의 PPI를 나타내는 블록도이다.
도 7b는 비디오 블록의 서브블록들 사이의 인트라, 인터 및 하이브리드 예측 모드들의 상속을 나타내는 일련의 블록도들 (a), (b) 및 (c)이다.
도 7c는 현재 블록에 의한 하이브리드 인코딩된 소스 블록으로부터의 다른 예시적인 PPI의 블록도이다.
도 8a는 코딩 트리 계층구조의 상이한 레벨들에서의, 즉 큰 CU로부터 작은 CU로의 PPI의 예시적인 도면이다.
도 8b는 코딩 트리 계층구조의 상이한 레벨들에서의, 즉 작은 CU로부터 큰 CU로의 PPI의 예시적인 도면이다.
도 9a는 PPI를 이용하여 멀티-뷰 텍스처 및 깊이 비디오/성분들을 인코딩하는 예시적인 방법의 흐름도이다.
도 9b는 도 9a의 방법의 인코딩을 상술하는 예시적인 방법의 흐름도이다.
도 10은 인코딩된 멀티-뷰 텍스처 및 깊이 비디오/성분들을 PPI를 이용하여 디코딩하는 예시적인 방법의 흐름도이다.
도 11은 인코더 및 디코더에서 PPI 실시예들을 수행하도록 구성되는 예시적인 컴퓨터 시스템의 블록도이다.
도 12는 PPI 구비 인코더 및 PPI 구비 디코더 실시예들을 구현할 수 있는 시스템의 일 실시예를 나타낸다.
도 13은 도 12의 시스템을 구현할 수 있는 소형 폼 팩터 장치의 실시예들을 나타낸다.
도면들에서, 참조 번호의 가장 좌측의 숫자(들)는 그 참조 번호가 처음 나타나는 도면을 식별한다.
삼차원(3D) 비디오 코딩(3DVC)은 다양한 3D 디스플레이들을 타겟으로 하는 비디오 압축 표준이다. 3DVC는 ISO/IEC(International Organization for Standardization/International Electrotechnical Commission) MPEG(Moving Picture Experts Group)에서 개발중이다. 표준화의 2개의 주요 부문은 고효율 비디오 코딩(HEVC), 및 전통적인 H.264/AVC에 기초하여 3DVC를 포함한다. 본 명세서에서 사용되는 바와 같은 용어 "코딩" 및 "인코딩"은 동의어이며 서로 교체 가능하다. 아래에서는 멀티-뷰 3D 비디오 인코딩 및 디코딩 환경들에서 사용되는 바와 같은 예측 파라미터 상속(PPI)에 관한 실시예들이 설명된다. 실시예들은 HEVC와 관련하여 설명되지만, 임의의 다른 비디오 표준이 사용될 수 있다. 따라서, 이제 관련 HEVC 프로토콜들의 개요를 설명하여, 후속 설명되는 PPI 인코딩 및 디코딩 실시예들에 대한 근거를 형성한다.
HEVC 프로토콜 개요
비디오 콘텐츠를 다양한 해상도로 표현하기 위해, HEVC는 코딩 단위(CU), 예측 단위(PU) 및 변환 단위(TU)를 포함하는 삼중 단위(triplet of units)를 정의한다. CU는 압축의 기본 단위이며, 대체로 H.264 표준의 매크로블록의 개념과 유사하지만, 더 유연하다. PU는 인터/인트라 예측의 단위이며, 단일 CU 내에 다수의 PU가 존재할 수 있다. TU는 변환의 단위이며, 하나 이상의 PU를 포함할 수 있다. 따라서, CU는 그 CU와 관련된 다수의 PU 및 TU를 포함할 수 있다.
비디오는 비디오 프레임들 또는 픽처들의 시퀀스를 포함한다. 각각의 픽처는 하나 이상의 슬라이스로 분할될 수 있다. HEVC에 따르면, 각각의 슬라이스는 루마 및 크로마 샘플들 양자를 포함하는 트리 블록들 또는 최대 코딩 단위들(LCU들)의 시퀀스로 분할될 수 있다. LCU는 매크로블록과 유사한 목적을 갖는다. 슬라이스는 다수의 연속적인 비중첩 LCU를 코딩 순서로 포함한다. 각각의 LCU는 순환 쿼드트리 구조에 따라 CU들의 계층구조로 분할 또는 세분될 수 있다. 예를 들어, 쿼드트리의 루트 노드인 LCU는 4개의 자식 노드로 분할될 수 있으며, 각각의 자식 노드는 또한 부모 노드일 수 있고, 다른 4개의 자식 노드로 분할될 수 있다. 분할은 쿼드트리 분할 플래그들을 이용하여 달성된다. 쿼드트리의 리프 노드인 최종 비분할 자식 또는 말단 노드는 코딩 노드, 즉 코딩 비디오 블록을 포함한다. CU의 크기는 8x8개의 픽셀로부터 최대 64x64개의 픽셀 또는 그 이상의 픽셀을 갖는 LCU의 크기까지의 범위에 걸칠 수 있다. 코딩된 비트스트림과 관련된 신택스 데이터는 쿼드트리 구조, LCU를 분할할 수 있는 최대 횟수 및 코딩 노드들의 크기들을 포함하는 CU 분할을 정의할 수 있다.
더 이상 예측되지 않는 말단 CU들, 즉 CU 계층적 쿼드트리의 리프 노드들(코딩 노드들)에 대해 예측 방법들이 지정된다. CU 리프 노드들은 PU들로 지칭되는 예측의 기본 단위들로 분할된다. PU는 예측의 방법을 지정한다. 구체적으로, 2개의 주요 파라미터가 PU와 관련된 예측 방법: 예측 타입/모드 및 PU 분할을 지정한다. (본 명세서에서 코딩 모드로도 지칭되는) 예측 모드는 예컨대 인트라 예측, 인터 예측 및 생략 중 하나로부터 선택된다. 인트라 예측은 동일 픽처 내의 다른 비디오 블록들과 관련된 현재 비디오 블록의 예측을 포함한다. 인터 예측은 시간적으로 이격된, 즉 더 이르고/이르거나 더 늦은 인접 픽처들과 관련된 현재 비디오 블록의 예측을 포함한다. 현재 블록에 대한 인터 예측을 정의하는 PU는 기준 블록과 관련된 모션 벡터를 포함한다. 모션 벡터를 정의하는 데이터는 예를 들어 모션 벡터의 수평 성분, 모션 벡터의 수직 성분, 모션 벡터에 대한 해상도(예로서, 1/4 픽셀 정밀도 또는 1/8 픽셀 정밀도), 모션 벡터가 가리키는 기준 픽처 및/또는 모션 벡터에 대한 기준 픽처 리스트(예로서, 리스트 0, 리스트 1 또는 리스트 C)를 설명할 수 있다.
TU는 변환 및 양자화 프로세스들을 위해 사용된다. 하나 이상의 PU를 갖는 CU는 하나 이상의 변환 단위(TU)도 포함할 수 있다. 예측에 이어서, PU에 대응하는 나머지 값들이 계산될 수 있다. 나머지 값들은 비디오 데이터의 현재 블록과 비디오 데이터의 예측 블록 사이의 픽셀 차이 값들을 포함한다. 나머지 값들은 TU들을 이용하여 변환 계수들로 변환되고, 양자화되고, 스캐닝되어, 엔트로피 코딩을 위한 직렬화된 변환 계수들을 생성할 수 있다. 용어 "비디오 블록" 또는 간단히 "블록"은 본 명세서에서는 대체로 (i) 임의의 분할 레벨에서 인코딩될 비디오 정보, (ii) 임의 분할 레벨에서 디코딩될 인코딩된 비디오 정보, 및 (iii) 디코딩 프로세스로부터 생성되는 디코딩된 비디오 정보 중 어느 하나를 의미하도록 상황에 따라 해석되며, 분할 레벨은 예를 들어 프레임, 슬라이스, LCU, CU(즉, 코딩 노드 또는 아님), PU 또는 TU 중 어느 하나일 수 있다.
HEVC와 관련된 신택스 데이터는 쿼드트리 구조에 따라 LCU 또는 CU를 하위 레벨 CU들로 분할한 후에 리프 노드 CU들을 PU들로 분할하는 것을 설명할 수 있다. 신택스 데이터는 리프 노드들에 대한 예측 모드(예로서, 인트라, 인터 및 생략) 및 PU 분할 또는 크기를 설명한다. CU와 관련된 신택스 데이터는 또한 예를 들어 CU의 하나 이상의 TU로의 분할 및 TU들의 크기들 및 형상들을 설명할 수 있다. 그러한 신택스 데이터는 본 명세서에서 "예측 파라미터들"로도 지칭되며, 그들의 사용은 인코딩될 HEVC의 리프 노드 레벨과 관련된 비디오 블록들의 예측을 제어한다. 즉, 비디오 블록들은 비디오 블록들과 관련된 예측 파라미터들에 기초하여 인코딩된다.
도 1은 LCU, CU들, PU들 및 TU들 사이의 예시적인 관계(100)의 도면이다. 전술한 바와 같이, HEVC 비디오 프레임은 비중첩 LCU들로 분할된다. LCU는 다수의 CU로 분할되며, 말단 CU들은 인트라 예측 또는 모션 보상 인터 예측을 위한 PU들 및 변환을 위한 TU들로 분할될 수 있다.
코덱 시스템
도 2는 예측 파라미터 상속(PPI)을 이용하여 비디오를 인코딩 및 디코딩할 수 있는 예시적인 3DVC 코덱 시스템(200)의 블록도이다. 코덱 시스템(200)은 HEVC에 따라 동작할 수 있다. 3DVC는 비디오 플러스 깊이(MVD) 구조체에 기초하여 3D 비디오 콘텐츠를 표현한다. MVD는 (본 명세서에서 멀티-뷰 비디오로 지칭되는) 비디오의 다수의 뷰를 포함한다. 각각의 뷰는 상이한 카메라 시각, 예를 들어 각도, 높이 등으로부터 캡처된 비디오를 표현한다. 각각의 뷰는 텍스처 비디오 및 그의 관련 깊이 비디오를 포함한다. 텍스처 비디오는 휘도 및 크로마 샘플들을 포함하는, 픽처를 렌더링하기 위한 비디오 정보를 포함한다. 깊이 비디오는 픽셀 단위로 깊이 값들과 같은 3D 비디오를 형성하기 위한 텍스처 비디오에 대응하는 깊이 맵과 같은 정보를 포함한다.
코덱 시스템(200)은 송신기 측(202) 및 수신기 측(204)을 포함한다. 송신기 측(202)은 3D 멀티-뷰 비디오(208)를 인코딩된 비트스트림(210)으로 인코딩하기 위한 3D 멀티-뷰 비디오 인코더(206)를 포함한다. 인코더(206)는 멀티-뷰 비디오의 텍스처 비디오 및 깊이 비디오 양자를 인코딩된 비트스트림(210)으로 인코딩한다. 인코더(206)는 또한 멀티-뷰 비디오(208)를 인코딩하는 데 사용되는 예측 파라미터들 및 카메라 각도, 높이, 식별자 등과 같은 카메라 파라미터들을 포함하는 제어 및 신택스 관련 정보를 인코딩된 비트스트림 내에 삽입하거나 팩킹한다. 송신기 측(202)은 인코딩된 비트스트림(210)을 수신기 측(204)으로 전송한다.
수신기 측(204)은 인코딩된 비트스트림(210)을 수신한다. 수신기 측(210)은 3D 멀티-뷰 비디오 디코더(212)를 포함하며, 이 디코더는 인코더(206)에 상보적이어서, 삽입된 제어 및 신택스 관련 정보에 기초하여 인코딩된 비트스트림을 디코딩하여, 214에서 멀티-뷰 비디오를 재생한다. 깊이 이미지 기반 렌더링(DIBR) 엔진(216)이 디코딩/재생된 비디오(214)에 기초하여 3D 디스플레이 이미지(218)를 구성한다.
인코더
도 3은 일 실시예에 따른, 멀티-뷰 인코더(206)를 포함하는 코덱 시스템(200)의 송신기 측(202)의 확대 블록도이다. 도 3에는 3D 멀티-뷰 비디오(208)의 다수의 예시적인 뷰, 즉 뷰 (0), 뷰 (1) 및 뷰 (N-1)가 도시된다. 각각의 뷰 (i)는 각각의 뷰의 좌측에 도시된 텍스처 비디오 및 각각의 뷰의 우측에 도시된 깊이 비디오를 포함한다. 용어 "텍스처 비디오" 및 "깊이 비디오"는 본 명세서에서 각각 "텍스처 성분" 및 "깊이 성분"으로도 지칭된다. 인코더(206)의 텍스처 비디오 인코더(Ti) 및 대응하는 깊이 비디오 인코더(Di)를 포함하는 한 쌍의 대응하는 비디오 인코더가 각각의 뷰 (i)와 관련된다. 인코더(Ti)는 뷰 (i)의 텍스처 비디오를 인코딩하며, 깊이 인코더(Di)는 뷰 (i)의 깊이 비디오를 인코딩한다. 예를 들어, 텍스처 비디오 인코더(T0)는 뷰 (0)의 텍스처 비디오를 인코딩하며, 깊이 비디오 인코더(D0)는 뷰 (0)의 깊이 비디오를 인코딩한다. 따라서, 주어진 뷰 (i)의 인코딩은 뷰 (i)와 관련된 텍스처 비디오 및 깊이 비디오의 인코딩을 의미한다. 인코더들(Ti, Di)은 본 명세서에서 설명되는 PPI 실시예들에 따라 확장된 HEVC 코딩 기술들을 이용하여 그들 각각의 뷰 (i)를 인코딩한다. 인코더들(Ti, Di)은 그들 각각의 인코딩된 텍스처 비디오 및 인코딩된 깊이 비디오를 인코더(206)의 멀티플렉서(310)에 제공하며, 이 멀티플렉서는 인코딩된 뷰들의 각각으로부터의 인코딩된 텍스처 및 깊이 비디오들을 인코딩된 비트스트림(210)으로 결합한다.
뷰 (0)는 기본 또는 독립 뷰로서 지칭되는데, 그 이유는 뷰 (0)가 나머지 뷰들과 독립적으로, 즉 다른 뷰들과 관계없이 인코딩되기 때문이다. 예를 들어, 뷰 (0)는 나머지 뷰들 중 임의의 뷰가 인코딩되기 전에 인코딩될 수 있다. 나머지 뷰들, 예를 들어 뷰 (1) - 뷰 (N-1)는 그들의 텍스처 비디오 및 관련 깊이 비디오를 포함하여 종속 또는 보조 뷰들로서 지칭되는데, 그 이유는 그들이 다른 뷰들로부터의 정보를 이용하여 인코딩될 수 있기 때문이다. 더 구체적으로, 본 명세서에서 설명되는 실시예들은 인코더들(Ti, Di)에 의해 사용되는 HEVC 코딩 기술들을 (본 명세서에서 간단히 "PPI"로도 참조되는) 유연하고 포괄적이며 선택적으로 적용되는 예측 파라미터 상속(PPI) 모드를 포함하도록 확장하며, 이 모드에서는 인코더들(Ti, Di) 중 선택된 인코더들이 다수의 선택 가능 방향 중 임의의 방향에서 인코더들(Ti, Di) 중 선택된 다른 인코더들로부터 예측 파라미터들을 상속한다.
인코더(206)는 PPI를 선택적으로 적용하며, 따라서 인코더들(Ti, Di) 중 임의의 인코더에 의해 그들 각각의 비디오 블록들(텍스처 또는 깊이에 관계없음)을 인코딩하는 데 사용된 예측 파라미터들이 그러한 인코더들로부터 다른 인코더들에 의해 그들 각각의 비디오 블록들을 인코딩하는 데 사용되도록 다수의 선택 가능한 PPI 방향 중 임의의 방향으로 상속될 수 있다. 전술한 바와 같이, 예측 파라미터들은 인코더가 그의 각각의 비디오 블록을 인코딩, 예를 들어 예측하는 방식을 제어한다. "방향"은 예측 파라미터들이 예측 파라미터들의 소스(인코더/블록)로부터 예측 파라미터들의 수신자(인코더/블록)로 전달되는 방향을 의미한다. 다수의 선택 가능한 PPI 방향은 블록들/인코더들이 상이한 뷰들과 관련되는 경우에는 뷰간 방향들 그리고 블록들/인코더들이 텍스처 및 깊이 성분들 중 상이한 성분들과 관련되는 경우에는 성분간 방향들을 포함한다. 또한, 방향들은 뷰간 및 성분간 방향들 양자의 결합일 수 있다.
예를 들어, 다수의 뷰에 걸쳐 시간 및 뷰간 중복성들을 제거하기 위해, 텍스처 비디오 및 깊이 비디오가 동일 뷰 내의 시간적으로 이웃하는 픽처들뿐만 아니라 인접 뷰들 내의 대응하는 뷰간 픽처들로부터도 예측되는 뷰간 인터 예측이 사용될 수 있다. 다른 예들에서는 뷰간 인트라 예측이 지원된다. 더욱이, 텍스처 비디오와 깊이 비디오 간의 성분간 중복성을 제거하기 위해, 깊이/텍스처 비디오들이 동일 뷰 내의 텍스처/깊이 비디오로부터 예측되는 성분간 인터 및 인트라 예측이 또한 깊이/텍스처 비디오에 적용될 수 있다. 성분간 예에서, 예측 파라미터들은 텍스처 및 깊이 성분들 사이에서 상속된다.
PPI는 또한 상이한 인코더들/블록들 사이의 예측 모드들의 상속을 지원한다. 예를 들어, 인코더/비디오 블록(텍스처 또는 깊이)은 서브블록들로 세분되는 대응하는, 예를 들어 같은 곳에 위치하는 또는 대안으로서 모션 보상된 비디오 블록으로부터 예측 파라미터들을 상속할 수 있으며,
(i) 모든 서브블록들이 인트라 예측되고,
(ii) 모든 서브블록들이 인터 예측되며,
(iii) 서브블록들이 하이브리드 예측되는데, 즉 서브블록들 중 일부가 인터 예측되고, 서브블록들 중 일부가 인트라 예측된다.
따라서, PPI에서 상속되는 예측 파라미터들은 CU/PU 세분을 정의하는 쿼드트리 분할 플래그들과 같은 쿼드트리 구조들을 포함하는 픽처 인코딩 구조, 인터, 인트라 및 하이브리드 예측 모드들, (예를 들어, PU들에 대한) 파티션 크기들 및 형상들, 모션 벡터들 및 필드들, 인터 방향들, 기준 인덱스들, 루마 인터 및 인트라 (예측) 모드들, 및 크로마 인터 및 인트라 (예측) 모드들을 포함하지만 이에 한정되지 않는다.
인코더(206)는 전술한 다양한 선택 가능한 방향들에서의 PPI를 지원하기 위해 도 3에 도시된 바와 같이 PPI 통신 기반구조를 포함하는 다수의 통신 경로를 포함하며, 상기 방향들은
a) 뷰내 텍스처-깊이 및 뷰내 깊이-텍스처 방향(312),
b) 독립-종속 방향(314) 및 종속-종속 방향(316)을 포함하는 뷰간 텍스처-텍스처 방향,
c) 독립-종속 방향(318) 및 종속-종속 방향(320)을 포함하는 뷰간 깊이-깊이 방향,
d) 독립 텍스처-깊이 방향(322) 및 종속 텍스처-깊이 방향(324)을 포함하는 뷰간 텍스처-깊이 방향, 및
e) 독립 깊이-텍스처 방향(318) 및 종속 깊이-텍스처(320) 방향을 포함하는 뷰간 깊이-텍스처 방향
을 포함한다.
인코더(206)는 전술한 모든 선택 가능 방향들에서의 PPI를 지원하며, 임의의 주어진 시간에 그러한 선택 가능 방향들 중 하나 이상의 방향에서의 PPI를 선택할 수 있거나, 필요에 따라서는 어느 것도 선택하지 않는다. 따라서, 본 명세서에서 설명되는 PPI 실시예들은 유연하며, PPI가 허용되지 않는 경우보다 더 큰 코딩 이득을 제공할 수 있다. 또한, PPI는 계산 부하를 줄이는데, 그 이유는 인코딩에서 사용할 예측 파라미터들의 상속으로 인해 비디오 블록의 인코딩이 필요할 때마다 예측 파라미터들을 분석적으로 도출하는 것과 관련된 계산 오버헤드가 감소하기 때문이다.
위의 예들과 관련하여 설명된 바와 같이, PPI는 인코더들 간의 예측 파라미터들의 상속으로 간주되고 지칭될 수 있으며, 이러한 상속에서는 제1 인코더에 의해 제1 비디오 블록들을 인코딩하는 데 사용된 예측 파라미터들이 제1 인코더로부터 제2 인코더에 의해 다수의 선택 가능 PPI 방향 중 임의의 방향으로 상속되고, 제2 인코더에 의해 상속된 예측 파라미터들을 이용하여 제2 블록들을 인코딩하는 데 사용된다. 대안으로서 그리고 등가적으로, PPI는 비디오 블록들 간의 상속으로 간주되고 지칭될 수 있으며, 이러한 상속에서는 제1 비디오 블록들을 인코딩하는 데 사용된 예측 파라미터들이 제1 비디오 블록들로부터 다수의 선택 가능 PPI 방향 중 임의의 방향으로 상속되고, 제2 비디오 블록들을 인코딩하는 데 사용된다.
도 4a는 일 실시예에 따른, 도 3의 뷰 (0)의 인코더들(T0, D0) 및 뷰 (1)의 인코더들(T1, D1)을 포함하는 2-뷰 인코더의 상세 블록도이다. 인코더들(T0, D0, T1, D1) 각각은 그의 각각의 텍스처 또는 깊이 비디오 성분을 비트스트림(210) 내에 팩킹될 대응하는 인코딩된 비디오 성분으로 인코딩하기 위해 나머지 인코더들과 실질적으로 동일한 방식으로 동작하도록 구성된다. 인코더들(T0, D0, T1, D1) 각각은 변환 양자화기, 역변환 양자화기, 루프내 필터, 인트라 및 인터 예측 모듈들 및 가산기들과 같은 공지된 인코더 모듈들을 포함한다.
게다가, 각각의 인코더는 (i) 비디오 블록들을 인코딩하기 위해 PPI를 사용/적용할지(즉, PPI 인코딩 모드를 적용할지)를 결정하고, (ii) PPI가 적용되는 것으로 결정되는 경우에, 상속된 예측 파라미터들을 상속된 예측 파라미터들에서 표시되는 예측 모드에 따라 선택되는 바와 같은 인트라 예측 모듈 또는 인터 예측 모듈로 라우팅하여, 선택된 예측 모듈이 상속된 예측 파라미터들을 이용하여 비디오 블록들을 예측할 수 있게 하도록 구성되는 모드 결정 모듈을 포함한다.
PPI를 사용할지를 결정하기 위해, 모드 결정 모듈은 비디오 블록들을 인코딩하기 위한 한 세트의 최상의 예측 파라미터들을 상이한 사례들(즉, 국지적 도출, 상속 및 국지적 도출과 상속의 혼합)에 대한 레이트 왜곡 비용들의 비교에 기초하여 (i) 국지적 도출 예측 파라미터들, (ii) 상속 예측 파라미터들 또는 (iii) 국지적 도출 및 상속 파라미터들의 혼합으로서 결정한다. 상속 예측 파라미터들이 (단독으로 또는 부분적으로) 최상의 선택인 것으로 결정되는 경우, 모드 결정 모듈은 PPI 인코딩 모드를 호출하며(즉, PPI를 적용하며), 따라서 예측 모듈들 중 선택된 예측 모듈은 적절한 PPI 방향으로부터 예측 파라미터들을 상속한다. 최상의 파라미터들을 결정하는 방법은 도 9b와 관련하여 후술된다.
인코더들(T0, D0, T1, D1)은 그들 각각의 비디오 성분들의 입력 블록들을 인코딩된 비디오 성분들의 블록들로 인코딩하며, 이어서 이러한 인코딩된 비디오 성분들의 블록들은 인코딩된 비트스트림(210)으로 컴파일된다. 인코더들은 또한 PPI와 관련된 신택스를 비트스트림(210) 내에 삽입한다. PPI 신택스는 PPI 인코딩 모드, 즉 PPI의 사용을 표시하는 PPI 플래그들을 포함한다. PPI 플래그들은 시퀀스별/뷰별/슬라이스별/픽처별/CU별/PU별/TU별 레벨들 중 임의 레벨에서의 PPI의 사용을 시그널링하는 데 사용될 수 있다. PPI 플래그들은 또한 시퀀스별/뷰별/슬라이스별/픽처별/CU별/PU별/TU별 레벨들 중 임의 레벨에서의 성분간 PPI 또는 뷰간 PPI(또는 이들 양자의 결합)의 사용을 시그널링하는 데 사용될 수 있다.
신택스는 또한 PPI 플래그들과 관련된 아래의 정보 필드들 중 하나 이상을 포함한다.
대응하는 소스 뷰(예로서, 뷰 (0), (1) 등) 및 소스 비디오 성분(즉, 깊이 또는 텍스처 비디오)의 식별자들을 포함하는, 소스 인코더, 및 예측 파라미터들을 상속해주는 인코딩된 비디오 블록들의 식별자들. 이것은 예측 파라미터들을 상속해주는 인코딩된 블록을 결정할 수 있는 (하나 이상의 인코딩된 블록 식별자와 같은) 정보도 포함할 수 있다.
대응하는 수신 뷰 및 수신 비디오 성분의 식별자들을 포함하는, 상속 예측 파라미터들의 수신 인코더/블록들의 식별자들.
상속 예측 파라미터들.
도 4b는 인코딩된 비트스트림(210) 내에 삽입될 수 있는 PPI 신택스(450)의 도면이다. PPI 신택스는 PPI 플래그들, PPI 방향(뷰, 성분, 하나 이상의 블록의 식별자와 같은 상속 파라미터들의 소스의 표시) 및 상속 예측 파라미터들을 포함한다.
도 4a의 굵은 선 안에는 인코더들(T0, D0, T1, D1) 사이의 다양한 방향에서의 PPI를 지원하는 (도 3에 도시된 PPI 통신 경로들에 대응하는) 예시적인 선택 가능 PPI 통신 또는 상속 경로들이 도시된다. PPI 통신 경로들은 또한 PPI를 지원하는 상이한 인코더별 모드 결정 모듈들 사이의 인터 통신을 허가하며, 따라서 수신 인코더는 PPI를 사용하기 위한 그의 결정을 상속될 예측 파라미터들의 소스인 인코더로 통신한다. 도 4a에는 아래의 통신 경로들이 설명된다.
a) 텍스처 인코더(T0)에서 깊이 인코더(D0)로의 그리고 텍스처 인코더(T1)에서 깊이 인코더(D1)로의 지시된 방향들에서의 예측 파라미터들의 상속을 지원하기 위한 뷰내(즉, 동일 뷰) 텍스처-깊이 PPI 경로들(404, 406). 예를 들어, 텍스처 인코더(T0)에 의해 텍스처 비디오 블록들을 인코딩하는 데 사용된 파라미터들이 텍스처 인코더로부터 (뷰내 텍스처-깊이 방향으로) 깊이 인코더(D0)에 의해 상속될 수 있으며, 따라서 깊이 인코더는 상속 파라미터들을 이용하여 깊이 비디오 블록들을 인코딩할 수 있다.
b) 텍스처 인코더(TO)에서 텍스처 인코더(T1)로의 예측 파라미터들의 상속을 지원하기 위한 뷰간 텍스처-텍스처 PPI 경로(408).
c) 깊이 인코더(D0)에서 깊이 인코더(D1)로의 예측 파라미터들의 상속을 지원하기 위한 뷰간 깊이-깊이 PPI 경로(410).
아래의 PPI 통신 경로들도 존재하지만, 과도한 복잡성을 피하기 위해 도 4a로부터 생략된다.
d) 뷰내 깊이-텍스처 경로.
e) 뷰간 깊이-텍스처 경로.
PPI 경로들(404-410)은 소스 인코더/블록으로부터 수신 인코더/블록으로의 지시된 방향들로 예측 파라미터들을 라우팅한다. 경로들(404-410) 각각은 신호 경로, 및 수신 인코더에 의한 액세스를 위해 소스 인코더로부터 예측 파라미터들을 수신 및 저장하기 위한 저장 버퍼를 포함한다. PPI 경로들(404-410)은 소스 인코더로부터의 상속 예측 파라미터들을 수신 인코더 내의 각각의 모드 결정 모듈의 입력으로 지향시킨다. PPI가 선택/적용되는 경우, 적절한 수신 인코더의 모드 결정 모듈은 모드 결정 모듈의 입력에서 제공된 상속 예측 파라미터들을 인트라 및 인터 예측 모듈들 중 선택된 예측 모듈로 라우팅하여, 선택된 예측 모듈이 비디오 블록들을 인코딩하는 데 사용하게 한다. 상속 예측 파라미터들은 사용될 적절한 예측 모델을 표시하는 예측 모드들(인터/인트라)을 포함한다.
PPI 통신 경로들은 모드 결정 모듈들과 더불어 함께 인코더에서의 PPI를 지원하는 PPI 통신 기반구조를 포함한다.
실시예들에서, 인코더들 각각은 인코더 컴퓨터 프로그램 모듈들 중 다른 것들로부터 예측 파라미터들을 상속하는 객체 지향 컴퓨터 프로그램 모듈(들)을 포함하는 하나 이상의 컴퓨터 프로그램 모듈로서 구현될 수 있다.
디코더
도 5는 도 4a의 2-뷰 인코더 시스템에 대응하는 예시적인 2-뷰 디코더 시스템의 상세 블록도이다. 도 5의 디코더들(D1, T1, DO, T0) 각각은 도 4a의 인코더들(D1, T1, D0, T0) 각각에 대응하며, 그의 쌍을 이루는 인코더로부터의 인코딩된 성분을 디코딩한다. 디코더들(T0, D0, T1, D1) 각각은 수신된 비트스트림(210)으로부터의 그의 각각의 인코딩된 텍스처 또는 깊이 비디오 성분을 적절한 경우에 대응하는 출력 텍스처 비디오 또는 출력 깊이 비디오로 디코딩하기 위해 나머지 디코더들과 실질적으로 동일한 방식으로 동작하도록 구성된다. 인코더들(T0, DO, T1, D1) 각각은 변환 양자화기, 역변환 양자화기, 루프내 필터, 인트라 및 인터 예측 모듈들 및 가산기와 같은 공지된 디코더 모듈들을 포함한다.
게다가, 각각의 디코더는 비트스트림(210) 내에 삽입된 PPI 신택스를 결정하고, (i) 비디오 블록들을 디코딩하기 위해 PPI를 적용할지를 포함하는 결정된 신택스에 기초하여 적절한 액션들을 취하고, PPI가 표시되는 경우에 (ii) 상속 예측 파라미터들을 인트라 및 인터 예측 모듈들 중 선택된 예측 모듈로 라우팅하여, 선택된 예측 모듈이 상속 예측 파라미터들을 이용하여 비디오 블록들을 예측할 수 있게 하도록 구성되는 모드 결정 모듈을 포함한다.
도 5의 굵은 선 안에는 디코더들(T0, D0, T1, D1) 사이의 다양한 방향들에서의 PPI를 지원하는 (도 4a의 인코더 내의 PPI 통신 경로들(404, 406, 408, 410)에 대응하는) 예시적인 선택 가능한 PPI 통신 경로들(504, 506, 508, 510)이 도시된다. 도면에 과도한 복잡성을 추가하지 않기 위해 도 5에는 모든 지원되는 PPI 통신 경로들이 도시되지는 않는다. PPI 통신 경로들은 PPI를 지원하는 상이한 모드 결정 모듈들 간의 인터 통신을 허가하며, 따라서 수신 디코더는 PPI를 사용하기 위한 그의 결정을 상속될 예측 파라미터들의 소스인 디코더로 통신할 수 있다. 디코더의 PPI 통신 경로들은 도 4a의 인코더의 그것들과 유사하게 동작하도록 구성되며, 따라서 여기서는 더 설명되지 않는다. 2-뷰 디코더는 도 4a의 인코더에 의해 지원되는 모든 동일 방향들에서의 PPI를 지원한다.
각각의 (디코더) 모드 결정 모듈은 수신된 비트스트림(210) 내에 삽입된 PPI 신택스를 결정한다. PPI 플래그가 PPI를 표시하는 경우, 결정 모듈은 그의 각각의 디코더가 상속 예측 파라미터들을 포함하는 PPI 플래그들과 관련된 PPI 신택스 정보 필드들에 따라 PPI를 이용하여 그의 수신된 인코딩된 비디오 블록들을 디코딩하게 한다. 모드 결정 모듈은 상속 예측 파라미터들에 포함된 예측 모드들에 따라 상속 예측 파라미터들의 표시된 소스로부터 인터 및 인트라 예측 모듈들 중 하나로의 방향으로 예측 파라미터들을 라우팅한다.
PPI 통신 경로들 및 모드 결정 모듈들은 함께 디코더에서의 PPI를 지원하는 PPI 통신 기반구조를 포함한다. 디코더 PPI 통신 기반구조는 전술한 인코더에서 지원되는 모든 PPI 방향들을 지원한다. 디코더들은 인코더들에 대해 전술한 모든 방향에서의 PPI를 지원하며, 임의의 주어진 시간에 그러한 방향들 중 하나 이상의 방향에서의 PPI를 선택할 수 있거나, 필요에 따라서는 어느 것도 선택하지 않는다.
실시예들에서, 디코더들 각각은 디코더 컴퓨터 프로그램 모듈들 중 다른 것들로부터 예측 파라미터들을 상속하는 객체 지향 컴퓨터 프로그램 모듈(들)을 포함하는 하나 이상의 컴퓨터 프로그램 모듈로서 구현될 수 있다.
PPI 신택스는 깊이 비디오와 같은 뷰간 성분, 또는 성분간 블록으로부터 예측 파라미터들을 상속하는 PPI를 표시할 수 있다. 예를 들어, 예측 파라미터들이 뷰간 깊이 성분, 예로서 깊이 맵으로부터 상속되는 경우, 도 6과 관련하여 후술하는 바와 같이, 뷰간 깊이 맵 내의 대응하는 블록이 생성된 변이 벡터를 이용하여 검색될 수 있다.
도 6은 뷰간 PPI에서 디코딩될 현재 블록에 대응하는 기준 블록을 결정하기 위해 도 5의 디코더에 의해 생성된 예시적인 생성된 변이 벡터의 도면이다. 생성된 변이 벡터는 깊이 변환된 변이 벡터, 전역 변이 벡터, 이웃하는 사전 코딩된 블록들로부터의 선택적 변이 벡터 등일 수 있다. 블록 기반 인코딩/디코딩의 결과로서, 사전 코딩된 뷰간 성분(도 6의 상부 블록들 참조), 예를 들어 깊이 맵 내의 변이 보상 블록은 전체 블록이 아닐 수 있다. 예를 들어, 변이 보상 블록은 도 6에 A, B, C 및 D로 표시되는 다수의 사전 코딩된 블록 중 둘 이상과 중첩될 수 있다. 대응하는 블록을 선택하기 위해 상이한 방법들이 이용될 수 있으며, 이들은 예를 들어 i) 주요 중첩 블록이 도 6에 "B"로 표시되는 대응 블록으로 선택될 수 있고, ii) 모든 중첩 블록들(A, B, C, D)이 레이트 왜곡 비용들에 기초하여 매치에 대해 검사되고, 블록들 중 최적 블록이 최상의 레이트 왜곡 비용에 기초하여 선택되는 것을 포함할 수 있다. PPI 플래그가 뷰간 PPI 대신에 뷰내 PPI를 표시하는 경우, 동일 뷰 내에 같은 곳에 위치하는 블록으로부터 예측 파라미터들이 복사(즉, 상속)된다.
PPI 예들
도 7a는 인코더들(D0, T0, D1, T1) 간의 다양한 선택 가능 방향들에서의 PPI를 나타내는 블록도이다. 화살표들에 의해 표시되는 선택 가능 PPI 방향들은 뷰내 성분간, 뷰간 성분간 및 뷰간 동일 성분을 포함한다. 블록도는 도 5의 디코더들(D0, T0, D1, T1) 사이에 적용될 수 있는 PPI 방향들에도 동일하게 적용된다. 표시되는 바와 같이:
a) (뷰 (0)의) D0의 비디오 블록은 (뷰 (0)의) T0의 비디오 블록으로부터 상속된 예측 파라미터들에 기초하여 인코딩/디코딩될 수 있다.
b) T0의 비디오 블록은 D0의 비디오 블록으로부터 예측 파라미터들을 상속할 수 있다.
c) D1의 비디오 블록은 D0, T0 및 T1로부터의 비디오 블록들 중 선택 가능한 하나의 비디오 블록으로부터 예측 파라미터들을 상속할 수 있다.
d) T1의 비디오 블록은 D0, T0 및 D1로부터의 비디오 블록들 중 선택 가능한 하나의 비디오 블록으로부터 예측 파라미터들을 상속할 수 있다.
도 7b는 일련의 블록도들이며, 이들은 위에서 아래로:
(a) 우측의 블록들이 좌측의 모든 인트라 인코딩된 블록들로부터 구조 및 인트라 예측 모드들을 상속하는 인트라,
(b) 우측의 코딩 블록들이 좌측의 모든 인터 인코딩된 블록들로부터 구조 및 인터 예측 모드들을 상속하는 인터, 및
(c) 우측의 코딩 블록들이 좌측의 하이브리드 인코딩된 블록들로부터 구조 및 하이브리드(인터 및 인트라) 예측 모드들을 상속하는 하이브리드
를 포함한다.
도 7c는 현재 블록(즉, 우측 블록)에 의한 하이브리드 인코딩된 소스 블록(즉, 좌측 블록)으로부터의 다른 예시적인 PPI의 블록도이다. 쿼드트리 분할(즉, 분할 플래그들), 예측 모드들, 파티션 크기, 모션 필드, 인터 방향, 기준 인덱스, 루마 인트라 모드 및 크로마 인트라 모드와 같은 소스 블록의 각각의 서브블록의 예측 파라미터들이 완전히 또는 부분적으로 상속될 수 있다.
PPI는 트리-블록(즉, 코딩 트리) 계층구조의 임의 레벨에 있을 수 있다. 따라서, 도 8a 및 8b와 관련하여 후술하는 바와 같이, 소스 CU 및 수신 CU는 계층구조 내에 상이한 레벨들에 있고, 상이한 크기들을 가질 수 있다.
도 8a는 코딩 트리 계층구조의 상이한 레벨들에서의, 즉 큰 CU로부터 작은 CU로의 PPI의 예시적인 도면이다. 이 예에서, PPI는 상속에 사용되는 소스 CU("더 높은 레벨에 있는 CU")의 크기보다 작은 수신 CU("현재 CU")의 크기에 대응하는 쿼드트리의 더 낮은 레벨에 있는 것으로 표시된다. 따라서, 현재 CU와 동일한 크기를 갖는 도 8a의 음영 블록은 상속 신호의 소스(즉, 상속의 소스)로서 표시된다. 예측 모드들, 모션 필드들, 인터 방향들, 기준 인덱스들, 루마 인트라 모드들 및 크로마 인트라 모드들과 같은 예측 파라미터들은 상속 신호로부터 완전히 또는 부분적으로 상속된다. 또한, 현재 CU의 쿼드트리 분할 플래그는 거짓으로 설정되며, 현재 CU의 파티션 크기는 2Nx2N으로 설정된다.
도 8b는 코딩 트리 계층구조의 상이한 레벨들에서의, 즉 작은 CU로부터 큰 CU로의 PPI의 다른 예시적인 도면이다. 이 예에서, PPI는 상속 신호(즉, 상속의 소스)를 위해 사용되는 CU 크기보다 작은 CU 크기에 대응하는 쿼드트리의 더 낮은 레벨에 있는 것으로 표시된다. 상속 신호(즉, 상속 PPI 소스)로서 표시되는 도 8b의 음영 블록은 현재 CU와 동일한 크기를 갖는다. 쿼드트리 분할 플래그들(CU/PU 세분), 예측 모드들, 파티션 크기들, 모션 필드들, 인터 방향들, 기준 인덱스들, 루마 인트라 모드들 및 크로마 인트라 모드들과 같은 예측 파라미터들은 상속 신호로부터 완전히 또는 부분적으로 상속된다.
방법 흐름도들
도 9a는 PPI를 이용하여 멀티-뷰 텍스처 및 깊이 비디오/성분들을 인코딩하는 예시적인 방법(900)의 흐름도이다.
905는 멀티-뷰 비디오의 다수의 뷰 중 제1 뷰의 텍스처 성분, 제1 뷰의 깊이 성분, 다수의 뷰 중 제2 뷰의 텍스처 성분 및 제2 뷰의 깊이 성분 각각으로부터 인코딩될/각각의 상이한 비디오 블록을 수신하는 단계를 포함한다. 멀티-뷰 비디오는 3D 멀티-뷰 비디오일 수 있다.
910은 각각의 상이한 비디오 블록을 나머지 상이한 비디오 블록들 중 선택 가능한 하나의 비디오 블록으로부터 상속된 예측 파라미터들 및 나머지 상이한 비디오 블록들 중 하나로부터 상속되지 않은 예측 파라미터들 중 선택 가능한 하나의 예측 파라미터에 기초하여 인코딩하는 단계를 포함한다.
상속 예측 파라미터들에 기초하여 각각의 상이한 비디오 블록을 인코딩하는 단계는
a) 제1 뷰의 텍스처 및 깊이 성분들 중 하나의 성분의 각각의 비디오 블록을 제1 뷰의 텍스처 및 깊이 성분들 중 나머지 하나의 성분의 나머지 비디오 블록들 중 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하는 단계, 및
b) 제2 뷰의 텍스처 및 깊이 성분들 중 하나의 성분의 각각의 비디오 블록을
제1 뷰의 텍스처 성분,
제1 뷰의 깊이 성분, 및
제2 뷰의 텍스처 및 깊이 성분들 중 나머지 하나의 성분
의 나머지 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하는 단계
를 포함할 수 있다.
상속 예측 파라미터들은 또한:
a. 나머지 비디오 블록들 중 하나가 인터 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 인터 예측 모드들,
b. 나머지 비디오 블록들 중 하나가 인트라 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 인트라 예측 모드들, 및
c. 나머지 비디오 블록들 중 하나가 인터 및 인트라 모드들의 결합에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 인터 및 인트라 예측 모드들의 결합
을 포함할 수 있다.
915는 다수의 뷰 각각 내의 텍스처 및 깊이 성분들의 인코딩된 비디오 블록들을 포함하는 인코딩된 비트스트림을 생성하는 단계를 포함한다.
920은 상속 예측 파라미터들에 기초하여 인코딩된, 인코딩된 비디오 블록들 각각과 관련된 PPI 신택스를 인코딩된 비트스트림 내에 삽입하는 단계를 포함하며, PPI 신택스는 인코딩된 비디오 블록이 상속 예측 파라미터들에 기초하여 인코딩되었음을 표시하는 PPI 플래그, 예측 파라미터들을 상속해준 나머지 비디오 블록들 중 하나를 결정할 수 있는(예를 들어, 예측 파라미터들을 상속해주었을 수 있는 블록 또는 여러 후보 블록을 구체적으로 식별하는) 정보 및 상속 예측 파라미터들을 포함한다.
도 9b는 방법(900)의 910에서의 인코딩을 상술하는 예시적인 방법의 흐름도이다.
930은 상속 예측 파라미터들의 세트 또는 상속되지 않은 예측 파라미터들의 세트에 기초하여 각각의 비디오 블록을 인코딩할지를 결정하는 단계를 포함한다. 930의 결정은 예를 들어 도 4a의 멀티-뷰 인코더들의 각각의 인코더(T0, D0, T1, D1) 내의 모드 결정 모듈들에 의해 수행될 수 있다.
935는 930에서 상속 예측 파라미터들의 세트에 기초하여 각각의 비디오 블록을 인코딩하기로 결정되는 경우에 그렇게 하는 단계를 포함한다.
940은 930에서 상속되지 않은 예측 파라미터들의 세트에 기초하여 각각의 비디오 블록을 인코딩하기로 결정되는 경우에 그렇게 하는 단계를 포함한다.
930에서의 결정은 950, 955 및 960에서 더 상술된다.
950은 인코딩될 각각의 비디오 블록 및 비디오 블록을 인코딩하기 위한 예측 파라미터들의 후보 세트들을 수신하는 단계를 포함하며, 후보 세트들은 상속 예측 파라미터들의 세트들 및 상속 예측 파라미터들이 아닌 예측 파라미터들의 세트들, 예를 들어 디폴트 및 국지적으로 생성된 예측 파라미터들(즉, 각각의 비디오 블록을 인코딩하는 인코더들 각각에서 생성된 예측 파라미터들)을 포함한다.
955는 레이트 왜곡 비용 함수에 기초하여 각각의 비디오 블록과 관련된 후보 예측 파라미터들의 세트들 각각에 대한 레이트 왜곡 비용을 추정하는 단계를 포함한다. 관련 분야의 통상의 기술자에게 명백한 바와 같은 1 기반 양자화 비디오 신호들, 제곱 합 차이들 및 라그랑지안 계수들과 같은 임의의 적절한 공지 레이트 왜곡 비용 함수가 사용될 수 있다.
960은 추정된 레이트 왜곡 비용을 최소화하는 예측 파라미터들의 세트들 중 최상의 세트를 선택하는 단계를 포함한다.
일 실시예에서, 상속 및 비상속 예측 파라미터들의 결합이 선택되고, 이어서 각각의 비디오 블록을 인코딩하는 데 사용될 수 있으며, 결합은 레이트 왜곡 비용 함수를 최소화한다.
도 10은 인코딩된 멀티-뷰 텍스처 및 깊이 비디오/성분들을 PPI를 이용하여 디코딩하는 예시적인 방법(1000)의 흐름도이다.
1005는 멀티-뷰 비디오의 다수의 뷰 중 제1 뷰의 텍스처 성분, 제1 뷰의 깊이 성분, 다수의 뷰 중 제2 뷰의 텍스처 성분 및 제2 뷰의 깊이 성분 각각의 인코딩된 비디오 블록을 수신하는 단계를 포함한다. 멀티-뷰 비디오는 3D 멀티-뷰 비디오일 수 있다.
1010은 각각의 인코딩된 비디오 블록이 각각의 인코딩된 비디오 블록이 상속 예측 파라미터들에 기초하여 인코딩되었음을 표시하는 PPI와 관련되는지를 결정하는 단계를 포함한다.
1015는 각각의 인코딩된 비디오 블록에 대해 상속 예측 파라미터들이 표시되는 경우에 PPI 신택스에서 표시되는 나머지 인코딩된 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들에 기초하여 각각의 인코딩된 비디오 블록을 디코딩하는 단계를 포함한다.
1020은 상속 예측 파라미터들이 표시되지 않는 경우에 상속되지 않은 예측 파라미터들에 기초하여 각각의 인코딩된 비디오 블록을 디코딩하는 단계를 포함한다.
인코더들 및 디코더들에서의 PPI의 실시예들은 다음 중 하나 이상을 포함/제공한다.
1. 3D 비디오 코덱의 성능을 개선하기 위해 3D 비디오 코딩에 대해 예측 파라미터 상속을 수행하기 위한 메커니즘.
2. 특정 시퀀스/뷰/슬라이스/픽처/CU/PU/TU 레벨에서 PPI를 선택적으로 적용하기 위한 메커니즘.
3. 추가적인 코딩 모드, 즉 PPI 코딩 모드로서 PPI를 적응적으로 적용하기 위한 메커니즘. 시퀀스별/뷰별/슬라이스별/픽처별/CU별/PU별/TU별 플래그를 이용하여 PPI를 시퀀스/뷰/슬라이스/픽처/CU/PU/TU에 적용할지를 시그널링할 수 있으며, PPI를 사용하기 위한 결정은 레이트 왜곡 비용 분석에 기초할 수 있다.
4. 성분간 또는 뷰간 방향들로부터 PPI를 적응적으로 그리고 선택적으로 적용하기 위한 메커니즘. 이 경우, 시퀀스별/뷰별/슬라이스별/픽처별/CU별/PU별/TU별 플래그를 이용하여 예측 파라미터들이 성분간 텍스처 또는 뷰간 텍스처/깊이 방향들로부터 상속되는지를 시그널링할 수 있으며, PPI를 적용하기 위한 결정은 레이트 왜곡 비용 분석에 기초하여 행해질 수 있다.
5. 독립/종속 깊이 맵 코딩 및/또는 종속 텍스처 비디오 코딩을 개선하기 위해 PPI를 수행하기 위한 메커니즘. 상속 방향은 텍스처-깊이 및/또는 깊이-깊이 및/또는 텍스처-텍스처일 수 있다.
독립/종속 깊이 맵 블록들에 PPI를 적용하기 위한 메커니즘, 여기서 예측 파라미터들은 같은 곳에 위치하는 텍스처 비디오 블록들에 의해 상속된다. "같은 곳에 위치"의 일례는 깊이 맵에 대한 현재 블록의 좌표들과 텍스처 프레임에 대한 텍스처 블록의 좌표들이 동일한 때이다.
종속 깊이 블록들에 PPI를 적용하기 위한 메커니즘, 여기서 예측 파라미터들은 대응하는 뷰간 깊이 블록들로부터 상속된다. 대응하는 뷰간 블록들은 i) 깊이 변환된 변이 벡터, ii) 전역 변이 벡터 및 iii) 이웃하는 사전 코딩된 블록들로부터의 선택적 변이 벡터와 같은 생성된 변이 벡터를 이용하여 검색될 수 있다. 블록 기반 코딩의 결과는 사전 코딩된 뷰간 깊이 맵 내의 변이 보상된 블록이 전체 블록이 아닐 수 있으며, 둘 이상의 사전 코딩된 블록과 중첩될 수 있다는 것이다. 이 경우, 대응하는 블록을 선택하기 위해 상이한 방법들이 이용될 수 있는데, 예를 들어 i) 주요 중첩 블록이 대응 블록으로서 선택되고, ii) 레이트 왜곡 비용 분석에 기초하여 최적의 블록을 결정하기 위해 모든 중첩된 블록들이 검사된다.
종속 텍스처 블록들에 PPI를 적용하기 위한 메커니즘, 여기서 예측 파라미터들은 대응하는 뷰간 텍스처 블록들로부터 상속된다. 대응하는 블록들의 도출은 전술한 바와 같이 생성된 변이 벡터를 이용할 수 있다.
6. 상속 신호의 소스인 서브블록들을 모두-인터/모두-인트라/하이브리드 예측을 이용하여 코딩할 수 있는 PPI를 적용하기 위한 메커니즘. 예를 들어, 독립 깊이 맵 블록은 a) 모든 서브블록들이 인트라 코딩되고, b) 모든 서브블록들이 인터 코딩되고, c) 일부 서브블록들이 인트라 코딩되고, 일부 서브블록들이 인터 코딩되는 그의 같은 곳에 위치하는 텍스처 비디오 블록으로부터 예측 파라미터들을 상속할 수 있다.
7. 트리-블록 계층구조의 임의 레벨에서 PPI를 적용하기 위한 메커니즘, 이는 다음의 경우에 해당한다.
PPI 모드가 상속 신호를 위해 사용되는 CU 크기보다 크거나 동일한 CU 크기에 대응하는 코딩 트리의 더 높은 레벨에서 표시되는 경우, 및
PPI 모드가 상속 신호를 위해 사용되는 CU 크기보다 작은 CU 크기에 대응하는 코딩 트리의 더 낮은 레벨에서 표시되는 경우.
컴퓨터 시스템
본 명세서에서 설명되는 방법들 및 시스템들은 개별 및 집적 회로 논리, 주문형 집적회로(ASIC) 논리 및 마이크로컨트롤러들을 포함하는 하드웨어, 소프트웨어, 펌웨어 및 이들의 결합들에서 구현될 수 있으며, 도메인 고유 집적회로 패키지의 일부 및/또는 집적회로 패키지들의 결합으로서 구현될 수 있다. 소프트웨어는 명령어들을 포함하는 컴퓨터 프로그램이 인코딩된 컴퓨터 판독 가능 매체를 포함할 수 있으며, 프로세서는 명령어들에 응답하여 하나 이상의 기능을 수행한다. 컴퓨터 판독 가능 매체는 일시적 및/또는 비일시적 매체를 포함할 수 있다. 프로세서는 범용 명령어 프로세서, 제어기, 마이크로컨트롤러 및/또는 다른 명령어 기반 프로세서를 포함할 수 있다.
도 11은 하나 이상의 위의 예에서 설명된 바와 같은 인코더 및 디코더에서의 PPI 실시예들을 수행하도록 구성되는 컴퓨터 시스템(1100)의 블록도이다.
컴퓨터 시스템(1100)은 본 명세서에서 컴퓨터 프로그램 논리로도 지칭되는 컴퓨터 판독 가능 명령어들을 실행하기 위해 본 명세서에서 프로세서(1102)로서 도시되는 하나 이상의 컴퓨터 명령어 처리 유닛 및/또는 프로세서 코어를 포함한다.
컴퓨터 시스템(1100)은 본 명세서에서 메모리(1104)로서 도시되는 메모리, 캐시, 레지스터들 및/또는 저장 장치를 포함할 수 있으며, 이들은 본 명세서에서 컴퓨터 프로그램(1106)으로서 설명되는 컴퓨터 프로그램이 인코딩된 비일시적 컴퓨터 판독 가능 매체를 포함할 수 있다.
메모리(1104)는 컴퓨터 프로그램(1106)을 실행할 때 프로세서(1102)에 의해 사용되고/되거나 컴퓨터 프로그램(1106)의 실행 동안 프로세서(1102)에 의해 생성되는 데이터(1108)를 포함할 수 있다. 데이터(1108)는 텍스처 비디오 및 깊이 맵 성분들(1108a), 예측 파라미터들(1108b) 및 코딩된 성분들(1108c)을 포함하는 다수의 비디오를 포함할 수 있다.
컴퓨터 프로그램(1106)은 프로세서(1102)로 하여금 하나 이상의 위의 예에서 설명된 바와 같은 PPI를 이용하여 3D 비디오를 인코딩하게 하기 위한 PPI 통신 기반구조 명령어들을 포함하는 인코더 명령어들(1110)을 포함할 수 있다.
컴퓨터 프로그램(1106)은 프로세서(1102)로 하여금 코딩된 3D 비디오를 하나 이상의 위의 예에서 설명된 바와 같은 PPI를 이용하여 디코딩하게 하기 위한 PPI 통신 기반구조 명령어들을 포함하는 디코더 명령어들(1110)을 포함할 수 있다.
실시예들에서, 관련 분야의 통상의 기술자에게 명백한 바와 같이, 인코딩 실시예들과 관련된 시스템(1100)의 컴포넌트들 및 디코딩 실시예들과 관련된 컴포넌트들은 물리적으로 분리된 장치들 내에 위치할 수 있으며, 예를 들어 인코딩 컴포넌트들은 송신기 측 장치 내에 위치하는 반면, 디코딩 컴포넌트들은 수신기 측 장치 내에 위치한다.
장치 시스템들
본 명세서에서 개시되는 방법들 및 시스템들은 도 12를 참조하여 후술하는 바와 같은 하나 이상의 소비자 시스템을 포함하는 다양한 시스템들 중 하나 이상과 관련하여 구현될 수 있다. 그러나, 본 명세서에서 개시되는 방법들 및 시스템들은 도 12의 예로 한정되지 않는다.
도 12는 본 명세서에서 설명되는 PPI 인코더 및 디코더 실시예들을 구현할 수 있는 시스템(1200)의 일 실시예를 나타낸다. 실시예들에서, 시스템(1200)은 미디어 시스템일 수 있지만, 시스템(1200)은 이 상황으로 한정되지 않는다. 예를 들어, 시스템(1200)은 개인용 컴퓨터(PC), 랩탑 컴퓨터, 울트라 랩탑 컴퓨터, 태블릿, 터치 패드, 휴대용 컴퓨터, 핸드헬드 컴퓨터, 팜탑 컴퓨터, 개인 휴대 단말기(PDA), 셀룰러 전화, 결합형 셀룰러 전화/PDA, 텔레비전, 스마트 장치(예로서, 스마트폰, 스마트 태블릿 또는 스마트 텔레비전), 이동 인터넷 장치(MID), 메시징 장치, 데이터 통신 장치 등 내에 통합될 수 있다.
실시예들에서, 시스템(1200)은 디스플레이(1220)에 결합된 플랫폼(1202)을 포함한다. 플랫폼(1202)은 콘텐츠 서비스 장치(들)(1230) 또는 콘텐츠 전달 장치(들)(1240) 또는 다른 유사한 콘텐츠 소스들과 같은 콘텐츠 장치로부터 콘텐츠를 수신할 수 있다. 하나 이상의 내비게이션 특징을 포함하는 내비게이션 제어기(1250)를 이용하여, 예를 들어 플랫폼(1202) 및/또는 디스플레이(1220)와 상호작용할 수 있다. 이러한 컴포넌트들 각각은 아래에서 더 상세히 설명된다.
실시예들에서, 플랫폼(1202)은 칩셋(1205), 프로세서(1210), 메모리(1212), 저장 장치(1214), 그래픽 서브시스템(1215), 애플리케이션들(1216) 및/또는 무선부(1218)의 임의 결합을 포함할 수 있다. 칩셋(1205)은 프로세서(1210), 메모리(1212), 저장 장치(1214), 그래픽 서브시스템(1215), 애플리케이션들(1216) 및/또는 무선부(1218) 사이의 상호 통신을 제공할 수 있다. 예를 들어, 칩셋(1205)은 저장 장치(1214)와의 상호 통신을 제공할 수 있는 저장 장치 어댑터(도시되지 않음)를 포함할 수 있다.
프로세서(1210)는 복합 명령어 세트 컴퓨터(CISC) 또는 축소 명령어 세트 컴퓨터(RISC) 프로세서들, x86 명령어 세트 호환 프로세서들, 멀티코어 또는 임의의 다른 마이크로프로세서 또는 중앙 처리 유닛(CPU)으로서 구현될 수 있다. 실시예들에서, 프로세서(1210)는 듀얼코어 프로세서(들), 듀얼코어 이동 프로세서(들) 등을 포함할 수 있다.
메모리(1212)는 랜덤 액세스 메모리(RAM), 동적 랜덤 액세스 메모리(DRAM) 또는 정적 RAM(SRAM)과 같은, 그러나 이에 한정되지 않는 휘발성 메모리 장치로서 구현될 수 있다.
저장 장치(1214)는 자기 디스크 드라이브, 광 디스크 드라이브, 테이프 드라이브, 내부 저장 장치, 부착형 저장 장치, 플래시 메모리, 배터리 백업 SDRAM(동기 DRAM) 및/또는 네트워크 액세스 가능 저장 장치와 같은, 그러나 이에 한정되지 않는 비휘발성 저장 장치로서 구현될 수 있다. 실시예들에서, 저장 장치(1214)는 예를 들어 다수의 하드 드라이브가 포함될 때 귀중한 디지털 미디어에 대한 저장 성능 향상 보호를 향상시키기 위한 기술을 포함할 수 있다.
그래픽 서브시스템(1215)은 표시를 위해 스틸 또는 비디오와 같은 이미지들의 처리를 수행할 수 있다. 그래픽 서브시스템(1215)은 예를 들어 그래픽 처리 유닛(GPU) 또는 비주얼 처리 유닛(VPU)일 수 있다. 아날로그 또는 디지털 인터페이스를 이용하여, 그래픽 서브시스템(1215)과 디스플레이(1220)를 통신 결합할 수 있다. 예를 들어, 인터페이스는 고화질 멀티미디어 인터페이스, 디스플레이 포트, 무선 HDMI 및/또는 무선 HD 추종 기술들 중 임의의 기술일 수 있다. 그래픽 서브시스템(1215)은 프로세서(1210) 또는 칩셋(1205) 내에 통합될 수 있다. 그래픽 서브시스템(1215)은 칩셋(1205)에 통신 결합되는 독립형 카드일 수 있다.
본 명세서에서 설명되는 그래픽 및/또는 비디오 처리 기술들은 다양한 하드웨어 아키텍처들에서 구현될 수 있다. 예를 들어, 그래픽 및/또는 비디오 기능이 칩셋 내에 통합될 수 있다. 대안으로서, 개별 그래픽 및/또는 비디오 프로세서가 사용될 수 있다. 또 다른 실시예로서, 그래픽 및/또는 비디오 기능들은 멀티코어 프로세서를 포함하는 범용 프로세서에 의해 구현될 수 있다. 추가 실시예에서, 기능들은 소비자 전자 장치에서 구현될 수 있다.
무선부(1218)는 다양한 적절한 무선 통신 기술을 이용하여 신호를 송신 및 수신할 수 있는 하나 이상의 무선부를 포함할 수 있다. 그러한 기술들은 하나 이상의 무선 네트워크를 통한 통신을 포함할 수 있다. 예시적인 무선 네트워크들은 무선 근거리 네트워크(WLAN), 무선 개인 영역 네트워크(WPAN), 무선 도시 영역 네트워크(WMAN), 셀룰러 네트워크 및 위성 네트워크를 포함한다(그러나 이에 한정되지 않는다). 그러한 네트워크들을 통한 통신에 있어서, 무선부(1218)는 임의 버전의 하나 이상의 응용 가능 표준에 따라 동작할 수 있다.
실시예들에서, 디스플레이(1220)는 임의의 텔레비전 타입 모니터 또는 디스플레이를 포함할 수 있다. 디스플레이(1220)는 예를 들어 컴퓨터 디스플레이 스크린, 터치스크린 디스플레이, 비디오 모니터, 텔레비전과 유사한 장치 및/또는 텔레비전을 포함할 수 있다. 디스플레이(1220)는 디지털 및/또는 아날로그일 수 있다. 실시예들에서, 디스플레이(1220)는 홀로그래픽 디스플레이일 수 있다. 또한, 디스플레이(1220)는 시각적 투영을 수신할 수 있는 투명 표면일 수 있다. 그러한 투영들은 다양한 형태의 정보, 이미지 및/또는 객체를 전달할 수 있다. 예를 들어, 그러한 투영들은 이동 증강 현실(MAR) 응용을 위한 비주얼 오버레이일 수 있다. 하나 이상의 소프트웨어 애플리케이션(1216)의 제어하에, 플랫폼(1202)은 디스플레이(1220) 상에 사용자 인터페이스(1222)를 표시할 수 있다.
실시예들에서, 콘텐츠 서비스 장치(들)(1230)는 임의의 국내, 국제 및/또는 독립 서비스에 의해 호스트될 수 있으며, 따라서 예를 들어 인터넷을 통해 플랫폼(1202)에 의해 액세스될 수 있다. 콘텐츠 서비스 장치(들)(1230)는 플랫폼(1202) 및/또는 디스플레이(1220)에 결합될 수 있다. 플랫폼(1202) 및/또는 콘텐츠 서비스 장치(들)(1230)는 네트워크(126)에 결합되어, 네트워크(1260)로 그리고 그로부터 미디어 정보를 통신(예로서, 송신 및/또는 수신)할 수 있다. 콘텐츠 전달 장치(들)(1240)도 플랫폼(1202) 및/또는 디스플레이(1220)에 결합될 수 있다.
실시예들에서, 콘텐츠 서비스 장치(들)(1230)는 케이블 텔레비전 박스, 개인용 컴퓨터, 네트워크, 전화, 디지털 정보 및/또는 콘텐츠를 전달할 수 있는 인터넷 인에이블드 장치 또는 기구, 및 네트워크(126)를 통해 또는 직접 콘텐츠 제공자들과 플랫폼(1202) 및/또는 디스플레이(1220) 사이에서 단방향 또는 양방향으로 콘텐츠를 통신할 수 있는 임의의 다른 유사한 장치를 포함할 수 있다. 콘텐츠는 네트워크(1260)를 통해 시스템(1200) 내의 컴포넌트들 중 어느 하나 및 콘텐츠 제공자로 그리고 그들로부터 단방향 및/또는 양방향으로 통신될 수 있다는 것을 알 것이다. 콘텐츠의 예는 예를 들어 비디오, 음악, 의료 및 게임 정보 등을 포함하는 임의의 미디어 정보를 포함할 수 있다.
콘텐츠 서비스 장치(들)(1230)는 미디어 정보, 디지털 정보 및/또는 다른 콘텐츠를 포함하는 케이블 텔레비전 프로그래밍과 같은 콘텐츠를 수신한다. 콘텐츠 제공자의 예는 임의의 케이블 또는 위성 텔레비전 또는 무선부 또는 인터넷 콘텐츠 제공자들을 포함할 수 있다. 제공된 예들은 본 발명의 실시예들을 한정하는 것을 의도하지 않는다.
실시예들에서, 플랫폼(1202)은 하나 이상의 내비게이션 특징을 갖는 내비게이션 제어기(1250)로부터 제어 신호들을 수신할 수 있다. 제어기(1250)의 내비게이션 특징들은 예를 들어 사용자 인터페이스(1222)와 상호작용하는 데 사용될 수 있다. 실시예들에서, 내비게이션 제어기(1250)는 사용자가 공간(예로서, 연속적이고 다차원적인) 데이터를 컴퓨터 내에 입력하는 것을 가능하게 하는 컴퓨터 하드웨어 컴포넌트(구체적으로 사람 인터페이스 장치)일 수 있는 포인팅 장치일 수 있다. 그래픽 사용자 인터페이스(GUI), 및 텔레비전 및 모니터와 같은 많은 시스템은 사용자가 물리 제스처를 이용하여 컴퓨터 또는 텔레비전을 제어하고 컴퓨터 또는 텔레비전에 데이터를 제공하는 것을 가능하게 한다.
제어기(1250)의 내비게이션 특징들의 이동들은 디스플레이 상에 표시된 포인터, 커서, 포커스 링 또는 기타 시각적 표시기들의 이동들에 의해 디스플레이(예로서, 디스플레이(1220)) 상에 반영될 수 있다. 예를 들어, 소프트웨어 애플리케이션들(1216)의 제어하에, 내비게이션 제어기(1250) 상에 위치하는 내비게이션 특징들은 예를 들어 사용자 인터페이스(1222) 상에 표시된 가상 내비게이션 특징들에 맵핑될 수 있다. 실시예들에서, 제어기(1250)는 개별 컴포넌트가 아니라 플랫폼(1202) 및/또는 디스플레이(1220) 내에 통합될 수 있다. 그러나, 실시예들은 요소들로 또는 본 명세서에 도시되거나 설명된 상황으로 한정되지 않는다.
실시예들에서, 드라이버들(도시되지 않음)은 사용자들이 초기 부트-업 후에, 예를 들어 인에이블될 때 버튼의 터치를 이용하여 텔레비전과 같은 플랫폼(1202)을 즉시 턴 온 및 오프하는 것을 가능하게 하기 위한 기술을 포함할 수 있다. 프로그램 논리는 플랫폼(1202)으로 하여금 플랫폼이 턴 "오프"될 때 콘텐츠를 미디어 어댑터들 또는 다른 콘텐츠 서비스 장치(들)(1230) 또는 콘텐츠 전달 장치(들)(1240)로 스트리밍하는 것을 가능하게 할 수 있다. 게다가, 칩셋(1205)은 예를 들어 5.1 서라운드 사운드 오디오 및/또는 고선명 12.1 서라운드 사운드 오디오를 위한 하드웨어 및/또는 소프트웨어 지원을 포함할 수 있다. 드라이버들은 통합 그래픽 플랫폼들을 위한 그래픽 드라이버를 포함할 수 있다. 실시예들에서, 그래픽 드라이버는 주변 컴포넌트 상호접속(PCI) 익스프레스 그래픽 카드를 포함할 수 있다.
다양한 실시예들에서, 시스템(1200) 내에 도시된 컴포넌트들 중 어느 하나 이상이 통합될 수 있다. 예를 들어, 플랫폼(1202)과 콘텐츠 서비스 장치(들)(1230)가 통합될 수 있거나, 플랫폼(1202)과 콘텐츠 전달 장치(들)(1240)가 통합될 수 있거나, 예를 들어 플랫폼(1202), 콘텐츠 서비스 장치(들)(1230) 및 콘텐츠 전달 장치(들)(1240)가 통합될 수 있다. 다양한 실시예들에서, 플랫폼(1202)과 디스플레이(1220)가 통합 유닛일 수 있다. 예를 들어, 디스플레이(1220)와 콘텐츠 서비스 장치(들)(1230)가 통합될 수 있거나, 디스플레이(1220)와 콘텐츠 전달 장치(들)(1240)가 통합될 수 있다. 이러한 예들은 본 발명을 한정하는 것을 의도하지 않는다.
다양한 실시예들에서, 시스템(1200)은 무선 시스템, 유선 시스템 또는 이들 양자의 결합으로서 구현될 수 있다. 무선 시스템으로서 구현될 때, 시스템(1200)은 하나 이상의 안테나, 송신기, 수신기, 송수신기, 증폭기, 필터, 제어 논리 등과 같이 무선 통신에 적합한 컴포넌트들 및 인터페이스들을 포함할 수 있다. 무선의 일례는 RF 스펙트럼 등과 같은 무선 스펙트럼의 부분들을 포함할 수 있다. 유선 시스템으로서 구현될 때, 시스템(1200)은 입출력(I/O) 어댑터, I/O 어댑터를 대응하는 유선 통신 접속하기 위한 물리적 커넥터, 네트워크 인터페이스 카드(NIC), 디스크 제어기, 비디오 제어기, 오디오 제어기 등과 같이 유선 통신에 적합한 컴포넌트들 및 인터페이스들을 포함할 수 있다. 유선 통신은 와이어, 케이블, 금속 도선, 인쇄 회로 보드(PCB), 백플레인, 스위치 패브릭, 반도체 재료, 트위스트 쌍 와이어, 동축 케이블, 광섬유 등을 통해 행해질 수 있다.
플랫폼(1202)은 정보를 통신하기 위한 하나 이상의 논리 또는 물리 채널을 형성할 수 있다. 정보는 미디어 정보 및 제어 정보를 포함할 수 있다. 미디어 정보는 사용자를 위해 의도된 콘텐츠를 표현하는 임의의 데이터를 지칭할 수 있다. 콘텐츠의 예는 예를 들어 음성 대화로부터의 데이터, 비디오 회의, 스트리밍 비디오, 전자 메일("이메일") 메시지, 음성 메일 메시지, 영숫자 심벌, 그래픽, 이미지, 비디오, 텍스트 등을 포함할 수 있다. 음성 대화로부터의 데이터는 예를 들어 이야기 정보, 침묵 기간, 배경 잡음, 안락 잡음, 톤 등일 수 있다. 제어 정보는 자동화 시스템을 위해 의도된 명령들, 명령어들 또는 제어 워드들을 표현하는 임의의 데이터를 지칭할 수 있다. 예를 들어, 제어 정보는 시스템을 통해 미디어 정보를 라우팅하거나, 사전 결정된 방식으로 미디어 정보를 처리하도록 노드에 지시하는 데 사용될 수 있다. 그러나, 실시예들은 요소들로 또는 도 12에 도시 또는 설명된 상황으로 한정되지 않는다.
전술한 바와 같이, 시스템(1200)은 다양한 물리적 스타일 또는 폼 팩터로 구현될 수 있다.
도 13은 시스템(1200)을 구현할 수 있는 소형 폼 팩터 장치(1300)의 실시예들을 도시한다. 실시예들에서, 예를 들어, 장치(1300)는 무선 능력을 갖는 이동 컴퓨팅 장치로서 구현될 수 있다. 이동 컴퓨팅 장치는 예를 들어 처리 시스템 및 이동 전원 또는 전력 공급 장치, 예로서 하나 이상의 배터리를 갖는 임의의 장치를 지칭할 수 있다.
전술한 바와 같이, 이동 컴퓨팅 장치의 예는 개인용 컴퓨터(PC), 랩탑 컴퓨터, 울트라 랩탑 컴퓨터, 태블릿, 터치 패드, 휴대용 컴퓨터, 핸드헬드 컴퓨터, 팜탑 컴퓨터, 개인 휴대 단말기(PDA), 셀룰러 전화, 결합형 셀룰러 전화/PDA, 텔레비전, 스마트 장치(예로서, 스마트폰, 스마트 태블릿 또는 스마트 텔레비전), 이동 인터넷 장치(MID), 메시징 장치, 데이터 통신 장치 등을 포함할 수 있다.
이동 컴퓨팅 장치의 예는 또한 사람이 착용하도록 배열된 컴퓨터들, 예를 들어 손목 컴퓨터, 손가락 컴퓨터, 반지 컴퓨터, 안경 컴퓨터, 벨트-클립 컴퓨터, 아암-밴드 컴퓨터, 신발 컴퓨터, 의복 컴퓨터 및 다른 착용식 컴퓨터를 포함할 수 있다. 실시예들에서, 예를 들어, 이동 컴퓨팅 장치는 컴퓨터 애플리케이션들은 물론, 음성 통신 및/또는 데이터 통신을 실행할 수 있는 스마트폰으로서 구현될 수 있다. 일부 실시예들은 예를 들어 스마트폰으로서 구현되는 이동 컴퓨팅 장치와 관련하여 설명될 수 있지만, 다른 실시예들은 다른 무선 이동 컴퓨팅 장치들을 이용하여 구현될 수도 있다는 것을 알 수 있다. 실시예들은 이와 관련하여 한정되지 않는다.
도 13에 도시된 바와 같이, 장치(1300)는 하우징(1302), 디스플레이(1304), 입출력(I/O) 장치(1306) 및 안테나(1308)를 포함할 수 있다. 장치(1300)는 또한 내비게이션 특징들(1312)을 포함할 수 있다. 디스플레이(1304)는 이동 컴퓨팅 장치에 적합한 정보를 표시하기 위한 임의의 적절한 디스플레이 유닛을 포함할 수 있다. I/O 장치(1306)는 이동 컴퓨팅 장치 내에 정보를 입력하기 위한 임의의 적절한 I/O 장치를 포함할 수 있다. I/O 장치(1306)의 예는 영숫자 키보드, 숫자 키패드, 터치 패드, 입력 키, 버튼, 스위치, 로커 스위치, 마이크, 스피커, 음성 인식 장치 및 소프트웨어 등을 포함할 수 있다. 정보는 또한 마이크를 통해 장치(1300) 내에 입력될 수 있다. 그러한 정보는 음성 인식 장치에 의해 디지털화될 수 있다. 실시예들은 이와 관련하여 한정되지 않는다.
다양한 실시예들은 하드웨어 요소들, 소프트웨어 요소들 또는 이들 양자의 결합을 이용하여 구현될 수 있다. 하드웨어 요소들의 예는 프로세서, 마이크로프로세서, 회로, 회로 요소(예로서, 트랜지스터, 저항기, 커패시터, 인덕터 등), 집적 회로, 주문형 집적 회로(ASIC), 프로그래밍 가능 논리 장치(PLD), 디지털 신호 프로세서(DSP), 필드 프로그래머블 게이트 어레이(FPGA), 논리 게이트, 레지스터, 반도체 장치, 칩, 마이크로칩, 칩셋 등을 포함할 수 있다. 소프트웨어의 예는 소프트웨어 컴포넌트, 프로그램, 애플리케이션, 컴퓨터 프로그램, 애플리케이션 프로그램, 시스템 프로그램, 기계 프로그램, 운영 체제 소프트웨어, 미들웨어, 펌웨어, 소프트웨어 모듈, 루틴, 서브루틴, 함수, 메소드, 프로시저, 소프트웨어 인터페이스, 애플리케이션 프로그램 인터페이스(API), 명령어 세트, 컴퓨팅 코드, 컴퓨터 코드, 코드 세그먼트, 컴퓨터 코드 세그먼트, 워드, 값, 심벌 또는 이들의 임의 결합을 포함할 수 있다. 실시예를 하드웨어 요소들 및/또는 소프트웨어 요소들을 이용하여 구현할지를 결정하는 것은 원하는 계산 레이트, 전력 레벨, 열 허용 한계, 처리 사이클 예산, 입력 데이터 레이트, 출력 데이터 레이트, 메모리 자원, 데이터 버스 속도 및 다른 설계 또는 성능 제약과 같은 임의 수의 팩터에 따라 달라질 수 있다.
본 명세서에서는 기능들, 특징들 및 이들의 관계들을 도시하는 기능 빌딩 블록들을 이용하여 방법들 및 시스템들이 개시된다. 본 명세서에서 이러한 기능 빌딩 블록들의 경계들 중 적어도 일부는 설명의 편의를 위해 임의로 정의되었다. 지정된 기능들 및 이들의 관계들이 적절히 수행되는 한은 대안 경계들이 정의될 수 있다.
본 명세서에서는 다양한 컴퓨터 프로그램 제품, 장치 및 방법 실시예들이 개시된다.
일 실시예는 명령어들을 포함하는 컴퓨터 프로그램이 인코딩된 비일시적 컴퓨터 판독 가능 매체를 포함하며, 상기 명령어들은 프로세서가
멀티-뷰 비디오의 다수의 뷰 중 제1 뷰의 텍스처 성분,
상기 제1 뷰의 깊이 성분,
상기 다수의 뷰 중 제2 뷰의 텍스처 성분, 및
상기 제2 뷰의 깊이 성분
각각으로부터 비디오 블록을 인코딩하게 하며,
상기 프로세서가 각각의 비디오 블록을 인코딩하게 하기 위한 상기 명령어들은 상기 프로세서가 각각의 비디오 블록을,
나머지 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들, 및
상기 나머지 비디오 블록들 중 하나로부터 상속되지 않은 예측 파라미터들
중 선택 가능한 하나에 기초하여 인코딩하게 하기 위한 명령어들
을 포함한다.
상기 멀티-뷰 비디오는 삼차원(3D) 멀티-뷰 비디오일 수 있다.
상기 프로세서가 상기 각각의 비디오 블록을 상기 나머지 블록들 중 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하게 하기 위한 상기 명령어들은 상기 프로세서가
상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 비디오 블록을 상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분의 상기 나머지 비디오 블록들 중 상기 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하고,
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 비디오 블록을,
상기 제1 뷰의 상기 텍스처 성분,
상기 제1 뷰의 상기 깊이 성분, 및
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분
의 상기 나머지 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하게 하기 위한 명령어들을 포함할 수 있다.
상기 상속된 예측 파라미터들은
상기 나머지 비디오 블록들 중 상기 하나가 인터 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 예측 모드들,
상기 나머지 비디오 블록들 중 상기 하나가 인트라 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인트라 예측 모드들, 및
상기 나머지 비디오 블록들 중 상기 하나가 인터 및 인트라 예측 모드들의 결합에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 및 인트라 예측 모드들의 상기 결합
을 포함할 수 있다.
인코딩하기 위한 상기 명령어들은 상기 각각의 비디오 블록을 상기 나머지 비디오 블록들 중 상기 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하기 위한 명령어들을 포함할 수 있으며, 상기 상속된 예측 파라미터들은 비디오 블록들을 코딩 단위들(CU들) 및 예측 단위들(PU들)로 분할하는 쿼드트리 구조, 상기 PU들의 크기들, 및 상기 PU들을 인코딩하는 데 사용되는 인터 및 인트라 예측 모드들을 포함한다.
상기 상속된 예측 파라미터들은 모션 벡터, 모션 필드들, 인터 방향들, 기준 인덱스들, 루마 인트라 모드들 및 크로마 인트라 모드들 중 적어도 둘 이상을 더 포함할 수 있다.
추가적인 명령어들은 상기 프로세서가
상기 각각의 비디오 블록을 상속된 예측 파라미터들에 기초하여 인코딩할지를 결정하고,
상속된 예측 파라미터들에 기초하여 인코딩하기로 결정되는 경우에 상기 각각의 비디오 블록을 상기 상속된 예측 파라미터들에 기초하여 인코딩하고,
상속된 예측 파라미터들에 기초하여 인코딩하지 않기로 결정되는 경우에 상기 각각의 비디오 블록을 상속되지 않은 예측 파라미터들에 기초하여 인코딩하게 할 수 있다.
추가적인 명령어들은 상기 프로세서가
상기 다수의 뷰 각각 내의 상기 텍스처 성분 및 상기 깊이 성분의 인코딩된 비디오 블록들을 포함하는 인코딩된 비트스트림을 생성하고,
상속된 예측 파라미터들에 기초하여 인코딩된 상기 인코딩된 비디오 블록들 각각과 관련된 예측 파라미터 상속(PPI) 신택스를 상기 인코딩된 비트스트림 내에 삽입하게 할 수 있으며,
상기 PPI 신택스는
상기 인코딩된 비디오 블록이 상속된 예측 파라미터들에 기초하여 인코딩되었음을 표시하는 PPI 플래그,
상기 예측 파라미터들을 상속해준 상기 나머지 비디오 블록들 중 상기 하나를 결정할 수 있는 정보, 및
상기 상속된 예측 파라미터들
을 포함한다.
장치 실시예는
멀티-뷰 비디오의 다수의 뷰 중 제1 뷰의 텍스처 성분,
상기 제1 뷰의 깊이 성분,
상기 다수의 뷰 중 제2 뷰의 텍스처 성분, 및
상기 제2 뷰의 깊이 성분
각각으로부터 비디오 블록을 인코딩하기 위한 인코더를 포함하며,
상기 인코더는 각각의 비디오 블록을,
나머지 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들, 및
상기 나머지 비디오 블록들 중 하나로부터 상속되지 않은 예측 파라미터들
중 선택 가능한 하나에 기초하여 인코딩하도록 구성된다.
상기 멀티-뷰 비디오는 삼차원(3D) 멀티-뷰 비디오일 수 있다.
상기 인코더는
상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 비디오 블록을 상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분의 상기 나머지 비디오 블록들 중 상기 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하고,
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 비디오 블록을,
상기 제1 뷰의 상기 텍스처 성분,
상기 제1 뷰의 상기 깊이 성분, 및
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분
의 상기 나머지 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하도록 구성될 수 있다.
상기 인코더는 상기 각각의 비디오 블록을 상기 나머지 비디오 블록들 중 상기 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하도록 구성될 수 있으며,
상기 상속된 예측 파라미터들은
상기 나머지 비디오 블록들 중 상기 하나가 인터 예측 모드들에 기초하여 상기 인코더에 의해 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 예측 모드들,
상기 나머지 비디오 블록들 중 상기 하나가 인트라 예측 모드들에 기초하여 상기 인코더에 의해 인코딩된 코딩 블록들을 포함하는 경우에 상기 인트라 예측 모드들, 및
상기 나머지 비디오 블록들 중 상기 하나가 인터 및 인트라 예측 모드들의 결합에 기초하여 상기 인코더에 의해 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 및 인트라 예측 모드들의 상기 결합
을 포함한다.
상기 인코더는 상기 각각의 비디오 블록을 상기 나머지 비디오 블록들 중 상기 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하도록 구성될 수 있으며, 상기 상속된 예측 파라미터들은 비디오 블록들을 코딩 단위들(CU들) 및 예측 단위들(PU들)로 분할하는 쿼드트리 구조, 상기 PU들의 크기들, 및 상기 PU들을 인코딩하는 데 사용되는 인터 및 인트라 예측 모드들을 포함한다.
상기 상속된 예측 파라미터들은 모션 벡터, 모션 필드들, 인터 방향들, 기준 인덱스들, 루마 인트라 모드들 및 크로마 인트라 모드들 중 적어도 둘 이상을 더 포함할 수 있다.
상기 인코더는
상기 각각의 비디오 블록을 상속된 예측 파라미터들에 기초하여 인코딩할지를 결정하고,
상속된 예측 파라미터들에 기초하여 인코딩하기로 결정되는 경우에 상기 각각의 비디오 블록을 상기 상속된 예측 파라미터들에 기초하여 인코딩하고,
상속된 예측 파라미터들에 기초하여 인코딩하지 않기로 결정되는 경우에 상기 각각의 비디오 블록을 상속되지 않은 예측 파라미터들에 기초하여 인코딩하도록 더 구성될 수 있다.
상기 인코더는
상기 다수의 뷰 각각 내의 상기 텍스처 성분 및 상기 깊이 성분의 인코딩된 비디오 블록들을 포함하는 인코딩된 비트스트림을 생성하고,
상속된 예측 파라미터들에 기초하여 인코딩된 상기 인코딩된 비디오 블록들 각각과 관련된 예측 파라미터 상속(PPI) 신택스를 상기 인코딩된 비트스트림 내에 삽입하도록 더 구성될 수 있으며,
상기 PPI 신택스는
상기 인코딩된 비디오 블록이 상속된 예측 파라미터들에 기초하여 인코딩되었음을 표시하는 PPI 플래그,
상기 예측 파라미터들을 상속해준 상기 나머지 비디오 블록들 중 상기 하나를 결정할 수 있는 정보, 및
상기 상속된 예측 파라미터들
을 포함한다.
상기 장치는
통신 네트워크와 통신하기 위한 통신 컴포넌트들,
사용자 인터페이스,
상기 통신 컴포넌트들 및 상기 사용자 인터페이스와 통신하기 위한 프로세서 및 메모리, 및
상기 인코더, 상기 프로세서 및 메모리, 상기 통신 컴포넌트들 및 상기 사용자 인터페이스를 수용하기 위한 하우징
을 더 포함할 수 있다.
방법 실시예는
멀티-뷰 비디오의 다수의 뷰 중 제1 뷰의 텍스처 성분,
상기 제1 뷰의 깊이 성분,
상기 다수의 뷰 중 제2 뷰의 텍스처 성분, 및
상기 제2 뷰의 깊이 성분
각각으로부터 비디오 블록을 인코딩하는 단계를 포함하며,
각각의 비디오 블록의 상기 인코딩은 상기 각각의 비디오 블록을,
나머지 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들, 및
상기 나머지 비디오 블록들 중 하나로부터 상속되지 않은 예측 파라미터들
중 선택 가능한 하나에 기초하여 인코딩하는 단계를 포함한다.
상기 멀티-뷰 비디오는 삼차원(3D) 멀티-뷰 비디오일 수 있다.
상기 각각의 비디오 블록을 인코딩하는 상기 단계는
상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 비디오 블록을 상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분의 상기 나머지 비디오 블록들 중 상기 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하는 단계, 및
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 비디오 블록을,
상기 제1 뷰의 상기 텍스처 성분,
상기 제1 뷰의 상기 깊이 성분, 및
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분
의 상기 나머지 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하는 단계
를 포함할 수 있다.
상기 인코딩은 상기 각각의 비디오 블록을 상기 나머지 비디오 블록들 중 상기 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하는 단계를 포함할 수 있으며,
상기 상속된 예측 파라미터들은
상기 나머지 비디오 블록들 중 상기 하나가 인터 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 예측 모드들,
상기 나머지 비디오 블록들 중 상기 하나가 인트라 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인트라 예측 모드들, 및
상기 나머지 비디오 블록들 중 상기 하나가 인터 및 인트라 예측 모드들의 결합에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 및 인트라 예측 모드들의 상기 결합
을 포함한다.
상기 인코딩은 상기 각각의 비디오 블록을 상기 나머지 비디오 블록들 중 상기 하나로부터 상속된 예측 파라미터들에 기초하여 인코딩하는 단계를 포함할 수 있으며, 상기 상속된 예측 파라미터들은 비디오 블록들을 코딩 단위들(CU들) 및 예측 단위들(PU들)로 분할하는 쿼드트리 구조, 상기 PU들의 크기들, 및 상기 PU들을 인코딩하는 데 사용되는 인터 및 인트라 예측 모드들을 포함한다.
상기 상속된 예측 파라미터들은 모션 벡터, 모션 필드들, 인터 방향들, 기준 인덱스들, 루마 인트라 모드들 및 크로마 인트라 모드들 중 적어도 둘 이상을 더 포함할 수 있다.
상기 방법은 상기 각각의 비디오 블록을 인코딩하기 전에,
상기 각각의 비디오 블록을 상속된 예측 파라미터들에 기초하여 인코딩할지를 결정하는 단계,
상속된 예측 파라미터들에 기초하여 인코딩하기로 결정되는 경우에 상기 각각의 비디오 블록을 상기 상속된 예측 파라미터들에 기초하여 인코딩하는 단계, 및
상속된 예측 파라미터들에 기초하여 인코딩하지 않기로 결정되는 경우에 상기 각각의 비디오 블록을 상속되지 않은 예측 파라미터들에 기초하여 인코딩하는 단계
를 더 포함할 수 있다.
상기 방법은
상기 다수의 뷰 각각 내의 상기 텍스처 성분 및 상기 깊이 성분의 인코딩된 비디오 블록들을 포함하는 인코딩된 비트스트림을 생성하는 단계, 및
상속된 예측 파라미터들에 기초하여 인코딩된 상기 인코딩된 비디오 블록들 각각과 관련된 예측 파라미터 상속(PPI) 신택스를 상기 인코딩된 비트스트림 내에 삽입하는 단계
를 더 포함할 수 있으며,
상기 PPI 신택스는
상기 인코딩된 비디오 블록이 상속된 예측 파라미터들에 기초하여 인코딩되었음을 표시하는 PPI 플래그,
상기 예측 파라미터들을 상속해준 상기 나머지 비디오 블록들 중 상기 하나를 결정할 수 있는 정보, 및
상기 상속된 예측 파라미터들
을 포함한다.
다른 실시예는 명령어들을 포함하는 컴퓨터 프로그램이 인코딩된 비일시적 컴퓨터 판독 가능 매체를 포함하며, 상기 명령어들은 프로세서가
멀티-뷰 비디오의 다수의 뷰 중 제1 뷰의 텍스처 성분,
상기 제1 뷰의 깊이 성분,
상기 다수의 뷰 중 제2 뷰의 텍스처 성분, 및
상기 제2 뷰의 깊이 성분
각각의 인코딩된 비디오 블록을 수신하고,
각각의 인코딩된 비디오 블록이 상기 각각의 인코딩된 비디오 블록이 상속된 예측 파라미터들에 기초하여 인코딩되었음을 표시하는 예측 파라미터 상속(PPI) 신택스와 관련되는지를 결정하고,
상속된 예측 파라미터들이 상기 각각의 인코딩된 비디오 블록에 대해 표시되는 경우에, 상기 각각의 인코딩된 비디오 블록을 상기 PPI 신택스에서 표시되는 나머지 인코딩된 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들에 기초하여 디코딩하게 한다.
상기 멀티-뷰 비디오는 삼차원(3D) 멀티-뷰 비디오를 포함할 수 있다.
상기 프로세서가 디코딩하게 하기 위한 상기 명령어들은 상기 프로세서가
상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 인코딩된 비디오 블록을 상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분으로부터의 상기 나머지 비디오 블록들 중 상기 하나로부터 상속된 예측 파라미터들에 기초하여 디코딩하고,
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 인코딩된 비디오 블록을,
상기 제1 뷰의 상기 텍스처 성분,
상기 제1 뷰의 상기 깊이 성분, 및
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분
의 상기 나머지 인코딩된 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들에 기초하여 디코딩하게 하기 위한 명령어들을 포함할 수 있다.
상기 상속된 예측 파라미터들은
상기 나머지 인코딩된 비디오 블록들 중 상기 하나가 인터 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 예측 모드들,
상기 나머지 인코딩된 비디오 블록들 중 상기 하나가 인트라 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인트라 예측 모드들, 및
상기 나머지 인코딩된 비디오 블록들 중 상기 하나가 인터 및 인트라 예측 모드들의 결합에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 및 인트라 예측 모드들의 상기 결합
을 포함할 수 있다.
상기 상속된 예측 파라미터들은 인코딩된 비디오 블록들을 코딩 단위들(CU들) 및 예측 단위들(PU들)로 분할하는 쿼드트리 구조, 상기 PU들의 크기들, 및 상기 PU들을 인코딩하는 데 사용되는 인터 및 인트라 예측 모드들을 포함할 수 있다.
상기 상속된 예측 파라미터들은 모션 벡터, 모션 필드들, 인터 방향들, 기준 인덱스들, 루마 인트라 모드들 및 크로마 인트라 모드들 중 적어도 둘 이상을 더 포함할 수 있다.
상기 프로세서가 디코딩하게 하기 위한 명령어들은 상기 프로세서가 상기 PPI 신택스가 상기 예측 파라미터들이 상기 각각의 인코딩된 비디오 블록의 상기 뷰와 다른 상기 다수의 뷰의 상기 뷰들 중 하나의 뷰의 인코딩된 비디오 블록으로부터 상속됨을 표시하는 경우에, 상기 나머지 인코딩된 비디오 블록들 중 상기 하나를 생성된 변이 벡터에 기초하여 식별하게 하기 위한 명령어들을 포함할 수 있다.
디코딩하기 위한 상기 명령어들은 상기 프로세서가 상속된 예측 파라미터들이 표시되지 않는 경우에 상기 각각의 인코딩된 비디오 블록을 상속되지 않은 예측 파라미터들에 기초하여 디코딩하게 하기 위한 명령어들을 더 포함할 수 있다.
장치 실시예는
디코더를 포함하고,
상기 디코더는
멀티-뷰 비디오의 다수의 뷰 중 제1 뷰의 텍스처 성분,
상기 제1 뷰의 깊이 성분,
상기 다수의 뷰 중 제2 뷰의 텍스처 성분, 및
상기 제2 뷰의 깊이 성분
각각의 인코딩된 비디오 블록을 수신하고,
각각의 인코딩된 비디오 블록이 상기 각각의 인코딩된 비디오 블록이 상속된 예측 파라미터들에 기초하여 인코딩되었음을 표시하는 예측 파라미터 상속(PPI) 신택스와 관련되는지를 결정하고,
상속된 예측 파라미터들이 상기 각각의 인코딩된 비디오 블록에 대해 표시되는 경우에, 상기 각각의 인코딩된 비디오 블록을 상기 PPI 신택스에서 표시되는 나머지 인코딩된 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들에 기초하여 디코딩하도록 구성된다.
상기 디코더는
상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 인코딩된 비디오 블록을 상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분으로부터의 상기 나머지 비디오 블록들 중 상기 하나로부터 상속된 예측 파라미터들에 기초하여 디코딩하고,
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 인코딩된 비디오 블록을,
상기 제1 뷰의 상기 텍스처 성분,
상기 제1 뷰의 상기 깊이 성분, 및
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분
의 상기 나머지 인코딩된 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들에 기초하여 디코딩하도록 구성될 수 있다.
상기 상속된 예측 파라미터들은
상기 나머지 인코딩된 비디오 블록들 중 상기 하나가 인터 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 예측 모드들,
상기 나머지 인코딩된 비디오 블록들 중 상기 하나가 인트라 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인트라 예측 모드들, 및
상기 나머지 인코딩된 비디오 블록들 중 상기 하나가 인터 및 인트라 예측 모드들의 결합에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 및 인트라 예측 모드들의 상기 결합
을 포함할 수 있다.
상기 상속된 예측 파라미터들은 인코딩된 비디오 블록들을 코딩 단위들(CU들) 및 예측 단위들(PU들)로 분할하는 쿼드트리 구조, 상기 PU들의 크기들, 및 상기 PU들을 인코딩하는 데 사용되는 인터 및 인트라 예측 모드들을 포함할 수 있다.
상기 상속된 예측 파라미터들은 모션 벡터, 모션 필드들, 인터 방향들, 기준 인덱스들, 루마 인트라 모드들 및 크로마 인트라 모드들 중 적어도 둘 이상을 더 포함할 수 있다.
상기 디코더는 상기 PPI 신택스가 상기 예측 파라미터들이 상기 각각의 인코딩된 비디오 블록의 상기 뷰와 다른 상기 다수의 뷰의 상기 뷰들 중 하나의 뷰의 인코딩된 비디오 블록으로부터 상속됨을 표시하는 경우에, 상기 나머지 인코딩된 비디오 블록들 중 상기 하나를 생성된 변이 벡터에 기초하여 식별하도록 더 구성될 수 있다.
상기 디코더는 상속된 예측 파라미터들이 표시되지 않는 경우에 상기 각각의 인코딩된 비디오 블록을 상속되지 않은 예측 파라미터들에 기초하여 디코딩하도록 더 구성될 수 있다.
상기 장치는
통신 네트워크와 통신하기 위한 통신 컴포넌트들,
사용자 인터페이스,
상기 통신 컴포넌트들 및 상기 사용자 인터페이스와 통신하기 위한 프로세서 및 메모리, 및
상기 디코더, 상기 프로세서 및 메모리, 상기 통신 컴포넌트들 및 상기 사용자 인터페이스를 수용하기 위한 하우징
을 더 포함할 수 있다.
방법 실시예는
멀티-뷰 비디오의 다수의 뷰 중 제1 뷰의 텍스처 성분,
상기 제1 뷰의 깊이 성분,
상기 다수의 뷰 중 제2 뷰의 텍스처 성분, 및
상기 제2 뷰의 깊이 성분
각각의 인코딩된 비디오 블록을 수신하는 단계,
각각의 인코딩된 비디오 블록이 상기 각각의 인코딩된 비디오 블록이 상속된 예측 파라미터들에 기초하여 인코딩되었음을 표시하는 예측 파라미터 상속(PPI) 신택스와 관련되는지를 결정하는 단계, 및
상속된 예측 파라미터들이 상기 각각의 인코딩된 비디오 블록에 대해 표시되는 경우에, 상기 각각의 인코딩된 비디오 블록을 상기 PPI 신택스에서 표시되는 나머지 인코딩된 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들에 기초하여 디코딩하는 단계
를 포함한다.
상기 디코딩은
상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 인코딩된 비디오 블록을 상기 제1 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분으로부터의 상기 나머지 비디오 블록들 중 상기 하나로부터 상속된 예측 파라미터들에 기초하여 디코딩하는 단계, 및
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 하나의 성분의 상기 각각의 인코딩된 비디오 블록을,
상기 제1 뷰의 상기 텍스처 성분,
상기 제1 뷰의 상기 깊이 성분, 및
상기 제2 뷰의 상기 텍스처 및 깊이 성분들 중 나머지 성분
의 상기 나머지 인코딩된 비디오 블록들 중 선택 가능한 하나로부터 상속된 예측 파라미터들에 기초하여 디코딩하는 단계
를 포함할 수 있다.
상기 상속된 예측 파라미터들은
상기 나머지 인코딩된 비디오 블록들 중 상기 하나가 인터 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 예측 모드들,
상기 나머지 인코딩된 비디오 블록들 중 상기 하나가 인트라 예측 모드들에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인트라 예측 모드들, 및
상기 나머지 인코딩된 비디오 블록들 중 상기 하나가 인터 및 인트라 예측 모드들의 결합에 기초하여 인코딩된 코딩 블록들을 포함하는 경우에 상기 인터 및 인트라 예측 모드들의 상기 결합
을 포함할 수 있다.
상기 상속된 예측 파라미터들은 인코딩된 비디오 블록들을 코딩 단위들(CU들) 및 예측 단위들(PU들)로 분할하는 쿼드트리 구조, 상기 PU들의 크기들, 및 상기 PU들을 인코딩하는 데 사용되는 인터 및 인트라 예측 모드들을 포함할 수 있다.
상기 상속된 예측 파라미터들은 모션 벡터, 모션 필드들, 인터 방향들, 기준 인덱스들, 루마 인트라 모드들 및 크로마 인트라 모드들 중 적어도 둘 이상을 더 포함할 수 있다.
상기 디코딩은 상기 PPI 신택스가 상기 예측 파라미터들이 상기 각각의 인코딩된 비디오 블록의 상기 뷰와 다른 상기 다수의 뷰의 상기 뷰들 중 하나의 뷰의 인코딩된 비디오 블록으로부터 상속됨을 표시하는 경우에, 상기 나머지 인코딩된 비디오 블록들 중 상기 하나를 생성된 변이 벡터에 기초하여 식별하는 단계를 포함할 수 있다.
상기 방법은 상속된 예측 파라미터들이 표시되지 않는 경우에 상기 각각의 인코딩된 비디오 블록을 상속되지 않은 예측 파라미터들에 기초하여 디코딩하는 단계를 더 포함할 수 있다.
본 명세서에서 다양한 실시예들이 개시되지만, 이들은 한정이 아니라 예시적으로 제공되었다는 것을 이해해야 한다. 본 명세서에서 개시되는 방법들 및 시스템들의 사상 및 범위로부터 벗어나지 않으면서 그 안에서 형태 및 상세에 있어서의 다양한 변경들이 이루어질 수 있다는 것이 관련 분야의 기술자들에게 명백할 것이다. 따라서, 청구범위의 폭 및 범위는 본 명세서에서 개시되는 임의의 예에 의해 한정되지 않아야 한다.

Claims (25)

  1. 3차원(3D) 비디오 인코더로서,
    멀티뷰 비디오의 깊이 뷰의 블록과 연관된 플래그를 생성하는 회로 -상기 플래그는 상기 깊이 뷰의 블록이 상기 멀티뷰 비디오의 텍스처 뷰의 블록과 연관된 상속된 예측 파라미터(inherited prediction parameters)에 기초하여 인코딩됨을 표시하고, 상기 깊이 뷰와 상기 텍스처 뷰는 동일한 뷰이고, 상기 깊이 뷰의 블록과 상기 텍스처 뷰의 블록은 동일 위치이며(co-located), 상기 상속된 예측 파라미터는 적어도 모션 벡터 및 기준 인덱스를 포함함- 와,
    제 3 블록과 연관된 제 2 상속된 예측 파라미터에 기초하여 제 2 블록을 인코딩하는 회로 -상기 제 2 블록 및 상기 제 3 블록은 상기 멀티뷰 비디오의 상이한 뷰들로부터 옴- 와,
    상기 플래그, 상기 인코딩된 제 2 블록, 및 상기 예측 파라미터를 3D 비디오를 나타내는 비트스트림 내에 삽입하는 회로를 포함하는
    3차원 비디오 인코더.
  2. 제 1 항에 있어서,
    상기 텍스처 뷰의 블록은 휘도 샘플 및 크로마 샘플을 포함하는 픽처를 렌더링하기 위한 비디오 정보를 포함하고,
    상기 깊이 뷰의 블록은 픽셀 단위별로(on a per-pixel basis) 깊이 값을 포함하는 3D 비디오를 형성하기 위한 상기 텍스처 뷰의 블록에 대응하는 정보를 포함하는
    3차원 비디오 인코더.
  3. 제 1 항에 있어서,
    상기 깊이 뷰의 블록은 상기 텍스처 뷰의 블록보다 크거나 상기 텍스처 뷰의 블록보다 작은
    3차원 비디오 인코더.
  4. 제 1 항에 있어서,
    상기 플래그는 시퀀스별(per-sequence), 뷰별(per-view), 슬라이별(per-slice), 픽처별(per-picture), 코딩 단위별(per-coding unit; per-CU), 또는 예측 단위별(per-prediction unit; per-PU) 레벨에서의 상속된 예측 파라미터의 사용을 표시하는
    3차원 비디오 인코더.
  5. 제 1 항에 있어서,
    상기 상속된 예측 파라미터는 픽처 코딩 구조, 인터, 인트라 또는 하이브리드 예측 모드, 또는 파티션 크기 및 형상 중 적어도 하나를 더 포함하는
    3차원 비디오 인코더.
  6. 제 1 항에 있어서,
    상기 동일한 뷰는 동일한 카메라 시각 또는 각도를 포함하는
    3차원 비디오 인코더.
  7. 제 1 항에 있어서,
    국지적 도출된 예측 파라미터(locally derived prediction parameters) 또는 상기 상속된 예측 파라미터로부터의 최상의 예측 파라미터 세트에 기초하여 상기 깊이 뷰의 블록에 대한 모드 결정을 판정하는 회로를 더 포함하는
    3차원 비디오 인코더.
  8. 제 1 항에 있어서,
    상기 깊이 뷰의 블록에 대한 적어도 하나의 국지적 도출된 예측 파라미터를 생성하는 회로를 더 포함하되,
    상기 인코딩하는 회로는 또한 상기 적어도 하나의 국지적 도출된 예측 파라미터를 상기 비트스트림으로 인코딩하는
    3차원 비디오 인코더.
  9. 삭제
  10. 제 1 항에 있어서,
    상기 제 2 상속된 예측 파라미터는 적어도 하나의 제 2 모션 벡터 및 적어도 하나의 제 2 기준 인덱스를 포함하고,
    상기 제 2 블록은 깊이 뷰 블록 또는 텍스처 뷰 블록을 포함하고,
    상기 제 3 블록은 깊이 뷰 블록 또는 텍스처 뷰 블록을 포함하는
    3차원 비디오 인코더.
  11. 디스플레이와,
    3차원(3D) 비디오 인코더
    를 포함하는 시스템으로서,
    상기 3차원(3D) 비디오 인코더는,
    멀티뷰 비디오의 깊이 뷰의 블록과 연관된 플래그를 생성하는 회로 -상기 플래그는 상기 깊이 뷰의 블록이 상기 멀티뷰 비디오의 텍스처 뷰의 블록과 연관된 상속된 예측 파라미터에 기초하여 인코딩됨을 표시하고, 상기 깊이 뷰와 상기 텍스처 뷰는 동일한 뷰이고, 상기 깊이 뷰의 블록과 상기 텍스처 뷰의 블록은 동일 위치이며, 상기 상속된 예측 파라미터는 적어도 모션 벡터 및 기준 인덱스를 포함함- 와,
    제 3 블록과 연관된 제 2 상속된 예측 파라미터에 기초하여 제 2 블록을 인코딩하는 회로 -상기 제 2 블록 및 상기 제 3 블록은 상기 멀티뷰 비디오의 상이한 뷰들로부터 옴- 와,
    상기 플래그, 상기 인코딩된 제 2 블록, 및 상기 예측 파라미터를 3D 비디오를 나타내는 비트스트림 내에 삽입하는 회로를 포함하는
    시스템.
  12. 제 11 항에 있어서,
    상기 플래그는 시퀀스별, 뷰별, 슬라이별, 픽처별, 코딩 단위별(per-CU), 또는 예측 단위별(per-PU) 레벨에서의 상속된 예측 파라미터의 사용을 표시하는
    시스템.
  13. 제 11 항에 있어서,
    상기 상속된 예측 파라미터는 픽처 코딩 구조, 인터, 인트라 또는 하이브리드 예측 모드, 또는 파티션 크기 및 형상 중 적어도 하나를 더 포함하는
    시스템.
  14. 제 11 항에 있어서,
    상기 3D 비디오 인코더는 국지적 도출된 예측 파라미터 또는 상기 상속된 예측 파라미터로부터의 최상의 예측 파라미터 세트에 기초하여 상기 깊이 뷰의 블록에 대한 모드 결정을 판정하는 회로를 더 포함하는
    시스템.
  15. 제 11 항에 있어서,
    상기 3D 비디오 인코더는 상기 깊이 뷰의 블록에 대한 적어도 하나의 국지적 도출된 예측 파라미터를 생성하는 회로를 더 포함하되,
    상기 인코딩하는 회로는 또한 상기 적어도 하나의 국지적 도출된 예측 파라미터를 상기 비트스트림으로 인코딩하는
    시스템.
  16. 그래픽 서브시스템과,
    3차원(3D) 비디오 인코더
    를 포함하는 시스템으로서,
    상기 3차원(3D) 비디오 인코더는,
    멀티뷰 비디오의 깊이 뷰의 블록과 연관된 플래그를 생성하는 회로 -상기 플래그는 상기 깊이 뷰의 블록이 상기 멀티뷰 비디오의 텍스처 뷰의 블록과 연관된 상속된 예측 파라미터에 기초하여 인코딩됨을 표시하고, 상기 깊이 뷰와 상기 텍스처 뷰는 동일한 뷰이고, 상기 깊이 뷰의 블록과 상기 텍스처 뷰의 블록은 동일 위치이며, 상기 상속된 예측 파라미터는 적어도 모션 벡터 및 기준 인덱스를 포함함- 와,
    제 3 블록과 연관된 제 2 상속된 예측 파라미터에 기초하여 제 2 블록을 인코딩하는 회로 -상기 제 2 블록 및 상기 제 3 블록은 상기 멀티뷰 비디오의 상이한 뷰들로부터 옴- 와,
    상기 플래그, 상기 인코딩된 제 2 블록, 및 상기 예측 파라미터를 3D 비디오를 나타내는 비트스트림 내에 삽입하는 회로를 포함하는
    시스템.
  17. 제 16 항에 있어서,
    상기 플래그는 시퀀스별, 뷰별, 슬라이별, 픽처별, 코딩 단위별(per-CU), 또는 예측 단위별(per-PU) 레벨에서의 상속된 예측 파라미터의 사용을 표시하는
    시스템.

  18. 제 16 항에 있어서,
    상기 상속된 예측 파라미터는 픽처 코딩 구조, 인터, 인트라 또는 하이브리드 예측 모드, 또는 파티션 크기 및 형상 중 적어도 하나를 더 포함하는
    시스템.
  19. 제 16 항에 있어서,
    상기 3D 비디오 인코더는 국지적 도출된 예측 파라미터 또는 상기 상속된 예측 파라미터로부터의 최상의 예측 파라미터 세트에 기초하여 상기 깊이 뷰의 블록에 대한 모드 결정을 판정하는 회로를 더 포함하는
    시스템.
  20. 제 16 항에 있어서,
    상기 3D 비디오 인코더는 상기 깊이 뷰의 블록에 대한 적어도 하나의 국지적 도출된 예측 파라미터를 생성하는 회로를 더 포함하되,
    상기 인코딩하는 회로는 또한 상기 적어도 하나의 국지적 도출된 예측 파라미터를 상기 비트스트림으로 인코딩하는
    시스템.
  21. 명령어를 포함하는 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체로서,
    상기 명령어는 프로세서로 하여금,
    멀티뷰 비디오의 깊이 뷰의 블록과 연관된 플래그를 생성하게 하고 -상기 플래그는 상기 깊이 뷰의 블록이 상기 멀티뷰 비디오의 텍스처 뷰의 블록과 연관된 상속된 예측 파라미터에 기초하여 인코딩됨을 표시하고, 상기 깊이 뷰와 상기 텍스처 뷰는 동일한 뷰이고, 상기 깊이 뷰의 블록과 상기 텍스처 뷰의 블록은 동일 위치이며, 상기 상속된 예측 파라미터는 적어도 모션 벡터 및 기준 인덱스를 포함함- ,
    제 3 블록과 연관된 제 2 상속된 예측 파라미터에 기초하여 제 2 블록을 인코딩하게 하며 -상기 제 2 블록 및 상기 제 3 블록은 상기 멀티뷰 비디오의 상이한 뷰들로부터 옴- ,
    상기 플래그, 상기 인코딩된 제 2 블록, 및 상기 예측 파라미터를 3D 비디오를 나타내는 비트스트림 내에 삽입하게 하는
    컴퓨터 판독가능 저장 매체.
  22. 제 21 항에 있어서,
    상기 플래그는 시퀀스별, 뷰별, 슬라이별, 픽처별, 코딩 단위별(per-CU), 또는 예측 단위별(per-PU) 레벨에서의 상속된 예측 파라미터의 사용을 표시하는
    컴퓨터 판독가능 저장 매체.
  23. 제 21 항에 있어서,
    상기 상속된 예측 파라미터는 픽처 코딩 구조, 인터, 인트라 또는 하이브리드 예측 모드, 또는 파티션 크기 및 형상 중 적어도 하나를 더 포함하는
    컴퓨터 판독가능 저장 매체.
  24. 제 21 항에 있어서,
    상기 컴퓨터 프로그램은, 상기 프로세서로 하여금, 국지적 도출된 예측 파라미터 또는 상기 상속된 예측 파라미터로부터의 최상의 예측 파라미터 세트에 기초하여 상기 깊이 뷰의 블록에 대한 모드 결정을 판정하게 하는 명령어를 더 포함하는
    컴퓨터 판독가능 저장 매체.
  25. 제 21 항에 있어서,
    상기 컴퓨터 프로그램은, 상기 프로세서로 하여금, 상기 깊이 뷰의 블록에 대한 적어도 하나의 국지적 도출된 예측 파라미터를 생성하게 하는 명령어를 더 포함하되,
    상기 인코딩하게 하는 명령어는 또한 상기 적어도 하나의 국지적 도출된 예측 파라미터를 상기 비트스트림으로 인코딩하게 하는
    컴퓨터 판독가능 저장 매체.
KR1020157030487A 2012-10-04 2013-06-17 3d 비디오 코딩을 위한 예측 파라미터 상속 KR101741940B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261709688P 2012-10-04 2012-10-04
US61/709,688 2012-10-04
PCT/US2013/046128 WO2014055140A1 (en) 2012-10-04 2013-06-17 Prediction parameter inheritance for 3d video coding

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020157005729A Division KR101662985B1 (ko) 2012-10-04 2013-06-17 3d 비디오 코딩을 위한 예측 파라미터 상속

Publications (2)

Publication Number Publication Date
KR20150126713A KR20150126713A (ko) 2015-11-12
KR101741940B1 true KR101741940B1 (ko) 2017-05-30

Family

ID=50432373

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020157030487A KR101741940B1 (ko) 2012-10-04 2013-06-17 3d 비디오 코딩을 위한 예측 파라미터 상속
KR1020157005729A KR101662985B1 (ko) 2012-10-04 2013-06-17 3d 비디오 코딩을 위한 예측 파라미터 상속

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020157005729A KR101662985B1 (ko) 2012-10-04 2013-06-17 3d 비디오 코딩을 위한 예측 파라미터 상속

Country Status (6)

Country Link
US (3) US9544612B2 (ko)
EP (2) EP2904775B1 (ko)
JP (3) JP2015536112A (ko)
KR (2) KR101741940B1 (ko)
SG (3) SG11201501643YA (ko)
WO (1) WO2014055140A1 (ko)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9445121B2 (en) 2008-08-04 2016-09-13 Dolby Laboratories Licensing Corporation Overlapped block disparity estimation and compensation architecture
EP2839436B1 (en) * 2012-04-20 2019-08-07 Affirmation,LLC Systems and methods for real-time conversion of video into three-dimensions
US9544612B2 (en) 2012-10-04 2017-01-10 Intel Corporation Prediction parameter inheritance for 3D video coding
US20150326880A1 (en) * 2012-12-14 2015-11-12 Liu He Inside view motion prediction among texture and depth view components with asymmetric spatial resolution
US9584792B2 (en) 2013-01-04 2017-02-28 Qualcomm Incorporated Indication of current view dependency on reference view in multiview coding file format
US9521389B2 (en) * 2013-03-06 2016-12-13 Qualcomm Incorporated Derived disparity vector in 3D video coding
US20140301463A1 (en) * 2013-04-05 2014-10-09 Nokia Corporation Method and apparatus for video coding and decoding
US10080036B2 (en) * 2013-05-16 2018-09-18 City University Of Hong Kong Method and apparatus for depth video coding using endurable view synthesis distortion
US9667990B2 (en) 2013-05-31 2017-05-30 Qualcomm Incorporated Parallel derived disparity vector for 3D video coding with neighbor-based disparity vector derivation
WO2015004606A1 (en) 2013-07-09 2015-01-15 Nokia Corporation Method and apparatus for video coding involving syntax for signalling motion information
WO2015009113A1 (ko) * 2013-07-18 2015-01-22 삼성전자 주식회사 인터 레이어 비디오 복호화 및 부호화 장치 및 방법을 위한 깊이 영상의 화면내 예측 방법
US9948915B2 (en) * 2013-07-24 2018-04-17 Qualcomm Incorporated Sub-PU motion prediction for texture and depth coding
SG11201510554RA (en) 2013-07-24 2016-02-26 Qualcomm Inc Simplified advanced motion prediction for 3d-hevc
US9906768B2 (en) * 2013-07-26 2018-02-27 Qualcomm Incorporated Use of a depth condition in 3DV codec
JP6396493B2 (ja) * 2013-12-30 2018-09-26 クゥアルコム・インコーポレイテッドQualcomm Incorporated 3dビデオコーディングにおける大型予測ブロックのセグメントごとのdcコーディングの簡易化
EP2894857A1 (en) * 2014-01-10 2015-07-15 Thomson Licensing Method and apparatus for encoding image data and method and apparatus for decoding image data
US10244223B2 (en) * 2014-01-10 2019-03-26 Ostendo Technologies, Inc. Methods for full parallax compressed light field 3D imaging systems
US9536351B1 (en) * 2014-02-03 2017-01-03 Bentley Systems, Incorporated Third person view augmented reality
US10567799B2 (en) 2014-03-07 2020-02-18 Qualcomm Incorporated Simplified sub-prediction unit (sub-PU) motion parameter inheritance (MPI)
WO2016056822A1 (ko) * 2014-10-08 2016-04-14 엘지전자 주식회사 3d 비디오 코딩 방법 및 장치
CN104717515A (zh) * 2015-03-24 2015-06-17 上海大学 基于3d-hevc的纹理视频和深度图码率分配方法
CN107431797B (zh) 2015-04-23 2019-10-11 奥斯坦多科技公司 用于全视差光场显示系统的方法和装置
WO2016172385A1 (en) 2015-04-23 2016-10-27 Ostendo Technologies, Inc. Methods for full parallax compressed light field synthesis utilizing depth information
KR102059066B1 (ko) * 2015-08-24 2019-12-24 후아웨이 테크놀러지 컴퍼니 리미티드 모션 벡터 필드 코딩 방법 및 디코딩 방법, 및 코딩 및 디코딩 장치들
US10448030B2 (en) 2015-11-16 2019-10-15 Ostendo Technologies, Inc. Content adaptive light field compression
WO2017099371A1 (ko) * 2015-12-11 2017-06-15 삼성전자 주식회사 인트라 프레임 스킵 모드 정보의 부호화 방법 및 장치, 복호화 방법 및 장치
CN106878751B (zh) 2015-12-11 2022-01-14 北京三星通信技术研究有限公司 视频帧内编码模式的标识方法、处理方法和装置
US10694187B2 (en) * 2016-03-18 2020-06-23 Lg Electronics Inc. Method and device for deriving block structure in video coding system
US10390026B2 (en) * 2016-03-25 2019-08-20 Google Llc Smart reordering in recursive block partitioning for advanced intra prediction in video coding
KR20180136967A (ko) * 2016-04-22 2018-12-26 엘지전자 주식회사 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
US10453431B2 (en) 2016-04-28 2019-10-22 Ostendo Technologies, Inc. Integrated near-far light field display systems
US10812795B2 (en) * 2016-09-30 2020-10-20 Lg Electronic Inc. Method for processing picture based on intra-prediction mode and apparatus for same
JPWO2018092868A1 (ja) 2016-11-21 2019-10-17 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法及び復号方法
CN116320415A (zh) 2016-11-21 2023-06-23 松下电器(美国)知识产权公司 图像编码装置及方法、图像解码装置及方法
FR3068557A1 (fr) 2017-07-05 2019-01-04 Orange Procede de codage et decodage d'images,dispositif de codage et decodage et programmes d'ordinateur correspondants
FR3062010A1 (fr) * 2017-07-05 2018-07-20 Orange Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'une sequence d'images
FR3068558A1 (fr) 2017-07-05 2019-01-04 Orange Procede de codage et decodage d'images,dispositif de codage et decodage et programmes d'ordinateur correspondants
EP3742403A4 (en) * 2018-01-19 2021-03-17 Panasonic Intellectual Property Corporation of America METHOD FOR CODING THREE-DIMENSIONAL DATA, METHOD FOR DECODING THREE-DIMENSIONAL DATA, DEVICE FOR CODING THREE-DIMENSIONAL DATA AND DEVICE FOR DECODING THREE-DIMENSIONAL DATA
US10652567B2 (en) 2018-03-28 2020-05-12 Apple Inc. Applications for decoder-side modeling of objects identified in decoded video data
US10638151B2 (en) * 2018-05-31 2020-04-28 Verizon Patent And Licensing Inc. Video encoding methods and systems for color and depth data representative of a virtual reality scene
WO2019234613A1 (en) 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Partition tree with partition into 3 sub-blocks by horizontal and vertical splits
US11558597B2 (en) * 2018-08-13 2023-01-17 Lg Electronics Inc. Method for transmitting video, apparatus for transmitting video, method for receiving video, and apparatus for receiving video
US11087549B2 (en) * 2018-10-15 2021-08-10 University Of Maryland, College Park Methods and apparatuses for dynamic navigable 360 degree environments
CN113287311B (zh) * 2018-12-22 2024-03-12 北京字节跳动网络技术有限公司 两步交叉分量预测模式的指示
EP3703013A1 (en) 2019-03-01 2020-09-02 Koninklijke Philips N.V. Apparatus and method of generating an image signal
CN114208167A (zh) * 2019-08-06 2022-03-18 寰发股份有限公司 具有帧内预测模式映射的视频数据的编码或解码方法和装置
WO2021027925A1 (en) 2019-08-14 2021-02-18 Beijing Bytedance Network Technology Co., Ltd. Position-dependent intra prediction sample filtering
WO2021027928A1 (en) 2019-08-14 2021-02-18 Beijing Bytedance Network Technology Co., Ltd. Weighting factors for prediction sample filtering in intra mode
CN110662040B (zh) * 2019-10-30 2022-02-18 西安邮电大学 基于可重构阵列处理器的深度图cu快速划分方法
US10999592B1 (en) * 2020-04-23 2021-05-04 Alibaba Group Holding Limited Estimated optimal video encoding parameter set systems and methods
CN114374675B (zh) 2020-10-14 2023-02-28 腾讯科技(深圳)有限公司 媒体文件的封装方法、媒体文件的解封装方法及相关设备
CN112929705B (zh) * 2021-02-02 2022-04-22 腾讯科技(深圳)有限公司 纹理压缩和解压方法、装置、计算机设备和存储介质
WO2023164245A1 (en) * 2022-02-28 2023-08-31 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for decoder-side intra mode derivation
US11388445B1 (en) * 2022-03-10 2022-07-12 Yendo Hu Mosquito noise smoothing between different video subsections encoded with different compression methods within a video frame
US11425423B1 (en) * 2022-03-10 2022-08-23 Yendo Hu Memory storage for motion estimation and visual artifact redcution

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5614952A (en) * 1994-10-11 1997-03-25 Hitachi America, Ltd. Digital video decoder for decoding digital high definition and/or digital standard definition television signals
US6057884A (en) * 1997-06-05 2000-05-02 General Instrument Corporation Temporal and spatial scaleable coding for video object planes
KR100285599B1 (ko) * 1998-03-14 2001-04-02 전주범 격행 부호화에서의 움직임 추정을 위한 텍스쳐 패딩 장치 및그 패딩 방법
US6157396A (en) * 1999-02-16 2000-12-05 Pixonics Llc System and method for using bitstream information to process images for use in digital display systems
AU2003279015A1 (en) 2002-09-27 2004-04-19 Videosoft, Inc. Real-time video coding/decoding
KR100513732B1 (ko) 2002-12-05 2005-09-08 삼성전자주식회사 3차원 객체 데이터 부호화 및 복호화 방법 및 장치
KR100519780B1 (ko) 2004-02-17 2005-10-07 삼성전자주식회사 3차원 체적 데이터 부호화/복호화 방법 및 장치
US7837937B2 (en) 2004-07-09 2010-11-23 Hamilton Sundstrand Corporation Biological agent detector
US20060153295A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for inter-layer prediction mode coding in scalable video coding
US9131247B2 (en) * 2005-10-19 2015-09-08 Thomson Licensing Multi-view video coding using scalable video coding
TWI344792B (en) * 2006-07-12 2011-07-01 Lg Electronics Inc A method and apparatus for processing a signal
US20120269458A1 (en) * 2007-12-11 2012-10-25 Graziosi Danillo B Method for Generating High Resolution Depth Images from Low Resolution Depth Images Using Edge Layers
US8787685B2 (en) * 2008-02-21 2014-07-22 France Telecom Encoding and decoding an image or image sequence divided into pixel blocks
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
US8179960B2 (en) * 2008-11-12 2012-05-15 Alcatel Lucent Method and apparatus for performing video coding and decoding with use of virtual reference data
US8837592B2 (en) * 2010-04-14 2014-09-16 Mediatek Inc. Method for performing local motion vector derivation during video coding of a coding unit, and associated apparatus
KR101385514B1 (ko) * 2010-06-08 2014-04-16 주식회사 에스칩스 깊이 맵 정보를 이용한 입체 영상 변환 방법 및 장치
KR101291071B1 (ko) * 2010-06-08 2013-08-01 주식회사 에스칩스 입체 영상 오류 개선 방법 및 장치
JP5527603B2 (ja) 2010-06-24 2014-06-18 ソニー株式会社 情報処理装置および情報処理方法
US9025661B2 (en) * 2010-10-01 2015-05-05 Qualcomm Incorporated Indicating intra-prediction mode selection for video coding
US9008175B2 (en) * 2010-10-01 2015-04-14 Qualcomm Incorporated Intra smoothing filter for video coding
JPWO2012070500A1 (ja) * 2010-11-22 2014-05-19 ソニー株式会社 符号化装置および符号化方法、並びに、復号装置および復号方法
US9807424B2 (en) * 2011-01-10 2017-10-31 Qualcomm Incorporated Adaptive selection of region size for identification of samples in a transition zone for overlapped block motion compensation
US9565449B2 (en) 2011-03-10 2017-02-07 Qualcomm Incorporated Coding multiview video plus depth content
US20120236934A1 (en) 2011-03-18 2012-09-20 Qualcomm Incorporated Signaling of multiview video plus depth content with a block-level 4-component structure
US9191646B2 (en) * 2011-08-29 2015-11-17 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
JPWO2013031574A1 (ja) * 2011-08-31 2015-03-23 ソニー株式会社 画像処理装置および方法
CN107071456B (zh) * 2011-09-23 2020-09-04 株式会社Kt 解码视频信号的方法
CN103688545B (zh) * 2011-10-28 2017-05-10 太阳专利托管公司 图像编码方法、图像解码方法、图像编码装置及图像解码装置
US9485503B2 (en) * 2011-11-18 2016-11-01 Qualcomm Incorporated Inside view motion prediction among texture and depth view components
US20130202194A1 (en) * 2012-02-05 2013-08-08 Danillo Bracco Graziosi Method for generating high resolution depth images from low resolution depth images using edge information
KR101877867B1 (ko) * 2012-02-21 2018-07-12 삼성전자주식회사 비디오 파라미터를 이용한 복잡도 측정 기반의 병렬 인-루프 화소 보정에 대한 부호화/복호화 장치 및 방법
WO2013133648A1 (ko) * 2012-03-07 2013-09-12 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
US9445076B2 (en) * 2012-03-14 2016-09-13 Qualcomm Incorporated Disparity vector construction method for 3D-HEVC
US9338451B2 (en) * 2012-04-12 2016-05-10 Qualcomm Incorporated Common spatial candidate blocks for parallel motion estimation
US10205961B2 (en) * 2012-04-23 2019-02-12 Qualcomm Incorporated View dependency in multi-view coding and 3D coding
WO2013165143A1 (ko) * 2012-04-30 2013-11-07 (주)휴맥스 멀티뷰 영상의 부호화 방법, 부호화 장치, 복호화 방법, 복호화 장치
US20130343465A1 (en) 2012-06-26 2013-12-26 Qualcomm Incorporated Header parameter sets for video coding
US9258389B2 (en) * 2012-08-13 2016-02-09 Gurulogic Microsystems Oy Encoder and method
JP6787667B2 (ja) * 2012-09-21 2020-11-18 ノキア テクノロジーズ オサケユイチア ビデオコーディングのための方法と装置
WO2014047893A1 (en) * 2012-09-28 2014-04-03 Intel Corporation Inter-layer pixel sample prediction
US9544612B2 (en) * 2012-10-04 2017-01-10 Intel Corporation Prediction parameter inheritance for 3D video coding
US9426465B2 (en) * 2013-08-20 2016-08-23 Qualcomm Incorporated Sub-PU level advanced residual prediction
US20150063455A1 (en) * 2013-09-02 2015-03-05 Humax Holdings Co., Ltd. Methods and apparatuses for predicting depth quadtree in three-dimensional video
US9667996B2 (en) * 2013-09-26 2017-05-30 Qualcomm Incorporated Sub-prediction unit (PU) based temporal motion vector prediction in HEVC and sub-PU design in 3D-HEVC

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HEVC Extension for Multiview Video Coding and Multiview Video plus Depth Coding, ITU-Telecommunications Standardization Sector Video Coding Experts Group, VCEG-AR13 (2012.02.10.)*

Also Published As

Publication number Publication date
EP2904775A4 (en) 2016-06-29
EP3029939B1 (en) 2020-04-29
KR20150126713A (ko) 2015-11-12
US9584822B2 (en) 2017-02-28
JP6415414B2 (ja) 2018-10-31
JP2018137817A (ja) 2018-08-30
EP2904775B1 (en) 2020-09-09
US9716897B2 (en) 2017-07-25
WO2014055140A1 (en) 2014-04-10
SG10201508813UA (en) 2015-11-27
SG10201707190RA (en) 2017-10-30
JP2016029814A (ja) 2016-03-03
KR101662985B1 (ko) 2016-10-06
US20140098189A1 (en) 2014-04-10
EP3029939A1 (en) 2016-06-08
US20150110193A1 (en) 2015-04-23
EP2904775A1 (en) 2015-08-12
JP6550633B2 (ja) 2019-07-31
JP2015536112A (ja) 2015-12-17
US9544612B2 (en) 2017-01-10
US20160029040A1 (en) 2016-01-28
SG11201501643YA (en) 2015-05-28
KR20150040346A (ko) 2015-04-14

Similar Documents

Publication Publication Date Title
KR101741940B1 (ko) 3d 비디오 코딩을 위한 예측 파라미터 상속
JP7069171B2 (ja) ビデオコーディングのためのサンプルアクセスを伴う線形モデル予測モード
JP7375125B2 (ja) ルーマおよびクロマ成分についてibc専用バッファおよびデフォルト値リフレッシュを使用するエンコーダ、デコーダおよび対応する方法
KR101636269B1 (ko) 3차원 비디오 코딩을 위한 뷰 간 필터 파라미터 재사용
EP2777250B1 (en) Cross-channel residual prediction
US9571809B2 (en) Simplified depth coding with modified intra-coding for 3D video coding
US9497485B2 (en) Coding unit size dependent simplified depth coding for 3D video coding
KR101626683B1 (ko) 멀티뷰 비디오 코딩 방안
BR102014013046B1 (pt) Método implementado por computador para a codificação de vídeo e sistema para codificação de vídeo em um computador
KR101618672B1 (ko) 깊이 기반 변이 벡터 교정을 포함하는 3d 비디오 코딩
KR20150024398A (ko) 크기 기반 변환 유닛 컨텍스트 도출
EP2901694A1 (en) Inter-layer residual prediction
WO2014000168A1 (en) Cross-layer cross-channel residual prediction
KR20150082512A (ko) 계층간 모션 데이터 상속
EP2865185A1 (en) Cross-layer cross-channel sample prediction
RU2637480C2 (ru) Упрощенное кодирование глубины с модифицированным внутрикадровым кодированием для кодирования трехмерных видеоданных

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant