KR100963864B1 - 스케일러블 비디오 코딩에서의 계층 간 예측 모드 코딩을위한 방법 및 시스템 - Google Patents

스케일러블 비디오 코딩에서의 계층 간 예측 모드 코딩을위한 방법 및 시스템 Download PDF

Info

Publication number
KR100963864B1
KR100963864B1 KR1020077018334A KR20077018334A KR100963864B1 KR 100963864 B1 KR100963864 B1 KR 100963864B1 KR 1020077018334 A KR1020077018334 A KR 1020077018334A KR 20077018334 A KR20077018334 A KR 20077018334A KR 100963864 B1 KR100963864 B1 KR 100963864B1
Authority
KR
South Korea
Prior art keywords
layer
prediction
surplus
block
enhancement layer
Prior art date
Application number
KR1020077018334A
Other languages
English (en)
Other versions
KR20070090273A (ko
Inventor
시앙린 왕
일리앙 바오
마르타 카르체위츠
저스틴 리쥐
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20070090273A publication Critical patent/KR20070090273A/ko
Application granted granted Critical
Publication of KR100963864B1 publication Critical patent/KR100963864B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Abstract

본 발명은, 베이스 계층의 해상도가 인핸스먼트 계층의 해상도보다 낮으면 베이스 계층에 있는 하나의 4x4 블록의 인트라4x4 모드를 인핸스먼트 계층에 있는 다중의 이웃 4x4 블록들로 복사하고, 베이스 계층의 해상도가 인핸스먼트 계층의 해상도보다 낮고 베이스 계층 해상도가 양 차원에서 인핸스먼트 계층 해상도의 반이면 인트라4x4 모드를 인트라8x8 모드로 사용함으로 해서 베이스 계층 MB가 인트라 코드에서 인코딩될 때에도 MI를 사용하고, RP에서 사용되는 베이스 계층 예측 잉여를 직접 계산하는 것을 실행하고, 메모리 요구를 줄이기 위해 예측 잉여를 클립핑하고, BLTP 모드에서 예측 잉여를 터널링하며; 플래그 비트들을 저장하고 구현의 복잡도를 줄이기 위해 RP 플래그를 조건부로 코딩하여, 잉여 예측을 개선시킨다.

Description

스케일러블 비디오 코딩에서의 계층 간 예측 모드 코딩을 위한 방법 및 시스템{Method and system for inter-layer prediction mode coding in scalable video coding}
본 발명은 비디오 코딩 분야에 대한 것이며, 더 특별하게는 스케일러블 비디오 코딩에 관한 것이다.
H.264와 같은 전형적인 단일 계층(single layer) 비디오 규칙에서 비디오 프레임은 매크로블록들에서 처리된다. 매크로블록(macroblock, 이하 MB)이 인터(inter)-MB 라면, 하나의 매크로블록 내의 픽셀들은 하나 또는 다중의 레퍼런스 프레임들 내의 픽셀들로부터 예측될 수 있다. 매크로블록이 인트라(intra)-MB 라면, 현재 프레임의 MB 내부의 픽셀들 역시 같은 비디오 프레임 내의 픽셀들부터 전적으로 예측될 수 있다.
인터-MB와 인트라-MB의 양쪽을 위해, MB는 다음과 같은 단계들을 거쳐서 디코드된다:
- MB 내의 신택스 엘리먼트(syntax element)들을 디코드하며, 이때에 신택스 엘리먼트들은 예측 모드들 및 연관된 매개변수(parameter)들을 포함;
- 신택스 엘리먼트들에 기반하여 MB의 각 분할구획(partition)에 대한 픽셀 예측자(predictor)를 회수한다. 하나의 MB는 다수의 분할구획들을 포함할 수 있고, 각 분할구획은 자신의 모드 정보를 포함할 수 있다;
- 양자화 계수들을 얻기 위해 엔트로피 디코딩 실행;
- 예측 잉여(residue)를 재구성하기 위해 상기 양자화된 계수들에 대해 역변환 실행; 그리고
- MB의 재구성된 픽섹 값들을 얻기 위해 픽셀 예측자를 상기 재구성된 예측 잉여에 더한다.
인코더 측에서, 예측 잉여는 원 픽셀들과 그 픽셀들의 예측자들 간의 차이이다. 잉여들은 변환되고 그러면 변환 계수가 양자화된다. 그리고 양자화된 계수들은 특정 엔트로피-코딩 규칙을 사용하여 인코딩된다.
MB가 인터-MB라면, 모드 결정에 관련된 다음과 같은 정보를 코딩하는 것이 필요하다:
- 인터-MB 라는 것을 나타내는 MB 유형;
- 사용되는 특정 인터-프레임 예측 모드들. 예측 모드들은 MB가 어떻게 분할구획 되는가를 나타낸다. 예를 들면, MB는 16x16 크기의 하나의 분할구획만을 가질 수 있거나 또는 두 개의 16x8 분할구획들을 가지며 이 때에 각 분할구획은 상이한 모션 정보를 가질 수 있다, 등등;
- 그로부터 픽셀 예측자가 얻어지는 레퍼런스 프레임들을 나타내는 하나 또는 그 이상의 레퍼런스 프레임 인덱스들. 한 MB의 상이한 부분들은 상이한 레퍼런스 프레임들로부터 예측자를 가질 수 있다;
- 예측자가 페치되는 레퍼런스 프레임들의 위치를 나타내는 하나 또는 그 이상의 모션 벡터들.
MB가 인트라-MB인 경우 다음과 같은 정보를 코딩하는 것이 필요하다:
- 인트라-MB라는 것을 나타내는 MB 유형;
- 루마(luma)를 위해 사용되는 인트라-프레임 예측 모드들. 루마 신호가 인트라4x4 모드를 사용하여 예측되면 16x16 루마 블록 내의 각 4x4 블록은 각각 자신의 예측 모드를 가질 수 있으며, 16개의 인트라4x4 모드들은 하나의 MB를 위해 코딩된다. 만일 루마 신호가 인트라16x16 모드를 사용하여 예측된다면 오직 하나의 인트라16x16 모드가 전체 MB와 연관된다;
- 채도(chroma)를 위해 사용되는 인트라-프레임 예측 모드.
어느 경우이건 모드들 및 연관된 매개변수를 코딩하는데 막대한 양의 비트들이 사용된다.
Scalable Video Model 3.0(ISO/IEC JTC 1/SC 29/WG 11N6716, 2004년 10월, Palma de Mallorca, Spain)에 제안된 스케일러블 비디오 코딩 솔루션에서, 비디오 시퀀스는 다중의 계층들로 코딩될 수 있고, 각 계층들은 일정 공간 해상도 또는 일시적인 해상도 또는 일정 품질 수준 또는 상기의 세 가지 경우가 결합된 경우에서의 비디오 시퀀스에 대한 하나의 표시이다. 좋은 코딩 효율을 얻기 위해, 몇몇의 새로운 텍스쳐 예측 모드들 및 신택스 예측 모드들이 계층들 간의 중복(redundancy)을 줄이기 위해 사용된다.
베이스 계층으로부터의 모드 계승(Mode Inheritance from base layer; 이하 MI)
이 모드에서는, MI 플래그를 제외하면 한 MB를 위해 추가적인 신택스 엘리먼트들이 코딩될 필요가 없다. MI 플래그는 이 MB의 모드 결정이 베이스 계층에 있는 대응하는 MB로부터 얻어진 것이라는 것을 나타내기 위해 사용된다. 베이스 계층의 해상도가 인핸스먼트(enhancement) 계층의 해상도와 동일하면 모드 정보는 모두 그 상태 그대로 사용될 수 있다. 베이스 계층의 해상도가 인핸스먼트 계층의 해상도와 다르다면(예를 들면 인핸스먼트 계층 해상도의 반), 인핸스먼트 계층에 의해 사용되는 모드 정보는 해상도 비율에 따라서 유도될 필요가 있다.
베이스 계층 텍스쳐 예측(Base Layer Texture Prediction; 이하 BLTP)
이 모드에서는, MB 전체 또는 MB의 일부를 위한 픽셀 예측자는 베이스 계층에 있는 협응-위치한(co-located) MB로부터 얻어진다. 새로운 신택스 엘리먼트들은 그러한 예측을 가리킬 필요가 있다. 이것은 인터-프레임 예측과 유사하지만, 예측자의 위치가 알려져 있기 때문에 어떤 모션 벡터도 필요하지 않다. 이 모드는 도 1에 도시된다. 도 1에서, C1은 인핸스먼트 계층 코딩에서의 원 MB이며, B1은 C1을 예측하는데 사용된 현재 프레임을 위해 베이스 계층에서 재구성된 MB이다. 도 1에서, 인핸스먼트 계층 프레임 크기는 베이스 계층에서의 크기와 동일하다. 베이스 계층이 다른 크기라면 베이스 계층 재구성 프레임에 대한 적절한 크기 조절 처리가 필요하다.
잉여 예측(Residue Prediction; 이하 RP)
이 모드에서는, 인핸스먼트 계층에서 코딩된 잉여의 양을 줄이기 위해 베이 스 계층의 재구성된 예측 잉여가 사용되며, 두 MB들은 인터 모드에서 인코딩된다.
도 1에서, 블록을 위한 베이스 계층에서의 재구성된 예측 잉여는 (B1-B0)이다. 인핸스먼트 계층에서의 가장 최선의 레퍼런스 블록은 E0이다. C1을 예측하는데 사용되는 실제의 예측기는 (E0+(B1-B0))이다. 그 실제의 예측기는 "잉여-조절된 예측기(residue-adjusted predictor)"로 언급된다. RP 모드에서의 예측 잉여를 계산한다면, 다음과 같은 결과를 얻게 된다.
C1-(E0+(B1-B0))=(C1-E0)-(B1-B0)
잉여 예측이 사용되지 않는다면 인핸스먼트 계층의 보통의 예측 잉여인 (C1-E0)가 인코딩된다. RP 모드에서 인코딩된 것은 인핸스먼트 계층에서의 제1계 예측 잉여와 베이스 계층에서의 제1계 예측 잉여간의 차이이다. 그러므로 이와 같은 텍스쳐 예측 모드가 잉여 예측이라고 언급되는 것이다. 현재 MB를 인코딩 하는데 RP 모드가 사용되는가의 여부를 나타내기 위해 한 개의 플래그가 필요하다.
잉여 예측 모드에서, 모션 벡터 mve는 실제의 코딩에서 모션 벡터 mvb와 같을 필요는 없다.
잉여 예측 모드는 MI와 결합될 수도 있다. 이런 경우, 베이스 계층으로부터의 모드 정보는 인핸스먼트 계층 E0 에서 픽셀 예측자에 억세스하는데 사용되며, 그러면 베이스 계층에서의 재구성된 예측 잉여는 인핸스먼트 계층에서 예측 잉여를 예측함에 있어서 사용된다.
본 발명의 주요 목적은 SVC 계층들에 존재하는 중복성을 추가적으로 제거하는 것이다. 이 목적은 계층 간(inter-layer) 예측 모드들을 개선함으로써 얻어질 수 있다.
베이스 계층 MB가 인트라모드에서 다음과 같이 인코딩될 때에 MI를 사용하여 개선이 이루어질 수 있다:
- 베이스 계층의 해상도가 인핸스먼트 계층 해상도보다 낮으면 베이스 계층에 있는 하나의 4x4 블록의 인트라4x4 모드를 인핸스먼트 계층에 있는 다중의 이웃한 4x4 블록들로 복사.
- 인트라4x4 모드를 인트라8x8 모드로 사용하며, 이는 양 차원에서 베이스 계층 해상도가 인핸스먼트 계층 해상도보다 낮고 베이스 계층 해상도가 인핸스먼트 계층 해상도의 반인 경우에 그렇게 사용한다.
잉여 예측(RP)에서의 개선은 다음에 의해서 이루어진다:
- RP에서 사용된 베이스 계층 예측 잉여를 직접 계산;
- 메모리 요구를 줄이기 위해 예측 잉여 클리핑(clipping);
- BLTP 모드에서 예측 잉여를 터널링(tunneling);
- 플래그 비트들을 세이브하고 구현의 복잡도를 줄이기 위해 RP 플래그를 조건부 코딩
더 나아가, 인핸스먼트 계층이 베이스 계층 텍스쳐 예측(BLTP) 모드에서 코딩될 때에 베이스 계층의 모드 정보에 대한 터널링이 실행된다.
도 1은 스케일러블 비디오 코딩에서의 텍스쳐 예측 모드들을 보여준다.
도 2는 잉여 예측에 사용된 예측 잉여를 계산하는 것을 도시한 것이다.
도 3은 공간 베이스 계층으로부터의 코딩된 블록 패턴과 인트라 모드들을 사용하는 것을 도시한 것이다.
도 4는 본 발명의 실시예가 구현될 수 있는 계층화된 스케일러블 인코더를 보여주는 블록 다이어그램이다.
본 발명은 다음에 설명되는 것과 같이 계층 간(inter-layer) 예측 모드들을 개선시킨다.
베이스 계층 MB가 인트라 모드에서 코딩될 때에 베이스 계층으로부터의 모드 계승
보통은, 인핸스먼트 계층의 MB에 대응하는 베이스 계층에서의 MB가 인터-MB인 경우에만 MI가 인핸스먼트 계층의 MB를 위해 사용된다. 본 발명에 따르면, MI는 베이스 계층 MB가 인트라-MB일 때에도 사용된다. 베이스 계층 해상도가 인핸스먼트 해상도와 동일하면 모드들은 그 상태 그대로 사용된다. 베이스 계층 해상도가 같지 않으면 모드 정보는 따라서 전환된다.
H.264에서는, 다음의 세 가지 인트라 예측 유형이 있다: 인트라4x4, 인트라8x8 그리고 인트라 16x16. 베이스 계층의 해상도가 인핸스먼트 해상도보다 낮으면, 베이스 계층 MB의 루마 신호가 인트라4x4 모드로 코딩되면, 베이스 계층의 한 4x4 블록의 인트라4x4 모드가 인핸스먼트 계층의 다중 4x4 블록들에 적용될 수 있다. 예를 들어, 베이스 계층 해상도가 양 차원에서 인핸스먼트 계층 해상도의 반이면 베이스 계층에서의 하나의 4x4 블록의 인트라 예측 모드는 인핸스먼트 계층에서의 4개의 4x4 블록들에 의해 사용될 수 있으며, 이는 도 2의 우측에 도시되었다.
다른 실시 예에서, 베이스 계층의 해상도가 인핸스먼트 계층의 해상도의 반이고 베이스 계층 MB의 루마 신호가 하나의 인트라4x4 모드로 코딩되면, 베이스 계층에서의 4x4 블록의 인트라4x4 모드가 인핸스먼트 계층의 대응하는 8x8 블록의 인트라8x8 모드로 사용된다. 그것은 인트라8x8 모드가 예측 방향이라는 면에서 인트라4x4 모드들과 유사하게 정의되기 때문이다. 인트라8x8 예측이 베이스 계층에서 적용된다면, 베이스 계층에서의 하나의 8x8 블록의 인트라8x8 예측 모드는 인핸스먼트 계층의 MB 내의 4개의 8x8 블록들 모두에 적용된다.
인트라16x16 모드와 채도(chroma) 예측 모드는 베이스 계층의 해상도가 인핸스먼트 계층의 해상도와 같지 않을지라도 사용될 수 있다.
베이스 계층 텍스쳐 예측 모드에서 모드 정보 터널링
종래 기술에서, MB가 BLTP 모드에서 계층 N-1로부터 예측된다면, 계층 N-1로부터의 어떤 모드 결정 정보도 계층 N에서 그 MB를 코딩하는데 필요하지 않다. 본 발명에 따르면, 계층 N-1에서 MB의 모드 결정 정보 모두는 계층 N에서 그 MB에 의해 승계되며, 그러면, 비록 그 정보는 계층 N에서 MB들을 코딩하는 데 사용될 수 없을 것이지만, 그 정보는 계층 N+1에서 MB(들)을 코딩하는데 사용될 수 있다.
잉여 예측(Residue Prediction; RP)
- RP에서 사용되는 베이스 계층 예측 잉여를 직접 계산
계층 N에서 하나의 MB를 코딩할 때에 잉여 예측을 위해 사용되는 값은 계층 N-1에서는 "진정 잉여(true residue)"이어야 하며, 이는 계층 N-1에서 재구성되어 같이 배치된 블록과 계층 N-1에서 같이 배치된 블록의 비-잉여-조절된(non-residue-adjusted) 예측자 간의 차이로 정의되며, 계층 N-1에서 주어진 대응하는 MB는 인터코딩된다(inter-coded).
디코딩 과정에서, "명의 잉여(nominal-residue)"는 다음의 2 단계를 사용해서 계산될 수 있다:
1. 양자화된 계수들을 탈양자화(dequantize), 그리고
2. 탈양자화된 계수들에 대해 역변환 수행.
베이스 계층의 하나의4x4 블록의 모드는 인핸스먼트 계층의 4개의 4x4 블록들에 의해 사용될 수 있으며, 이는 도 2의 우측에 도시되었다.
잉여 예측이 이 계층에서 MB를 코딩하는데 사용되지 않는다면, 그 계층에서 그 MB에 대해서는 명의 잉여는 진정 잉여와 동일하다. 잉여 예측이 이 계층에서 MB를 코딩하는데 사용된다면, 명의 잉여는 재구성된 픽셀과 잉여-조절된 예측자간의 차이이기 때문에 명의 잉여는 진정 잉여와 다르다.
도 2 좌측의 3-계층 SVC 구조를 예로 든다. 잉여 예측이 계층 0에서 MB를 위해 사용되지 않는다면 명의 잉여와 진정 잉여는 모두 (B1-B0)이다. 그러나, 만일 계층 1에서 잉여 예측이 MB를 위해 사용된다면, 명의 잉여는 (E1-(E0+(B1-B0)))이다. 이 결과는 탈양자화 및 탈양자화된 계수들을 역변환하여 직접 얻어질 수 있다. 진정 잉여는 (E1-E0)이다.
다음은 계층 N-1에서 진정 잉여를 계산하기 위한 두 가지의 예시 방법이며, 이것은 계층 N에서는 잉여 예측으로 사용될 것이다.
방법 A
계층 N-1에서 현재 프레임과 그의 레퍼런스 프레임들 모두에 대해 전체 재구성을 실행하며, 그러면 계층 N-1에서의 진정 잉여가 쉽게 계산될 수 있다. 그러나, 몇몇 애플리케이션을 위해서는 계층 2에서 하나의 프레임을 재구성하는 것이 계층 0과 계층 1에서 프레임에 대한 전체 재구성을 요구하지 않을 것이 요망된다.
방법 B
계층 N-1에서 MB를 위해 잉여 예측이 사용되지 않는다면, 계층 N-1에서의 진정 잉여는 명의 잉여와 동일하다. 그렇지 않다면 그것은 계층 N-1에서의 명의 잉여와 계층 N-2에서의 진정 잉여의 합이다.
도 2에서, 계층 0에서의 진정 잉여는 (B1-B0)이며, 계층 1에서 대응하는 MB를 코딩하는데 RP 모드가 사용된다. 계층 1에서 현재의 MB를 위한 잉여-조절된 예측자는 (E0+(B1-B0))이다. 계층 1에서 재구성된 명의 예측 잉여는 (E1-(E0+(B1-B0)))이다. 따라서 계층 1에서의 진정 잉여는 다음과 같이 계산될 수 있다.
(E1-(E0+(B1-B0))+(B1-B0) = (E1-E0)
방법 B는 하위 계층에서의 프레임에 대한 전체 재구성의 필요가 없다. 이 방법은 진정 잉여에 대해서는 "직접 계산"으로 언급된다.
수학적으로는 방법 A와 방법 B로부터의 결과는 동일하다. 그러나 실제의 구현에 있어서 다양한 클립핑(clipping) 처리가 실행되기 때문에 그 결과들은 약간 차이가 난다. 본 발명에 따라, 다음은 계층 N-1에서 "진정 잉여"를 계산하기 위한 절차이며, 이것은 계층 N에서는 잉여 예측으로 사용된다:
1. 양자화된 계수들을 탈양자화;
2. "계층 N-1에서의 명의잉여(nominalResidue)"를 구하기 위해 탈양자화된 계수들에 대해 역변환 실행;
3. 계층 N-1의 MB를 위해 잉여 예측이 사용되지 않는다면, "임시잉여(tempResidue)"를 "계층 N-1에서 명의잉여(nominalResidue)"와 같게 설정하고, 단계 5로 진행;
4. 계층 N-1의 MB를 위해 잉여 예측이 사용되면, "임시잉여(tempResidue)"를 "계층 N-1에서의 명의잉여(nominalResidue)" + "계층 N-2에서의 진정잉여(trueResidue)"로 설정하고, 단계 5로 진행;
5. 계층 N-1에서 "진정잉여(trueResidue)"를 얻기 위해 "임시잉여(tempResidue)"에 클립핑 실행.
본 발명에서, 진정 잉여는 클립핑되어 잉여 데이터를 저장하기 위해 필요한 메모리를 절약하기 위해 특정 범위 내로 위치할 것이다. 비트 스트림에서 추가적인 신택스 요소인 "residueRange"를 잉여의 동적인 범위를 나타내기 위해 도입될 수 있다. 한 예로, 8비트 비디오 데이터를 위해 [-128, 127]의 영역에 잉여를 잘라낸다(clip). 더 적극적인 클립핑은 특정 복잡도와 코딩 효율간의 트레이드 오프를 위 해 적용될 수 있다.
계수 도메인에서의 잉여 예측
한 실시예에서, 잉여 예측은 계수 도메인에서 실행될 수 있다. 잉여 예측 모드가 사용된다면, 계수 도메인에서의 베이스 계층 잉여는 인핸스먼트 계층의 예측 잉여의 계수 변환으로부터 빼질 수 있다. 이 연산에 인핸스먼트 계층에서의 양자화과정이 이어진다. 계수 도메인에서의 잉여 예측을 실행함으로 해서 모든 베이스 계층들의 공간 도메인에서의 예측 잉여를 재구성하는 역변환 단계가 회피될 수 있다. 그 결과 계산의 복잡도가 크게 줄어들 수 있다.
인트라 및 BLTP 모드에서의 예측 잉여 터널링
보통은, 근접한 베이스 계층의 MB가 인트라-MB이거나 또는 BLTP 모드를 사용하여 그 자체 베이스 계층으로부터 예측된다면 예측 잉여는 0으로 설정된다. 본 발명에 따르면, 예측 잉여는 상위의 인핸스먼트 계층으로 전송될 것이며, 인트라-프레임 예측으로부터는 아무 잉여도 더해지지 않을 것이다. 3-계층의 SVC 구조를 고려한다: MB가 계층 0에서 인터-모드로 코딩되고 계층 1에서 인트라 모드라면, 계층 0의 예측 잉여는 계층 2에서 사용될 수 있다.
현재의 인핸스먼트 계층(예를 들면 도 2의 계층 1)의 MB가 BLTP 모드에서 코딩되면, 일 실시예에서는, 그의 베이스 계층(계층 0)의 예측 잉여, 그 값은 (B1-B0)인 예측 잉여는 계층 1 예측 잉여로 기록될 것이며 상위 인핸스먼트 계층(계층 2)의 잉여 예측에 사용될 것이다. 계층 1의 BLTP 모드로부터의 명의 잉여는 더해지지 않는다. 이것은 이전에 설명된 인트라-모드와 유사한 것이다. 다른 실시예에서, 계층 1에서 (E1-B1) 값의 BLTP 모드 예측 잉여 역시 베이스 계층 예측 잉여 (B1-B0)에 더해진다. 그와 같이, 계층 2 잉여 예측에 사용된 잉여는 (B1-B0)라기 보다는 (E1-B0)이다. 이것은 도 2의 우측에 도시되어 있다.
플래그 비트들을 저장하고 구현 복잡도를 감소시키기 위한 RP 플래그들의 조건부 코딩
RP 플래그는 RP 모드가 인핸스먼트 계층에서 MB를 위해 사용되는가의 여부를 나타내기 위해 사용된다. 인핸스먼트 계층에서의 MB를 위한 잉여 예측에 사용될 수 있는 재구성된 예측 잉여가 0이면, 잉여 예측 모드는 코딩 효율을 개선하는데 도움이 되지 않을 것이다. 본 발명에 따르면, 잉여 예측 모드가 평가되기 전에, 인코더 측에서 이런 상태가 항상 체크된다. 그러므로, 계산의 상당한 양이 모드 결정에서 감소될 수 있다. 인코더 측과 디코더 측의 양쪽에서, 인핸스먼트 계층에서 MB를 위한 잉여 예측에 사용될 수 있는 재구성된 예측 잉여가 0이면 어떤 RP 플래그도 코딩되지 않는다. 그러므로, RP 플래그를 코딩하는데 소모되는 비트들의 개수가 감소한다.
매크로블록을 코딩할 때에, 하나 또는 그 이상의 변수들이 비트스트림으로 코딩되어 MB가 인트라-코딩된 것인지 혹은 인터-코딩된 것인지 혹은 BLTP 모드에서 코딩된 것인지를 나타낸다. 이때에 집합적 변수인 mbType이 이러한 세가지 예측 모드들을 구분하기 위해 사용된다.
명의 예측 잉여는 인트라-코딩된 매크로블록에 대해서는 항상 0이다. 베이스 계층에 배치된(collocated) 매크로블록들의 어느 것도 인터-코딩되지 않았다면, 인 핸스먼트 계층의 MB를 위한 잉여 예측에 사용될 수 있는 재구성된 예측 잉여는 0이다. 예를 들면, 2-계층 SVC 구조에서, 베이스 계층이 인터-코딩되지 않았다면, 계층 1의 매크로블록을 코딩하는데 사용될 수 있는 잉여는 0이며, 잉여 예측 과정은 이 매크로블록을 위해서 생략될 수 있고, 어떤 잉여 예측 플래그도 전송되지 않는다.
비디오 코딩에서, 예측 잉여가 MB에서 어떻게 분포되어 있는가를 나타내기 위해 부호화된 블록 패턴(Coded Block Pattern; CBP)을 이용하는 것이 일반적이다. CBP의 값이 0이라는 것은 예측 잉여가 0이라는 것을 나타낸다.
베이스 계층이 다른 해상도일 때에, 베이스 계층에서의 CBP는 도 3에 나타난 것과 같이 인핸스먼트 계층의 적절한 크기로 변환된다. 특정한 예는 양 차원에서 베이스 계층의 해상도가 인핸스먼트 계층 해상도의 반인 경우이다. 보통 CBP 비트는 한 MB 내의 각 8x8 루마 블록을 위해 전송된다. 적절한 위치에서 하나의 CBP 비트를 검사하여, 공간 베이스 계층으로부터의 예측 잉여가 0인가의 여부를 알 수 있다. 이것은 도 3의 좌측부분에서 설명된다. 채도 CBP 역시 잉여 예측이 사용되어야 하는가 여부를 결정하기 위해 비슷한 방법으로 검사될 수 있다.
본 발명의 일 실시예에서 있어서, 베이스 계층들의 CBP와 mbType 은 현재 MB의 잉여 예측에서 사용될 수 있는 예측 잉여가 0인가의 여부를 추측하기 위해 사용될 수 있다. 그렇게 해서, MB 내의 예측 잉여를 픽셀 단위로 실제 검사하는 것을 피할 수 있다.
CBP와 mbType을 검사한 결과는 예측 잉여를 픽셀 단위로 검사한 결과와 같지 않을 수도 있다는 것에 유의하여야 한다. 왜냐하면 베이스 계층 텍스쳐 데이터가 디코딩된 후에 그 베이스 계층 텍스쳐 데이터에, 베이스 계층 해상도가 인핸스먼트 계층 해상도보다 낮으면 업샘플링 처리 그리고 루프 필터링 처리와 같은 추가적인 처리 단계들이 적용될 수 있기 때문이다. 예를 들면 베이스 계층 해상도가 인핸스먼트 계층 해상도의 반이면 베이스 계층의 재구성된 예측 잉여는 2의 인수(factor)로 업샘플링될 것이다(도 3). 업샘플링 프로세스에서 실행되는 필터링 처리는 0이 아닌 블록으로부터 이웃하는 0 블록으로 적은 양의 에너지를 누출시킬 수 있다. 블록의 예측 잉여가 픽셀 단위로 검사된다면 CBP와 mbType으로부터 추측되는 정보가 0일지라도 잉여가 0이 아닌 것을 알 수 있을 것이다.
그러므로 베이스 계층들에서 CBP와 mbType 값들만을 검사함으로 해서 메모리 접근만이 아니라 계산 복잡도도 감소될 수 있다.
도 4는 본 발명의 실시예가 구현될 수 있는 스케일러블 비디오 인코더(400)의 블록 다이아그램을 도시한 것이다. 도 4에 도시된 것과 같이, 인코더는 두 개의 코딩 모듈들(410, 420)를 포함하며, 각 모듈은 다른 계층의 비트스트림을 생성할 수 있는 엔트로피 인코더를 포함한다. 인코더(400)는 어떻게 계수들이 코딩되는가를 결정하는 소프트웨어 프로그램을 포함한다. 예를 들면, 베이스 계층에 있는 하나의 4x4 블록의 인트라4x4 모드를 인핸스먼트 계층에 있는 다중의 이웃 4x4 블록들로 복사하고 베이스 계층 해상도가 인핸스먼트 계층 해상도의 반이면 인트라4x4 모드를 인트라8x8 모드로 사용함으로 해서 베이스 계층 MB가 인트라 코드에서 인코딩될 때에도, 그 소프트웨어 프로그램은 MI를 사용하기 위한 의사 코드를 포함한 다. 그 소프트웨어 프로그램은 잉여 예측 모드를 직접적으로 사용하는 베이스 계층 예측 잉여를 계산하고 예측 잉여를 잘라내기 위해 사용될 수 있다.
정리하면, 인트라8x8과 인트라4x4는 상이한 루마 예측 유형들이다. 인트라 예측에서의 기본적인 아이디어는 처리될 블록의 픽셀들에 대한 직접적인 예측을 수행하기 위해 인접한 (이미 처리되고 재구성된) 블록의 가장자리 픽셀들을 사용하는 것이다. 어떤 특정한 모드는 예측 방향, 하(下)-우(右) 방향, 수평 방향 등의 예측 방향을 특정한다. 그에 대해 더 자세하게 설명하면, 수평 방향에서 있어서, 현재 블록의 왼쪽 측면의 가장자리 픽셀들은 수평으로 복제될 것이며, 현재 블록의 예측자들로 사용될 것이다.
인트라8x8 예측 유형에서, MB는 4개의 8x8 블록들에서 처리되며, 각 8x8 블록들에 연관된 하나의 인트라8x8 예측 모드가 존재한다. 인트라4x4에서, MB는 4x4 블록들에서 처리된다. 그러나 모드(예측 방향)는 양 예측 유형들을 위해 유사하게 정의된다. 그러므로 본 발명을 구현하는 한 유형에서, 하나의 4x4 블록의 예측 모드를 인핸스먼트 계층의 4개의 4x4 블록들로 복사할 수 있으며, 이는 양 차원에서 프레임 크기가 두 배로 되는 경우에 일어난다. 다른 유형의 구현 예에서는, 동일한 2/1 프레임 크기의 관계일 때에, 하나의 4x4 블록의 예측 모드를 인핸스먼트 계층에 있는 하나의 8x8 블록의 인트라8x8 모드로 사용할 수 있다.
본 발명에서, 양 방향을 위해 절반의 해상도가 존재한다. 그러나 어떤 애플리케이션에서는, 비디오는 한 방향으로만 다운-샘플될 수도 있다. 이런 경우에는, 하나의 인트라4x4 모드를 인핸스먼트 계층의 2개의 4x4 블록들로 복사한다, 그러면 인트라4x4를 인트라8x8로 매핑하는 것은 더 이상 유효하지 않다.
본 발명이 하나 또는 그 이상의 실시예에 관하여 기술되었지만, 본 발명이 속한 기술 분야의 통상의 지식을 가진 자는 본 발명의 요지를 유지하면서도 형식과 상세한 설명의 면에서 전술한 내용과 다양한 다른 변경, 생략 및 유도가 될 수 있다는 것을 이해할 수 있다.
본 발명은 비디오 코딩 분야, 더 특별하게는 스케일러블 비디오 코딩에 사용될 수 있다.

Claims (22)

  1. 인코딩된 이미지를 디코딩하는 방법으로서,
    현재 이미지의 제1 인핸스먼트 (enhancement) 계층의 한 블록에 대한 제1 예측 잉여 (prediction residue)를 나타내는 정보를, 인코딩된 비트스트림 내에서, 수신하는 단계;
    상기 제1 예측 잉여와 상기 현재 이미지의 제2 계층의 블록의 예측 잉여의 의 합을 나타내는, 상기 제1 인핸스먼트 계층의 블록에 대한 제2 예측 잉여를 저장하는 단계; 및
    상기 제2 예측 잉여를 기반으로 하여 상기 현재 이미지의 제3 계층의 블록을 디코딩하는 단계;를 포함하는, 인코딩된 이미지를 디코딩하는 방법.
  2. 제1항에 있어서,
    상기 제1 예측 잉여와 이전에 디코드된 이미지의 인핸스먼트 계층에 관한 예측을 기반으로 하여 상기 제1 인핸스먼트 계층의 블록을 디코딩하는 단계;를 더 포함하는, 인코딩된 이미지를 디코딩하는 방법.
  3. 삭제
  4. 제1항에 있어서,
    상기 제1 인핸스먼트 계층의 블록은 완전하게 재구성된 것이 아닌, 인코딩된 이미지를 디코딩하는 방법.
  5. 제1항에 있어서,
    상기 제3 계층의 블록을 디코딩하는 것은 상기 제2 예측 잉여와 이전에 디코드된 이미지의 인핸스먼트 계층에 관한 예측을 기반으로 하여 실행되는, 인코딩된 이미지를 디코딩하는 방법.
  6. 제1항에 있어서,
    상기 제2 계층의 블록의 예측 잉여와 제1 예측 잉여의 합을 상기 제2 예측 잉여의 범위를 제한하기 위해 클립핑 (clipping)하는 단계를 더 포함하는, 인코딩된 이미지를 디코딩하는 방법.
  7. 제1항에 있어서,
    상기 제2 계층은 상기 현재 이미지의 베이스 (base) 계층인, 인코딩된 이미지를 디코딩하는 방법.
  8. 제1항에 있어서,
    상기 제2 계층은 상기 현재 이미지의 제2 인핸스먼트 계층인, 인코딩된 이미지를 디코딩하는 방법.
  9. 제1항에 있어서,
    상기 제2 계층의 블록의 예측 잉여는 상기 인코딩된 비트스트림 내에서 수신되는, 인코딩된 이미지를 디코딩하는 방법.
  10. 제1항에 있어서,
    상기 제2 예측 잉여는 변환 계수들 (transform coefficients)을 포함하는, 인코딩된 이미지를 디코딩하는 방법.
  11. 인코딩된 이미지를 디코딩하기 위한 소프트웨어 애플리케이션이 저장된 컴퓨터로 읽을 수 있는 저장 매체로서,
    상기 소프트웨어 애플리케이션은 제1항의 방법을 실행하기 위한 프로그램 코드들을 포함하는, 컴퓨터로 읽을 수 있는 저장 매체.
  12. 이미지를 스케일러블 (scalable) 비트스트림으로 인코딩하는 방법으로서,
    현재 이미지의 제1 인핸스먼트 계층의 블록에 대한 제1 예측 잉여를 계산하는 단계;
    상기 제1 예측 잉여와 상기 현재 이미지의 제2 계층의 블록의 예측 잉여의 의 합을 나타내는, 상기 제1 인핸스먼트 계층의 블록에 대한 제2 예측 잉여를 저장하는 단계; 및
    상기 제2 예측 잉여를 기반으로 하여 상기 현재 이미지의 제3 계층의 블록을 인코딩하는 단계;를 포함하는, 이미지를 스케일러블 비트스트림으로 인코딩하는 방법.
  13. 제12항에 있어서,
    상기 제1 예측 잉여와 이전에 디코드된 이미지의 인핸스먼트 계층에 관한 예측을 기반으로 하여 상기 제1 인핸스먼트 계층의 블록을 인코딩하는 단계;를 더 포함하는, 이미지를 스케일러블 비트스트림으로 인코딩하는 방법.
  14. 삭제
  15. 제12항에 있어서,
    상기 제3 계층의 블록을 인코딩하는 것은 상기 제2 예측 잉여와 이전에 디코드된 이미지의 인핸스먼트 계층에 관한 예측을 기반으로 하여 실행되는, 이미지를 스케일러블 비트스트림으로 인코딩하는 방법.
  16. 제12항에 있어서,
    상기 제2 계층의 블록의 예측 잉여와 제1 예측 잉여의 합을 상기 제2 예측 잉여의 범위를 제한하기 위해 클립핑 (clipping)하는 단계를 더 포함하는, 이미지를 스케일러블 비트스트림으로 인코딩하는 방법.
  17. 제12항에 있어서,
    상기 제2 계층은 상기 현재 이미지의 베이스 (base) 계층인, 이미지를 스케일러블 비트스트림으로 인코딩하는 방법.
  18. 제12항에 있어서,
    상기 제2 계층은 상기 현재 이미지의 제2 인핸스먼트 계층인, 이미지를 스케일러블 비트스트림으로 인코딩하는 방법.
  19. 제12항에 있어서,
    상기 제2 예측 잉여는 변환 계수들 (transform coefficients)을 포함하는, 이미지를 스케일러블 비트스트림으로 인코딩하는 방법.
  20. 이미지를 스케일러블 비트스트림으로 인코딩하기 위한 소프트웨어 애플리케이션이 저장된 컴퓨터로 읽을 수 있는 저장 매체로서,
    상기 소프트웨어 애플리케이션은 제12항의 방법을 실행하기 위한 프로그램 코드들을 포함하는, 컴퓨터로 읽을 수 있는 저장 매체.
  21. 인코딩된 이미지를 디코딩하는 장치로서,
    현재 이미지의 제1 인핸스먼트 (enhancement) 계층의 한 블록에 대한 제1 예측 잉여 (prediction residue)를 나타내는 정보를, 인코딩된 비트스트림 내에서, 수신하는 수신 유닛;
    상기 제1 예측 잉여와 상기 현재 이미지의 제2 계층의 블록의 예측 잉여의 의 합을 나타내는, 상기 제1 인핸스먼트 계층의 블록에 대한 제2 예측 잉여를 저장하는 저장 유닛; 및
    상기 제2 예측 잉여를 기반으로 하여 상기 현재 이미지의 제3 계층의 블록을 디코딩하는 디코딩 유닛;을 포함하는, 인코딩된 이미지를 디코딩하는 장치.
  22. 이미지를 스케일러블 (scalable) 비트스트림으로 인코딩하는 장치로서,
    현재 이미지의 제1 인핸스먼트 계층의 블록에 대한 제1 예측 잉여를 계산하는 계산 유닛;
    상기 제1 예측 잉여와 상기 현재 이미지의 제2 계층의 블록의 예측 잉여의 의 합을 나타내는, 상기 제1 인핸스먼트 계층의 블록에 대한 제2 예측 잉여를 저장하는 저장 유닛; 및
    상기 제2 예측 잉여를 기반으로 하여 상기 현재 이미지의 제3 계층의 블록을 인코딩하는 인코딩 유닛;을 포함하는, 이미지를 스케일러블 (scalable) 비트스트림으로 인코딩하는 장치.
KR1020077018334A 2005-01-12 2006-01-12 스케일러블 비디오 코딩에서의 계층 간 예측 모드 코딩을위한 방법 및 시스템 KR100963864B1 (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US64345505P 2005-01-12 2005-01-12
US60/643,455 2005-01-12
US64384705P 2005-01-14 2005-01-14
US60/643,847 2005-01-14
US11/331,433 2006-01-11
US11/331,433 US20060153295A1 (en) 2005-01-12 2006-01-11 Method and system for inter-layer prediction mode coding in scalable video coding

Publications (2)

Publication Number Publication Date
KR20070090273A KR20070090273A (ko) 2007-09-05
KR100963864B1 true KR100963864B1 (ko) 2010-06-16

Family

ID=36653227

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077018334A KR100963864B1 (ko) 2005-01-12 2006-01-12 스케일러블 비디오 코딩에서의 계층 간 예측 모드 코딩을위한 방법 및 시스템

Country Status (8)

Country Link
US (1) US20060153295A1 (ko)
EP (1) EP1836857A1 (ko)
JP (2) JP2008527881A (ko)
KR (1) KR100963864B1 (ko)
CN (1) CN101129072A (ko)
AU (1) AU2006205633A1 (ko)
TW (1) TW200704196A (ko)
WO (1) WO2006075240A1 (ko)

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100703740B1 (ko) * 2004-10-21 2007-04-05 삼성전자주식회사 다 계층 기반의 모션 벡터를 효율적으로 부호화하는 방법및 장치
KR100913088B1 (ko) * 2005-01-21 2009-08-21 엘지전자 주식회사 베이스 레이어의 내부모드 블록의 예측정보를 이용하여영상신호를 엔코딩/디코딩하는 방법 및 장치
US7929606B2 (en) 2005-01-21 2011-04-19 Lg Electronics Inc. Method and apparatus for encoding/decoding video signal using block prediction information
CN101171845A (zh) * 2005-03-17 2008-04-30 Lg电子株式会社 对使用层间预测编码的视频信号进行解码的方法
KR100896279B1 (ko) * 2005-04-15 2009-05-07 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
AU2006201490B2 (en) * 2005-04-19 2008-05-22 Samsung Electronics Co., Ltd. Method and apparatus for adaptively selecting context model for entropy coding
KR100746007B1 (ko) * 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
MX2008000522A (es) * 2005-07-11 2008-03-06 Thomson Licensing Metodo y aparato para la prediccion adaptable de intra-textura entre capas de macrobloque.
KR100725407B1 (ko) * 2005-07-21 2007-06-07 삼성전자주식회사 방향적 인트라 잔차 예측에 따라 비디오 신호를 인코딩하고디코딩하는 방법 및 장치
US8867618B2 (en) * 2005-07-22 2014-10-21 Thomson Licensing Method and apparatus for weighted prediction for scalable video coding
US8340179B2 (en) * 2006-03-21 2012-12-25 Canon Kabushiki Kaisha Methods and devices for coding and decoding moving images, a telecommunication system comprising such a device and a program implementing such a method
US8428144B2 (en) * 2006-09-07 2013-04-23 Lg Electronics Inc. Method and apparatus for decoding/encoding of a video signal
CN106982382B (zh) * 2006-10-16 2020-10-16 维德约股份有限公司 用于在可分级视频编码中信令并执行时间级切换的系统和方法
US8054885B2 (en) * 2006-11-09 2011-11-08 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal
US7742532B2 (en) * 2006-11-17 2010-06-22 Lg Electronics Inc. Method and apparatus for applying de-blocking filter to a video signal
EP2092748A4 (en) * 2006-12-14 2011-01-05 Thomson Licensing METHOD AND DEVICE FOR CODING AND / OR DECODING VIDEO DATA USING EXPANSION LAYER RESTRICTION FOR SOFTENCE SCALINGABILITY
US8548056B2 (en) * 2007-01-08 2013-10-01 Qualcomm Incorporated Extended inter-layer coding for spatial scability
KR101365575B1 (ko) * 2007-02-05 2014-02-25 삼성전자주식회사 인터 예측 부호화, 복호화 방법 및 장치
US20080225952A1 (en) * 2007-03-15 2008-09-18 Nokia Corporation System and method for providing improved residual prediction for spatial scalability in video coding
US8238428B2 (en) * 2007-04-17 2012-08-07 Qualcomm Incorporated Pixel-by-pixel weighting for intra-frame coding
KR101365596B1 (ko) * 2007-09-14 2014-03-12 삼성전자주식회사 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
KR20150126728A (ko) * 2007-10-19 2015-11-12 톰슨 라이센싱 조합된 공간 및 비트 심도 확장성
KR100963424B1 (ko) * 2008-07-23 2010-06-15 한국전자통신연구원 스케일러블 영상 복호화기 및 그 제어 방법
US20110194616A1 (en) * 2008-10-01 2011-08-11 Nxp B.V. Embedded video compression for hybrid contents
US8509302B2 (en) 2008-10-22 2013-08-13 Nippon Telegraph And Telephone Corporation Scalable video encoding method, scalable video encoding apparatus, scalable video encoding program, and computer readable recording medium storing the program
KR101210578B1 (ko) 2008-12-23 2012-12-11 한국전자통신연구원 스케일러블 비디오 코딩에서의 비트율-왜곡값을 이용한 상위 계층의 빠른 부호화 방법 및 그 부호화 장치
KR101233627B1 (ko) * 2008-12-23 2013-02-14 한국전자통신연구원 스케일러블 부호화 장치 및 방법
TWI468020B (zh) 2009-02-19 2015-01-01 Sony Corp Image processing apparatus and method
TWI463878B (zh) 2009-02-19 2014-12-01 Sony Corp Image processing apparatus and method
KR101066117B1 (ko) * 2009-11-12 2011-09-20 전자부품연구원 스케일러블 영상 코딩 방법 및 장치
CN102098519B (zh) * 2009-12-09 2013-04-17 浙江大学 视频编码方法、解码方法、编码及解码装置
US9819358B2 (en) * 2010-02-19 2017-11-14 Skype Entropy encoding based on observed frequency
US9313526B2 (en) 2010-02-19 2016-04-12 Skype Data compression for video
US9609342B2 (en) * 2010-02-19 2017-03-28 Skype Compression for frames of a video signal using selected candidate blocks
US8681873B2 (en) * 2010-02-19 2014-03-25 Skype Data compression for video
US20110206118A1 (en) * 2010-02-19 2011-08-25 Lazar Bivolarsky Data Compression for Video
DK2559005T3 (en) 2010-04-13 2015-11-23 Ge Video Compression Llc Inheritance at sample array multitræsunderinddeling
CN106231324B (zh) 2010-04-13 2019-11-05 Ge视频压缩有限责任公司 解码器、解码方法、编码器以及编码方法
BR112012026400B1 (pt) 2010-04-13 2021-08-10 Ge Video Compression, Ll Predição inter-plano
KR101549644B1 (ko) 2010-04-13 2015-09-03 지이 비디오 컴프레션, 엘엘씨 샘플 영역 병합
US8755432B2 (en) 2010-06-30 2014-06-17 Warner Bros. Entertainment Inc. Method and apparatus for generating 3D audio positioning using dynamically optimized audio 3D space perception cues
US9591374B2 (en) 2010-06-30 2017-03-07 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion for 3D movies
US10326978B2 (en) 2010-06-30 2019-06-18 Warner Bros. Entertainment Inc. Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning
US8917774B2 (en) * 2010-06-30 2014-12-23 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion
WO2012081874A2 (ko) * 2010-12-13 2012-06-21 한국전자통신연구원 스테레오스코픽 비디오 서비스 위한 시그널링 방법 및 이러한 방법을 사용하는 장치
TWI487381B (zh) * 2011-05-19 2015-06-01 Nat Univ Chung Cheng Predictive Coding Method for Multimedia Image Texture
EP2719184B1 (en) * 2011-06-10 2018-09-12 HFI Innovation Inc. Method and apparatus of scalable video coding
KR101979284B1 (ko) * 2011-10-26 2019-05-17 인텔렉추얼디스커버리 주식회사 인터 예측 모드 스케일러블 코딩 방법 및 장치
HUE052957T2 (hu) 2011-10-28 2021-05-28 Samsung Electronics Co Ltd Eljárás és berendezés video intra predikciójára
KR20140098107A (ko) * 2011-12-01 2014-08-07 인텔 코포레이션 잔류 예측을 위한 움직임 추정 방법
JP2013126157A (ja) * 2011-12-15 2013-06-24 Sony Corp 画像処理装置及び画像処理方法
WO2013106986A1 (en) 2012-01-16 2013-07-25 Mediatek Singapore Pte. Ltd. Methods and apparatuses of intra mode coding
EP2830312A4 (en) * 2012-03-20 2015-12-02 Samsung Electronics Co Ltd METHOD AND APPARATUS FOR SCREENABLE VIDEO CODING BASED ON ARBORESCENT STRUCTURE CODING UNIT, AND METHOD AND DEVICE FOR DECODING SCREENABLE VIDEO BASED ON ARBORESCENT STRUCTURE CODING UNIT
WO2013139212A1 (en) * 2012-03-21 2013-09-26 Mediatek Singapore Pte. Ltd. Method and apparatus for intra mode derivation and coding in scalable video coding
CN108377393A (zh) * 2012-03-22 2018-08-07 联发科技股份有限公司 编码视频数据的方法以及装置
WO2013147455A1 (ko) * 2012-03-29 2013-10-03 엘지전자 주식회사 인터 레이어 예측 방법 및 이를 이용하는 장치
US9420285B2 (en) 2012-04-12 2016-08-16 Qualcomm Incorporated Inter-layer mode derivation for prediction in scalable video coding
US9491458B2 (en) 2012-04-12 2016-11-08 Qualcomm Incorporated Scalable video coding prediction with non-causal information
US9838688B2 (en) 2012-06-22 2017-12-05 Mediatek Inc. Method and apparatus of adaptive intra prediction for inter-layer and inter-view coding
CN104322068A (zh) * 2012-06-27 2015-01-28 英特尔公司 跨层跨通道残差预测
US20150208092A1 (en) * 2012-06-29 2015-07-23 Samsung Electronics Co., Ltd. Method and apparatus for encoding scalable video, and method and apparatus for decoding scalable video
US9843801B2 (en) * 2012-07-10 2017-12-12 Qualcomm Incorporated Generalized residual prediction for scalable video coding and 3D video coding
CN103577503A (zh) * 2012-08-10 2014-02-12 鸿富锦精密工业(深圳)有限公司 云端文件存储系统及方法
TWI625052B (zh) * 2012-08-16 2018-05-21 Vid衡器股份有限公司 多層視訊編碼以片段為基礎之跨越模式傳訊
WO2014029261A1 (en) * 2012-08-23 2014-02-27 Mediatek Inc. Method and apparatus of interlayer texture prediction
KR102062506B1 (ko) * 2012-08-29 2020-01-03 브이아이디 스케일, 인크. 스케일러블 비디오 코딩을 위한 모션 벡터 예측 방법 및 장치
US20150334389A1 (en) * 2012-09-06 2015-11-19 Sony Corporation Image processing device and image processing method
US9491459B2 (en) * 2012-09-27 2016-11-08 Qualcomm Incorporated Base layer merge and AMVP modes for video coding
EP2901693A4 (en) * 2012-09-28 2016-04-27 Intel Corp BETWEEN SHIFTS INTRA-PREDICTION MODE
CN105052134B (zh) 2012-10-01 2019-09-03 Ge视频压缩有限责任公司 一种可伸缩视频编解码方法及计算机可读存储介质
US9544612B2 (en) * 2012-10-04 2017-01-10 Intel Corporation Prediction parameter inheritance for 3D video coding
JP6190103B2 (ja) * 2012-10-29 2017-08-30 キヤノン株式会社 動画像符号化装置、動画像符号化方法およびプログラム
US9602841B2 (en) * 2012-10-30 2017-03-21 Texas Instruments Incorporated System and method for decoding scalable video coding
US10085017B2 (en) * 2012-11-29 2018-09-25 Advanced Micro Devices, Inc. Bandwidth saving architecture for scalable video coding spatial mode
US9648319B2 (en) 2012-12-12 2017-05-09 Qualcomm Incorporated Device and method for scalable coding of video information based on high efficiency video coding
US10542286B2 (en) * 2012-12-19 2020-01-21 ARRIS Enterprise LLC Multi-layer video encoder/decoder with base layer intra mode used for enhancement layer intra mode prediction
US20140185671A1 (en) * 2012-12-27 2014-07-03 Electronics And Telecommunications Research Institute Video encoding and decoding method and apparatus using the same
PL2941872T3 (pl) * 2013-01-02 2019-03-29 Dolby Laboratories Licensing Corporation Kompatybilne wstecznie kodowanie dla sygnałów wideo o ultra wysokiej rozdzielczości z rozszerzonym zakresem dynamicznym
GB2509901A (en) 2013-01-04 2014-07-23 Canon Kk Image coding methods based on suitability of base layer (BL) prediction data, and most probable prediction modes (MPMs)
CN104104956B (zh) * 2013-04-08 2017-10-17 华为技术有限公司 用于分层视频编码和解码的方法、编码装置和解码装置
WO2015037920A1 (ko) 2013-09-10 2015-03-19 주식회사 케이티 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치
WO2015053598A1 (ko) * 2013-10-12 2015-04-16 삼성전자 주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
CN105684409B (zh) 2013-10-25 2019-08-13 微软技术许可有限责任公司 在视频和图像编码和解码中使用散列值来表示各块
CN103731670B (zh) * 2013-12-25 2017-02-01 同观科技(深圳)有限公司 一种图像的帧内预测算法
CN106105220B (zh) * 2014-01-07 2019-07-05 诺基亚技术有限公司 用于视频编码和解码的方法和装置
US10368092B2 (en) 2014-03-04 2019-07-30 Microsoft Technology Licensing, Llc Encoder-side decisions for block flipping and skip mode in intra block copy prediction
US10567754B2 (en) * 2014-03-04 2020-02-18 Microsoft Technology Licensing, Llc Hash table construction and availability checking for hash-based block matching
WO2015196322A1 (en) 2014-06-23 2015-12-30 Microsoft Technology Licensing, Llc Encoder decisions based on results of hash-based block matching
KR102490706B1 (ko) 2014-09-30 2023-01-19 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 코딩을 위한 해시 기반 인코더 결정
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
US10390039B2 (en) 2016-08-31 2019-08-20 Microsoft Technology Licensing, Llc Motion estimation for screen remoting scenarios
US11095877B2 (en) 2016-11-30 2021-08-17 Microsoft Technology Licensing, Llc Local hash-based motion estimation for screen remoting scenarios
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding
US11202085B1 (en) 2020-06-12 2021-12-14 Microsoft Technology Licensing, Llc Low-cost hash table construction and hash-based block matching for variable-size blocks

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030223493A1 (en) 2002-05-29 2003-12-04 Koninklijke Philips Electronics N.V. Entropy constrained scalar quantizer for a laplace-markov source

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000013790A (ja) * 1998-06-19 2000-01-14 Sony Corp 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに提供媒体
EP1081650B1 (en) * 1999-09-02 2007-02-07 Canon Kabushiki Kaisha Progressive Display of Target Objects
WO2001049036A1 (en) * 1999-12-28 2001-07-05 Koninklijke Philips Electronics N.V. Snr scalable video encoding method and corresponding decoding method
US6940905B2 (en) * 2000-09-22 2005-09-06 Koninklijke Philips Electronics N.V. Double-loop motion-compensation fine granular scalability
US20020037046A1 (en) * 2000-09-22 2002-03-28 Philips Electronics North America Corporation Totally embedded FGS video coding with motion compensation
US20020118742A1 (en) * 2001-02-26 2002-08-29 Philips Electronics North America Corporation. Prediction structures for enhancement layer in fine granular scalability video coding
JP2005506815A (ja) * 2001-10-26 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間拡張可能圧縮のための方法及び装置
JP2003299103A (ja) * 2002-03-29 2003-10-17 Toshiba Corp 動画像符号化方法と装置及び動画像復号化方法と装置
EP1597919A1 (en) * 2003-02-17 2005-11-23 Koninklijke Philips Electronics N.V. Video coding
JP3914214B2 (ja) * 2004-03-15 2007-05-16 株式会社東芝 画像符号化装置および画像復号化装置
EP1800488A1 (de) * 2004-10-15 2007-06-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zum erzeugen einer codierten videosequenz und zum decodieren einer codierten videosequenz unter verwendung einer zwischen-schicht-restwerte-praediktion

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030223493A1 (en) 2002-05-29 2003-12-04 Koninklijke Philips Electronics N.V. Entropy constrained scalar quantizer for a laplace-markov source

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ICASSP 2004 (17-21, May), Su-Ren Chen et al., "MPEG-4 coding performance improvement using adaptive inter-layer prediction"
Schwarz, H et al: "SVC Core Experiment 2.1; Inter-layer prediction of motion and residual data". ISO/IEC JTC 1/SC29/WG11, no M11043, 2004-7-23

Also Published As

Publication number Publication date
WO2006075240A1 (en) 2006-07-20
TW200704196A (en) 2007-01-16
US20060153295A1 (en) 2006-07-13
KR20070090273A (ko) 2007-09-05
EP1836857A1 (en) 2007-09-26
AU2006205633A1 (en) 2006-07-20
CN101129072A (zh) 2008-02-20
JP2008527881A (ja) 2008-07-24
JP2012050153A (ja) 2012-03-08

Similar Documents

Publication Publication Date Title
KR100963864B1 (ko) 스케일러블 비디오 코딩에서의 계층 간 예측 모드 코딩을위한 방법 및 시스템
US11563968B2 (en) Video encoding and decoding
JP6526292B2 (ja) 符号化装置、復号装置、符号化方法、復号方法、及びプログラム
JP5467141B2 (ja) 下層のフィルタリングを備えたスケーラブルビデオ符号化
RU2369038C1 (ru) Способ кодирования изображения/декодирования изображения, устройство кодирования изображения/декодирования изображения
CN1870754B (zh) 减少分块现象的编/解码装置和方法
US20060012719A1 (en) System and method for motion prediction in scalable video coding
KR101500781B1 (ko) 이미지들을 처리하기 위한 방법 및 그 대응하는 전자 장치
KR19980025035A (ko) 영상 예측부호화 장치 및 그 방법
US20140064373A1 (en) Method and device for processing prediction information for encoding or decoding at least part of an image
US20140177721A1 (en) Method and device for determining residual data for encoding or decoding at least part of an image
GB2509704A (en) Processing prediction information for encoding or decoding of an enhancement layer of video data
GB2492396A (en) Decoding a Scalable Video Bit-Stream
KR101375667B1 (ko) 영상의 부호화, 복호화 방법 및 장치
JP2007096479A (ja) 階層間予測符号化方法および装置,階層間予測復号方法および装置,並びにそれらのプログラムおよび記録媒体
JP7228980B2 (ja) 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム
CN113542748B (zh) 视频编解码方法、设备和非暂时性计算机可读存储介质
Park et al. Adaptive lossless video compression
GB2506592A (en) Motion Vector Prediction in Scalable Video Encoder and Decoder
KR101005394B1 (ko) H.264/avc 인코더에서 인트라 예측 블록을 생성하는 방법
GB2511288A (en) Method, device, and computer program for motion vector prediction in scalable video encoder and decoder
JPWO2019017327A1 (ja) 動画像符号化装置、動画像符号化方法、及び、動画像符号化プログラムが格納された記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee