WO2013147495A1

WO2013147495A1 - 스케일러블 비디오 인코딩/디코딩 방법 및 장치

Info

Publication number: WO2013147495A1
Application number: PCT/KR2013/002500
Authority: WO
Inventors: 김철근; 전병문; 박승욱; 임재현; 전용준; 박준영; 박내리
Original assignee: 엘지전자 주식회사
Priority date: 2012-03-26
Filing date: 2013-03-26
Publication date: 2013-10-03

Abstract

스케일러블 비디오 인코딩/디코딩 방법 및 장치가 개시된다. 스케일러블 비디오 디코딩 방법은 인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용할지 여부를 결정하는 단계 및 상기 인터 레이어 차분 모드를 적용할 경우, 상기 현재 블록의 참조 픽처를 선택하고, 상기 참조 픽처에 대한 차분 영상을 기반으로 상기 현재 블록에 대한 예측을 수행하는 단계를 포함한다.

Description

스케일러블 비디오 인코딩/디코딩 방법 및 장치

본 발명은 비디오 압축 기술에 관한 것으로, 더 구체적으로는 스케일러블 비디오 코딩(Scalable Video Coding; SVC)을 수행하는 방법 및 장치에 관한 것이다.

최근 고해상도, 고품질의 영상에 대한 요구가 다양한 응용 분야에서 증가하고 있다. 영상이 고해상도를 가지고 고품질이 될수록 해당 영상에 관한 정보량도 함께 증가하고 있다. 정보량의 증가로 인해 다양한 성능의 장치와 다양한 환경의 네트워크가 등장하고 있다. 다양한 성능의 장치와 다양한 환경의 네트워크가 등장함에 따라서, 동일한 콘텐츠를 다양한 품질로 이용할 수 있게 되었다.

구체적으로, 단말 장치가 지원할 수 있는 품질의 영상이 다양해지고, 구축된 네트워크 환경이 다양해짐으로써, 어떤 환경에서는 일반적인 품질의 영상을 이용하지만, 또 다른 환경에서는 더 높은 품질의 영상을 이용할 수 있게 된다.

예를 들어, 휴대 단말에서 비디오 콘텐츠를 구매한 소비자가 가정 내 대화면의 디스플레이를 통해 동일한 비디오 콘텐츠를 더 큰 화면과 더 높은 해상도로 감상할 수 있게 되는 것이다.

최근에는 HD(High Definition) 해상도를 가지는 방송이 서비스되면서 많은 사용자들은 이미 고해상도, 고화질의 영상에 익숙해지고 있고, 서비스 제공자와 사용자들은 HDTV와 더불어 HDTV의 4배 이상의 해상도를 갖는 UHD(Ultra High Definition)의 서비스에도 관심을 기울이고 있다.

따라서, 다양한 환경에서 사용자가 요구하는 영상 서비스를 품질에 따라서 다양하게 제공하기 위해 고용량 비디오에 대한 고효율의 인코딩/디코딩 방법을 기반으로 영상의 품질, 에컨대 영상의 화질, 영상의 해상도, 영상의 크기, 비디오의 프레임 레이트 등에 스케일러빌러티를 제공하는 것이 필요하다.

본 발명은 스케일러블 비디오 인코딩/디코딩에서 압축 효율을 높이는 방법 및 장치를 제공한다.

본 발명은 인터 레이어 차분 모드에 사용되는 차분 영상의 인터 예측 성능을 향상시키는 방법 및 장치를 제공한다.

본 발명은 인터 레이어 차분 모드에 사용되는 차분 영상의 보간을 효과적으로 수행하는 방법 및 장치를 제공한다.

본 발명의 일 양태에 따르면, 인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용하는 스케일러블 비디오 디코딩 방법이 제공된다. 상기 방법은 상기 현재 블록의 참조 픽처를 선택하고, 상기 참조 픽처에 대한 차분 영상을 생성하는 단계 및 상기 참조 픽처에 대한 차분 영상을 기반으로 상기 현재 블록에 대한 예측을 수행하는 단계를 포함한다.

상기 참조 픽처에 대한 차분 영상은, 상기 참조 픽처에 대한 인핸스먼트 레이어의 복원 영상과 상기 참조 픽처에 대한 베이스 레이어의 복원 영상 간의 차이를 기반으로 생성될 수 있다.

상기 현재 블록에 대한 예측을 수행하는 단계에서는, 상기 참조 픽처에 대한 차분 영상에 적용되는 필터 정보를 기반으로 정수 이하 픽셀 샘플을 생성하여 상기 현재 블록에 대응하는 예측 블록을 생성할 수 있다.

본 발명의 다른 양태에 따르면, 인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용하는 스케일러블 비디오 인코딩 방법이 제공된다. 상기 방법은 상기 현재 블록의 참조 픽처를 선택하고, 상기 참조 픽처에 대한 차분 영상을 생성하는 단계 및 상기 참조 픽처에 대한 차분 영상을 기반으로 상기 현재 블록에 대한 예측을 수행하는 단계를 포함한다.

스케일러블 비디오 코딩에서, 인터 레이어 차분 모드에 사용되는 차분 영상의 특성을 고려하여 보간 필터의 종류(필터의 탭 크기, 필터 계수)를 결정함으로써, 예측 블록 및 움직임 정보의 정확도를 높일 수 있다. 또한, 인코딩 장치 및 디코딩 장치에서 예측 성능을 향상시킬 수 있다.

도 1은 본 발명의 일 실시예에 따라 스케일러빌러티를 지원하는 비디오 인코딩 장치를 개략적으로 도시한 블록도이다.

도 2는 본 발명의 일 실시예에 따라 스케일러빌러티를 지원하는 비디오 디코딩 장치를 개략적으로 도시한 블록도이다.

도 3은 본 발명에 따라서 스케일러블 코딩을 수행하는 인코딩 장치와 디코딩 장치에서의 레이어 간 예측에 관한 일 예를 설명하는 블록도이다.

도 4는 본 발명이 적용될 수 있는 인터 레이어 차분 모드를 개략적으로 설명하기 위한 도면이다.

도 5는 본 발명에 따라서 인터 레이어 차분 모드를 적용하여 인트라 예측 및 인터 예측을 수행하는 방법을 개략적으로 설명하기 위한 도면이다.

도 6은 인터 예측에서 참조 픽처의 휘도 성분에 대해 1/4 픽셀 단위 샘플을 생성하기 위해 업샘플링을 수행하는 방법을 개략적으로 설명하기 위한 도면이다.

도 7은 인터 레이어 차분 모드를 적용할 경우, 인핸스먼트 레이어의 복원 영상과 베이스 레이어의 복원 영상을 업샘플링한 영상 간의 차이를 기반으로 생성된 차분 영상의 일예를 나타낸 도면이다.

도 8은 본 발명의 실시예에 따라서 인터 레이어 차분 모드의 적용 여부에 따라 필터의 탭 크기를 결정하는 방법을 개략적으로 나타낸 순서도이다.

도 9는 본 발명의 실시예에 따라서 인터 레이어 차분 모드의 적용 여부에 따라 필터의 계수를 결정하는 방법을 개략적으로 나타낸 순서도이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니다. 본 명세서에서 사용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

한편, 본 발명에서 설명되는 도면상의 각 구성들은 비디오 인코딩 장치/디코딩 장치에서 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성 요소에 대해서는 동일한 참조 부호를 사용하고 동일한 구성 요소에 대해서 중복된 설명은 생략한다.

스케일러빌러티를 지원하는 비디오 코딩 방법(이하, '스케일러블 코딩'이라 함)에서는 입력 신호들을 레이어별로 처리할 수 있다. 레이어에 따라서 입력 신호(입력 영상)들은 해상도(resolution), 프레임 레이트(frame rate), 비트 뎁스(bit-depth), 컬러 포맷(colot format), 애스팩트 율(aspect ratio) 중 적어도 하나가 상이할 수 있다.

본 명세서에서, 스케일러블 코딩이라 함은 스케일러블 인코딩과 스케일러블 디코딩을 포함한다.

스케일러블 인코딩/디코딩에서는 레이어 간의 차이를 이용하여, 즉 스케일러빌러티에 기반하여, 레이어 간의 예측을 수행함으로써 정보의 중복 전송/처리를 줄이고 압축 효율을 높일 수 있다.

도 1을 참조하면, 인코딩 장치(100)는 레이어 1에 대한 인코딩부(105)와 레이어 0에 대한 인코딩부(135)를 포함한다.

레이어 0은 베이스 레이어, 참조 레이어 혹은 하위 레이어일 수 있으며, 레이어 1은 인핸스먼트 레이어, 현재 레이어 혹은 상위 레이어일 수 있다.

레이어 1의 인코딩부(105)는 예측부(110), 변환/양자화부(115), 필터링부(120), DPB(Decoded Picture Buffer, 125), 엔트로피 코딩부(130) 및 MUX(Multiplexer, 165)를 포함한다.

레이어 0의 인코딩부(135)는 예측부(140), 변환/양자화부(145), 필터링부(150), DPB(155) 및 엔트로피 코딩부(160)를 포함한다.

예측부(110, 140)는 입력된 영상에 대하여 인터 예측과 인트라 예측을 수행할 수 있다. 예측부(110, 140)는 소정의 처리 단위로 예측을 수행할 수 있다. 예측의 수행 단위는 코딩 유닛(Coding Unit: CU)일 수도 있고, 예측 유닛(Prediction Unit: PU)일 수도 있으며, 변환 유닛(Transform Unit: TU)일 수도 있다.

예컨대, 예측부(110, 140)는 CU 단위로 인터 예측을 적용할 것인지 인트라 예측을 적용할 것인지를 결정하고, PU 단위로 예측의 모드를 결정하며, PU 단위 혹은 TU 단위로 예측을 수행할 수도 있다. 수행되는 예측은 예측 블록의 생성과 레지듀얼 블록(레지듀얼 신호)의 생성을 포함한다.

인터 예측을 통해서는 현재 픽처의 이전 픽처 및/또는 이후 픽처 중 적어도 하나의 픽처의 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다. 인트라 예측을 통해서는 현재 픽처 내의 픽셀 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다.

인터 예측의 모드 또는 방법으로서, 스킵(skip) 모드, 머지(merge) 모드, MVP(Motion Vector Predtiction) 방법 등이 있다. 인터 예측에서는 예측 대상인 현재 PU에 대하여 참조 픽처를 선택하고, 참조 픽처 내에서 현재 PU에 대응하는 참조 블록을 선택할 수 있다. 예측부(160)는 참조 블록을 기반으로 예측 블록을 생성할 수 있다.

예측 블록은 정수 샘플 단위로 생성될 수도 있고, 정수 이하 픽셀 단위로 생성될 수도 있다. 이때, 움직임 벡터 역시 정수 픽셀 단위 혹은 정수 픽셀 이하의 단위로 표현될 수 있다.

인터 예측에 있어서 움직임 정보 즉, 참조 픽처의 인덱스, 움직임 벡터, 레지듀얼 신호 등의 정보는 엔트로피 인코딩되어 디코딩 장치에 전달된다. 스킵 모드가 적용되는 경우에는 레지듀얼을 생성, 변환, 양자화, 전송하지 않을 수 있다.

인트라 예측에서 예측 모드는 33개의 방향성 예측 모드와 적어도 2개 이상의 비방향성 모드를 가질 수 있다. 비향성성 모드는 DC 예측 모드 및 플래이너 모드(Planar 모드)을 포함할 수 있다. 인트라 예측에서는 참조 샘플에 필터를 적용한 후 예측 블록을 생성할 수도 있다.

PU는 다양한 사이즈/형태의 블록일 수 있으며, 예컨대 인터 예측의 경우에 PU는 2Nx2N 블록, 2NxN 블록, Nx2N 블록, 또는 NxN 블록 (N은 정수) 등일 수 있다. 인트라 예측의 경우에 PU는 2Nx2N 블록 또는 NxN 블록 (N은 정수) 등일 수 있다. 이때, NxN 블록 크기의 PU는 특정한 경우에만 적용하도록 설정할 수 있다. 예컨대 최소 크기 CU에 대해서만 NxN 블록 크기의 PU를 이용하도록 정하거나 인트라 예측에 대해서만 이용하도록 정할 수도 있다. 또한, 상술한 크기의 PU 외에, NxmN 블록, mNxN 블록, 2NxmN 블록 또는 mNx2N 블록 (m<1) 등의 PU를 더 정의하여 사용할 수도 있다.

또한, 예측부(110, 140)는 레이어 0의 정보를 이용하여 레이어 1에 대한 예측을 수행할 수 있다. 본 명세서에서는 다른 레이어의 정보를 이용하여 현재 레이어의 정보를 예측하는 방법을, 설명의 편의를 위해, 인터 레이어 예측이라고 한다.

다른 레이어의 정보를 이용하여 예측되는 (즉, 인터 레이어 예측에 의해 예측되는) 현재 레이어의 정보로는 텍스처, 움직임 정보, 유닛 정보, 소정의 파라미터(예컨대, 필터링 파라미터 등) 등이 있을 수 있다.

또한, 현재 레이어에 대한 예측에 이용되는 (즉, 인터 레이어 예측에 이용되는) 다른 레이어의 정보로는 텍스처, 움직임 정보, 유닛 정보, 소정의 파라미터(예컨대, 필터링 파라미터 등)이 있을 수 있다.

인터 레이어 예측의 일 예로서, 인터 레이어 유닛 파라미터 예측에서는 베이스 레이어의 유닛(CU, PU 및/또는 TU) 정보를 유도하여 인핸스먼트 레이어의 유닛 정보로 사용하거나, 베이스 레이어의 유닛 정보를 기반으로 인핸스먼트 레이어의 유닛 정보를 결정할 수 있다.

또한, 유닛 정보는 각 유닛 레벨에서의 정보를 포함할 수 있다. 예컨대, CU 정보의 경우, 파티션(CU, PU 및 또는 TU)에 관한 정보, 변환에 관한 정보, 예측에 대한 정보, 코딩에 대한 정보를 포함할 수 있다. PU 정보의 경우, PU 파티션에 관한 정보, 예측에 관한 정보(예컨대, 움직임 정보, 예측 모드에 관한 정보 등) 등을 포함할 수 있다. TU에 관한 정보는 TU 파티션에 관한 정보, 변환에 관한 정보(변환 계수, 변환 방법 등) 등을 포함할 수 있다.

또한, 유닛 정보는 처리 단위(예컨대, CU, PU, TU 등)의 분할 정보만을 포함할 수도 있다.

인터 레이어 예측의 다른 예인 인터 레이어 움직임 예측은 인터 레이어 인터 예측이라고도 한다. 인터 레이어 인터 예측에 의하면, 레이어 0 (참조 레이어 혹은 베이스 레이어)의 움직임 정보를 이용하여 레이어 1 (현재 레이어 혹은 인핸스먼트 레이어)의 현재 블록에 대한 예측을 수행할 수 있다.

인터 레이어 인터 예측을 적용하는 경우에는, 참조 레이어의 움직임 정보를 스케일링 할 수도 있다.

인터 레이어 예측의 또 다른 예로서 인터 레이어 텍스처 예측은 인터 레이어 인트라 예측 혹은 인트라 BL(Base Layer) 예측이라고도 불린다. 인터 레이어 텍스처 예측은 참조 레이어 내 참조 블록이 인트라 예측에 의해 복원된 경우에 적용될 수 있다.

인터 레이어 인트라 예측에서는 참조 레이어 내 참조 블록의 텍스처를 인핸스먼트 레이어의 현재 블록에 대한 예측 값으로 사용할 수 있다. 이때, 참조 블록의 텍스처는 업샘플링에 의해 스케일링될 수 있다.

인터 레이어 예측의 또 다른 예인 인터 레이어 파라미터 예측에서는 베이스 레이어에서 사용한 파라미터를 유도하여 인핸스먼트 레이어에서 재사용하도록 하거나 베이스 레이어에서 사용한 파라미터를 기반으로 인핸스먼트 레이어에 대한 파라미터를 예측할 수 있다.

여기서는 인터 레이어 예측의 예로서, 인터 레이어 텍스처 예측, 인터 레이어 움직임 예측, 인터 레이어 유닛 정보 예측, 인터 레이어 파라미터 예측을 설명하였으나, 본 발명에서 적용할 수 있는 인터 레이어 예측은 이에 한정되지 않는다.

예컨대, 예측부는 인터 레이어 예측으로서 다른 레이어의 레지듀얼 정보를 이용하여 현재 레이어의 레지듀얼을 예측하고 이를 기반으로 현재 레이어 내 현재 블록에 대한 예측을 수행하는 인터 레이어 레지듀얼 예측을 이용할 수도 있다.

또한, 예측부는 인터 레이어 예측으로서 현재 레이어의 복원 픽처와 다른 레이어의 복원 픽처를 업샘플링 혹은 다운샘플링한 영상 간의 차분 (차분 영상) 영상을 이용하여 현재 레이어 내 현재 블록에 대한 예측을 수행하는 인터 레이어 차분 예측을 수행할 수도 있다.

변환/양자화부(115, 145)는 변환 블록 단위로 레지듀얼 블록에 대한 변환을 수행하여 변환 계수를 생성하고, 변환 계수를 양자화할 수 있다.

변환 블록은 샘플들의 사각형 블록으로서 동일한 변환이 적용되는 블록이다. 변환 블록은 변환 유닛(TU)일 수 있으며, 쿼드 트리(quad tree) 구조를 가질 수 있다.

변환/양자화부(115, 145)는 레지듀얼 블록에 적용된 예측 모드와 변환 블록의 크기에 따라서 변환을 수행해서 변환 계수들의 2차원 어레이를 생성할 수 있다. 예컨대, 레지듀얼 블록에 인트라 예측이 적용되었고 블록이 4x4의 레지듀얼 배열이라면, 레지듀얼 블록을 DST(Discrete Sine Transform)를 이용하여 변환하고, 그 외의 경우라면 레지듀얼 블록을 DCT(Discrete Cosine Transform)를 이용하여 변환할 수 있다.

또한, 변환/양자화부(115, 145)는 예측 모드와 변환 블록의 크기에 상관없이 특정 변환을 고정적으로 사용할 수도 있다. 예컨대, 변환/양자화부(115, 145)는 모든 변환 블록에 DST만을 적용할 수 있다. 또한, 변환/양자화부(115, 145)는 모든 변환 블록에 DCT만을 적용할 수도 있다.

변환/양자화부(115, 145)는 변환 계수들을 양자화하여 양자화된 변환 계수를 생성할 수 있다.

변환/양자화부(115, 145)는 양자화된 변환 계수를 엔트로피 코딩부(130, 160)로 전달할 수 있다. 이때, 변환/양자화부(115, 145)는 양자화된 변환 계수의 2차원 어레이를 소정의 스캔 순서에 따라 1차원 어레이로 재정렬하여 엔트로피 코딩부(130, 160)로 전달할 수도 있다. 또한, 변환/양자화부(115, 145)는 인터 예측을 위해, 레지듀얼과 예측 블록을 기반으로 생성된 복원 블록을 변환/양자화하지 않고, 필터링부(120, 150)에 전달할 수 있다.

한편, 변환/양자화부(115, 145)는 필요에 따라서, 변환을 생략(skip)하고 양자화만 수행하거나 변환과 양자화를 모두 생략할 수도 있다. 예컨대, 변환/양자화부(115, 145)는 특정한 예측 방법이 적용되거나 특정 크기를 갖는 블록, 혹은 특정 예측 블록이 적용된 특정한 크기의 블록에 대하여 변환을 생략할 수도 있다.

엔트로피 코딩부(130, 160)는 양자화된 변환 계수들에 대한 엔트로피 인코딩을 수행할 수 있다. 엔트로피 인코딩에는 예를 들어, 지수 골롬(Exponential Golomb), CABAC(Context-Adaptive Binary Arithmetic Coding) 등과 같은 인코딩 방법을 사용할 수 있다.

필터링부(120, 150)는 디블록킹 필터, ALF(Adaptive Loop Filter), SAO(Sample Adaptive Offset)를 복원된 픽처에 적용할 수 있다.

디블록킹 필터는 복원된 픽처에서 블록 간의 경계에 생긴 왜곡을 제거할 수 있다. ALF(Adaptive Loop Filter)는 디블록킹 필터를 통해 블록이 필터링된 후 복원된 영상과 원래의 영상을 비교한 값을 기초로 필터링을 수행할 수 있다. SAO는 디블록킹 필터가 적용된 레지듀얼 블록에 대하여, 픽셀 단위로 원본 영상과의 오프셋 차이를 복원하며, 밴드 오프셋(Band Offset), 에지 오프셋(Edge Offset) 등의 형태로 적용된다.

필터링부(120, 150)는 디블록킹 필터, ALF, SAO를 모두 적용하지 않고 디블록킹 필터만 적용하거나 디블록킹 필터와 ALF만 적용하거나 디블록킹 필터와 SAO만을 적용할 수도 있다.

DPB(125, 155)는 필터링부(120, 150)로부터 복원 블록 또는 복원 픽처를 전달받아 저장할 수 있다. DPB(125, 155)는 복원 블록 또는 픽처를 인터 예측을 수행하는 예측부(110, 140)에 제공할 수 있다.

레이어 0의 엔트로피 코딩부(160)에서 출력되는 정보와 레이어 1의 엔트로피 코딩부(130)에서 출력되는 정보는 MUX(165)에서 멀티플렉싱되어 비트스트림으로 출력될 수 있다.

한편, 여기서는 설명의 편의를 위해, 레이어 1의 인코딩부(105)가 MUX(165)를 포함하는 것으로 설명하였으나, MUX는 레이어 1의 인코딩부(105) 및 레이어 0의 인코딩부(135)와는 별도의 장치 혹은 모듈일 수 있다.

도 2를 참조하면, 디코딩 장치(200)는 레이어 1의 디코딩부(210)와 레이어 0의 디코딩부(250)를 포함한다.

레이어 1의 디코딩부(210)는 엔트로피 디코딩부(215), 재정렬부(220), 역양자화부(225), 역변환부(230), 예측부(235), 필터링부(240), 메모리(245)를 포함할 수 있다.

레이어 0의 디코딩부(250)는 엔트로피 디코딩부(255), 재정렬부(260), 역양자화부(265), 역변환부(270), 예측부(275), 필터링부(280), 메모리(285)를 포함할 수 있다.

인코딩 장치로부터 영상 정보를 포함하는 비트스트림이 전송되면, DEMUX(205)는 레이어별로 정보를 디멀티플렉싱하여 각 레이어별 디코딩 장치로 전달할 수 있다.

엔트로피 디코딩부(215, 255)는 인코딩 장치에서 사용한 엔트로피 코딩 방식에 대응하여 엔트로피 디코딩을 수행할 수 있다. 예컨대, 인코딩 장치에서 CABAC이 사용된 경우에, 엔트로피 디코딩부(215, 255)도 CABAC을 이용하여 엔트로피 디코딩을 수행할 수 있다.

엔트로피 디코딩부(215, 255)에서 디코딩된 정보 중 예측 블록을 생성하기 위한 정보는 예측부(235, 275)로 제공되고, 엔트로피 디코딩부(215, 255)에서 엔트로피 디코딩이 수행된 레지듀얼 값, 즉 양자화된 변환 계수는 재정렬부(220, 260)로 입력될 수 있다.

재정렬부(220, 260)는 엔트로피 디코딩부(215, 255)에서 엔트로피 디코딩된 비트스트림의 정보, 즉 양자화된 변환 계수를 인코딩 장치에서 재정렬한 방법을 기초로 재정렬할 수 있다.

예컨대, 재정렬부(220, 260)는 1차원 어레이의 양자화된 변환 계수들을 다시 2차원 어레이의 계수들로 재정렬할 수 있다. 재정렬부(220, 260)는 현재 블록(변환 블록)에 적용된 예측 모드 및/또는 변환 블록의 크기를 기반으로 스캐닝을 수행하여 계수(양자화된 변환 계수)들의 2차원 어레이를 생성할 수 있다.

역양자화부(225, 265)는 인코딩 장치에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행하여 변환 계수들을 생성할 수 있다.

역양자화부(225, 265)는 소정의 조건에 따라서 혹은 인코딩 장치에서의 양자화 방식에 따라서, 엔트로피 디코딩된 레지듀얼을 역양자화하지 않고 역변환부(230, 270)에 전달할 수도 있다.

역변환부(230, 270)는 변환 계수들에 대하여 인코딩 장치의 변환부가 수행한 변환에 대한 역변환을 수행할 수 있다. 역변환부(230, 270)는 인코딩 장치에서 수행된 DCT(Discrete Cosine Transform) 및 DST(Discrete Sine Transform)에 대해 역DCT 및/또는 역DST를 수행할 수 있다.

인코딩 장치에서 DCT 및/또는 DST는 예측 방법, 현재 블록의 크기 및 예측 방향 등 복수의 정보에 따라 선택적으로 수행될 수 있고, 디코딩 장치의 역변환부(230, 270)는 인코딩 장치에서 수행된 변환 정보를 기초로 역변환을 수행할 수 있다.

예컨대, 역변환부(230, 270)는 예측 모드/블록 크기에 따라서 역DCT와 역DST를 적용할 수 있다. 가령, 역변환부(230, 270)는 인트라 예측이 적용된 4x4 루마 블록에 대해서 역DST를 적용할 수도 있다.

또한, 역변환부(230, 270)는 예측 모드/블록 크기에 상관 없이, 특정 역변환 방법을 고정적으로 사용할 수도 있다. 예컨대, 역변환부(230, 270)는 모든 변환 블록에 역DST만을 적용할 수 있다. 또한, 역변환부(230, 270)는 모든 변환 블록에 역DCT만을 적용할 수도 있다.

역변환부(230, 270)는 변환 계수들 혹은 변환 계수의 블록을 역변환하여 레지듀얼 혹은 레지듀얼 블록을 생성할 수 있다.

역변환부(230, 270)는 또한, 필요에 따라서 혹은 인코딩 장치에서 인코딩된 방식에 따라서, 변환을 생략(skip) 할 수도 있다. 예컨대, 역변환부(230, 270)는 특정한 예측 방법이 적용되거나 특정 크기를 갖는 블록, 혹은 특정 예측 블록이 적용된 특정한 크기의 블록에 대하여 변환을 생략할 수도 있다.

예측부(235, 275)는 엔트로피 디코딩부(215, 255)로부터 전달된 예측 블록 생성 관련 정보와 메모리(245, 285)에서 제공된 이전에 디코딩된 블록 및/또는 픽처 정보를 기초로 현재 블록에 대한 예측 블록을 생성할 수 있다.

현재 블록에 대한 예측 모드가 인트라 예측(intra prediction) 모드인 경우에, 예측부(235, 275)는 현재 픽처 내의 픽셀 정보를 기초로 현재 블록에 대한 인트라 예측을 수행할 수 있다.

현재 블록에 대한 예측 모드가 인터 예측(inter prediction) 모드인 경우에, 예측부(235, 275)는 현재 픽처의 이전 픽처 또는 이후 픽처 중 적어도 하나의 픽처에 포함된 정보를 기초로 현재 블록에 대한 인터 예측을 수행할 수 있다. 인터 예측에 필요한 움직임 정보의 일부 또는 전부는 인코딩 장치로부터 수신한 정보를 확인하고, 이에 대응하여 유도될 수 있다.

인터 예측의 모드로서 스킵 모드가 적용되는 경우에는 인코딩 장치로부터 레지듀얼이 전송되지 않으며 예측 블록을 복원 블록으로 할 수 있다.

한편, 레이어 1의 예측부(235)는 레이어 1 내의 정보만을 이용하여 인터 예측 또는 인트라 예측을 수행할 수도 있고, 다른 레이어(레이어 0)의 정보를 이용하여 인터 레이어 예측을 수행할 수도 있다.

예컨대, 레이어 1의 예측부(235)는 레이어 1의 움직임 정보, 레이어 1의 텍스처 정보, 레이어 1의 유닛 정보, 레이어 1의 파라미터 정보 중 하나를 이용하여 현재 블록에 대한 예측을 수행할 수 있다. 또한, 레이어 1의 예측부(235)는 레이어 1의 움직임 정보, 레이어 1의 텍스처 정보, 레이어 1의 유닛 정보, 레이어 1의 파라미터 정보 중 복수의 정보를 이용하여 현재 블록에 대한 예측을 수행할 수도 있다.

레이어 1의 예측부(235)는 레이어 0의 예측부(275)로부터 레이어 1의 움직임 정보를 전달받아서 움직임 예측을 수행할 수 있다. 인터 레이어 움직임 예측을 인터 레이어 인터 예측이라고도 한다. 인터 레이어 움직임 예측에 의해, 참조 레이어(베이스 레이어)의 움직임 정보를 이용하여 현재 레이어(인핸스먼트 레이어)의 현재 블록에 대한 예측이 수행될 수 있다. 예측부(235)는 필요한 경우에, 참조 레이어의 움직임 정보를 스케일링 하여 이용할 수도 있다.

레이어 1의 예측부(235)는 레이어 0의 예측부(275)로부터 레이어 1의 텍스처 정보를 전달받아서 텍스처 예측을 수행할 수 있다. 텍스처 예측은 인터 레이어 인트라 예측 혹은 인트라 BL(Base Layer) 예측이라고도 불린다. 텍스처 예측은 참조 레이어의 참조 블록이 인트라 예측에 의해 복원된 경우에 적용될 수 있다. 인터 레이어 인트라 예측에서는 참조 레이어 내 참조 블록의 텍스처를 인핸스먼트 레이어의 현재 블록에 대한 예측 값으로 사용할 수 있다. 이때, 참조 블록의 텍스처는 업샘플링에 의해 스케일링될 수 있다.

레이어 1의 예측부(235)는 레이어 0의 예측부(275)로부터 레이어 1의 유닛 파라미터 정보를 전달받아서 유닛 파라미터 예측을 수행할 수 있다. 유닛 파라미터 예측에 의해, 베이스 레이어의 유닛(CU, PU 및/또는 TU) 정보가 인핸스먼트 레이어의 유닛 정보로 사용되거나, 베이스 레이어의 유닛 정보를 기반으로 인핸스먼트 레이어의 유닛 정보가 결정될 수 있다.

레이어 1의 예측부(235)는 레이어 0의 예측부(275)로부터 레이어 1의 필터링에 관한 파라미터 정보를 전달받아서 파라미터 예측을 수행할 수도 있다. 파라미터 예측에 의해, 베이스 레이어에서 사용한 파라미터를 유도하여 인핸스먼트 레이어에서 재사용하거나, 베이스 레이어에서 사용한 파라미터를 기반으로 인핸스먼트 레이어에 대한 파라미터를 예측할 수 있다.

가산기(290, 295)는 예측부(235, 275)에서 생성된 예측 블록과 역변환부(230, 270)에서 생성된 레지듀얼 블록을 이용해 복원 블록을 생성할 수 있다. 이 경우, 가산기(290, 295)를 복원 블록을 생성하는 별도의 유닛(복원 블록 생성부)로 볼 수 있다.

가산기(290, 295)에서 복원된 블록 및/또는 픽처는 필터링부(240, 280)로 제공될 수 있다.

필터링부(240, 280)는 복원된 블록 및/또는 픽처에 디블록킹 필터링, SAO(Sample Adaptive Offset) 및/또는 ALF 등을 적용할 수 있다.

필터링부(240, 280)는 디블록킹 필터, ALF, SAO를 모두 적용하지 않고, 디블록킹 필터만 적용하거나, 디블록킹 필터와 ALF만 적용하거나, 디블록킹 필터와 SAO만을 적용할 수도 있다.

도 2의 예을 참조하면, 레이어 1의 필터링부(240)는 레이어 1의 예측부(235) 및/또는 레이어 1의 필터링부(280)으로부터 전달되는 파라미터 정보를 이용하여 복원된 픽처에 대한 필터링을 수행할 수도 있다. 예컨대, 레이어 1에서 필터링부(240)는 레이어 0에서 적용된 필터링의 파라미터로부터 예측된 파라미터를 이용하여 레이어 1에 대한 혹은 레이어 간의 필터링을 적용할 수 있다.

메모리(245, 285)는 복원된 픽처 또는 블록을 저장하여 참조 픽처 또는 참조 블록으로 사용할 수 있도록 할 수 있다. 메모리(245, 285)는 저장된 복원 픽처를 소정의 출력부(미도시) 혹은 디스플레이(미도시)를 통해 출력할 수도 있다.

도 2의 예에서는 재정렬부, 역양자화부, 역변환부 등으로 나누어 설명하였으나, 도 1의 인코딩 장차에서와 같이, 역양자화/역변환부의 한 모듈에서 재정렬, 역양자화, 역변환을 순서대로 수행하도록 디코딩 장치를 구성할 수도 있다.

도 1 및 도 2의 예에서는 예측부로 설명하였으나, 발명의 이해를 돕기 위해, 레이어 1의 예측부는 다른 레이어(레이어 0)의 정보를 이용하여 예측을 수행하는 인터 레이어 예측부와 다른 레이어(레이어 0)의 정보를 이용하지 않고 예측을 수행하는 인터/인트라 예측부를 포함하는 것으로 볼 수도 있다.

도 3을 참조하면, 레이어 1의 예측부(300)는 인터/인트라 예측부(340) 및 인터 레이어 예측부(350)를 포함한다.

레이어 1의 예측부(300)는 레이어 0의 정보로부터 레이어 1의 예측에 필요한 인터 레이어 예측을 수행할 수 있다.

예컨대, 인터 레이어 예측부(350)는 레이어 0의 예측부(320) 및/또는 필터링부(330)로부터 레이어 0의 정보를 전달받아 레이어 1의 예측에 필요한 인터 레이어 예측을 수행할 수 있다.

레이어 1의 인터/인트라 예측부(340)는, 레이어 0의 정보를 이용하지 않고, 레이어 1의 정보를 이용하여 인터 예측 혹은 인트라 예측을 수행할 수 있다.

또한, 레이어 1의 인터/인트라 예측부(340)는, 인터 레이어 예측부(350)로부터 전달된 정보를 이용하여, 레이어 0의 정보에 기반한 예측을 수행할 수도 있다.

아울러, 레이어 1의 필터링부(310)는 레이어 1의 정보에 기반하여 필터링을 수행할 수도 있고, 레이어 0의 정보에 기반하여 필터링을 수행할 수도 있다. 레이어 0의 정보는 레이어 0의 필터링부(330)로부터 레이어 1의 필터링부(310)에 전달될 수도 있고, 레이어 1의 인터 레이어 예측부(350)로부터 레이어 1의 필터링부(310)에 전달될 수도 있다.

한편, 레이어 0으로부터 인터 레이어 예측부(350)로 전달되는 정보로는 레이어 0의 유닛 파라미터에 관한 정보, 레이어 0의 움직임 정보, 레이어 0의 텍스처 정보, 레이어 0의 필터 파라미터 정보 중 적어도 하나일 수 있다.

설명의 편의를 위해, 인터 레이어 예측부(350) 내에서 각 인터 레이어 정보를 예측하는 서브 예측부를 가정하자.

예컨대, 인터 레이어 예측부(350)는 텍스처 예측부(360), 움직임 예측부(370), 유닛 정보 예측부(380), 파라미터 예측부(390)를 포함할 수 있다.

텍스처 예측부(360)는, 참조 레이어의 참조 블록이 인트라 예측에 의해 복원된 경우에, 참조 레이어 내 참조 블록의 텍스처를 인핸스먼트 레이어의 현재 블록에 대한 예측 값으로 사용할 수 있다. 이때, 텍스처 예측부(360)는 참조 블록의 텍스처를 업샘플링에 의해 스케일링할 수 있다.

움직임 예측부(370)는 레이어 0 (참조 레이어 혹은 베이스 레이어)의 움직임 정보를 이용하여 레이어 1 (현재 레이어 혹은 인핸스먼트 레이어)의 현재 블록에 대한 예측을 수행할 수 있다. 이때, 움직임 예측부(370)는 참조 레이어의 움직임 정보를 스케일링 할 수도 있다.

유닛 정보 예측부(380)는 베이스 레이어의 유닛(CU, PU 및/또는 TU) 정보를 유도하여 인핸스먼트 레이어의 유닛 정보로 사용하거나, 베이스 레이어의 유닛 정보를 기반으로 인핸스먼트 레이어의 유닛 정보를 결정할 수 있다.

파라미터 예측부(390)는 베이스 레이어에서 사용한 파라미터를 유도하여 인핸스먼트 레이어에서 재사용하도록 하거나 베이스 레이어에서 사용한 파라미터를 기반으로 인핸스먼트 레이어에 대한 파라미터를 예측할 수 있다.

예컨대, 인터 레이어 예측부는 인터 레이어 레지듀얼 예측을 수행하는 서브 예측부 및/또는 인터 레이어 차분 예측을 수행하는 서브 예측부를 더 포함할 수도 있고, 상술한 서브 예측부들의 조합으로 인터 레이어 레지듀얼 예측, 인터 레이어 차분 예측 등을 수행할 수도 있다.

도 3의 구성이 인코딩 장치의 구성이라고 할 때, 레이어 1에서, 예측부(300)는 도 1의 예측부(110)에 대응할 수 있고, 필터링부(310)는 도 1의 필터링부(120)에 대응할 수 있다. 레이어 0에서, 예측부(320)는 도 1의 예측부(140)에 대응할 수 있고, 필터링부(330)는 도 1의 필터링부(150)에 대응할 수 있다.

또한, 도 3의 구성이 디코딩 장치의 구성이라고 한다면, 레이어 1에서, 예측부(300)는 도 2의 예측부(235)에 대응할 수 있고, 필터링부(310)는 도 2의 필터링부(240)에 대응할 수 있다. 레이어 0에서, 예측부(320)는 도 2의 예측부(275)에 대응할 수 있고, 필터링부(330)는 도 2의 필터링부(280)에 대응할 수 있다.

이처럼, 스케일러블 비디오 코딩에서는 다른 레이어의 정보를 이용하여 현재 레이어의 정보를 예측하는 인터 레이어 예측이 수행될 수 있다.

이하, 도면을 참조하여, 인터 레이어 차분 예측(Inter layer differential prediction)에 대하여 구체적으로 설명한다. 인터 레이어 차분 예측은 인터 레이어 차분 픽처 코딩(Inter layer differential picture coding) 또는 인터 레이어 차분 모드(Inter layer differential mode; IL-Diff mode)라고 불릴 수도 있다. 이하, 본 명세서에서는 인터 레이어 차분 모드라고 한다.

도 4는 본 발명이 적용될 수 있는 인터 레이어 차분 모드를 개략적으로 설명하기 위한 도면이다. 인터 레이어 차분 모드는 상술한 도 1 내지 도 3의 예측부 혹은 인터 레이어 예측부에서 수행될 수 있다. 여기서는 설명의 편의를 위해, 예측부에서 수행되는 것으로 설명한다.

도 4를 참조하면, 베이스 레이어(base layer)의 복원 영상(reconstructed picture)(410)을 R_BL이라 하고, R_BL을 인핸스먼트 레이어(enhancement layer)의 해상도(resolution)에 맞추어 업샘플링(upsampling)한 영상(420)을 UR_BL이라 하자. 그리고, 인핸스먼트 레이어의 복원 영상(430)을 R_EL이라 하자. 이때, 예측부는 R_EL(430)의 값에서 UR_BL(420)의 값을 뺀 차분 값을 가지는 차분 영상(differential picture)(440)을 생성할 수 있다. 차분 영상(440)을 D라고 하면, D 영상들의 도메인(domain)에서 독립적으로 부호화/복호화를 수행할 수 있다. 이 방법을 본 명세서에서는 인터 레이어 차분 모드라고 한다.

여기서, 복원 영상은 인루프 필터를 적용하기 전의 영상일 수 있다. 또는, 복원 영상은 인루프 필터, 예컨대 디블록킹 필터(deblocking filter), SAO(Sample Adaptive Offset) 필터, ALF(Adaptive Loop Filter) 중 일부를 적용한 후의 영상일 수도 있다. 또는, 복원 영상은 인루프 필터 전부를 적용한 후의 영상일 수도 있다.

상술한 인터 레이어 차분 모드는 시퀀스 단위, 픽처 단위, 슬라이스 단위, 가장 큰 코딩 유닛(Largest CU; LCU) 단위, 코딩 유닛(Coding Unit; CU) 단위, 또는 예측 유닛(Prediction Unit; PU) 단위에서 적용될 수 있다. 인터 레이어 차분 모드를 적용하고자 하는 처리 단위에서, 인터 레이어 차분 모드를 사용할지 여부를 알려주는 플래그(flag)가 인코딩 장치로부터 디코딩 장치로 전송될 수 있다. 인터 레이어 차분 모드가 적용된 처리 단위에 대해서는, 다른 스케일러빌러티(scalability)를 이용한 코딩(인코딩/디코딩)을 수행하지 않고, 단일 레이어 코딩(single layer coding) 방법을 이용할 수도 있다. 이 경우, 다른 스케일러빌러티를 이용한 코딩을 수행할지 여부를 지시하기 위한 신택스(syntax)를 시그널링하지 않아도 되므로, 비트량을 절약할 수 있다.

도 5는 본 발명에 따라서 인터 레이어 차분 모드를 적용하여 인트라 예측 및 인터 예측을 수행하는 방법을 개략적으로 설명하기 위한 도면이다. 도 5의 방법은 상술한 도 1 내지 도 3의 예측부 혹은 인터 레이어 예측부에서 수행될 수 있다. 여기서는 설명의 편의를 위해, 예측부에서 수행되는 것으로 설명한다.

인터 레이어 차분 모드를 적용하여 인트라 예측(intra prediction)을 수행하는 방법을 설명한다.

인핸스먼트 레이어의 픽처 R_EL(530)는 현재 블록(535)을 기준으로 이미 복원된 복원 영역(532)과 아직 복원되지 않은 미복원 영역(537)을 포함할 수 있다. 이때, 인핸스먼트 레이어의 픽처 R_EL(530)에 대한 복원이 완료되면 복원 영상을 획득할 수 있다. 베이스 레이어의 복원 영상 R_BL(510)은 인핸스먼트 레이어의 해상도에 맞추어 업샘플링될 수 있다. 이때, 업샘플링된 영상을 UR_BL(520)이라 하자.

인터 레이어 차분 모드를 적용하여 부호화할 때, 예측부는 인핸스먼트 레이어의 복원 영상 R_EL(530)과 업샘플링된 영상 UR_BL(520) 간의 차이를 기반으로 차분 영상 D(540)을 획득할 수 있다. 차분 영상 D(540)은 아래 수학식 1과 같이 유도될 수 있다.

수학식 1

여기서, R_EL(530)은 미복원 영역(537)의 존재로 인해, 디블록킹 필터, SAO, ALF 등과 같은 인루프 필터가 적용되지 않은 상태의 영상을 사용할 수 있다. 베이스 레이어의 복원 영상 R_BL(510)은 모든 영역이 복원된 상태이기 때문에, R_BL(510)은 디블록킹 필터, SAO, ALF 등과 같은 인루프 필터가 적용된 상태의 영상일 수 있으며, 또는 상기 인루프 필터의 일부가 적용된 상태의 영상일 수도 있으며, 또는 상기 인루프 필터가 적용되지 않은 상태의 영상일 수도 있다.

예측부는 차분 영상 D(540)에서 이미 복원된 복원 영역(542)의 픽셀 값들을 참조하여, 현재 블록(545)에 대해 인트라 예측을 수행할 수 있다.

인터 레이어 차분 모드를 적용하여 현재 블록(535)을 복호화할 때, 예측부는 복호화 하려는 현재 블록(535)과 동일 위치에 존재하는 업샘플링된 영상 UR_BL(520) 내의 블록 P_BL(525)과, 차분 영상 D(540)의 복원 영역(542)으로부터 인트라 예측을 수행하여 생성된 예측 블록 P_D(545)을 기반으로 현재 블록(535)을 복원할 수 있다. 현재 블록(535)은 아래 수학식 2와 같이 유도될 수 있다.

수학식 2

여기서, R_EL(current_block)은 인핸스먼트 레이어에서 복원된 현재 블록이고, RES는 레지듀얼 정보이다. 이때, 레지듀얼 정보는 인코딩 장치로부터 전송될 수 있으며, 차분 영상 D(540)의 부호화 시 현재 블록(545)에 대한 인트라 예측을 수행하여 생성된 예측 블록과 원본 블록 간의 잔차값 정보를 포함하는 레지듀얼 블록일 수 있다.

인터 레이어 차분 모드를 적용하여 인터 예측(inter prediction)을 수행하는 방법을 설명한다.

인핸스먼트 레이어의 픽처 R_EL(530) 내 현재 블록(535)에 대한 인터 예측을 수행하기 위해, 예측부는 참조 픽처에 대한 차분 영상 D_R을 생성한다. 예컨대, 현재 복원하려는 픽처 R_EL(530)의 이전 픽처 또는 이후 픽처 중 적어도 하나를 참조 픽처로 하여, 참조 픽처에 대한, 인핸스먼트 레이어의 복원 영상과 베이스 레이어의 복원 영상 간의 차이를 기반으로 참조 픽처에 대한 차분 영상 D_R을 생성할 수 있다.

예측부는 참조 픽처에 대한 차분 영상 D_R을 기반으로 인터 예측을 수행하여, 현재 블록(535)의 차분 영상 D(540)에 대해 예측 블록 P_D(545)을 생성할 수 있다.

인터 레이어 차분 모드를 적용하여 현재 블록(535)을 복호화할 때, 예측부는 참조 픽처에 대한 차분 영상 D_R을 기반으로 인터 예측을 수행하여 생성된 예측 블록 P_D(545)과, 현재 블록(535)과 동일 위치에 존재하는 업샘플링된 영상 UR_BL(520) 내의 블록 P_BL(525)을 이용하여 현재 블록(535)을 복원할 수 있다. 현재 블록(535)은 아래 수학식 3과 같이 유도될 수 있다.

수학식 3

여기서, R_EL(current_block)은 인핸스먼트 레이어에서 복원된 현재 블록이고, RES는 레지듀얼 정보이다. 이때, 레지듀얼 정보는 인코딩 장치로부터 전송될 수 있으며, 차분 영상 D(540)의 부호화 시 현재 블록(545)에 대한 인터 예측을 수행하여 생성된 예측 블록과 원본 블록 간의 잔차값 정보를 포함하는 레지듀얼 블록일 수 있다.

참조 픽처에 대한 차분 영상 D_R은 미리 생성되어 DPB(Decoded Picture Buffer)에 저장될 수 있다. DPB는 도 1 내지 도 3에서 설명한 메모리에 대응할 수 있다. 또는, 참조 픽처에 대한 차분 영상 D_R은 현재 블록의 움직임 정보(예컨대, 움직임 벡터)를 기초로 현재 블록의 복원을 위해서 필요한 위치의 참조 블록에 대해서 매번 계산하여 사용할 수도 있다.

인터 레이어 차분 모드에 대한 인터 예측에서 참조 픽처에 대한 차분 영상을 생성할 때, 인핸스먼트 레이어의 복원 영상은 디블록킹 필터, SAO, ALF 등과 같은 인루프 필터의 일부 또는 전부가 적용된 상태의 영상일 수 있다.

한편, 인터 예측의 경우, 현재 픽처의 이전 픽처 또는 이후 픽처 중 적어도 하나의 픽처(참조 픽처)를 기반으로 예측이 수행되어 현재 블록에 대한 예측 블록이 생성될 수 있다. 예컨대, 예측 대상인 현재 블록에 대하여 움직임 예측을 통해, 참조 픽처로부터 현재 블록에 대응하는 참조 블록을 선택하여 움직임 정보(예를 들어, 참조 픽처 인덱스, 움직임 벡터, 예측 모드에 대한 정보 등)를 유도할 수 있고, 이를 기반으로 예측 블록을 생성할 수 있다.

이때, 예측의 정확도를 높이기 위해서 예측 블록은 정수 픽셀 단위로 생성될 수 있고, 정수 이하 픽셀 단위로 생성될 수도 있다. 움직임 벡터 역시 정수 픽셀 단위 혹은 정수 이하 픽셀 단위로 도출될 수 있다. 1/2 픽셀 단위 샘플, 1/4 픽셀 단위 샘플 등과 같이 정수 이하 단위의 픽셀 정보를 가지는 부분 샘플(fractional sample)은 정수 단위의 픽셀 정보를 가지는 풀 샘플(full sample)을 기반으로 보간(interpolation)을 통해 생성될 수 있다. 예컨대, 휘도 성분의 경우, 1/4 픽셀 단위의 샘플 정보를 가질 수 있으며, 8탭 보간 필터(Interpolation Filter)를 사용하여 1/4 픽셀 단위로 픽셀 정보를 생성할 수 있다. 색차 성분의 경우, 1/8 픽셀 단위의 샘플 정보를 가질 수 있으며, 4탭 보간 필터를 사용하여 1/8 픽셀 단위로 픽셀 정보를 생성할 수 있다. 따라서, 인터 예측 시, 보간을 통해 정수 이하 단위의 부분 샘플을 생성함으로써 현재 블록에 더 유사한 참조 블록을 선택하여 예측 성능을 높일 수 있다.

상술한 바와 같이, 보간(interpolation)은 정수 이하 픽셀(또는, 서브-펠; sub-pel) 샘플을 생성함으로써 픽셀 샘플이 증가하여 픽셀 정밀도를 향상시킬 수 있다. 한편, 스케일러블 코딩에서는, 레이어 간의 서로 다른 해상도 또는 영상 크기를 조절하기 위해서 업샘플링(up sampling)을 수행할 수 있다. 예컨대, 인핸스먼트 레이어보다 작은 영상 크기 또는 해상도를 가지는 베이스 레이어의 영상에 업샘플링을 수행하게 되면, 베이스 레이어의 영상은 인핸스먼트 레이어의 영상 크기 또는 해상도와 동일해질 수 있다. 이러한 업샘플링은 보간을 적용함으로써 수행될 수 있다. 즉, 업샘플링은 보간을 적용함으로써 정수 이하 픽셀 샘플을 생성할 수 있으며, 이로 인해 픽셀 샘플이 증가하여 영상의 크기 또는 해상도가 증가될 수 있다.

따라서, 본 명세서에서 업샘플링을 수행한다고 함은 보간을 수행하는 과정일 수 있다. 또한, 보간을 위해 사용되는 보간 필터(혹은 필터)를 본 명세서에서는 업샘플링 필터라고 한다.

도 6을 참조하면, 2차원 어레이로 구성된 참조 픽처 내 픽셀들(600) 중에서, 음영으로 표시(대문자로 표기)된 블록에 위치한 픽셀들은 정수 샘플을 나타내고, 음영 없이 표시(소문자로 표기)된 블록에 위치한 픽셀들은 부분 샘플(정수 이하 단위 샘플)을 나타낸다. 이때, 하나의 정수 샘플을 기준으로 하는 영역에 8탭 필터를 적용하여 1/4 픽셀 단위의 부분 샘플을 생성할 수 있다.

이하, 설명의 편의를 위해 정수 샘플 A_0,0을 기준으로 하는 영역(610)에 대해서 업샘플링을 수행하여 1/4 픽셀 단위의 부분 샘플들(a_0,0 ~ r_0,0)을 생성하는 과정에 대해 설명한다.

예를 들어, 정수 샘플(A_i,j)에 대한 픽셀 값을 알고 있을 경우, 부분 샘플 a_0,0, b_0,0, c_0,0, d_0,0, h_0,0, n_0,0은 가장 근접한 정수 샘플들에 8탭 필터를 적용하여 아래 수학식 4와 같이 도출될 수 있다.

수학식 4

여기서, shift1은 BitDepth_Y(Y 컴포넌트의 비트 깊이) - 8을 나타내고, ">>"우측 시프트 연산자를 나타낸다. 예컨대, "x >> y"는 x의 2의 보수 표현을 이진수 단위 y만큼 산술적으로 우측으로 이동하는 것을 말한다.

또한, 정수 샘플에 위치한 픽셀들에 대한 픽셀 값을 알고 있을 경우, 부분 샘플 e_0,0, i_0,0, p_0,0, f_0,0, j_0,0, q_0,0, g_0,0, k_0,0, r_0,0은 수직 방향에 있는 샘플들 a_0,i, b_0,i, c_0,i(여기서, i = -3, -2, …, 4)에 8탭 필터를 적용하여 아래 수학식 5와 같이 도출될 수 있다.

수학식 5

여기서, shift2는 6을 나타내고, ">>"는 우측 시프트 연산자를 나타낸다.

상술한 수학식 4 및 5와 같은 방법을 통해 정수 샘플 A_i,j의 인근 영역에 있는 1/4 픽셀 단위의 부분 샘플들을 산출하는 경우에도 동일하게 적용할 수 있다.

상술한 바와 같이 참조 픽처에 업샘플링을 수행하여 정수 이하 픽셀 샘플들을 생성하게 되면, 현재 블록에 대한 예측 시 참조 픽처로부터 정수 픽셀 단위뿐만 아니라 정수 이하 픽셀 단위로 예측 블록을 생성할 수 있다. 그리고, 예측 블록을 기반으로 움직임 벡터를 유도할 수 있으며, 움직임 벡터 역시 정수 이하 픽셀 단위로 유도될 수 있다. 따라서, 현재 블록에 대한 예측 시 참조 픽처에 업샘플링을 수행하여 예측 블록을 생성하면 현재 블록에 더 유사한 예측 블록을 생성할 수 있다.

한편, 상술한 바와 같이 인터 레이어 차분 모드를 적용하여 인터 예측을 수행하는 경우, 참조 픽처에 대한 차분 영상을 이용하여 움직임 예측(Motion Estimation; ME) 및/또는 움직임 보상(Motion Compensation; MC)을 수행하고, 이를 기반으로 현재 픽처의 차분 영상에 대응하는 예측 블록을 생성할 수 있고 움직임 정보를 유도할 수 있다. 이때, 차분 영상은 주파수 영역에서 DC 부분에 많은 값들이 분포하기 때문에, 차분 영상에 대해 정수 이하 단위의 픽셀 정보를 생성하기 위해 업샘플링을 수행하게 되면 성능이 저하되는 경우가 발생할 수 있다.

도 7을 참조하면, 차분 영상(700)은 평활한 배경과 같은 부분(어두운 부분)에서는 0에 가까운 값을 갖게 된다. 반면, 에지(edge)가 있는 부분(흰색 부분)에서는 큰 값을 갖는 특징이 있다. 따라서, 차분 영상(700)은 주파수 영역에서의 특징이 보통 영상과는 다르게 나타날 수 있다. 예컨대, 차분 영상(700)은 보통 영상에 비해, 저주파 및/또는 고주파 부분에 많은 값들이 분포하게 될 수 있다.

상술한 바와 같이, 인터 레이어 차분 모드를 적용할 경우 차분 영상을 이용하여 예측이 수행되기 때문에, 보통 영상과 주파수 특징이 다르게 나타나는 차분 영상에 업샘플링을 수행하여 예측 블록을 생성할 경우 예측의 정확도가 감소되는 경우가 발생할 수 있다. 따라서, 인터 레이어 차분 모드를 적용하여 예측할 경우 차분 영상의 특성을 고려할 필요가 있다. 즉, 인터 레이어 차분 모드의 적용 여부에 따라 업샘플링에 사용되는 필터의 종류를 결정하여 업샘플링을 수행할 필요가 있다. 여기서, 필터의 종류는 필터의 특징을 말하는 것으로, 예컨대 필터의 길이, 필터의 계수 등일 수 있다. 필터의 길이는 필터의 탭 크기를 말하며, 필터의 계수는 각 탭에 적용할 계수 값을 말한다.

이하, 인터 레이어 차분 모드의 적용 여부에 따라 업샘플링에 사용되는 필터의 탭 크기, 필터의 계수를 결정하는 방법의 실시예들에 대해 설명한다.

도 8의 방법은 상술한 도 1의 인코딩 장치 또는 도 2의 디코딩 장치에서 수행될 수 있다. 도 8의 실시예에서는 설명의 편의를 위해 도 8의 방법이 인코딩 장치에서 수행되는 것으로 설명하나, 이는 디코딩 장치에서도 동일하게 적용될 수 있다.

도 8을 참조하면, 인코딩 장치는 인터 레이어 차분 모드를 적용할지 여부를 결정할 수 있다(S810). 즉, 인코딩 장치는 인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용하여 예측을 수행할지 여부를 결정할 수 있다.

인터 레이어 차분 모드를 적용할지 여부에 대한 정보는 플래그를 이용하여 나타낼 수 있다. 예컨대, 상기 플래그는 inter_layer_Differential_coding_flag일 수 있다. 만일, 인터 레이어 차분 모드를 적용하는 경우 inter_layer_Differential_coding_flag의 값은 1일 수 있고, 인터 레이어 차분 모드를 적용하지 않는 경우 inter_layer_Differential_coding_flag의 값은 0일 수 있다.

예를 들어, 인코딩 장치는 인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용할지 여부를 결정하고, 상기 결정된 정보를 플래그(예를 들어, inter_layer_Differential_coding_flag) 형태로 디코딩 장치에 시그널링할 수 있다. 디코딩 장치는 인터 레이어 차분 모드를 적용할지 여부를 나타내는 플래그(예를 들어, inter_layer_Differential_coding_flag) 정보를 이용하여 인핸스먼트 레이어의 현재 블록에 대한 예측을 수행할 수 있다. 예컨대, 인터 레이어 차분 모드를 적용할지 여부를 나타내는 플래그(예를 들어, inter_layer_Differential_coding_flag)의 값이 1이면 인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용하여 예측을 수행하고, 인터 레이어 차분 모드를 적용할지 여부를 나타내는 플래그(예를 들어, inter_layer_Differential_coding_flag)의 값이 0이면 인핸스먼트 레이어의 현재 블록에 대해 다른 예측 모드를 적용할 수 있다.

인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용할 경우, 인코딩 장치는 현재 블록에 대한 예측을 위해 참조 픽처에 대한 차분 영상에 8탭보다 작은 크기의 탭 필터를 사용하여 업샘플링을 수행할 수 있다(S820). 그리고, 인코딩 장치는 8탭보다 작은 크기의 탭 필터를 적용하여 업샘플링된 차분 영상(즉, 참조 픽처에 대한 차분 영상)을 이용하여 현재 블록에 대한 예측 블록을 생성하고 움직임 보상을 수행할 수 있다.

여기서, 참조 픽처에 대한 차분 영상은, 상술한 바와 같이, 현재 복원하려는 인핸스먼트 레이어의 현재 블록(현재 픽처)의 이전 픽처 또는 이후 픽처 중 적어도 하나를 참조 픽처로 하여, 참조 픽처에 대한 인핸스먼트 레이어의 복원 영상과 참조 픽처에 대한 베이스 레이어의 복원 영상 간의 차이를 기반으로 생성된 차분 영상을 말한다.

예를 들어, 인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를적용하여 예측 수행 시, 인코딩 장치는 참조 픽처에 대한 차분 영상의 휘도 성분에 대하여 움직임 예측을 통해 1/4 픽셀 단위로 예측 블록을 생성할 수 있으며, 움직임 보상을 통해 1/4 픽셀 단위로 움직임 벡터를 유도할 수도 있다. 이때, 참조 픽처에 대한 차분 영상에 기존 보간 수행 시 사용되는 8탭 필터와 같이 긴 탭을 적용할 경우, 상술한 바와 같이 차분 영상의 주파수 특징으로 인해 성능이 저하될 수 있다. 따라서, 참조 픽처에 대한 차분 영상에 8탭보다 작은 크기의 탭 필터, 예컨대 6탭 혹은 4탭 필터를 사용하여 정수 이하 픽셀 샘플들을 생성하여, 현재 블록에 대한 인터 레이어 차분 모드를 적용한 인터 예측을 수행할 수 있다. 물론, 6탭 혹은 4탭보다 더 작은 크기, 예컨대 2탭 필터를 사용할 수도 있다.

본 실시예에서 6탭, 4탭, 또는 2탭 등과 같은 필터의 탭 크기는 하나의 예시로, 본 발명이 이에 한정되는 것은 아니며, 차분 영상에 대해 8탭보다 작은 크기의 탭 필터이면 적용 가능하다.

인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용하지 않을 경우, 인코딩 장치는 현재 블록에 대한 예측을 위해, 인핸스먼트 레이어의 현재 블록에 대한 참조 픽처에 8탭 필터를 사용하여 업샘플링을 수행할 수 있다(S830). 그리고, 인코딩 장치는 8탭 필터를 적용하여 정수 이하 픽셀 샘플들을 생성한 참조 픽처를 이용하여 현재 블록에 대한 예측 블록을 생성하고 움직임 보상을 수행할 수 있다.

도 9의 방법은 상술한 도 1의 인코딩 장치 또는 도 2의 디코딩 장치에서 수행될 수 있다. 도 9의 실시예에서는 설명의 편의를 위해 도 9의 방법이 인코딩 장치에서 수행되는 것으로 설명하나, 이는 디코딩 장치에서도 동일하게 적용될 수 있다.

도 9를 참조하면, 인코딩 장치는 인터 레이어 차분 모드를 적용할지 여부를 결정할 수 있다(S910). 즉, 인코딩 장치는 인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용하여 예측을 수행할지 여부를 결정할 수 있다.

인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용할 경우, 인코딩 장치는 현재 블록에 대한 예측을 위해 참조 픽처에 대한 차분 영상에, 차분 영상의 주파수 특성에 맞춰서 생성된 소정의 계수 값을 가지는 필터를 사용하여 업샘플링을 수행할 수 있다(S920). 그리고, 인코딩 장치는 소정의 계수 값을 가지는 필터를 적용하여 업샘플링된 차분 영상(즉, 참조 픽처에 대한 차분 영상)을 이용하여 현재 블록에 대한 예측 블록을 생성하고 움직임 보상을 수행할 수 있다.

차분 영상은 상술한 바와 같이 저주파 및/또는 고주파 부분에 많은 값들이 분포하기 때문에, 이러한 차분 영상의 주파수 특성에 맞춰서 계수 값을 생성할 수 있다. 예컨대, 저역대역 및/또는 고역대역의 값들에 가중치가 주어진 계수 값을 생성할 수 있다. 일예로, 차분 영상에 적용될 업샘플링 필터의 계수는 {-2, 5, -11, 40, 40, -11, 5, -2}일 수 있다.

본 실시예에서 저역대역 및/또는 고역대역의 값들에 가중치가 주어진 계수 값을 가지는 필터 계수를 사용하는 것은 하나의 예시로, 본 발명이 이에 한정되는 것은 아니며, 차분 영상에 대해 보다 향상된 예측 성능을 나타낼 수 있는 계수 값으로 이루어진 필터이면 적용 가능하다.

인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용하지 않을 경우, 인코딩 장치는 현재 블록에 대한 예측을 위해, 인핸스먼트 레이어의 현재 블록에 대한 참조 픽처에, 저역대역 및/또는 고역대역의 값들에 가중치가 주어지지 않은 계수 값을 가지는 기존의 필터 계수를 사용하여 업샘플링을 수행할 수 있다(S930). 그리고, 인코딩 장치는 기존의 필터 계수를 적용하여 정수 이하 픽셀 샘플들을 생성한 참조 픽처를 이용하여 현재 블록에 대한 예측 블록을 생성하고 움직임 보상을 수행할 수 있다.

일예로, 기존의 필터 계수, 즉 저역대역 및/또는 고역대역의 값들에 가중치가 주어지지 않은 계수 값을 가지는 필터 계수는 {-1, 4, -11, 40, 40, -11, 4, -1}일 수 있다.

상술한 도 8 및 도 9의 실시예에서는 인터 레이어 차분 모드의 적용 여부에 따라 필터의 탭 크기 또는 필터의 계수를 결정하는 방법에 대해 설명하였다. 이하, 인터 레이어 차분 모드를 적용할 경우 차분 영상에 사용되는 필터의 탭 크기 또는 필터의 계수와 같은 필터 정보를 시그널링하는 방법에 대해 설명한다.

상술한 바와 같이, 인터 레이어 차분 모드를 적용할 경우 차분 영상에 사용될 수 있는 필터의 탭 크기, 필터의 계수 등과 같은 필터 정보는 룩업 테이블(Look-up table) 형태로 구성될 수 있다.

예컨대, 인코딩 장치는 룩업 테이블 상에서, 차분 영상의 업샘플링 시 사용되는 필터 정보(필터의 탭 크기, 필터의 계수 등)를 지시하는 인덱스를 디코딩 장치로 전송할 수 있다. 디코딩 장치는 필터 정보를 지시하는 인덱스를 이용하여 인코딩 장치에서 차분 영상에 대해 사용된 필터 정보(필터의 탭 크기, 필터의 계수 등)를 알 수 있다.

표 1은 본 발명에 따라서 필터 정보를 시그널링 하는데 사용되는 룩업 테이블의 일예를 나타내며, 룩업 테이블의 인덱스 값을 이용하여 필터의 탭 크기에 대한 정보를 나타낸다.

표 1

표 1에 도시된 룩업 테이블은 필터 인덱스의 값을 이용하여 특정 탭 크기를 가지는 필터를 지시할 수 있다. 예컨대, 필터 인덱스의 값이 '01'이면 6탭 필터를 지시할 수 있고, 필터 인덱스의 값이 '10'이면 4탭 필터를 지시할 수 있다.

표 1에 도시된 6탭, 4탭, 또는 2탭 보간 필터는, 예컨대 기존의 참조 픽처에 대한 보간 시 사용되는 8탭 필터(휘도 성분의 경우) 또는 4탭 필터(색차 성분의 경우)에서 탭 크기를 조정하여 사용할 수 있다. 예를 들어, 표 1에 도시된 6탭 필터의 경우, 기존의 8탭 필터에서 양쪽 끝에 위치한 2개의 탭을 제외한 가운데 6개의 탭으로 구성하여 사용할 수 있다. 4탭 필터의 경우에도 기존의 8탭 필터에서 양쪽 끝 부분에 위치한 4개의 탭을 제외한 가운데 4개의 탭으로 구성하여 사용할 수 있다.

만일, 인코딩 장치에서 인터 레이어 차분 모드 적용 시, 차분 영상에 8탭보다 작은 크기의 필터(예컨대, 6탭 필터)를 사용하여 업샘플링을 할 경우, 필터 정보를 지시하는 지시자(예컨대, 후술할 Interpolation_filter_indicator)에 필터의 탭 크기에 대한 정보(예컨대, 6탭 필터를 지시하는 룩업 테이블의 인덱스 값)를 저장하여 시그널링할 수 있다. 이때, 인코딩 장치에서는 필터의 탭 크기와 함께 탭에 적용될 계수 값(필터 계수)을 결정하여 시그널링할 수도 있다. 예컨대, 표 2의 룩업 테이블을 이용하여 필터 계수에 대한 정보를 함께 시그널링할 수 있다.

표 2는 본 발명에 따라서 필터 정보를 시그널링 하는데 사용되는 룩업 테이블의 다른 예를 나타내며, 룩업 테이블의 인덱스 값을 이용하여 필터의 계수에 대한 정보를 나타낸다.

표 2

표 2에 도시된 룩업 테이블은 필터 인덱스의 값을 이용하여 특정 계수 값을 가지는 필터를 지시할 수 있다. 예컨대, 필터 인덱스의 값이 '00'이면 필터 계수 A를 지시할 수 있고, 필터 인덱스의 값이 '11'이면 필터 계수 D를 지시할 수 있다.

여기서, 필터 계수 A, B, C, D는 소정의 계수 값들이다. 예컨대, 필터 계수 A, B, C, D는 인터 레이어 차분 모드를 적용할 경우 사용되는 차분 영상에 대한 주파수 특성에 맞추어 저역대역 및/또는 고역대역의 값들에 가중치가 주어진 계수 값들일 수 있다. 각 필터 계수 A, B, C, D는 필터의 탭수에 대응하는 개수의 필터 계수로 구성된다.

일예로, 필터 계수 A는 저역대역의 값에 가중치가 주어진 계수 값들로 이루어질 수 있고, 필터 계수 B는 고역대역의 값에 가중치가 주어진 계수 값들로 이루어질 수도 있다. 필터 계수 C는 저역대역과 고역대역의 값들에 가중치를 부여하되, 저역대역보다 고역대역에 더 많은 가중치가 부여된 계수 값들로 이루어질 수 있고, 필터 계수 D는 필터 계수 C와 반대로 가중치가 부여된 계수 값들로 이루어질 수도 있다.

또한, 필터 계수 A, B, C, D는 8탭 필터에 적용할 8개의 계수 값들로 구성될 수도 있고, 또는 8탭보다 작은 크기의 탭 필터 혹은 8탭 보다 큰 크기의 탭 필터에 적용할 계수 값들로 구성될 수도 있다.

상술한 바와 같은 본 발명의 실시예에 따른 상기 표 1 및 상기 표 2에 도시된 룩업 테이블은 하나의 예시로, 본 발명이 이에 한정되는 것은 아니다. 또한, 본 발명에 따른 룩업 테이블은 상기 표 1에서와 같은 필터의 탭 크기에 관한 정보와 상기 표 2에서와 같은 필터 계수에 관한 정보를 조합한 필터 정보로 구성된 형태일 수도 있다.

한편, 상기 표 1 및 표 2에 도시된 필터 정보는 부호화 과정에서 소정의 레벨에 저장될 수 있다. 예컨대, 필터의 탭 크기에 대한 정보, 필터의 계수에 대한 정보 등과 같은 필터 정보는 시퀀스 파라미터 세트, 픽처 파라미터 세트, 슬라이스 헤더 등에 저장될 수 있다. 아래 표 3은 시퀀스 파라미터 세트를 이용하여 상기 필터 정보를 저장하는 경우의 일예를 개략적으로 나타낸 것이다.

표 3

표 3을 참조하면, Interpolation_filter_indicator는 업샘플링에 사용되는 필터 정보를 지시한다. 예컨대, 상기 표 1과 같은 룩업 테이블을 이용할 경우, Interpolation_filter_indicator는 필터의 탭 크기를 지시할 수 있다. 상기 표 2와 같은 룩업 테이블을 이용할 경우, Interpolation_filter_indicator는 필터 계수를 지시할 수 있다.

일예로, 인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용하여 예측을 수행할 경우(예컨대, inter_layer_Differential_coding_flag의 값이 1일 경우), 인코딩 장치는 현재 블록에 대한 예측 블록을 생성하고 움직임 정보를 유도하기 위해, 참조 픽처에 대한 차분 영상에 업샘플링 시 사용할 필터 정보(예컨대, 필터의 탭 크기, 필터 계수)를 결정하고, 상기 결정된 필터 정보를 Interpolation_filter_indicator에 저장하여 디코딩 장치로 전송할 수 있다. 예컨대, 필터 정보를 상기 표 1 또는 상기 표 2와 같은 룩업 테이블 형태로 미리 구성하여, 인코딩 장치가 룩업 테이블에서 상기 차분 영상에 업샘플링 시 사용할 필터를 지시하는 인덱스 값을 Interpolation_filter_indicator를 통해 저장하여 디코딩 장치로 전송할 수 있다. 디코딩 장치는 Interpolation_filter_indicator가 지시하는 필터 정보를 적용하여 업샘플링을 수행할 수 있다.

상기 표 3에서는 시퀀스 파라미터 세트에서 필터 정보를 저장하는 경우의 신택스를 나타냈으나, 이는 하나의 예시로서, 본 발명에서는 픽처 파라미터 세트, 슬라이스 헤더 등에 필터 정보를 저장할 수도 있다. 또한, 업샘플링에 사용되는 필터 정보를 지시하는 지시자로 Interpolation_filter_indicator를 사용하였으나, 이는 하나의 예시이며, 다른 지시자를 이용할 수도 있다.

상술한 예시적인 시스템에서, 방법들은 일련의 단계 또는 블록으로써 순서도를 기초로 설명되고 있지만, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 상술한 실시예들은 다양한 양태의 예시들을 포함한다. 따라서, 본 발명은 이하의 특허청구범위 내에 속하는 모든 다른 교체, 수정 및 변경을 포함한다고 할 것이다.

Claims

인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용하는 스케일러블 비디오 디코딩 방법으로서,

상기 현재 블록의 참조 픽처를 선택하고, 상기 참조 픽처에 대한 차분 영상을 생성하는 단계; 및

상기 참조 픽처에 대한 차분 영상을 기반으로 상기 현재 블록에 대한 예측을 수행하는 단계를 포함하며,

상기 참조 픽처에 대한 차분 영상은, 상기 참조 픽처에 대한 인핸스먼트 레이어의 복원 영상과 상기 참조 픽처에 대한 베이스 레이어의 복원 영상 간의 차이를 기반으로 생성되며,

상기 현재 블록에 대한 예측을 수행하는 단계에서는,

상기 참조 픽처에 대한 차분 영상에 적용되는 필터 정보를 기반으로 정수 이하 픽셀 샘플을 생성하여 상기 현재 블록에 대응하는 예측 블록을 생성하는 것을 특징으로 하는 스케일러블 비디오 디코딩 방법.
제1항에 있어서,

상기 필터 정보는 상기 참조 픽처에 대한 차분 영상에 적용되는 필터의 탭 크기에 관한 정보를 포함하는 것을 특징으로 하는 스케일러블 비디오 디코딩 방법.
제1항에 있어서,

상기 필터 정보는 상기 참조 픽처에 대한 차분 영상에 적용되는 필터 계수에 관한 정보를 포함하는 것을 특징으로 하는 스케일러블 비디오 디코딩 방법.
제1항에 있어서,

상기 필터 정보는 상기 참조 픽처에 대한 차분 영상에 적용되는 필터의 탭 크기에 관한 정보 및 필터 계수에 관한 정보를 포함하는 것을 특징으로 하는 스케일러블 비디오 디코딩 방법.
제2항에 있어서,

상기 필터의 탭 크기는 8탭보다 작은 크기인 것을 특징으로 하는 스케일러블 비디오 디코딩 방법.
제3항에 있어서,

상기 필터 계수는 주파수 대역에 대해 저역대역 및 고역대역의 값들 중 적어도 하나의 대역 값에 가중치가 주어진 계수 값들으로 이루어진 것을 특징으로 하는 스케일러블 비디오 디코딩 방법.
제1항에 있어서,

상기 필터 정보는 소정의 필터 집합에서 상기 참조 픽처에 대한 차분 영상에 적용되는 필터를 지시하는 인덱스인 것을 특징으로 하는 스케일러블 비디오 디코딩 방법.
인핸스먼트 레이어의 현재 블록에 대해 인터 레이어 차분 모드를 적용하는 스케일러블 비디오 인코딩 방법으로서,

상기 현재 블록의 참조 픽처를 선택하고, 상기 참조 픽처에 대한 차분 영상을 생성하는 단계; 및

상기 참조 픽처에 대한 차분 영상을 기반으로 상기 현재 블록에 대한 예측을 수행하는 단계를 포함하며,

상기 참조 픽처에 대한 차분 영상은, 상기 참조 픽처에 대한 인핸스먼트 레이어의 복원 영상과 상기 참조 픽처에 대한 베이스 레이어의 복원 영상 간의 차이를 기반으로 생성되며,

상기 현재 블록에 대한 예측을 수행하는 단계에서는,

상기 참조 픽처에 대한 차분 영상에 적용되는 필터 정보를 기반으로 정수 이하 픽셀 샘플을 생성하여 상기 현재 블록에 대응하는 예측 블록을 생성하는 것을 특징으로 하는 스케일러블 비디오 인코딩 방법.
제8항에 있어서,

상기 필터 정보는 상기 참조 픽처에 대한 차분 영상에 적용되는 필터의 탭 크기에 관한 정보를 포함하는 것을 특징으로 하는 스케일러블 비디오 인코딩 방법.
제8항에 있어서,

상기 필터 정보는 상기 참조 픽처에 대한 차분 영상에 적용되는 필터 계수에 관한 정보를 포함하는 것을 특징으로 하는 스케일러블 비디오 인코딩 방법.
제8항에 있어서,

상기 필터 정보는 상기 참조 픽처에 대한 차분 영상에 적용되는 필터의 탭 크기에 관한 정보 및 필터 계수에 관한 정보를 포함하는 것을 특징으로 하는 스케일러블 비디오 인코딩 방법.
제9항에 있어서,

상기 필터의 탭 크기는 8탭보다 작은 크기인 것을 특징으로 하는 스케일러블 비디오 인코딩 방법.
제10항에 있어서,

상기 필터 계수는 주파수 대역에 대해 저역대역 및 고역대역의 값들 중 적어도 하나의 대역 값에 가중치가 주어진 계수 값들으로 이루어진 것을 특징으로 하는 스케일러블 비디오 인코딩 방법.
제8항에 있어서,

상기 필터 정보는 소정의 필터 집합에서 상기 참조 픽처에 대한 차분 영상에 적용되는 필터를 지시하는 인덱스인 것을 특징으로 하는 스케일러블 비디오 인코딩 방법.