WO2014104725A1

WO2014104725A1 - 영상의 부호화/복호화 방법 및 이를 이용하는 장치

Info

Publication number: WO2014104725A1
Application number: PCT/KR2013/012135
Authority: WO
Inventors: 강정원; 이하현; 이진호; 최진수; 김진웅
Original assignee: 한국전자통신연구원
Priority date: 2012-12-26
Filing date: 2013-12-24
Publication date: 2014-07-03
Also published as: US20190068990A1; KR102271877B1; KR20140088014A; JP6874032B2; CN108540806B; CN108650513B; US20150319453A1; CN108650513A; JP2019092213A; KR20140087971A; CN104969553B; KR20140087981A; CN104969553A; EP3223522B1; CN108540805B; EP3223522A1; EP2941002A1; US20200092580A1; CN108540804A; JP2016506178A

Abstract

본 발명에 따른 복수의 계층을 지원하는 영상의 복호화 방법은 현재 계층이 상기 비트스트림 전체에서 참조할 수 있는 참조 계층에 대한 계층 의존성 정보를 수신하여 파싱하는 단계와; 상기 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는 경우, 상기 참조 계층 중 상기 현재 픽쳐가 참조하는 참조 계층에 대한 계층 정보를 수신하여 파싱하는 단계와; 상기 계층 정보에 기초하여 상기 현재 픽쳐의 디코딩을 수행하는 단계를 포함할 수 있다.

Description

영상의 부호화/복호화 방법 및 이를 이용하는 장치

본 발명은 영상의 부호화 및 복호화 처리에 관한 것으로서, 보다 상세하게는 계층적 비디오 부호화에서 다중 참조 계층을 적용한 계층간 영상 부/복호화 방법 및 그 장치에 관한 것이다.

최근 HD(High Definition) 해상도를 가지는 방송 서비스가 국내뿐만 아니라 세계적으로 확대되면서, 많은 사용자들이 고해상도, 고화질의 영상에 익숙해지고 있으며 이에 따라 많은 기관들이 차세대 영상기기에 대한 개발에 박차를 가하고 있다. 또한 HDTV와 더불어 HDTV의 4배 이상의 해상도를 갖는 UHD(Ultra High Definition)에 대한 관심이 증대되면서 보다 높은 해상도, 고화질의 영상에 대한 압축기술이 요구되고 있다.

영상 압축을 위해, 시간적으로 이전 및/또는 이후의 픽쳐로부터 현재 픽쳐에 포함된 화소값을 예측하는 인터(inter) 예측 기술, 현재 픽쳐 내의 화소 정보를 이용하여 현재 픽쳐에 포함된 화소값을 예측하는 인트라(intra) 예측 기술, 출현 빈도가 높은 심볼(symbol)에 짧은 부호를 할당하고 출현 빈도가 낮은 심볼에 긴 부호를 할당하는 엔트로피 부호화 기술 등이 사용될 수 있다.

영상 압축 기술에는 유동적인 네트워크 환경을 고려하지 않고 하드웨어의 제한적인 동작 환경하에서 일정한 네트워크 대역폭을 제공하는 기술이 있다. 그러나 수시로 대역폭이 변화하는 네트워크 환경에 적용되는 영상 데이터를 압축하기 위해서는 새로운 압축 기술이 요구되고, 이를 위해 스케일러블(scalable) 비디오 부호화/복호화 방법이 사용될 수 있다.

본 발명은 하나 이상의 참조 계층을 포함한 참조픽쳐 리스트를 효율적으로 생성 및 관리하여 부호화/복호화 효율을 향상시킬 수 있는 영상의 부호화/복호화 방법 및 이를 이용하는 장치를 제공한다.

본 발명의 일 실시예는 계층간 예측을 수행할 때, 움직임 예측 및 움직임 보상을 위한 참조 영상 리스트를 생성함에 있어, 한 개 이상의 참조계층을 포함하여 참조픽쳐 리스트를 생성할 수 있는 영상의 부호화/복호화 방법 및 이를 이용하는 장치를 제공한다.

본 발명의 일 실시예는 참조 계층의 복호화 영상을 포함하여 참조픽쳐 리스트 생성 시 참조픽쳐 리스트 내에서의 참조계층들의 복호화 영상의 위치 및 참조계층 복호화 영상간의 순서를 조정할 수 있는 영상의 부호화/복호화 방법 및 이를 이용하는 장치를 제공한다.

본 발명의 일 실시예에 따른 복수의 계층을 지원하는 영상의 복호화 방법은 현재 계층이 상기 비트스트림 전체에서 참조할 수 있는 참조 계층에 대한 계층 의존성 정보를 수신하여 파싱하는 단계와; 상기 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는 경우, 상기 참조 계층 중 상기 현재 픽쳐가 참조하는 참조 계층에 대한 계층 정보를 수신하여 파싱하는 단계와; 상기 계층 정보에 기초하여 상기 현재 픽쳐의 디코딩을 수행하는 단계를 포함할 수 있다.

상기 계층 의존성 정보는 비디오 파라미터 세트 확장에 포함되어 수신될 수있다.

상기 계층 정보는 상기 현재 픽쳐가 참조할 수 있는 참조 픽쳐의 계층의 ID 이며, 상기 계층 정보는 슬라이스 헤더에 포함되어 수신될 수있다.

상기 계층 의존성 정보에 기초하여 상기 현재 계층이 상기 비트스트림 전체에서 참조할 수 있는 참조 계층의 개수를 유도하는 단계와; 상기 참조 레이어의 개수가 0보다 크면, 상기 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는지 여부를 나타내는 플래그 정보를 수신하여 파싱하는 단계를 더 포함할 수 있다.

상기 플래그 정보가 1이고, 상기 참조 레이어 개수가 1보다 크고, 전체 비트스트림에 포함된 모든 계층이 하나의 참조 계층을 사용하는 것이 아니면, 상기 현재 픽쳐의 상기 인터 레이어 예측을 위하여 사용될 수 있는 계층 참조 픽쳐의 개수를 특정할 수 있는 계층 참조 픽쳐 개수 정보를 수신하여 파싱하는 단계를 더 포함할 수 있다.

상기 계층 정보는 상기 참조 레이어의 개수와 상기 계층 참조 픽쳐의 개수가 동일하지 않은 경우 수신될 수있다.

상기 계층 참조 픽쳐의 개수는 상기 계층 참조 픽쳐 개수 정보에 1을 더한 값으로 특정될 수 있다.

본 발명의 다른 실시예에 따른 복수의 계층을 지원하는 영상의 복호화 장치는 현재 계층이 상기 비트스트림 전체에서 참조할 수 있는 참조 계층에 대한 계층 의존성 정보를 수신하여 파싱하고, 상기 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는 경우, 상기 참조 계층 중 상기 현재 픽쳐가 참조하는 참조 계층에 대한 계층 정보를 수신하여 파싱하는 파싱부와; 상기 계층 정보에 기초하여 상기 현재 픽쳐의 디코딩을 수행하는 디코딩부를 포함할 수 있다.

본 발명의 일 실시예에 따르면, 하나 이상의 참조 계층을 포함한 참조픽쳐 리스트를 효율적으로 생성 및 관리하여 부호화/복호화 효율을 향상시킬 수 있는 영상의 부호화/복호화 방법 및 이를 이용하는 장치가 제공된다.

본 발명의 일 실시예에 따르면 계층간 예측을 수행할 때, 움직임 예측 및 움직임 보상을 위한 참조 영상 리스트를 생성함에 있어, 한 개 이상의 참조계층을 포함하여 참조픽쳐 리스트를 생성할 수 있는 영상의 부호화/복호화 방법 및 이를 이용하는 장치가 제공된다.

본 발명의 일 실시예는 참조 계층의 복호화 영상을 포함하여 참조픽쳐 리스트 생성 시 참조픽쳐 리스트 내에서의 참조계층들의 복호화 영상의 위치 및 참조계층 복호화 영상간의 순서를 조정할 수 있는 영상의 부호화/복호화 방법 및 이를 이용하는 장치가 제공된다.

도 1은 영상 부호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.

도 2는 영상 복호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.

도 3은 본 발명이 적용될 수 있는, 복수 계층을 이용한 스케일러블 비디오 코딩 구조의 일 실시예를 개략적으로 나타내는 개념도이다.

도 4는 본 발명의 일 실시예에 따라 공간 화질 계층 및 시점 계층을 개략적으로 나타내는 개념도이다

도 5는 본 발명의 일 실시예에 따른 부호화 장치에서 상위 계층의 부호화를 수행하는 방법을 설명하기 위한 제어흐름도이다.

도 6은 본 발명의 일 실시예에 따른 복호화 장치에서 상위 계층의 복호화를 수행하는 방법을 설명하기 위한 제어흐름도이다.

도 7은 본 발명의 일 실시예에 따른 영상 디코딩 장치의 제어 블록도이다.

도 8은 본 발명의 일 실시예에 따른 영상 디코딩 장치의 디코딩 방법을 설명하기 위한 제어 흐름도이다.

이하, 도면을 참조하여 본 발명의 실시 형태에 대하여 구체적으로 설명한다. 본 명세서의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 명세서의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.

어떤 구성 요소가 다른 구성 요소에 “연결되어” 있다거나 “접속되어” 있다고 언급된 때에는, 그 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있으나, 중간에 다른 구성 요소가 존재할 수도 있다고 이해되어야 할 것이다. 아울러, 본 발명에서 특정 구성을 “포함”한다고 기술하는 내용은 해당 구성 이외의 구성을 배제하는 것이 아니며, 추가적인 구성이 본 발명의 실시 또는 본 발명의 기술적 사상의 범위에 포함될 수 있음을 의미한다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.

또한 본 발명의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 포함한 것으로 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있고 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.

또한, 일부의 구성 요소는 본 발명에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 발명은 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 발명의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 발명의 권리범위에 포함된다.

도 1은 영상 부호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다. 스케일러블(scalable) 비디오 부호화/복호화 방법 또는 장치는 스케일러빌리티(scalability)를 제공하지 않는 일반적인 영상 부호화/복호화 방법 또는 장치의 확장(extension)에 의해 구현될 수 있으며, 도 1의 블록도는 스케일러블 비디오 부호화 장치의 기초가 될 수 있는 영상 부호화 장치의 일 실시예를 나타낸다.

도 1을 참조하면, 상기 영상 부호화 장치(100)는 움직임 예측부(111), 움직임 보상부(112), 인트라 예측부(120), 스위치(115), 감산기(125), 변환부(130), 양자화부(140), 엔트로피 부호화부(150), 역양자화부(160), 역변환부(170), 가산기(175), 필터부(180) 및 참조영상 버퍼(190)를 포함한다.

영상 부호화 장치(100)는 입력 영상에 대해 인트라(intra) 모드 또는 인터(inter) 모드로 부호화를 수행하고 비트스트림(bit stream)을 출력할 수 있다. 인트라 예측은 화면 내 예측, 인터 예측은 화면 간 예측을 의미한다. 인트라 모드인 경우 스위치(115)가 인트라로 전환되고, 인터 모드인 경우 스위치(115)가 인터로 전환된다. 영상 부호화 장치(100)는 입력 영상의 입력 블록에 대한 예측 블록을 생성한 후, 입력 블록과 예측 블록의 차분을 부호화할 수 있다.

인트라 모드인 경우, 인트라 예측부(120)는 현재 블록 주변의 이미 부호화된 블록의 화소값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성할 수 있다.

인터 모드인 경우, 움직임 예측부(111)는, 움직임 예측 과정에서 참조 영상 버퍼(190)에 저장되어 있는 참조 영상에서 입력 블록과 가장 매치가 잘 되는 영역을 찾아 움직임 벡터를 구할 수 있다. 움직임 보상부(112)는 움직임 벡터와 참조 영상 버퍼(190)에 저장되어 있는 참조 영상을 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다.

감산기(125)는 입력 블록과 생성된 예측 블록의 차분에 의해 잔여 블록(residual block)을 생성할 수 있다. 변환부(130)는 잔여 블록에 대해 변환(transform)을 수행하여 변환 계수(transform coefficient)를 출력할 수 있다. 그리고 양자화부(140)는 입력된 변환 계수를 양자화 파라미터에 따라 양자화하여 양자화된 계수(quantized coefficient)를 출력할 수 있다.

엔트로피 부호화부(150)는, 양자화부(140)에서 산출된 값들 또는 부호화 과정에서 산출된 부호화 파라미터 값 등을 기초로, 심볼(symbol)을 확률 분포에 따라 엔트로피 부호화하여 비트스트림(bit stream)을 출력할 수 있다. 엔트로피 부호화 방법은 다양한 값을 갖는 심볼을 입력 받아, 통계적 중복성을 제거하면서, 복호 가능한 2진수의 열로 표현하는 방법이다.

여기서, 심볼이란 부호화/복호화 대상 구문 요소(syntax element) 및 부호화 파라미터(coding parameter), 잔여 신호(residual signal)의 값 등을 의미한다. 부호화 파라미터는 부호화 및 복호화에 필요한 매개변수로서, 구문 요소와 같이 부호화 장치에서 부호화되어 복호화 장치로 전달되는 정보뿐만 아니라, 부호화 혹은 복호화 과정에서 유추될 수 있는 정보를 포함할 수 있으며 영상을 부호화하거나 복호화할 때 필요한 정보를 의미한다. 부호화 파라미터는 예를 들어 인트라/인터 예측모드, 이동/움직임 벡터, 참조 영상 색인, 부호화 블록 패턴, 잔여 신호 유무, 변환 계수, 양자화된 변환 계수, 양자화 파라미터, 블록 크기, 블록 분할 정보 등의 값 또는 통계를 포함할 수 있다. 또한 잔여 신호는 원신호와 예측 신호의 차이를 의미할 수 있고, 또한 원신호와 예측 신호의 차이가 변환(transform)된 형태의 신호 또는 원신호와 예측 신호의 차이가 변환되고 양자화된 형태의 신호를 의미할 수도 있다. 잔여 신호는 블록 단위에서는 잔여 블록이라 할 수 있다.

엔트로피 부호화가 적용되는 경우, 높은 발생 확률을 갖는 심볼에 적은 수의 비트가 할당되고 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당되어 심볼이 표현됨으로써, 부호화 대상 심볼들에 대한 비트열의 크기가 감소될 수 있다. 따라서 엔트로피 부호화를 통해서 영상 부호화의 압축 성능이 높아질 수 있다.

엔트로피 부호화를 위해 지수 골룸(exponential golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 부호화 방법이 사용될 수 있다. 예를 들어, 엔트로피 부호화부(150)에는 가변 길이 부호화(VLC: Variable Lenghth Coding/Code) 테이블과 같은 엔트로피 부호화를 수행하기 위한 테이블이 저장될 수 있고, 엔트로피 부호화부(150)는 저장된 가변 길이 부호화(VLC) 테이블을 사용하여 엔트로피 부호화를 수행할 수 있다. 또한 엔트로피 부호화부(150)는 대상 심볼의 이진화(binarization) 방법 및 대상 심볼/빈(bin)의 확률 모델(probability model)을 도출한 후, 도출된 이진화 방법 또는 확률 모델을 사용하여 엔트로피 부호화를 수행할 수도 있다.

양자화된 계수는 역양자화부(160)에서 역양자화되고 역변환부(170)에서 역변환될 수 있다. 역양자화, 역변환된 계수는 가산기(175)를 통해 예측 블록과 더해지고 복원 블록이 생성될 수 있다.

복원 블록은 필터부(180)를 거치고, 필터부(180)는 디블록킹 필터(deblocking filter), SAO(Sample Adaptive Offset), ALF(Adaptive Loop Filter) 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(180)를 거친 복원 블록은 참조 영상 버퍼(190)에 저장될 수 있다.

도 2는 영상 복호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다. 도 1에서 상술한 바와 같이 스케일러블 비디오 부호화/복호화 방법 또는 장치는 스케일러빌리티를 제공하지 않는 일반적인 영상 부호화/복호화 방법 또는 장치의 확장에 의해 구현될 수 있으며, 도 2의 블록도는 스케일러블 비디오 복호화 장치의 기초가 될 수 있는 영상 복호화 장치의 일 실시예를 나타낸다.

도 2를 참조하면, 상기 영상 복호화 장치(200)는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 움직임 보상부(250), 필터부(260) 및 참조 영상 버퍼(270)를 포함한다.

영상 복호화 장치(200)는 부호화 장치에서 출력된 비트스트림을 입력 받아 인트라 모드 또는 인터 모드로 복호화를 수행하고 재구성된 영상, 즉 복원 영상을 출력할 수 있다. 인트라 모드인 경우 스위치가 인트라로 전환되고, 인터 모드인 경우 스위치가 인터로 전환될 수 있다. 영상 복호화 장치(200)는 입력 받은 비트스트림으로부터 복원된 잔여 블록(residual block)을 얻고 예측 블록을 생성한 후 복원된 잔여 블록과 예측 블록을 더하여 재구성된 블록, 즉 복원 블록을 생성할 수 있다.

엔트로피 복호화부(210)는, 입력된 비트스트림을 확률 분포에 따라 엔트로피 복호화하여, 양자화된 계수(quantized coefficient) 형태의 심볼을 포함한 심볼들을 생성할 수 있다. 엔트로피 복호화 방법은 2진수의 열을 입력 받아 각 심볼들을 생성하는 방법이다. 엔트로피 복호화 방법은 상술한 엔트로피 부호화 방법과 유사하다.

양자화된 계수는 역양자화부(220)에서 역양자화되고 역변환부(230)에서 역변환되며, 양자화된 계수가 역양자화/역변환 된 결과, 복원된 잔여 블록(residual block)이 생성될 수 있다.

인트라 모드인 경우, 인트라 예측부(240)는 현재 블록 주변의 이미 부호화된 블록의 화소값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성할 수 있다. 인터 모드인 경우, 움직임 보상부(250)는 움직임 벡터 및 참조 영상 버퍼(270)에 저장되어 있는 참조 영상을 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다.

복원된 잔여 블록과 예측 블록은 가산기(255)를 통해 더해지고, 더해진 블록은 필터부(260)를 거친다. 필터부(260)는 디블록킹 필터, SAO, ALF 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(260)는 재구성된 영상, 즉 복원 영상을 출력한다. 복원 영상은 참조 영상 버퍼(270)에 저장되어 화면 간 예측에 사용될 수 있다.

상기 영상 복호화 장치(200)에 포함되어 있는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 움직임 보상부(250), 필터부(260) 및 참조 영상 버퍼(270) 중 영상의 복호화에 직접적으로 관련된 구성요소들, 예컨대, 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 움직임 보상부(250), 필터부(260) 등을 다른 구성요소와 구분하여 복호화부 또는 디코딩부로 표현할 수 있다.

또한, 영상 복호화 장치(200)는 비트스트림에 포함되어 있는 인코딩된 영상에 관련된 정보를 파싱하는 도시하지 않은 파싱부를 더 포함할 수 있다. 파싱부는 엔트로피 복호화부(210)를 포함할 수도 있고, 엔트로피 복호화부(210)에 포함될 수도 있다. 이러한 파싱부는 또한 디코딩부의 하나의 구성요소로 구현될 수도 있다.

도 3은 본 발명이 적용될 수 있는, 복수 계층을 이용한 스케일러블 비디오 코딩 구조의 일 실시예를 개략적으로 나타내는 개념도이다. 도 3에서 GOP(Group of Picture)는 픽쳐군 즉, 픽쳐의 그룹을 나타낸다.

영상 데이터를 전송하기 위해서는 전송 매체가 필요하며, 그 성능은 다양한 네트워크 환경에 따라 전송 매체별로 차이가 있다. 이러한 다양한 전송 매체 또는 네트워크 환경에의 적용을 위해 스케일러블 비디오 코딩 방법이 제공될 수 있다.

스케일러블 비디오 코딩 방법은 계층(layer) 간의 텍스쳐 정보, 움직임 정보, 잔여 신호 등을 활용하여 계층간 중복성을 제거하여 부호화/복호화 성능을 높이는 코딩 방법이다. 스케일러블 비디오 코딩 방법은, 전송 비트율, 전송 에러율, 시스템 자원 등의 주변 조건에 따라, 공간적, 시간적, 화질적 관점에서 다양한 스케일러빌리티를 제공할 수 있다.

스케일러블 비디오 코딩은, 다양한 네트워크 상황에 적용 가능한 비트스트림을 제공할 수 있도록, 복수 계층(multiple layers) 구조를 사용하여 수행될 수 있다. 예를 들어 스케일러블 비디오 코딩 구조는, 일반적인 영상 부호화 방법을 이용하여 영상 데이터를 압축하여 처리하는 기본 계층을 포함할 수 있고, 기본 계층의 부호화 정보 및 일반적인 영상 부호화 방법을 함께 사용하여 영상 데이터를 압축 처리하는 향상 계층을 포함할 수 있다.

여기서, 계층(layer)은 공간(spatial, 예를 들어, 영상 크기), 시간(temporal, 예를 들어, 부호화 순서, 영상 출력 순서, 프레임 레이트), 화질, 복잡도 등을 기준으로 구분되는 영상 및 비트스트림(bitstream)의 집합을 의미한다. 또한 기본 계층은 하위 계층, 참조 계층 또는 Base layer, 향상 계층은 상위 계층, Enhancement layer를 의미할 수 있다. 또한 복수의 계층들은 서로 간에 종속성을 가질 수도 있다.

도 3을 참조하면, 예를 들어 기본 계층은 SD(standard definition), 15Hz의 프레임율, 1Mbps 비트율로 정의될 수 있고, 제1 향상 계층은 HD(high definition), 30Hz의 프레임율, 3.9Mbps 비트율로 정의될 수 있으며, 제2 향상 계층은 4K-UHE(ultra high definition), 60Hz의 프레임율, 27.2Mbps 비트율로 정의될 수 있다. 상기 포맷(format), 프레임율, 비트율 등은 하나의 실시예로서, 필요에 따라 달리 정해질 수 있다. 또한 사용되는 계층의 수도 본 실시예에 한정되지 않고 상황에 따라 달리 정해질 수 있다.

예를 들어, 전송 대역폭이 4Mbps라면 상기 제1향상계층 HD의 프레임 레이트를 줄여서 15Hz이하로 전송할 수 있다. 스케일러블 비디오 코딩 방법은 상기 도 3의 실시예에서 상술한 방법에 의해 시간적, 공간적, 화질적 스케일러빌리티를 제공할 수 있다.

비트스트림 내 복수의 계층을 지원하는 비디오의 부호화 및 복호화, 즉 스케일러블 코딩(scalable coding)의 경우, 복수의 계층간에는 강한 연관성(correlation)이 존재하기 때문에 이런 연관성을 이용하여 예측을 수행하면 데이터의 중복 요소를 제거할 수 있고 영상의 부호화 성능을 향상시킬 수 있다. 다른 계층의 정보를 이용하여 예측의 대상이 되는 현재 레이어의 예측을 수행하는 것을 이하에서는 계층간 예측(inter-layer prediction)이라고 표현한다. 스케일러블 비디오 코딩은 이하 부호화 관점에서는 스케일러블 비디오 부호화, 복호화 관점에서는 스케일러블 비디오 복호화와 동일한 의미를 가진다.

복수의 계층들은 해상도, 프레임 레이트, 컬러 포맷 중 적어도 하나가 서로 다를 수 있으며, 계층간 예측 시 해상도의 조절을 위하여 레이어의 업샘플링 또는 다운샘플링이 수행될 수 있다.

도 4는 본 발명의 일 실시예에 따라 공간 화질 계층 및 시점 계층을 개략적으로 나타내는 개념도이다.

도시된 바와 같이, 비트스트림은 복수의 계층을 포함할 수 있다.

비트스트림은 공간(spatial) 및 화질(quality)은 동일하지만 상이한 시점(view)에 대한 복수의 시점 계층(시점 1, 시점 2, 시점 3)을 포함할 수 있다.

또한, 비트스트림은 시점은 동일하지만 공간 및 화질이 상이한 계층으로 구성될 수도 있다. 공간 화질 계층은 SD 급 계층과 HD 급 계층으로 분류될 수 있으며, SD 급 계층과 HD 급 계층은 또 다시 기본 계층과 향상 계층으로 구성될 수 있다.

도시된 바와 같이 공간, 화질 및 시점이 혼재되어 있는 계층을 식별하기 위하여 각 계층은 식별자(layer_id)로 서로 구분할 수 있다. 각 식별자가 어떠한 계층(예컨대, 시점 계층, 공간 및 화질 계층)인지, 계층 내에서 상위 계층인지 하위 계층인지에 대한 정보는 VPS(video parameter set) 또는 SPS(sequence parameter set), NAL 유닛 헤더(nal unit header) 등에 포함되어 시그널링 될 수 있다.

상술한 바와 같이, 계층간의 연관성을 이용하여 계층간 예측을 수행하는 경우, 적어도 하나 이상의 하위 계층을 참조하여 상위 계층을 예측하게 된다. 이하, 설명의 편의를 위하여 예측이 수행되는 계층을 대상 계층이라고 명명하고, 대상 계층의 예측에 이용되는 또는 참조되는 계층을 참조 계층이라고 표현한다.

본 발명은 동일한 슬라이드내의 블록들을 부호화하는 경우에 한 개 이상의 참조 계층을 이용하여 부호화함에 있어서 공간, 화질, 시점 스케일러빌리티의 부호화 효율을 고려한 효율적인 참조 계층 리스트 생성 및 관리를 위한 발명이다.

통상적으로 화면간 예측은 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나를 참조 픽쳐로 하고, 참조 픽쳐를 기반으로 현재 블록에 대한 예측을 수행할 수 있다. 현재 블록의 예측에 이용되는 영상을 참조 픽쳐(reference picture) 또는 참조 프레임(reference frame)이라고 한다.

참조 픽쳐 내의 영역은 참조 픽쳐를 지시하는 참조 픽쳐 인덱스(refIdx) 및 움직임 벡터(motion vector) 등을 이용하여 나타낼 수 있다.

화면간 예측은 참조 픽쳐 및 참조 픽쳐 내에서 현재 블록에 대응하는 참조 블록을 선택해서, 현재 블록에 대한 예측 블록을 생성할 수 있다.

화면 간 예측에서 부호화 장치 및 복호화 장치는 현재 블록의 움직임 정보를 도출한 후, 도출된 움직임 정보에 기반하여 화면 간 예측 및/또는 움직임 보상을 수행할 수 있다. 이 때, 부호화 장치 및 복호화 장치는 복원된 주변 블록(neighboring block) 및/또는 이미 복원된 콜(col) 픽쳐(collocated picture) 내에서 현재 블록에 대응되는 콜(col) 블록(collocated block)의 움직임 정보를 이용함으로써, 부호화/복호화 효율을 향상시킬 수 있다.

여기서, 복원된 주변 블록은 이미 부호화 및/또는 복호화되어 복원된 현재 픽쳐 내의 블록으로서, 현재 블록에 인접한 블록 및/또는 현재 블록의 외부 코너에 위치한 블록을 포함할 수 있다. 또한 부호화 장치 및 복호화 장치는, 콜 픽쳐 내에서 현재 블록과 공간적으로 대응되는 위치에 존재하는 블록을 기준으로 소정의 상대적인 위치를 결정할 수 있고, 상기 결정된 소정의 상대적인 위치(상기 현재 블록과 공간적으로 대응되는 위치에 존재하는 블록의 내부 및/또는 외부의 위치)를 기반으로 상기 콜 블록을 도출할 수 있다. 여기서, 일례로 콜 픽쳐는 참조 픽쳐 리스트에 포함된 참조 픽쳐 중에서 하나의 픽쳐에 해당될 수 있다.

화면간 예측은 현재 블록과의 레지듀얼(residual) 신호가 최소화되며 움직임 벡터 크기 역시 최소가 되도록 예측 블록을 생성할 수 있다.

한편, 움직임 정보 도출 방식은 현재 블록의 예측 모드에 따라 달라질 수 있다. 인터 예측을 위해 적용되는 예측 모드에는 AMVP(Advanced Motion Vector Predictor), 머지(merge) 등이 있을 수 있다.

일례로, AMVP(Advanced Motion Vector Predictor)가 적용되는 경우, 부호화 장치 및 복호화 장치는 복원된 주변 블록의 움직임 벡터 및/또는 콜 블록의 움직임 벡터를 이용하여, 예측 움직임 벡터 후보 리스트를 생성할 수 있다. 즉, 복원된 주변 블록의 움직임 벡터 및/또는 콜 블록의 움직임 벡터는 예측 움직임 벡터 후보로 사용될 수 있다. 부호화 장치는 상기 리스트에 포함된 예측 움직임 벡터 후보 중에서 선택된 최적의 예측 움직임 벡터를 지시하는 예측 움직임 벡터 인덱스를 복호화 장치로 전송할 수 있다. 이 때, 복호화 장치는 상기 예측 움직임 벡터 인덱스를 이용하여, 예측 움직임 벡터 후보 리스트에 포함된 예측 움직임 벡터 후보 중에서, 현재 블록의 예측 움직임 벡터를 선택할 수 있다.

부호화 장치는 현재 블록의 움직임 벡터와 예측 움직임 벡터 간의 움직임 벡터 차분(MVD: Motion Vector Difference)을 구할 수 있고, 이를 부호화하여 복호화 장치로 전송할 수 있다. 이 때, 복호화 장치는 수신된 움직임 벡터 차분을 복호화할 수 있고, 복호화된 움직임 벡터 차분과 예측 움직임 벡터의 합을 통해 현재 블록의 움직임 벡터를 도출할 수 있다.

부호화 장치는 또한 참조 픽쳐를 지시하는 참조 픽쳐 인덱스 등을 복호화 장치에 전송할 수 있다.

복호화 장치는 주변 블록의 움직임 정보들을 이용하여 현재 블록의 움직임 벡터를 예측하고, 부호화 장치로부터 수신한 레지듀얼을 이용하여 현재 블록에 대한 움직임 벡터를 유도할 수 있다. 복호화 장치는 유도한 움직임 벡터와 부호화 장치로부터 수신한 참조 픽쳐 인덱스 정보를 기반으로 현재 블록에 대한 예측 블록을 생성할 수 있다.

다른 예로, 머지(merge)가 적용되는 경우, 부호화 장치 및 복호화 장치는 복원된 주변 블록의 움직임 정보 및/또는 콜 블록의 움직임 정보를 이용하여, 머지 후보 리스트를 생성할 수 있다. 즉, 부호화 장치 및 복호화 장치는 복원된 주변 블록 및/또는 콜 블록의 움직임 정보가 존재하는 경우, 이를 현재 블록에 대한 머지 후보로 사용할 수 있다.

부호화 장치는 머지 후보 리스트에 포함된 머지 후보 중에서 최적의 부호화 효율을 제공할 수 있는 머지 후보를 현재 블록에 대한 움직임 정보로 선택할 수 있다. 이 때, 상기 선택된 머지 후보를 지시하는 머지 인덱스가 비트스트림에 포함되어 복호화 장치로 전송될 수 있다. 복호화 장치는 상기 전송된 머지 인덱스를 이용하여, 머지 후보 리스트에 포함된 머지 후보 중에서 하나를 선택할 수 있으며, 상기 선택된 머지 후보를 현재 블록의 움직임 정보로 결정할 수 있다. 따라서, 머지 모드가 적용되는 경우, 복원된 주변 블록 및/또는 콜 블록의 움직임 정보가 현재 블록의 움직임 정보로 그대로 사용될 수 있다. 복호화 장치는 예측 블록과 부호화 장치로부터 전송되는 레 지듀얼을 더하여 현재 블록을 복원할 수 있다.

상술한 AMVP 및 머지 모드에서는, 현재 블록의 움직임 정보를 도출하기 위해, 복원된 주변 블록의 움직임 정보 및/또는 콜 블록의 움직임 정보가 사용될 수 있다.

화면 간 예측에 이용되는 다른 모드 중 하나 인 스킵 모드의 경우에, 주변 블록의 정보를 그대로 현재 블록에 이용할 수 있다. 따라서 스킵 모드의 경우에, 부호화 장치는 현재 블록의 움직임 정보로서 어떤 블록의 움직임 정보를 이용할 것인지를 지시하는 정보 외에 레지듀얼 등과 같은 신택스 정보를 복호화 장치에 전송하지 않는다.

부호화 장치 및 복호화 장치는 상기 도출된 움직임 정보에 기반하여 현재 블록에 대한 움직임 보상을 수행함으로써, 현재 블록의 예측 블록을 생성할 수 있다. 여기서, 예측 블록은 현재 블록에 대한 움직임 보상 수행 결과 생성된, 움직임 보상된 블록을 의미할 수 있다. 또한, 복수의 움직임 보상된 블록은 하나의 움직임 보상된 영상을 구성할 수 있다.

복호화 장치는 현재 블록의 인터 예측에 필요한 움직임 정보, 예컨대 움직임 벡터, 참조 픽쳐 인덱스 등에 관한 정보를 부호화 장치로부터 수신한 스킵 플래그, 머지 플래그 등을 확인하고 이에 대응하여 유도할 수 있다.

예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 서로 다를 수 있다. 예컨대, 예측 블록 단위로 예측모드가 정해져서 변환 블록 단위로 예측이 수행될 수도 있고, 예측 블록 단위로 예측 모드가 정해지고 변환 블록 단위로 화면 내 예측이 수행될 수 도 있다.

이하에서는 도 5를 참조하여 적어도 한가지 이상의 스케일러빌리티 (예를 들어, 공간, 화질, 시점 스케일러빌리티)를 지원하며 다 계층 구조를 사용하는 비디오 부호화 방법에 있어서 상위 계층의 부호화를 수행하는 방법, 보다 구체적으로 대상 영상이 참조할 수 있는 참조 계층 리스트를 구성하는 방법에 대하여 살펴본다.

우선, 부호화 장치는 현재 부호화 대상 영상이 참조할 수 있는 계층의 리스트를 구성한다(S510).

부호화 장치는 현재 부호화 대상 계층의 하위계층들 가운데 현재 부호화 대상 계층이 부호화 시 동일 시점 내에서 참조할 수 있는 적어도 한 개 이상의 계층들을 포함하는 참조 계층 리스트를 구성할 수 있다. 참조 계층 리스트는 하기 설명된 방법 중 적어도 하나에 따라 구성될 수 있다.

첫 번째 실시예에 따르면, 부호화 장치는 전체 비트스트림에서 현재 부호화 대상 계층과 동일한 계층들이 참조할 수 있는 참조 계층 리스트를 구성할 수 있다.

부호화 장치는 대상 계층과 동일한 계층들이 참조 가능한 참조 계층들을 임의의 순서로 구성하여 참조 계층 리스트를 생성할 수 있다.

또는 참조 계층들 가운데 layer_id 값이 대상 계층의 layer_id 값과 차이가 적은 계층 (즉, 가까운 계층)부터 차이가 큰 계층 순서로 구성될 수 있다.

또는 현재 부호화 대상 계층의 참조 계층 리스트는 참조 계층들 가운데 우선 순위(priority)가 높은 계층부터 낮은 계층의 순서로 구성될 수 있다.

우선 순위와 관련된 정보는 NAL 유닛 헤더(NALU header) 혹은 비디오 파라미터 세트(video parameter set) 등에 포함되어 시그널링될 수 있다.

또는 현재 부호화 대상 계층과 동일 시점을 가지는 계층에 대해서는 현재 부호화 대상 계층과 공간 해상도 차이가 작은 계층부터 큰 계층 순으로 참조계층 리스트가 구성될 수 있다. 이때, 동일한 공간 해상도에서의 화질 참조 계층 순서는 현재 부호화 대상 계층의 layer_id 값과 차이가 작은 계층(즉, 가까운 계층)부터 큰 계층 순서일 수 있다.

추가적으로, 현재 부호화 대상 계층의 시점과 가까운 시점부터 먼 시점순으로 계층들을 참조계층 리스트에 포함시킬 수 있다. 동일한 시점 내의 계층들을 참조계층 리스트에 포함시키는 순서는 상술한 현재 부호화 대상 계층과 동일한 시점을 갖는 계층들과 동일한 방식을 적용할 수 있다.

예를 들어, 도 4와 같은 비트스트림 구조에서 layer_id 가 n인 계층의 참조 계층 리스트는 layer_id 가 n-1, n-2, n-3, n-4, n-5, n-6, n-7, n-8, n-9, n-10, n-11인 계층의 순서로 구성될 수 있다.

또는 현재 부호화 대상 계층과 동일 시점의 참조 계층을 포함하는 참조 계층 리스트는 현재 부호화 대상 계층과 공간 해상도 차이가 작은 계층부터 큰 계층 순으로 구성될 수 있다. 이때, 동일한 공간 해상도에서의 화질 참조 계층 순서는 부호화하고자 하는 양자화 파라미터(quantization parameter)값이 낮은 값에서 높은 값의 순서(즉, 복호시 화질이 좋은 계층부터 낮은 계층순서) 일 수 있다.

대상 계층이 참조하는 참조 계층에 대하여는 비트스트림 내 시그널링되는layer_id을 이용하여 기술될 수 있다. 참조 계층을 기술하고 있는 비디오 파라미터 세트(video parameter set)에 대한 예는 표 1 및 표 2와 같다.

표 1

표 1을 참조하면, num_direct_ref_layers[i]는 i번째 계층 (즉, nuh_layer_id[i]의 layer_id를 가지는 계층)이 직접적으로 참조하는 참조 계층의 수를 나타낸다.

ref_layer_id[i][j]는 i번째 계층이 참조하는 j번째 참조 계층의 layer_id를 나타낸다. 즉, ref_layer_id[i][j]는 layer_id가 nuh_layer_id[i]인 계층이 layer_id가 nuh_layer_id[j]인 계층을 참조하는 것을 의미한다.

표 2

표 2를 참조하면, direct_dependency_flag[i][j]이 1이면, i번째 계층 (즉, nuh_layer_id[i]의 layer_id를 가지는 계층)이 j번째 참조 계층(즉, nuh_layer_id[j]의 layer_id를 가지는 계층)을 직접적으로 참조하는 것을 나타낸다.

max_one_active_ref_layer_flag이 1이면, 전체 비트스트림에서 각 영상(picture), 즉 i번째 계층의 계층간 예측을 위해 최대 한 개의 영상이 사용되는 것을 나타낸다. max_one_active_ref_layer_flag가 0이면, 비트스트림내의 특정 영상 즉, i번째 계층의 계층간 예측을 위하여 한 개보다 많은 영상이 사용될 수도 있음을 나타낼 수 있다. 또는 혹은 max_one_active_ref_layer_flag가 0인 경우는 i번째 계층이 계층간 예측을 사용하지 않음을 나타낼 수도 있다.

한편, max_one_active_ref_layer_flag는 각 계층 마다 시그널링 될 수도 있고, 전체 비트스트림에서 한 번만 시그널링될 수도 있다.

max_one_active_ref_layer_flag이 전체 비트스트림에서 한 번 시그널링될 때, 모든 계층들이 하나의 참조 계층만을 참조할 때 max_one_active_ref_layer_flag 의 값은 1이 될 수 있다. 따라서, max_one_active_ref_layer_flag 값이 0이더라도 특정 계층의 참조 계층의 개수를 나타내는 slice_numdirect_ref_layers 값이 ‘1’이 될 수 있다.

참조계층 리스트를 구성하는 두 번째 실시예에 따르면, 부호화 장치는 현재 부호화하고자 하는 대상 영상이 참조 가능한 참조 계층 리스트를 구성할 수 있다. 이는 현재 부호화하고자 하는 영상의 현재 부호화 대상 계층이 참조할 수 있는 참조계층 리스트를 구성하는 것으로, 하기의 방법 가운데 하나로 구성할 수 있다.

부호화 장치는 참조 계층들을 임의의 순서로 구성하여 현재 부호화 대상 영상이 참조할 수 있는 참조 계층 리스트를 생성할 수 있다.

또는 부호화 장치는 참조 계층들 가운데 layer_id 값이 부호화 대상 계층의 layer_id 값과 차이가 적은 계층 (즉, 가까운 계층)부터 큰 계층 순서로 구성하여 참조 계층 리스트를 생성할 수 있다.

또는 참조 계층 리스트는 대상 계층과 동일 시점을 갖는 참조 계층들 가운데 우선 순위(priority)가 높은 계층부터 낮은 계층의 순서로 구성될 수 있다.

이때, 우선 순위와 관련된 정보는 NAL 유닛 헤더(NALU header) 혹은 비디오 파라미터 세트(video parameter set) 등에 포함되어 시그널링될 수 있다.

또는 현재 부호화 대상 계층과 동일 시점의 계층들로 구성될 수 있는 참조 계층 리스트는 현재 부호화 대상 계층과 공간 해상도 차이가 적은 계층부터 큰 계층 순으로 구성될 수 있다. 이때, 동일한 공간 해상도를 갖는 참조 계층의 순서는 현재 부호화 대상 계층의 layer_id 값과 차이가 작은 계층(즉, 가까운 계층)부터 큰 계층 순서일 수 있다.

또는 현재 부호화 대상 계층과 동일 시점을 갖는 계층들로 구성되는 참조 계층 리스트는 참조 계층들 가운데 현재 부호화 대상 계층과 공간 해상도 차이가 작은 계층부터 큰 계층 순으로 구성될 수 있다. 이때, 동일한 공간 해상도에서의 화질 참조 계층 순서는 부호화하고자 하는 양자화 파라미터(quantization parameter)값이 낮은 값에서 높은 값의 순서(즉, 복호시 화질이 좋은 계층부터 낮은 계층순서) 일 수 있다.

현재 부호화 대상 계층의 해당 슬라이스가 부호화시 참조할 수 있는 참조 계층은 다양한 방법을 통하여 기술될 수 있다. 이하, 표 3 내지 표 24를 참조하여 슬라이스 헤더(slice header0에서 참조 계층들을 기술하여 시그널링 하는 것을 설명한다.

표 3부터 표 11에 대응하는 실시예에 따르면, 슬라이스 헤더는 비디오 파라미터 세트에서 시그널링 되는 전체 비트스트림에서 현재 부호화 대상 계층과 동일한 계층들이 참조할 수 있는 참조계층들의 서브 세트(sub-set) 가운데 현재 부호화하고자 하는 해당 슬라이스가 참조할 수 있는 계층들의 정보를 포함하고 있다.

이 때, 현재 부호화하고자 하는 해당 슬라이스가 계층간 예측을 사용하여 부호화되는 경우에만, 표 3부터 표 10의 신택스 중 어느 하나가 적용될 수도 있다.

표 3

표 3을 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 갖는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다.

ref_layer_id[j]는 해당 영상이 직접적으로 참조하는 j번째 참조계층의 layer_id를 나타낸다.

표 4

표 4를 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 갖는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다.

ref_layer_id_delta[j]는 해당 영상이 직접적으로 참조하는 j번째 참조계층의 layer_id와 j-1번째 참조계층의 layer_id의 차이를 나타낸다. 이때, 레이어 id의 차이값이 “0”에 가까울수록 현재 영상은현재 영상이 해당하는 계층과 가까운 layer_id를 갖는 참조 계층을 참조하는 것을 의미한다. 이 때, ref_layer_id_delta[0]은 0번째 참조계층의 layer_id와 현재 영상이 속하는 계층의 layer_id와의 차이를 나타낸다.

표 5

표 5를 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다.

ref_layer_idx_delta[j]: 해당 영상이 직접적으로 참조하는 j번째 참조계층의 인덱스(비디오 파라미터 세트에서 기술된 인덱스 기준)와 j-1번째 참조계층의 인덱스(비디오 파라미터 세트에서 기술된 인덱스 기준)의 차이를 나타낸다. 이때, ref_layer_idx_delta[0]는 0번째 참조계층의 인덱스를 나타낸다.

표 6

표 6을 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다.

ref_layer_idx[j]은 해당 영상이 직접적으로 참조하는 j번째 참조 계층의 인덱스(비디오 파라미터 세트에서 기술된 인덱스 기준)를 나타낸다.

표 7

표 7을 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id )를 가지는 계층들이 참조하는 참조계층의 수 (즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다. slice_num_direct_ref_layers 가 “0”인 경우는 비디오 파라미터 세트에서 시그널링 되는 해당 영상과 동일한 계층에 해당하는 참조계층을 현재 영상의 참조계층으로 사용할 수 있다는 것을 의미한다.

ref_layer_id [j]는 해당 영상이 직접적으로 참조하는 j번째 참조계층의 layer_id를 나타낸다.

표 8

표 8을 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수 (즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다. slice_num_direct_ref_layers 가 “0”인 경우는 비디오 파라미터 세트에서 시그널링 되는 해당 영상과 동일한 계층에 해당하는 참조계층을 현재 영상의 참조계층으로 사용할 수 있다는 것을 나타낸다.

ref_layer_id_delta[j]는 해당 영상이 직접적으로 참조하는 j번째 참조계층의 layer_id와 j-1번째 참조계층의 layer_id의 차이를 나타낸다. 이때, 레이어 id의 차이값이 “0”에 가까울수록 현재 영상은현재 영상이 해당하는 계층과 가까운 layer_id를 갖는 참조 계층을 참조하는 것을 의미한다. ref_layer_id_delta[0]는 0번째 참조계층의 layer_id와 현재 영상이 해당하는 계층의 layer_id와의 차이를 나타낸다.

표 9

표 9를 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다.

slice_num_direct_ref_layers 가 “0”인 경우, 비디오 파라미터 세트에서 시그널링 되는 해당 영상과 동일한 계층에 해당하는 참조계층을 현재 영상의 참조계층으로 사용할 수 있다는 것을 나타낸다.

ref_layer_idx_delta[j]는 해당 영상이 직접적으로 참조하는 j번째 참조계층의 인덱스(비디오 파라미터 세트에 기술된 인덱스 기준)와 j-1번째 참조계층의 인덱스(비디오 파라미터 세트에 기술된 인덱스 기준)의 차이를 나타낸다. ref_layer_idx_delta[0]는 0번째 참조계층의 인덱스를 나타낸다.

표 10

표 10을 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다.

slice_num_direct_ref_layers 가 “0”인 경우는 비디오 파라미터 세트에서 시그널링 되는 해당 영상과 동일한 계층에 해당하는 참조계층을 현재 영상의 참조계층으로 사용할 수 있다는 것을 의미한다.

ref_layer_idx[j]는 해당 영상이 직접적으로 참조하는 j번째 참조계층의 인덱스(비디오 파라미터 세트에 기술된 인덱스 기준)를 나타낸다.

표 11부터 표 14에 대응하는 실시예에 따르면, 비디오 파라미터 세트에서 시그널링 되는 현재 부호화 대상계층과 동일한 계층들이 참조할 수 있는 참조계층들을 현재 부호화하고자 하는 해당 슬라이스에서 동일하게 사용하는지 여부를 알려주는 플래그, 예컨대, layer_dependency_vps_flag를 슬라이스 헤더에 시그널링한다.

플래그가 "1"인 경우에는 비디오 파라미터 세트에서 시그널링되는 참조계층 정보가 사용되고, 플래그가 "0"인 경우에는 슬라이스 헤더에서 기술되는 참조계층들의 정보가 사용될 수 있다.

이 때, 현재 부호화하고자 하는 해당 슬라이스 혹은 픽쳐가 계층간 예측을 사용하여 부호화하는 경우에만, 표 11부터 표 14의 신택스 중 어느 하나가 적용될 수도 있다.

표 11

표 11을 참조하면, layer_dependency_vps_flag는 참조계층 정보를 슬라이스 헤더 또는 슬라이스 세그먼트 헤더(slice segment header)에서 시그널링 하는지 여부를 나타낸다. layer_dependency_vps_flag가 “0”인 경우 슬라이스 세그먼트 헤더에서 참조계층 정보를 시그널링 한다. layer_dependency_vps_flag가 “1”인 경우는 슬라이스 세그먼트 헤더에서 참조계층 정보를 시그널링 하지 않고 비디오 파라미터 세트 확장(VPS extension)에서 시그널링된 참조계층 정보를 해당 영상의 참조계층 정보로 사용할 수 있다.

slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다.

표 12

표 12를 참조하면, layer_dependency_vps_flag는 참조계층 정보를 슬라이스 헤더 또는 슬라이스 세그먼트 헤더에서 시그널링 하는지 여부를 나타낸다. layer_dependency_vps_flag가 “0”인 경우 슬라이스 세그먼트 헤더에서 참조계층 정보를 시그널링 한다. layer_dependency_vps_flag가 “1”인 경우는 슬라이스 세그먼트 헤더에서 참조계층 정보를 시그널링 하지 않고 비디오 파라미터 세트 확장(VPS extension)에서 시그널링된 참조계층 정보를 해당 영상의 참조계층 정보로 사용할 수 있다.

ref_layer_id_delta[j]는 해당 영상이 직접적으로 참조하는 j번째 참조계층의 layer_id와 j-1번째 참조계층의 layer_id의 차이를 나타낸다. ref_layer_id_delta[0]는 ref_layer_id[0]와 현재 영상의 layer_id와의 차이를 나타낸다.

표 13

표 13을 참조하면, layer_dependency_vps_flag는 참조계층 정보를 슬라이스 헤더 또는 슬라이스 세그먼트 헤더에서 시그널링 하는지 여부를 나타낸다. layer_dependency_vps_flag가 “0”인 경우 슬라이스 세그먼트 헤더에서 참조계층 정보를 시그널링 한다. layer_dependency_vps_flag가 “1”인 경우는 슬라이스 세그먼트 헤더에서 참조계층 정보를 시그널링 하지 않고 비디오 파라미터 세트 확장(VPS extension)에서 시그널링된 참조계층 정보를 해당 영상의 참조계층 정보로 사용할 수 있다.

표 14

표 14를 참조하면, layer_dependency_vps_flag는 참조계층 정보를 슬라이스 헤더 또는 슬라이스 세그먼트 헤더에서 시그널링 하는지 여부를 나타낸다. layer_dependency_vps_flag가 “0”인 경우 슬라이스 세그먼트 헤더에서 참조계층 정보를 시그널링 한다. layer_dependency_vps_flag가 “1”인 경우는 슬라이스 세그먼트 헤더에서 참조계층 정보를 시그널링 하지 않고 비디오 파라미터 세트 확장(VPS extension)에서 시그널링된 참조계층 정보를 해당 영상의 참조계층 정보로 사용할 수 있다.

ref_layer_idx [j]는 해당 영상이 직접적으로 참조하는 j번째 참조계층의 인덱스(비디오 파라미터 세트에 기술된 인덱스 기준)를 나타낸다.

표 15부터 표 18에 대응하는 실시예에 따르면, 현재 부호화하고자 하는 해당 슬라이스의 참조계층 수가 슬라이스 헤더에 포함되어 시그널링 (예를 들어, slice_num_direct_ref_layers)될 수 있다. 이 때, 참조계층들은 시그널링된 참조계층 수가 비디오 파라미터 세트에서 시그널링되는 현재 부호화 대상 계층과 동일한 계층들이 참조할 수 있는 참조계층 수(예를들어, NumDirectRefLayers[nuh_layer_id])와 동일하지 않은 경우에만 시그널링된다.

이 때, 현재 부호화하고자 하는 해당 슬라이스가 계층간 예측을 사용하여 부호화하는 경우에만, 표 15부터 표 18의 신택스 중 어느 하나가 적용될 수도 있다.

표 15

표 15를 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다. NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일한 경우에는 VPS extension에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용하며, NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일하지 않은 경우에는 슬라이스 세크먼트 헤더에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용한다.

표 16

표 16을 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다. NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일한 경우에는 VPS extension에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용하며, NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일하지 않은 경우에는 슬라이스 세크먼트 헤더에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용한다.

표 17

표 17을 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다. NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일한 경우에는 VPS extension에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용하며, NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일하지 않은 경우에는 슬라이스 세크먼트 헤더에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용한다.

표 18

표 18을 참조하면, slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다. NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일한 경우에는 VPS extension에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용하며, NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일하지 않은 경우에는 슬라이스 세크먼트 헤더에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용한다.

본 발명의 또 다른 실시예에 따르면, 현재 부호화하고자 하는 해당 슬라이스가 계층간 예측을 사용하여 부호화하는 경우에 대하여 표 19부터 표 24에 도시되어 있는 신호들이 시그널링 될 수 있다.

표 2에서와 같이 비디오 파라미터 세트에서 현재 부호화 대상 계층과 동일한 계층들이 참조할 수 있는 참조계층의 수가 최대 한 개인지 여부를 알려주는 플래그 (예를 들어, max_one_active_ref_layer_flag)가 시그널링되고, 해당 플래그가 "0"일 때 표 19 내지 표 24가 적용될 수 있다. 즉, 표 19 내지 표 24를 참조하여, 현재 부호화 대상 계층과 동일한 계층들이 두 개 이상의 참조계층을 가지는 경우, 현재 부호화하고자 하는 해당 슬라이스의 참조계층 수를 시그널링(예를 들어, slice_num_direct_ref_layers)하는 실시예에 대하여 기술된다.

구체적으로, 표 19, 표 21, 표 23은 비디오 파라미터 세트에서 시그널링되는 참조계층들을 해당 슬라이스에서 동일하게 사용하는지 여부를 알려주는 플래그(예를 들어, layer_dependency_vps_flag)가 슬라이스 헤더에서 시그널링되고, 해당 플래그가 "1"인 경우에는 비디오 파라미터 세트에서 시그널링되는 참조계층 정보가 사용되고, 플래그가 "0"인 경우에는 슬라이스 헤더에서 참조계층들을 기술하여 시그널링한다.

표 20, 표 22, 표 24에 따른 실시예는, 현재 부호화하고자 하는 해당 슬라이스의 참조계층 수(예를 들어, slice_num_direct_ref_layers)가 비디오 파라미터 세트에서 시그널링되는 현재 부호화 대상계층과 동일한 계층들이 참조할 수 있는 참조계층 수와 동일하지 않은 경우에만 참조계층들을 시그널링한다.

표 19

표 19를 참조하면, inter_layer_pred_enabled_flag가 “1”이면, 해당 영상이 계층간 예측을 사용함을 나타내며, inter_layer_pred_enabled_flag가 “0”이면 계층간 예측을 사용하지 않음을 나타낸다.

layer_dependency_vps_flag는 참조계층 정보를 슬라이스 헤더(슬라이스 세그먼트 헤더)에서 시그널링 하는지 여부를 나타낸다. layer_dependency_vps_flag가 “0”인 경우 참조계층 정보를 슬라이스 헤더에서 시그널링 하는 것을 나타내고, layer_dependency_vps_flag가 “1”인 경우는 슬라이스 세그먼트 헤더에서 참조계층 정보를 시그널링 하지 않고 VPS extension에서 시그널링된 참조계층 정보를 해당 영상의 참조계층 정보로 사용하는 것을 나타낸다.

slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다. max_one_active_ref_layer_flag가 “1”인 경우는 NumActiveRefLayerPics = 1 (NumActiveRefLayerPics = slice_num_driect_ref_layers)이 되므로, slice_num_direct_ref_layers은 시그널링 되지 않는다.

ref_layer_idx [i]은 해당 영상이 직접적으로 참조하는 i번째 참조계층의 인덱스(비디오 파라미터 세트에 기술된 인덱스 기준)를 나타낸다.

표 20

표 20을 참조하면, inter_layer_pred_enabled_flag가 “1”이면, 해당 영상이 계층간 예측을 사용함을 나타내며, inter_layer_pred_enabled_flag가 “0”이면 계층간 예측을 사용하지 않음을 나타낸다.

slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타낸다. slice_num_direct_ref_layers로 특정되는 참조 계층의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다. NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일한 경우에는 VPS extension에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용하고, NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일하지 않은 경우에는 슬라이스 세그먼트 헤더에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용한다.

ref_layer_idx [i]는 해당 영상이 직접적으로 참조하는 i번째 참조계층의 인덱스(비디오 파라미터 세트에 기술된 인덱스 기준)를 나타낸다.

표 21

표 21을 참조하면, inter_layer_pred_enabled_flag가 “1”이면, 해당 영상이 계층간 예측을 사용함을 나타내며, inter_layer_pred_enabled_flag가 “0”이면 계층간 예측을 사용하지 않음을 나타낸다.

layer_dependency_vps_flag가 “1”이면, slice_num_direct_ref_layers은 NumDirectRefLayers[nuh_layer_id] 값과 같을 수 있고, ref_layer_idx[i]는 i로 간주될수 있다. layer_dependency_vps_flag값이 시그널링 되지 않는 경우에는 “0”의 값으로 간주될 수 있다. max_one_active_ref_layer_flag 값이 “1”인 경우에는 layer_dependency_vps_flag는 “0”의 값을 가질 수 있다.

max_one_active_ref_layer_flag가 “1”인 경우는 NumActiveRefLayerPics = 1 (NumActiveRefLayerPics = slice_num_driect_ref_layers)이 되므로, slice_num_direct_ref_layers은 시그널링 되지 않는다.

표 22

표 22를 참조하면, inter_layer_pred_enabled_flag가 “1”이면, 해당 영상이 계층간 예측을 사용함을 나타내며, inter_layer_pred_enabled_flag가 “0”이면 계층간 예측을 사용하지 않음을 나타낸다.

slice_num_direct_ref_layers는 해당 영상이 직접적으로 참조하는 참조계층의 수를 나타내거나 영상의 인터 레이어 예측에 사용되는 계층 참조 픽쳐의 수를 나타낼 수 있다. . slice_num_direct_ref_layers로 특정되는 참조 계층의 수 또는 계층 참조 픽쳐의 수는 비디오 파라미터 세트에서 시그널링되는 해당 영상과 동일한 layer_id (즉, nuh_layer_id)를 가지는 계층들이 참조하는 참조계층의 수(즉, NumDirectRefLayers[nuh_layer_id])와 같거나 작아야 한다. NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일한 경우에는 VPS extension에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용하고, NumDirectRefLayers[nuh_layer_id] 값과 slice_num_direc_ref_layers 값이 동일하지 않은 경우에는 슬라이스 세그먼트 헤더에서 시그널링되는 참조계층 정보를 해당 영상의 참조계층 정보로 사용한다.

표 22의 NumDirecRefLayers[nuh_layer_id]는 비디오 파라미터 세트 확장에서 수신되는 계층 의존성 정보에 기초하여 유도될 수 있다. 계층 의존성 정보는 신택스 요소 direct_dependency_flag[i][j] 로 시그널링 될 수 있고, 전체 비트스트림에서 i번째 인덱스를 갖는 레이어가 j번째 레이어를 직접적으로 참조하는 지 여부를 나타낸다. 이러한 계층 의존성 정보에 의하여 전체 비트스트림에서 i번째 레이어가 참조하는 참조 레이어의 정보를 파악할 수 있다.

즉, direct_dependency_flag[i][j] 와 같은 플래그 정보(계층 레이어 정보)를 통하여 현재 계층이 비트스트림 전체에서 참조할 수 있는 참조 계층의 개수를 유도할 수 있다.

현재 계층의 nuh_layer_id 값이 0보다 크고, 즉 현재 계층이 베이스 계층이 아니고, 유도된 참조 계층의 개수가 0보다 크면, 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는지 여부를 나타내는 플래그 정보(inter_layer_pred_enabled_flag)가 수신된다.

inter_layer_pred_enabled_flag가 1이고, NumDirectRefLayers[nuh_layer_id]이 1보다 크고(NumDirectRefLayers[nuh_layer_id ] > 1), 전체 비트스트림에 포함된 모든 계층이 하나의 참조 계층을 사용하는 것이 아니면 (!max_one_active_ref_layer_flag), 현재 픽쳐의 인터 레이어 예측을 위하여 사용될 수 있는 참조 픽쳐의 개수를 특정할 수 있는 참조 픽쳐 개수 정보(slice_num_direct_ref_layers)가 수신된다. 이하에서는 인터 레이어 예측을 위하여 사용될 수 있는 참조 픽쳐를 계층 참조 픽쳐(inter layer reference picture)라고 표현하고, 계층 참조 픽쳐의 개수를 특정할 수 있는 정보를 계층 참조 픽쳐 개수 정보라고 표현한다.

만약, 현재 픽쳐가 속한 계층이 참조하는 참조 계층의 개수가 최대 하나이면, 현재 픽쳐가 참조하는 계층의 수도 한 개가 된다.

계층 참조 픽쳐 개수 정보는 num_inter_layer_ref_pics_minus1와 같은 신택스 요소로 시그널링 될 수도 있다.

계층 참조 픽쳐의 개수(NumActiveRefLayerPics)는 시그널링되는 계층 참조 픽쳐 정보의 값(slice_num_direct_ref_layers인 경우)으로 특정될 수 있고, 계층 참조 픽쳐 개수 정보에 1을 더한 값(num_inter_layer_ref_pics_minus1인 경우)으로 특정될 수도 있다.

참조 계층의 개수(NumDirecRefLayers[nuh_layer_id])와 계층 참조 픽쳐의 개수(NumActiveRefLayerPics)가 동일하지 않으면(NumDirectRefLayers[ nuh_layer_id ] != NumActiveRefLayerPics), 참조 계층 중 현재 픽쳐가 참조하는 참조 계층에 대한 계층 정보(ref_layer_idx [i])가 수신된다.

계층 정보는 현재 픽쳐가 참조할 수 있는 참조 픽쳐의 계층의 ID 일 수 있다.

표 23

표 23을 참조하면, inter_layer_pred_enabled_flag가 “1”이면, 해당 영상이 계층간 예측을 사용함을 나타내며, inter_layer_pred_enabled_flag가 “0”이면 계층간 예측을 사용하지 않음을 나타낸다.

표 24

표 24를 참조하면, inter_layer_pred_enabled_flag가 “1”이면, 해당 영상이 계층간 예측을 사용함을 나타내며, inter_layer_pred_enabled_flag가 “0”이면 계층간 예측을 사용하지 않음을 나타낸다.

이때, 슬라이스 헤더에서 기술되는 해당 슬라이스가 부호화시 참조할 수 있는 계층들은 전체 비트스트림에서 현재 부호화 대상 계층과 동일한 계층들이 참조할 수 있는 참조계층들의 서브 세트일 수 있다.

예를 들어, 슬라이스 헤더에 시그널링 되는 참조계층들은 비디오 파라미터 세트에서 시그널링되는 현재 부호화 대상 계층과 동일한 계층들이 참조할 수 있는 참조계층 리스트의 서브 세트일 수 있다.

다시 도 5로 돌아가서, 현재 부호화 대상 계층의 영상이 참조할 수 있는 계층의 리스트를 구성한 부호화 장치는 대상 계층이 참조할 수 있는 참조 계층의 복호화 영상이 포함된 현재 부호화 대상 영상의 화면간 예측을 위하여 참조픽쳐 집합(reference picture set)을 구성하고, 참조픽쳐 형태 표시(reference picture marking)를 수행한다(S520).

이 때, 부호화 장치는 참조 계층 리스트에 포함된 영상들로 구성된 복원된 영상으로 가용한지(available)를 확인하고 가용한 경우 해당 복원영상을 참조픽쳐 집합에 포함시키고, 가용하지 않은 경우 해당 복원영상을 “no reference picture”로 표시할 수 있다.

참조 계층 리스트에 포함된 영상들로 구성된 참조픽쳐 집합(이하, 제1 집합)은 “used for long term reference”로 표시되어 현재 부호화 대상 영상의 화면간 예측시 장기 참조 픽쳐(long-term reference picture)로 취급될 수 있다.

제1 집합, 즉 참조 계층 리스트에 포함된 영상들로 구성된 참조픽쳐 집합 이외에 현재 부호화 대상 계층과 동일한 계층의 영상으로 이루어진 화면간 예측을 위한 참조픽쳐 집합은 다양한 형태로 존재할 수 있다.

화면간 예측을 위한 참조픽쳐 집합은 현재 부호화 대상 영상의 화면간 예측에 사용되며, 디스플레이 순서상 현재 부호화 대상 영상을 기준으로 이전인 기간 참조 픽쳐(short-term reference picture) (제2 집합), 현재 부호화 대상 영상의 화면간 예측에 사용되며, 디스플레이 순서상 현재 부호화 대상 영상을 기준으로 이후인 단기 참조 픽쳐 (제3 집합), 현재 부호화 대상 영상의 화면간 예측을 위한 장기 참조 픽쳐 (제4 집합), 현재 부호화 대상 영상 이후에 부호화할 수 있는 영상을 위한 단기 참조 픽쳐 (제5 집합), 현재 부호화 대상 영상 이후에 부호화 할 수 있는 영상을 위한 장기 참조 픽쳐 (제6 집합)으로 구성될 수 있다.

그런 후, 부호화 장치는 참조픽쳐 집합과 참조픽쳐 형태에 따라 참조 픽쳐 리스트를 생성한다(S530).

부호화 장치는 상기와 같은 여러 참조 픽쳐 집합에 기초하여 참조픽쳐 집합의 특성과 참조픽쳐 형태에 따라 현재 부호화 대상 영상의 참조픽쳐 리스트를 생성할 수 있다.

일 예로, 부호화 장치는 현재 부호화 대상 영상과 동일한 계층의 영상들로 이루어진 참조픽쳐 집합들로 구성된 화면간 참조영상 리스트 L0 및 L1에 단계 S520에서 생성된 참조 계층 리스트로 구성된 참조픽쳐 집합을 다음과 같이 추가하여 최종 참조픽쳐 리스트를 생성할 수 있다.

이 경우, 부호화 장치는 참조픽쳐 리스트 생성시마다 고정된 위치에 참조 계층의 복호화 영상을 추가할 수도 있고, 효율적인 부호화를 위해 참조픽쳐 리스트 생성한 후 추가로 참조 계층의 복호화 영상의 위치를 변경할 수도 있다.

참조픽쳐 리스트 생성시마다 고정된 위치에 참조 계층의 복호화 영상을 추가하는 경우, L0 리스트 생성 시 제1 집합을 마지막 혹은 첫 번째(ref_idx=0) 혹은 두 번째(ref_idx=1) 위치에부터 추가할 수 있다.

참조 계층을 L0 리스트의 중간 위치에 추가하는 경우, 해당 위치 및 그 이후에 있는 영상들의 리스트에서의 인덱스를 추가한 참조 계층의 수(참조 계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

또는 부호화 장치는 L0 리스트 생성 시 첫 번째 (ref_idx=0) 혹은 두 번째 (ref_idx=1) 위치에서부터 참조 계층 리스트로 구성된 참조픽쳐 집합의 수만큼의 참조영상들을 제1 집합으로 대체할 수 있다.

부호화 장치는 L0 리스트 생성 시 제1 집합을 임의의 시그널링된 위치에서부터 추가할 수 있다. 제1 집합이 리스트의 중간 위치에 추가하는 경우, 해당 위치 및 그 이후에 있던 영상들의 리스트에서의 인덱스를 추가한 참조계층 수(참조계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

또는, 부호화 장치는 L0 리스트 생성 시 임의의 시그널링된 위치에서부터 참조계층 리스트로 구성된 참조픽쳐 집합의 수만큼의 참조영상들을 제1 집합으로 대체할 수 있다.

또는, 부호화 장치는 L0 리스트 생성 시 제1 집합의 참조계층 리스트에 포함된 각각의 픽쳐들을 임의의 서로 다른 위치에 추가할 수 있다. 이 때, 부호화 장치는 추가된 영상들의 해당 위치 및 이후에 있던 영상들의 리스트에서의 인덱스를 추가한 참조계층 수(참조계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

또는, 부호화 장치는 L0 리스트 생성 시 임의의 서로 다른 위치에 있는 참조영상들을 제1 집합의 참조계층 리스트에 포함된 각각의 픽쳐들로 대체할 수 있다.

또는 부호화 장치는 L1 리스트 생성 시 제1 집합을 마지막 혹은 첫 번째 (ref_idx=0) 혹은 두 번째 (ref_idx=1) 위치에 추가할 수 있다.

참조 계층을 L1 리스트의 중간 위치에 추가하는 경우, 부호화 장치는 해당 위치 및 그 이후에 있는 영상들의 리스트에서의 인덱스를 추가한 참조 계층의 수(참조 계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

또는 부호화 장치는 L1 리스트 생성 시 첫 번째 (ref_idx=0) 혹은 두 번째 (ref_idx=1) 위치에서부터 참조 계층 리스트로 구성된 참조픽쳐 집합의 수만큼의 참조영상들을 제1 집합으로 대체할 수 있다.

부호화 장치는 L1 리스트 생성 시 제1 집합을 임의의 시그널링된 위치에서부터 추가할 수 있다. 제1 집합이 리스트의 중간 위치에 추가하는 경우, 해당 위치 및 그 이후에 있던 영상들의 리스트에서의 인덱스를 추가한 참조계층 수(참조계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

또는, 부호화 장치는 L1 리스트 생성 시 임의의 시그널링된 위치에서부터 참조계층 리스트로 구성된 참조픽쳐 집합의 수만큼의 참조영상들을 제1 집합으로 대체할 수 있다.

또는, 부호화 장치는 L1 리스트 생성 시 제1 집합의 참조계층 리스트에 포함된 각각의 픽쳐들을 임의의 서로 다른 위치에 추가할 수 있다. 이 때, 부호화 장치는 추가된 영상들의 해당 위치 및 이후에 있던 영상들의 리스트에서의 인덱스를 추가한 참조계층 수(참조계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

또는, 부호화 장치는 L1 리스트 생성 시 임의의 서로 다른 위치에 있는 참조영상들을 제1 집합의 참조계층 리스트에 포함된 각각의 픽쳐들로 대체할 수 있다.

한편, 참조픽쳐 리스트 생성한 후, 추가로 효율적인 부호화를 위해 참조 계층의 복호화 영상의 위치를 변경하는 경우, 슬라이스 헤더 혹은 픽쳐 파라미터 세트에 포함될 수 있는 부호화 파라미터를 이용하여 참조 계층의 복호화 영상의 위치를 참조픽쳐 리스트의 어떠한 위치로든지 변경시킬 수 있다

참조 계층 리스트가 생성되면, 부호화 장치는 참조픽쳐 리스트내의 참조픽쳐를 이용하여 현재 부호화 대상 영상에 대한 움직임 예측 및 움직임 보상을 수행할 수 있다(S540).

부호화 장치는 통상적인 화면 간 예측 방법으로 참조픽쳐 리스트내의 참조픽쳐를 이용해서 현재 부호화 대상 영상에 대한 움직임 예측 및 움직임 보상을 수행할 수 있다.

도 6은 본 발명의 일 실시예에 따른 복호화 장치에서 상위 계층의 복호화를 수행하는 방법을 설명하기 위한 제어흐름도이다. 본 발명에 따른 복호화 장치는 적어도 한가지 이상의 스케일러빌리티 (예를 들어, 공간, 화질, 시점 스케일러빌리티)를 지원하며 다 계층 구조를 지원하는 비디오 구조에서 상위 계층의 복호화를 수행한다.

도 6을 참조하면 우선, 복호화 장치는 현재 복호화 대상 영상이 참조할 수 있는 계층들의 리스트를 구성한다(S610).

비트스트림이 적어도 한가지 이상의 스케일러빌리티 (예를 들어, 공간, 화질, 시점 스케일러빌리티)를 지원하면, 본 발명의 일 실시예에 따른 복호화 장치는 적어도 한 개 이상의 계층에 대한 참조계층 리스트를 구성할 수 있다. 이렇게 구성된 참조 계층 리스트들은 현재 복호화 대상 영상을 복호화하기 위해 사용될 수 있다.

복호화 장치는 비디오 파라미터 세트등에 포함되어 시그널링되는 현재 복호화 대상 계층의 참조계층 정보를 이용하여 아래와 같은 참조 계층 리스트를 구성할 수 있다.

본 발명의 일 실시예에 따르면, 복호화 장치는 전체 비트스트림에서 현재 복호화 대상 계층과 동일한 계층들이 참조할 수 있는 참조계층 리스트를 구성할 수 있다. 참조계층 리스트는 현재 복호화 대상 영상이 속한 계층과 동일한 계층에 속한 영상들을 복호화하기 위해 사용될 수 있으며, 비디오 파라미터 세트에서 시그널링되는 현재 복호화 대상 계층의 참조계층 정보에 기초하여 구성될 수 있다.

예컨대, 복호화 장치는 표 1에 도시되어 있는 바와 같이, 시그널링되는 nuh_layer_id[i]의 값 가운데, 현재 복호화 대상 영상이 속한 계층과 동일한 nuh_layer_id 값을 갖는 계층의 참조계층들(ref_layer_id)로 참조계층 리스트를 구성할 수 있다.

시그널링된 참조계층 정보를 이용하여, 참조계층 리스트를 구성함에 있어서, 리스트 내에서의 참조계층의 순서는 다음의 방법 가운데 하나로 정해질 수 있다.

우선, 참조계층은 표 1 및 표 2에서 시그널링 되는 순서대로 구성될 수 있다.

또는 복호화 장치는 layer_id 값이 복호화 대상 계층의 layer_id 값과 차이가 작은 계층 (즉, 가까운 계층)부터 큰 계층 순서로 참조 계층 리스트를 구성할 수 있다.

또는 복호화 장치는 우선 순위(priority)가 높은 계층부터 낮은 계층의 순서로 공간 화질 참조 계층 리스트를 구성할 수 있다.

이 때, 우선 순위에 대한 정보는 NAL 유닛 헤더 혹은 비디오 파라미터 세트등에서 시그널링될 수 있다.

또는 복호화 장치는 현재 복호화 대상과 동일 시점을 가지는 참조 계층들 가운데 현재 복호화 대상 계층과 공간 해상도 차이가 작은 계층부터 큰 계층 순으로 공간 화질 참조 계층 리스트를 구성할 수 있다.

이때, 동일한 공간 해상도에서의 화질 참조 계층 순서는 현재 복호화 대상 계층의 layer_id값과 차이가 작은 계층(즉, 가까운 계층)부터 큰 계층 순서로 구성할 수 있다.

추가로, 현재 복호화 대상 계층의 시점과 가까운 시점부터 먼 시점순으로 계층들이 참조계층 리스트에 포함될 수 있으며, 동일한 시점내의 계층들이 참조계층리스트에 포함되는 순서는 앞에서 기술한 현재 복호화 대상 계층과 동일 시점의 계층들과 동일한 방식을 적용할 수 있다.

예를 들어, 도 4와 같은 비트스트림 구조에서 layer_id 가 n인 계층의 참조 계층 리스트는 layer_id 가 n-1, n-2, n-3, n-4, n-5, n-6, n-7, n-8, n-9, n-10, n-11 인 계층의 순서로 구성될 수 있다.

또는 현재 복호화 대상 계층과 동일 시점을 가지는 계층들 가운데 현재 복호화 대상 계층과 공간 해상도 차이가 작은 계층부터 큰 계층 순으로 구성될 수 있다. 이때, 동일한 공간 해상도에서의 화질 참조 계층 순서는 복호화하고자 하는 양자화 파라미터(quantization parameter)값이 낮은 값에서 높은 값의 순서(즉, 복호시 화질이 좋은 계층부터 낮은 계층순서) 일 수 있다.

본 발명의 다른 실시예에 따라 복호화 장치는 현재 복호화하고자 하는 영상의 현재 복호화 대상 계층 (혹은 해당 슬라이스)이 참조 가능한 참조 계층 리스트를 구성할 수 있으며, 구성된 참조 계층 리스트들은 현재 복호화 대상 영상을 복호화하기 위해 사용될 수 있다.

복호화 장치는 현재 복호화 대상 계층의 슬라이스 헤더에서 시그널링되는 참조 계층 정보를 이용하여 참조 계층 리스트를 구성할 수 있다.

현재 복호화 대상 영상이 한 개 이상의 슬라이스로 나누어져 있는 경우에도 슬라이스 헤더에서 시그널링되는 참조계층 정보는 동일할 수도 있고, 각 슬라이스마다 다른 참조계층 정보를 가질수도 있다.

복호화 장치는 표 3 내지 표 24까지 중 어느 하나에 따라 시그널링되는 정보에 기초하여 참조계층들로 참조계층 리스트를 구성할 수 있다.

이때, 슬라이스 헤더에서 시그널링되는 참조계층들은 전체 비트스트림에서 현재 복호화 대상 계층과 동일한 계층들이 참조할 수 있는 참조계층들의 서브 세트일 수 있다.

예를 들어, 슬라이스 헤더에 시그널링 되는 참조계층들은 비디오 파라미터 세트에서 시그널링되는 현재 복호화 대상 계층과 동일한 계층들이 참조할 수 있는 참조계층 리스트의 서브 세트일 수 있다.

시그널링 되거나 시그널링된 정보를 활용하여 얻어지는 참조 계층 정보(ref_layer_id)를 이용하여, 참조 계층 리스트를 구성함에 있어서, 참조 계층 리스트 내에서 참조 계층의 순서는 아래와 같이 다양하게 구성할 수 있다.

우선, 복호화 장치는 표 3 내지 표 24까지 중 어느 하나에 따라 시그널링 되는 순서대로 참조 계층을 참조 계층 리스트에 추가할 수 있다.

또는, 복호화 장치는 참조 계층의 layer_id 값이 복호화 대상 계층의 layer_id 값과 차이가 적은 계층 (즉, 가까운 계층)부터 큰 계층 순서로 구성하여 공간 화질 참조 계층 리스트를 생성할 수 있다.

또는 참조 계층 리스트는 참조 계층들 가운데 우선 순위(priority)가 높은 계층부터 낮은 계층의 순서로 구성될 수 있다.

이때, 우선 순위와 관련된 정보는 NAL 유닛 헤더(NALU header) 혹은 비디오 파라미터 세트(video parameter set) 등에 포함되어 시그널링될 수 있다

또는 현재 복호화 대상 계층과 동일 시점을 가지는 참조 계층 리스트는 현재 복호화 대상 계층과 공간 해상도 차이가 작은 계층부터 큰 계층 순으로 구성될 수 있다. 이때, 동일한 공간 해상도를 갖는 화질 참조 계층의 순서는 현재 복호화 대상 계층의 layer_id 값과 차이가 작은 계층(즉, 가까운 계층)부터 큰 계층 순서일 수 있다.

이 경우, 추가로, 현재 복호화 대상 계층의 시점과 가까운 시점부터 먼 시점순으로 계층들이 참조계층 리스트에 포함될 수 있으며, 동일한 시점내의 계층들이 참조계층리스트에 포함되는 순서는 앞에서 기술한 현재 복호화 대상 계층과 동일 시점의 계층들과 동일한 방식을 적용할 수 있다.

또는 현재 복호화 대상 계층과 동일 시점을 가지는 계층들 가운데현재 복호화 대상 계층과 공간 해상도 차이가 작은 계층부터 큰 계층 순으로 참조 계층 리스트를 구성될 수 있다. 이때, 동일한 공간 해상도에서의 화질 참조 계층 순서는 복호화하고자 하는 양자화 파라미터(quantization parameter)값이 낮은 값에서 높은 값의 순서(즉, 복호시 화질이 좋은 계층부터 낮은 계층순서) 일 수 있다.

이 경우, 추가로, 현재 복호화 대상 계층의 시점과 가까운 시점부터 먼 시점순으로 계층들이 참조계층 리스트에 포함될 수 있으며, 동일한 시점내의 계층들이 참조계층리스트에 포함되는 순서는 앞에서 기술한 현재 복호화 대상 계층과 동일 시점의 계층들과 동일한 방식을 적용할 수 있다. 구성된 참조 계층 리스트는 해당 슬라이스를 복호화하기 위하여 사용될 수 있다.

최대한 참조할 수 있는 계층의 수는 비트스트림 전체에 대해 제한될 수 있으며, 이는 비디오 파라미터 세트, 시퀀스 파라미터 세트 혹은 슬라이스 헤더 등에서 시그널링 될 수도 있고, 프로파일 및 레벨에 따라 제약을 둘 수도 있다.

복호화 장치는 구성된 참조 계층 리스트에 대하여 추가 시그널링(예를 들어, 슬라이스 헤더와 같은 상위 레벨의 시그널링)이 있을 경우 시그널링에서 표현하는 내용에 따라 리스트 내에서의 순서를 변경할 수 있다.

다음으로, 복호화 장치는 참조 계층의 복호화 영상을 포함하여 현재 복호화 대상 영상의 화면 간 예측을 위한 참조픽쳐 집합 구성 및 참조 픽쳐 형태를 표시한다(S620).

복호화 장치는 참조 계층의 복호화 영상을 포함하여 현재 복호화 대상 영상의 화면간 예측을 위한 참조픽쳐 집합(reference picture set) 구성 및 참조픽쳐 형태표시(reference picture marking)를 수행할 수 있다.

즉, 복호화 장치는 참조 계층 리스트에 포함된 영상들로 구성된 참조픽쳐 집합(제1 집합)을 구성한다. 이 때, 참조 계층 리스트에 포함된 영상이 복원된 영상으로 가용한지(available)를 확인하고 가용한 경우 해당 복원영상을 참조픽쳐 집합에 포함시키고, 가용하지 않은 경우 해당 복원영상을 “no reference picture”로 표시할 수 있다.

제1 집합은 “used for long term reference”로 표시하여 현재 복호화 대상 영상의 화면간 예측시 장기 참조 픽쳐로 취급할 수 있다.

복호화 장치는 제1 집합, 즉 참조 계층 리스트에 포함된 영상들로 구성된 참조픽쳐 집합 이외에 현재 복호화 대상 계층과 동일한 계층의 영상으로 이루어진 화면간 예측을 위한 하기와 같이 다양한 참조픽쳐 집합들을 구성할 수 있다.

참조픽쳐 집합들은 현재 복호화 대상 영상의 화면간 예측에 사용되며, 디스플레이 순서상 현재 복호화 대상 영상을 기준으로 이전인 단기 참조 픽쳐 (제2 집합), 현재 복호화 대상 영상의 화면간 예측에 사용되며, 디스플레이 순서상 현재 복호화 대상 영상을 기준으로 이후인 단기 참조 픽쳐 (제3 집합), 현재 복호화 대상 영상의 화면간 예측을 위한 장기 참조 픽쳐 (제4 집합), 현재 복호화 대상 영상 이후에 복호화할 수 있는 영상을 위한 단기 참조 픽쳐 (제5 집합), 현재 복호화 대상 영상 이후에 복호화할 수 있는 영상을 위한 장기 참조 픽쳐 (제6 집합) 중 적어도 하나 일 수 있다.

그런 후, 복호화 장치는 참조픽쳐 집합과 참조 픽쳐 형태에 따라 참조픽쳐 리스트를 생성한다(S630).

복호화 장치는 참조픽쳐 집합과 참조픽쳐 형태에 따라 현재 복호화 대상 영상의 참조픽쳐 리스트를 생성할 수 있다. 즉 복호화 장치는 제1 집합과 상기 제2 집합 내지 제4 집합을 조합하여 참조픽쳐 리스트를 생성할 수 있다.

예컨대, 복호화 장치는 현재 복호화 대상 영상의 참조픽쳐 리스트를 생성함에 있어서, 현재 복호화 대상 영상과 동일한 계층의 영상들로 이루어진 참조픽쳐 집합들로 구성된 화면간 참조영상 리스트 L0 및 L1에, 제1 집합에 포함된 참조 계층 리스트로 구성된 참조픽쳐 집합을 추가하여 최종 참조픽쳐 리스트를 생성할 수 있다.

이 경우, 참조픽쳐 리스트 생성시마다 고정된 위치에 참조 계층의 복호화 영상을 추가할 수도 있고, 효율적인 부호화를 위해 참조 계층의 복호화 영상의 위치를 변경할 수도 있다.

참조 계층을 L0 리스트의 중간 위치에 추가하는 경우, 해당위치 이후에 있는 영상들의 리스트에서의 인덱스를 추가한 참조 계층 수(참조 계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

또는 복호화 장치는 L0 리스트 생성 시 제1 집합을 첫 번째 (ref_idx=0) 혹은 두 번째 (ref_idx=1) 위치에서부터 참조 계층 리스트로 구성된 참조픽쳐 집합의 수만큼의 참조영상들을 대체할 수 있다.

또는 복호화 장치는 L0 리스트 생성 시 제1 집합을 임의의 시그널링된 위치에서부터 추가할 수 있다. 이때, 리스트의 중간 위치에 추가하는 경우, 해당 위치 및 그 이후에 있던 영상들의 리스트에서의 인덱스를 추가한 참조계층 수(참조계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

복호화 장치는 L0 리스트 생성 시 제1 집합으로 임의의 시그널링된 위치에서부터 참조계층 리스트로 구성된 참조픽쳐 집합의 수 만큼의 참조영상들을 대체할 수 있다.

복호화 장치는 L0 리스트 생성 시 제1 집합에 포함된 각각의 픽쳐들을 임의의 서로 다른 위치에 추가할 수 있다. 이때, 추가된 영상들의 해당위치 및 이후에 있던 영상들의 리스트에서의 인덱스를 추가한 참조계층 수(참조계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

복호화 장치는 L0 리스트 생성 시 제1 집합에 포함된 각각의 픽쳐들로 임의의 서로 다른 위치에 있는 참조영상들을 대체할 수 있다.

또는 복호화 장치는 L1 리스트 생성 시 제1 집합을 마지막 혹은 첫 번째 (ref_idx=0) 혹은 두 번째 (ref_idx=1) 위치에 추가할 수 있다.

참조 계층을 L1 리스트의 중간 위치에 추가하는 경우, 해당위치 이후에 있는 영상들의 리스트에서의 인덱스를 추가한 참조 계층 수(참조 계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

또는 복호화 장치는 L1 리스트 생성 시 제1 집합을 첫 번째 (ref_idx=0) 혹은 두 번째 (ref_idx=1) 위치에서부터 참조 계층 리스트로 구성된 참조픽쳐 집합의 수만큼의 참조영상들을 대체할 수 있다.

복호화 장치는 L1 리스트 생성 시 제1 집합을 임의의 시그널링된 위치에서부터 추가할 수 있다. 이때, 리스트의 중간 위치에 추가하는 경우, 해당위치 및 그 이후에 있던 영상들의 리스트에서의 인덱스를 추가한 참조계층 수(참조계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

복호화 장치는 L1 리스트 생성 시 제1 집합으로 임의의 시그널링된 위치에서부터 참조계층 리스트로 구성된 참조픽쳐 집합의 수만큼의 참조영상들을 대체할 수 있다.

복호화 장치는 L1 리스트 생성 시 제1 집합에 포함된 각각의 픽쳐들을 임의의 서로 다른 위치에 추가할 수 있다. 이때, 추가된 영상들의 해당위치 및 이후에 있던 영상들의 리스트에서의 인덱스를 추가한 참조계층 수(참조계층 리스트로 구성된 참조픽쳐 집합의 수) 만큼씩 증가시킬 수 있다.

복호화 장치는 L1 리스트 생성 시 제1 집합에 포함된 각각의 픽쳐들로 임의의 서로 다른 위치에 있는 참조영상들을 대체할 수 있다.

한편, 참조픽쳐 리스트를 생성한 후, 추가로 효율적인 부호화를 위해 참조 계층의 복호화 영상의 위치를 변경하는 경우, 슬라이스 헤더 혹은 픽쳐 파라미터 세트에 포함될 수 있는 부호화 파라미터를 이용하여 참조 계층의 복호화 영상의 위치를 참조픽쳐 리스트의 어떠한 위치로든지 변경할 수 있다.

참조 계층 리스트가 생성되면, 참조픽쳐 리스트 내의 참조픽쳐를 이용하여 현재 복호화 대상 영상에 대한 움직임 예측 및 움직임 보상을 수행할 수 있다(S640).

현재 계층의 현재 복호화 대상 블록이 화면간 예측을 하는 경우 복호화 장치는 참조픽쳐 리스트내의 참조픽쳐를 이용해서 현재 복호화 대상 블록에 대한 움직임 보상을 수행할 수 있다.

도시된 바와 같이, 디코딩 장치는 영상 정보를 파싱하는 파싱부(710)와 파싱부(710)의 영상 정보를 이용하여 현재 레이어를 예측하는 디코딩부(720)를 포함한다.

파싱부(710)는 현재 계층이 비트스트림 전체에서 참조할 수 있는 참조 계층에 대한 계층 의존성 정보를 수신하여 파싱하고, 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는 경우, 참조 계층 중 현재 픽쳐가 참조하는 참조 계층에 대한 계층 정보를 수신하여 파싱한다.

계층 의존성 정보는 비디오 파라미터 세트 확장에 포함되어 수신될 수 있다.

한편, 현재 픽쳐가 참조하는 참조 계층에 대한 계층 정보는 현재 픽쳐가 참조할 수 있는 참조 픽쳐의 계층의 ID 이며, 계층 정보는 슬라이스 헤더에 포함될 수 있다.

이때, 계층 의존성 정보에 기초하여 현재 계층이 비트스트림 전체에서 참조할 수 있는 참조 계층의 개수가 유도될 수 있다.

파싱부(710)는 유도된 참조 레이어의 개수가 0보다 크면, 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는지 여부를 나타내는 플래그 정보를 수신하여 파싱할 수 있다.

플래그 정보가 1이고, 참조 레이어 개수가 1보다 크고, 전체 비트스트림에 포함된 모든 계층이 하나의 참조 계층을 사용하는 것이 아니면, 파싱부(710)는 현재 픽쳐의 인터 레이어 예측을 위하여 사용될 수 있는 계층 참조 픽쳐의 개수를 특정할 수 있는 계층 참조 픽쳐 개수 정보를 수신하여 파싱할 수 있다.

계층 참조 픽쳐의 개수는 계층 참조 픽쳐 개수 정보에 1을 더한 값으로 특정될 수 있다. 즉, 계층 참조 픽쳐 개수 정보는 계층 참조 픽쳐의 개수에 1을 뺀 값으로 시그널링 될 수 있다.

이때, 계층 정보는 참조 레이어의 개수와 계층 참조 픽쳐의 개수가 동일하지 않은 경우에만 수신될 수 있다.

디코딩부(720)는 계층 정보에 기초하여 현재 픽쳐의 디코딩을 수행할 수 있다.

우선, 디코딩 장치는 현재 계층이 비트스트림 전체에서 참조할 수 있는 참조 계층에 대한 계층 의존성 정보를 수신하여 파싱한다(S810).

그런 후, 디코딩 장치는 계층 의존성 정보에 기초하여 현재 계층이 비트스트림 전체에서 참조할 수 있는 참조 계층의 개수를 유도한다(S820).

참조 레이어의 개수가 0보다 크면, 디코딩 장치는 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는지 여부를 나타내는 플래그 정보를 수신하여 파싱할 수 있다(S830).

플래그 정보가 1이고, 참조 레이어 개수가 1보다 크고, 전체 비트스트림에 포함된 모든 계층이 하나의 참조 계층을 사용하는 것이 아니면, 디코딩 장치는 현재 픽쳐의 인터 레이어 예측을 위하여 사용될 수 있는 계층 참조 픽쳐의 개수를 특정할 수 있는 계층 참조 픽쳐 개수 정보를 수신하여 파싱할 수 있다(S840).

계층 참조 픽쳐의 개수는 시그널링되는 계층 참조 픽쳐 정보의 값으로 특정될 수도 있고, 계층 참조 픽쳐 개수 정보에 1을 더한 값으로 특정될 수 있다.

단계 S820에서 유도된 참조 계층의 개수와 단계 S840에서 확인된 계층 참조 픽쳐의 개수가 동일하지 않으면(S850), 디코딩 장치는 참조 계층 중 현재 픽쳐가 참조하는 참조 계층에 대한 계층 정보를 수신하여 파싱한다(S860).

즉 디코딩 장치는 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측되고, 상기 조건들이 만족하면, 계층 정보를 수신한다.

계층 정보는 현재 픽쳐가 참조할 수 있는 참조 픽쳐의 계층의 ID 일 수 있으며, 비트스트림에서 슬라이스 헤더에 포함되어 수신될 수 있다.

계층 정보가 파악되면, 디코딩 장치는 계층 정보에 기초하여 현재 픽쳐의 디코딩을 수행한다(S870).

한편, 참조 계층의 개수와 계층 참조 픽쳐의 개수가 동일하면, VPS에서 시그널링된 계층 의존성 정보에 기초하여 현재 픽쳐를 디코딩한다(S880).

이와 같이, 본 발명에 따를 경우, 하나 이상의 참조 계층을 포함한 참조픽쳐 리스트를 효율적으로 생성 및 관리하여 부호화/복호화 효율을 향상시킬 수 있는 영상의 부호화/복호화 방법 및 이를 이용하는 장치가 제공된다.

또한, 참조 계층의 복호화 영상을 포함하여 참조픽쳐 리스트 생성 시 참조픽쳐 리스트 내에서의 참조계층들의 복호화 영상의 위치 및 참조계층 복호화 영상간의 순서를 조정할 수 있는 영상의 부호화/복호화 방법 및 이를 이용하는 장치가 제공된다.

상술한 실시예에서, 방법들은 일련의 단계 또는 블록으로서 순서도를 기초로 설명되고 있으나, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 당해 기술 분야에서 통상의 지식을 가진 자라면 순서도에 나타난 단계들이 배타적이지 않고, 다른 단계가 포함되거나, 순서도의 하나 또는 그 이상의 단계가 본 발명의 범위에 영향을 미치지 않고 삭제될 수 있음을 이해할 수 있을 것이다.

상술한 실시예는 다양한 양태의 예시들을 포함한다. 다양한 양태들을 나타내기 위한 모든 가능한 조합을 기술할 수는 없지만, 해당 기술 분야의 통상의 지식을 가진 자는 다른 조합이 가능함을 인식할 수 있을 것이다. 따라서, 본 발명은 이하의 특허청구범위 내에 속하는 모든 다른 교체, 수정 및 변경을 포함한다고 할 것이다.

Claims

복수의 계층을 지원하는 영상의 복호화 방법에 있어서,

현재 계층이 상기 비트스트림 전체에서 참조할 수 있는 참조 계층에 대한 계층 의존성 정보를 수신하여 파싱하는 단계와;

상기 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는 경우, 상기 참조 계층 중 상기 현재 픽쳐가 참조하는 참조 계층에 대한 계층 정보를 수신하여 파싱하는 단계와;

상기 계층 정보에 기초하여 상기 현재 픽쳐의 디코딩을 수행하는 단계를 포함하는 것을 특징으로 하는 영상의 복호화 방법.
제1항에 있어서,

상기 계층 의존성 정보는 비디오 파라미터 세트 확장에 포함되어 수신되는 것을 특징으로 하는 영상의 복호화 방법.
제1항에 있어서,

상기 계층 정보는 상기 현재 픽쳐가 참조할 수 있는 참조 픽쳐의 계층의 ID 이며, 상기 계층 정보는 슬라이스 헤더에 포함되어 수신되는 것을 특징으로 하는 영상의 복호화 방법.
제1항에 있어서,

상기 계층 의존성 정보에 기초하여 상기 현재 계층이 상기 비트스트림 전체에서 참조할 수 있는 참조 계층의 개수를 유도하는 단계와;

상기 참조 레이어의 개수가 0보다 크면, 상기 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는지 여부를 나타내는 플래그 정보를 수신하여 파싱하는 단계를 더 포함하는 것을 특징으로 하는 영상의 복호화 방법.
제4항에 있어서,

상기 플래그 정보가 1이고, 상기 참조 레이어 개수가 1보다 크고, 전체 비트스트림에 포함된 모든 계층이 하나의 참조 계층을 사용하는 것이 아니면,

상기 현재 픽쳐의 상기 인터 레이어 예측을 위하여 사용될 수 있는 계층 참조 픽쳐의 개수를 특정할 수 있는 계층 참조 픽쳐 개수 정보를 수신하여 파싱하는 단계를 더 포함하는 것을 특징으로 하는 영상의 복호화 방법.
제5항에 있어서,

상기 계층 정보는 상기 참조 레이어의 개수와 상기 계층 참조 픽쳐의 개수가 동일하지 않은 경우 수신되는 것을 특징으로 하는 영상의 복호화 방법.
제5항에 있어서,

상기 계층 참조 픽쳐의 개수는 상기 계층 참조 픽쳐 개수 정보에 1을 더한 값으로 특정되는 것을 특징으로 하는 영상의 복호화 방법.
복수의 계층을 지원하는 영상의 복호화 장치에 있어서,

현재 계층이 상기 비트스트림 전체에서 참조할 수 있는 참조 계층에 대한 계층 의존성 정보를 수신하여 파싱하고, 상기 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는 경우, 상기 참조 계층 중 상기 현재 픽쳐가 참조하는 참조 계층에 대한 계층 정보를 수신하여 파싱하는 파싱부와;

상기 계층 정보에 기초하여 상기 현재 픽쳐의 디코딩을 수행하는 디코딩부를포함하는 것을 특징으로 하는 영상의 복호화 장치.
제8항에 있어서,

상기 계층 의존성 정보는 비디오 파라미터 세트 확장에 포함되어 수신되는 것을 특징으로 하는 영상의 복호화 장치.
제8항에 있어서,

상기 계층 정보는 상기 현재 픽쳐가 참조할 수 있는 참조 픽쳐의 계층의 ID 이며, 상기 계층 정보는 슬라이스 헤더에 포함되어 수신되는 것을 특징으로 하는 영상의 복호화 장치.
제8항에 있어서,

상기 계층 의존성 정보에 기초하여 상기 현재 계층이 상기 비트스트림 전체에서 참조할 수 있는 참조 계층의 개수가 유도되고,

상기 참조 레이어의 개수가 0보다 크면, 상기 파싱부는 상기 현재 계층 내 현재 픽쳐의 디코딩에 인터 레이어 예측이 사용되는지 여부를 나타내는 플래그 정보를 수신하여 파싱하는 것을 특징으로 하는 영상의 복호화 장치.
제11항에 있어서,

상기 플래그 정보가 1이고, 상기 참조 레이어 개수가 1보다 크고, 전체 비트스트림에 포함된 모든 계층이 하나의 참조 계층을 사용하는 것이 아니면,

상기 파싱부는 상기 현재 픽쳐의 상기 인터 레이어 예측을 위하여 사용될 수 있는 계층 참조 픽쳐의 개수를 특정할 수 있는 계층 참조 픽쳐 개수 정보를 수신하여 파싱하는 것을 특징으로 하는 영상의 복호화 장치.
제12항에 있어서,

상기 계층 정보는 상기 참조 레이어의 개수와 상기 계층 참조 픽쳐의 개수가 동일하지 않은 경우 수신되는 것을 특징으로 하는 영상의 복호화 장치.
제12항에 있어서,

상기 계층 참조 픽쳐의 개수는 상기 계층 참조 픽쳐 개수 정보에 1을 더한 값으로 특정되는 것을 특징으로 하는 영상의 복호화 장치.