WO2014051396A1

WO2014051396A1 - 영상 부호화/복호화 방법 및 장치

Info

Publication number: WO2014051396A1
Application number: PCT/KR2013/008715
Authority: WO
Inventors: 이진호; 강정원; 이하현; 최진수; 김진웅
Original assignee: 한국전자통신연구원
Priority date: 2012-09-27
Filing date: 2013-09-27
Publication date: 2014-04-03

Abstract

영상 부호화/복호화 방법 및 장치가 개시된다. 본 발명에 따른 복수의 계층을 지원하는 영상 복호화 방법은 제1 계층에서 제2 계층으로 계층간 전환이 가능한지 여부를 나타내는 계층간 전환 시점 정보를 포함하는 비트스트림을 수신하는 단계 및 상기 계층간 전환 시점 정보에 기초하여 상기 비트스트림을 복호화하는 단계를 포함한다. 상기 계층간 전환 시점 정보는 계층간 전환이 가능한 시점의 계층 전환 픽처(layer switching picture; LSP)에 대한 정보를 포함하며, 상기 계층 전환 픽처에 대한 정보는 상기 비트스트림으로부터 파싱된 NAL(Network Abstraction Layer) 유닛 타입으로부터 유도된다.

Description

영상 부호화/복호화 방법 및 장치

본 발명은 영상 부호화 및 복호화에 관한 것으로, 보다 상세하게는 스케일러블 비디오 코딩(Scalable Video Coding; SVC)을 기반으로 하는 영상 부호화 및 복호화에 관한 것이다.

최근 멀티미디어(multimedia) 환경이 구축되면서, 다양한 단말과 네트워크가 이용되고 있으며, 이에 따른 사용자 요구도 다변화하고 있다.

예컨대, 단말의 성능과 컴퓨팅 능력(computing capability)가 다양해짐에 따라서 지원하는 성능도 기기별로 다양해지고 있다. 또한 정보가 전송되는 네트워크 역시 유무선 네트워크와 같은 외형적인 구조뿐만 아니라, 전송하는 정보의 형태, 정보량과 속도 등 기능별로도 다양해지고 있다. 사용자는 원하는 기능에 따라서 사용할 단말과 네트워크를 선택하며, 또한 기업이 사용자에게 제공하는 단말과 네트워크의 스펙트럼도 다양해지고 있다.

이와 관련하여, 최근 HD(High Definition) 해상도를 가지는 방송이 국내뿐만 아니라 세계적으로 확대되어 서비스되면서, 많은 사용자들이 고해상도, 고화질의 영상에 익숙해지고 있다. 이에 따라서 많은 영상 서비스 관련 기관들이 차세대 영상 기기에 대한 개발에 많은 노력을 하고 있다.

또한 HDTV와 더불어 HDTV의 4배 이상의 해상도를 가지는 UHD(Ultra High Definition)에 대한 관심이 증대되면서 보다 높은 해상도, 고화질의 영상을 압축하여 처리하는 기술에 대한 요구는 더 높아지고 있다.

영상을 압축하여 처리하기 위해, 시간적으로 이전 및/또는 이후의 픽처로부터 현재 픽처에 포함된 화소값을 예측하는 인터(inter) 예측 기술, 현재 픽처 내의 화소 정보를 이용하여 현재 픽처에 포함된 다른 화소값을 예측하는 인트라(intra) 예측 기술, 출현 빈도가 높은 심볼(symbol)에 짧은 부호를 할당하고 출현 빈도가 낮은 심볼에 긴 부호를 할당하는 엔트로피 인코딩 기술 등이 사용될 수 있다.

상술한 바와 같이, 지원하는 기능이 상이한 각 단말과 네트워크 그리고 다변화된 사용자의 요구를 고려할 때, 지원되는 영상의 품질, 크기, 프레임 등도 이에 따라 다변화될 필요가 있다.

이와 같이, 이종의 통신망과 다양한 기능 및 종류의 단말로 인해, 영상의 화질, 해상도, 크기, 프레임 율 등을 다양하게 지원하는 스케일러빌리티(scalability)는 비디오 포맷의 중요한 기능이 되고 있다.

따라서, 고효율의 비디오 부호화 방법을 기반으로 다양한 환경에서 사용자가 요구하는 서비스를 제공하기 위해 시간, 공간, 화질 등의 측면에서 효율적인 비디오 부호화와 복호화가 가능하도록 스케일러빌리티 기능을 제공하는 것이 필요하다.

본 발명은 부호화/복호화 효율을 향상시킬 수 있는 영상 부호화/복호화 방법 및 장치를 제공한다.

본 발명은 부호화/복호화 효율을 향상시킬 수 있는 스케일러블 비디오 코딩에서 계층간 전환을 수행하는 방법 및 장치를 제공한다.

본 발명은 스케일러블 비디오 코딩에서 계층간 전환이 가능한 시점을 지시하기 위한 정보를 제공하는 방법 및 장치를 제공한다.

본 발명의 일 양태에 따르면, 복수의 계층을 지원하는 영상 복호화 방법이 제공된다. 상기 영상 복호화 방법은 제1 계층에서 제2 계층으로 계층간 전환이 가능한지 여부를 나타내는 계층간 전환 시점 정보를 포함하는 비트스트림을 수신하는 단계 및 상기 계층간 전환 시점 정보에 기초하여 상기 비트스트림을 복호화하는 단계를 포함한다. 상기 계층간 전환 시점 정보는 계층간 전환이 가능한 시점의 계층 전환 픽처(layer switching picture; LSP)에 대한 정보를 포함하며, 상기 계층 전환 픽처에 대한 정보는 상기 비트스트림으로부터 파싱된 NAL(Network Abstraction Layer) 유닛 타입으로부터 유도된다.

본 발명의 다른 양태에 따르면, 복수의 계층을 지원하는 영상 복호화 장치가 제공된다. 상기 영상 복호화 장치는 제1 계층에서 제2 계층으로 계층간 전환이 가능한지 여부를 나타내는 계층간 전환 시점 정보를 포함하는 비트스트림을 수신하고, 상기 계층간 전환 시점 정보에 기초하여 상기 비트스트림을 복호화하는 복호화부를 포함한다. 상기 계층간 전환 시점 정보는 계층간 전환이 가능한 시점의 계층 전환 픽처(layer switching picture; LSP)에 대한 정보를 포함하며, 상기 계층 전환 픽처에 대한 정보는 상기 비트스트림으로부터 파싱된 NAL(Network Abstraction Layer) 유닛 타입으로부터 유도된다.

본 발명의 또 다른 양태에 따르면, 복수의 계층을 지원하는 영상 부호화 방법이 제공된다. 상기 영상 부호화 방법은 제1 계층에서 제2 계층으로 계층간 전환이 가능한지 여부를 나타내는 계층간 전환 시점 정보를 부호화하는 단계 및 상기 계층간 전환 시점 정보를 포함하는 비트스트림을 전송하는 단계를 포함한다. 상기 계층간 전환 시점 정보는 계층간 전환이 가능한 시점의 계층 전환 픽처(layer switching picture; LSP)에 대한 정보를 포함하며, 상기 계층 전환 픽처에 대한 정보는 NAL(Network Abstraction Layer) 유닛 타입으로 특정된다.

본 발명의 또 다른 양태에 따르면, 복수의 계층을 지원하는 영상 부호화 장치가 제공된다. 상기 영상 부호화 장치는 제1 계층에서 제2 계층으로 계층간 전환이 가능한지 여부를 나타내는 계층간 전환 시점 정보를 부호화하고, 상기 계층간 전환 시점 정보를 포함하는 비트스트림을 전송하는 부호화부를 포함한다. 상기 계층간 전환 시점 정보는 계층간 전환이 가능한 시점의 계층 전환 픽처(layer switching picture; LSP)에 대한 정보를 포함하며, 상기 계층 전환 픽처에 대한 정보는 NAL(Network Abstraction Layer) 유닛 타입으로 특정된다.

스케일러블 비디오 코딩에서 계층간 전환을 수행할 때, 계층간 전환 가능한 픽처임을 나타내는 지시자 또는 식별자를 할당할 수 있다. 또한, 계층간 전환 가능한 픽처임을 나타내는 지시자 또는 식별자를 판별함으로써 계층간 전환 가능한 픽처에서 계층 전환이 이루어져 정상적인 전송 및 복호화가 수행될 수 있다.

도 1은 발명이 적용되는 영상 부호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.

도 2는 본 발명이 적용되는 영상 복호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.

도 3은 본 발명이 적용될 수 있는 복수 계층을 이용한 스케일러블 비디오 코딩 구조의 일예를 개략적으로 나타내는 개념도이다.

도 4는 디코딩 장치에서 처리되는 코딩된 영상에 대한 계층 구조를 도시한 도면이다.

도 5는 본 발명이 적용될 수 있는 스케일러블 비디오 코딩 구조에서 계층간 전환을 나타내는 도면이다.

도 6은 본 발명의 일 실시예에 따른 계층간 전환이 가능한 시점의 전환 픽처가 다른 계층을 참조하여 부호화 혹은 복호화되는 방법의 일예를 설명하기 위해 도시된 도면이다.

도 7은 본 발명의 일 실시예에 따른 계층간 전환이 가능한 시점을 지시하기 위한 픽처(LSP)를 설명하기 위한 도면이다.

도 8은 본 발명의 일 실시예에 따른 계층간 전환이 가능한 시점을 지시하기위한 픽처(LSP)에서 계층 전환이 발생했을 경우 계층간 전환을 정상적으로 수행하는 방법을 설명하기 위한 도면이다.

도 9는 본 발명의 일 실시예에 따른 영상 정보의 인코딩 방법을 개략적으로 나타내는 순서도이다.

도 10은 본 발명의 일 실시예에 따른 영상 정보의 디코딩 방법을 개략적으로 나타내는 순서도이다.

이하, 도면을 참조하여 본 발명의 실시 형태에 대하여 구체적으로 설명한다. 본 명세서의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 명세서의 요지를 흐릴 수 있다고 판단되는 경우에는 해당 설명을 생략할 수도 있다.

본 명세서에서 어떤 구성 요소가 다른 구성 요소에 “연결되어” 있다거나 “접속되어” 있다고 언급된 때에는, 그 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있는 것을 의미할 수도 있고, 중간에 다른 구성 요소가 존재하는 것을 의미할 수도 있다. 아울러, 본 명세서에서 특정 구성을 “포함”한다고 기술하는 내용은 해당 구성 이외의 구성을 배제하는 것이 아니며, 추가적인 구성이 본 발명의 실시 또는 본 발명의 기술적 사상의 범위에 포함될 수 있음을 의미한다.

제1, 제2 등의 용어는 다양한 구성들을 설명하는데 사용될 수 있지만, 상기 구성들은 상기 용어에 의해 한정되지 않는다. 상기 용어들은 하나의 구성을 다른 구성으로부터 구별하는 목적으로 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성은 제2 구성으로 명명될 수 있고, 유사하게 제2 구성도 제1 구성으로 명명될 수 있다.

또한 본 발명의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성 단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 포함한 것으로 각 구성부 중 적어도 두 개의 구성부가 하나의 구성부를 이루거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있다. 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리 범위에 포함된다.

또한, 일부의 구성 요소는 본 발명에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 발명은 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 발명의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 발명의 권리범위에 포함된다.

스케일러블(scalable) 비디오 부호화/복호화 방법 또는 장치는, 스케일러빌리티(scalability)를 제공하지 않는 일반적인 영상 부호화/복호화 방법 또는 장치의 확장(extension)에 의해 구현될 수 있으며, 도 1의 블록도는 스케일러블 비디오 부호화 장치의 기초가 될 수 있는 영상 부호화 장치의 일 실시예를 나타낸다.

도 1을 참조하면, 영상 부호화 장치(100)는 움직임 예측부(111), 움직임 보상부(112), 인트라 예측부(120), 스위치(115), 감산기(125), 변환부(130), 양자화부(140), 엔트로피 부호화부(150), 역양자화부(160), 역변환부(170), 가산기(175), 필터부(180) 및 참조 픽처 버퍼(190)를 포함한다.

영상 부호화 장치(100)는 입력 영상에 대해 인트라(intra) 모드 또는 인터(inter) 모드로 부호화를 수행하고 비트스트림을 출력할 수 있다. 인트라 모드인 경우 스위치(115)가 인트라로 전환되고, 인터 모드인 경우 스위치(115)가 인터로 전환될 수 있다. 인트라 예측은 화면 내 예측, 인터 예측은 화면 간 예측을 의미한다. 영상 부호화 장치(100)는 입력 영상의 입력 블록에 대한 예측 블록을 생성한 후, 입력 블록과 예측 블록의 차분(residual)을 부호화할 수 있다. 이때, 입력 영상은 원 영상(original picture)를 의미할 수 있다.

인트라 모드인 경우, 인트라 예측부(120)는 현재 블록 주변의 이미 부호화/복호화된 블록의 픽셀값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성할 수 있다.

인터 모드인 경우, 움직임 예측부(111)는, 움직임 예측 과정에서 참조 픽처 버퍼(190)에 저장되어 있는 참조 영상에서 입력 블록과 가장 매치가 잘 되는 영역을 찾아 움직임 벡터를 구할 수 있다. 움직임 보상부(112)는 움직임 벡터를 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다. 여기서, 움직임 벡터는 인터 예측에 사용되는 2차원 벡터이며, 현재 부호화/복호화 대상 영상과 참조 영상 사이의 오프셋을 나타낼 수 있다.

감산기(125)는 입력 블록과 생성된 예측 블록의 차분에 의해 잔차 블록(residual block)을 생성할 수 있다.

변환부(130)는 잔차 블록에 대해 변환(transform)을 수행하여 변환 계수(transform coefficient)를 출력할 수 있다. 여기서, 변환 계수는 잔차 블록 및/또는 잔차 신호에 대한 변환을 수행함으로써 생성된 계수 값을 의미할 수 있다. 이하, 본 명세서에서는 변환 계수에 양자화가 적용되어 생성된, 양자화된 변환 계수 레벨(transform coefficient level)도 변환 계수로 불릴 수 있다.

양자화부(140)는 입력된 변환 계수를 양자화 파라미터(quantization parameter, 또는 양자화 매개변수)에 따라 양자화하여 양자화된 계수(quantized coefficient)를 출력할 수 있다. 양자화된 계수는 양자화된 변환 계수 레벨(quantized transform coefficient level)로 불릴 수도 있다. 이때, 양자화부(140)에서는 양자화 행렬을 사용하여 입력된 변환 계수를 양자화할 수 있다.

엔트로피 부호화부(150)는, 양자화부(140)에서 산출된 값들 또는 부호화 과정에서 산출된 부호화 파라미터 값 등을 기초로 엔트로피 부호화를 수행하여 비트스트림(bitstream)을 출력할 수 있다. 엔트로피 부호화가 적용되는 경우, 높은 발생 확률을 갖는 심볼(symbol)에 적은 수의 비트가 할당되고 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당되어 심볼이 표현됨으로써, 부호화 대상 심볼들에 대한 비트열의 크기가 감소될 수 있다. 따라서 엔트로피 부호화를 통해서 영상 부호화의 압축 성능이 높아질 수 있다. 엔트로피 부호화부(150)는 엔트로피 부호화를 위해 지수-골롬(Exponential-Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 부호화 방법을 사용할 수 있다.

도 1의 실시예에 따른 영상 부호화 장치(100)는 인터 예측 부호화, 즉 화면 간 예측 부호화를 수행하므로, 현재 부호화된 영상은 참조 영상으로 사용되기 위해 복호화되어 저장될 필요가 있다. 따라서 양자화된 계수는 역양자화부(160)에서 역양자화되고 역변환부(170)에서 역변환된다. 역양자화, 역변환된 계수는 가산기(175)를 통해 예측 블록과 더해지고 복원 블록(Reconstructed Block)이 생성된다.

복원 블록은 필터부(180)를 거치고, 필터부(180)는 디블록킹 필터(deblocking filter), SAO(Sample Adaptive Offset), ALF(Adaptive Loop Filter) 중 적어도 하나 이상을 복원 블록 또는 복원 픽처에 적용할 수 있다. 필터부(180)는 적응적 인루프(in-loop) 필터로 불릴 수도 있다. 디블록킹 필터는 블록 간의 경계에 생긴 블록 왜곡을 제거할 수 있다. SAO는 코딩 에러를 보상하기 위해 픽셀값에 적정 오프셋(offset) 값을 더해줄 수 있다. ALF는 복원된 영상과 원래의 영상을 비교한 값을 기초로 필터링을 수행할 수 있다. 필터부(180)를 거친 복원 블록은 참조 픽처 버퍼(190)에 저장될 수 있다.

도 1에서 상술한 바와 같이, 스케일러블 비디오 부호화/복호화 방법 또는 장치는, 스케일러빌리티를 제공하지 않는 일반적인 영상 부호화/복호화 방법 또는 장치의 확장에 의해 구현될 수 있으며, 도 2의 블록도는 스케일러블 비디오 복호화 장치의 기초가 될 수 있는 영상 복호화 장치의 일 실시예를 나타낸다.

도 2를 참조하면, 영상 복호화 장치(200)는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 움직임 보상부(250), 가산기(255), 필터부(260) 및 참조 픽처 버퍼(270)를 포함한다.

영상 복호화 장치(200)는 부호화기에서 출력된 비트스트림을 입력 받아 인트라 모드 또는 인터 모드로 복호화를 수행하고 재구성된 영상, 즉 복원 영상을 출력할 수 있다. 인트라 모드인 경우 스위치가 인트라로 전환되고, 인터 모드인 경우 스위치가 인터로 전환될 수 있다.

영상 복호화 장치(200)는 입력 받은 비트스트림으로부터 복원된 잔차 블록(reconstructed residual block)을 얻고 예측 블록을 생성한 후 복원된 잔차 블록과 예측 블록을 더하여 재구성된 블록, 즉 복원 블록을 생성할 수 있다.

엔트로피 복호화부(210)는, 입력된 비트스트림을 확률 분포에 따라 엔트로피 복호화하여, 양자화된 계수(quantized coefficient) 형태의 심볼을 포함한 심볼들을 생성할 수 있다.

엔트로피 복호화 방법이 적용되는 경우, 높은 발생 확률을 갖는 심볼에 적은 수의 비트가 할당되고 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당되어 심볼이 표현됨으로써, 각 심볼들에 대한 비트열의 크기가 감소될 수 있다.

양자화된 계수는 역양자화부(220)에서 역양자화되고 역변환부(230)에서 역변환되며, 양자화된 계수가 역양자화/역변환 된 결과, 복원된 잔차 블록이 생성될 수 있다. 이때, 역양자화부(220)에서는 양자화된 계수에 양자화 행렬을 적용할 수 있다.

인트라 모드인 경우, 인트라 예측부(240)는 현재 블록 주변의 이미 복호화된 블록의 픽셀값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성할 수 있다. 인터 모드인 경우, 움직임 보상부(250)는 움직임 벡터 및 참조 픽처 버퍼(270)에 저장되어 있는 참조 영상을 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다.

잔차 블록과 예측 블록은 가산기(255)를 통해 더해지고, 더해진 블록은 필터부(260)를 거칠 수 있다. 필터부(260)는 디블록킹 필터, SAO, ALF 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(260)는 재구성된 영상, 즉 복원 영상을 출력할 수 있다. 복원 영상은 참조 픽처 버퍼(270)에 저장되어 인터 예측에 사용될 수 있다.

도 3은 본 발명이 적용될 수 있는 복수 계층을 이용한 스케일러블 비디오 코딩 구조의 일예를 개략적으로 나타내는 개념도이다. 도 3에서 GOP(Group of Picture)는 픽처군 즉, 픽처의 그룹을 나타낸다.

영상 데이터를 전송하기 위해서는 전송 매체가 필요하며, 그 성능은 다양한 네트워크 환경에 따라 전송 매체별로 차이가 있다. 이러한 다양한 전송 매체 또는 네트워크 환경에의 적용을 위해 스케일러블 비디오 코딩 방법이 제공될 수 있다.

스케일러빌러티를 지원하는 비디오 코딩 방법(이하, ‘스케일러블 코딩’혹은 ‘스케일러블 비디오 코딩’이라 함)은 계층(layer) 간의 텍스쳐 정보, 움직임 정보, 잔여 신호 등을 활용하여 계층 간 중복성을 제거하여 인코딩 및 디코딩 성능을 높이는 코딩 방법이다. 스케일러블 비디오 코딩 방법은, 전송 비트율, 전송 에러율, 시스템 자원 등의 주변 조건에 따라, 공간적(spatial), 시간적(temporal), 화질적(혹은 품질적, quality) 관점에서 다양한 스케일러빌리티를 제공할 수 있다.

스케일러블 비디오 코딩은, 다양한 네트워크 상황에 적용 가능한 비트스트림을 제공할 수 있도록, 복수 계층(multiple layers) 구조를 사용하여 수행될 수 있다. 예를 들어 스케일러블 비디오 코딩 구조는, 일반적인 영상 디코딩 방법을 이용하여 영상 데이터를 압축하여 처리하는 기본 계층을 포함할 수 있고, 기본 계층의 디코딩 정보 및 일반적인 영상 디코딩 방법을 함께 사용하여 영상 데이터를 압축 처리하는 향상 계층을 포함할 수 있다.

여기서, 계층(layer)은 공간(spatial, 예를 들어, 영상 크기), 시간(temporal, 예를 들어, 디코딩 순서, 영상 출력 순서, 프레임 레이트), 화질, 복잡도 등을 기준으로 구분되는 영상 및 비트스트림(bitstream)의 집합을 의미한다. 또한, 기본 계층은 베이스 레이어(Base layer)를 의미할 수 있고, 향상 계층은 인핸스먼트 레이어(Enhancement layer) 또는 상위 계층(higher layer)을 의미할 수 있다. 특정 계층보다 낮은 스케일러빌러티를 지원하는 계층은 하위 계층(lower layer)이라 칭할 수 있고, 특정 계층이 부호화 혹은 복호화 시 참조하는 계층은 참조 계층이라 칭할 수 있다.

도 3을 참조하면, 예를 들어 기본 계층은 SD(standard definition), 15Hz의 프레임율, 1Mbps 비트율로 정의될 수 있고, 제1 향상 계층은 HD(high definition), 30Hz의 프레임율, 3.9Mbps 비트율로 정의될 수 있으며, 제2 향상 계층은 4K-UHD (ultra high definition), 60Hz의 프레임율, 27.2Mbps 비트율로 정의될 수 있다.

상기 포맷(format), 프레임율, 비트율 등은 하나의 실시예로서, 필요에 따라 달리 정해질 수 있다. 또한 사용되는 계층의 수도 본 실시예에 한정되지 않고 상황에 따라 달리 정해질 수 있다. 예를 들어, 전송 대역폭이 4Mbps라면 상기 제1 향상계층 HD의 프레임 레이트를 줄여서 15Hz 이하로 전송할 수 있다.

스케일러블 비디오 코딩 방법은 상기 도 3의 실시예에서 상술한 방법에 의해 시간적, 공간적, 화질적 스케일러빌리티를 제공할 수 있다.

본 명세서에서 스케일러블 비디오 코딩은 인코딩 관점에서는 스케일러블 비디오 인코딩, 디코딩 관점에서는 스케일러블 비디오 디코딩과 동일한 의미를 가진다.

코딩된 영상은 영상의 디코딩 처리 및 그 자체를 다루는 VCL(video coding layer, 비디오 코딩 계층), 부호화된 정보를 전송하고 저장하는 하위 시스템, 그리고 VCL과 하위 시스템 사이에 존재하며 네트워크 적응 기능을 담당하는 NAL(network abstraction layer, 네트워크 추상 계층)로 구분되어 있다.

VCL에서는 압축된 영상 데이터(슬라이스 데이터)를 포함하는 VCL 데이터를 생성하거나, 혹은 픽처 파라미터 세트(Picture Parameter Set: PPS), 시퀀스 파라미터 세트(Sequence Parameter Set: SPS), 비디오 파라미터 세트(Video Parameter Set: VPS) 등의 정보를 포함하는 파라미터 세트 또는 영상의 디코딩 과정에 부가적으로 필요한 SEI(Supplemental Enhancement Information) 메시지를 생성할 수 있다.

NAL에서는 VCL에서 생성된 RBSP(Raw Byte Sequence Payload)에 헤더 정보(NAL 유닛 헤더)를 부가하여 NAL 유닛을 생성할 수 있다. 이때, RBSP는 VCL에서 생성된 슬라이스 데이터, 파라미터 세트, SEI 메시지 등을 말한다. NAL 유닛 헤더에는 해당 NAL 유닛에 포함되는 RBSP 데이터에 따라 특정되는 NAL 유닛 타입 정보를 포함할 수 있다.

도 4에 도시된 바와 같이, NAL 유닛은 VCL에서 생성된 RBSP의 따라 VCL NAL 유닛과 Non-VCL NAL 유닛으로 구분될 수 있다. VCL NAL 유닛은 영상에 대한 정보(슬라이스 데이터)를 포함하고 있는 NAL 유닛을 의미하고, Non-VCL NAL 유닛은 영상을 디코딩하기 위하여 필요한 정보(파라미터 세트 또는 SEI 메시지)를 포함하고 있는 NAL 유닛을 의미한다.

상술한 VCL NAL 유닛, Non-VCL NAL 유닛은 하위 시스템의 데이터 규격에 따라 헤더 정보를 붙여서 네트워크를 통해 전송될 수 있다. 예컨대, NAL 유닛은 H.264/AVC 파일 포맷, RTP(Real-time Transport Protocol), TS(Transport Stream) 등과 같은 소정 규격의 데이터 형태로 변형되어 다양한 네트워크를 통해 전송될 수 있다.

한편, 스케일러블 비디오 코딩 구조에서는 복호화기 또는 네트워크의 전송 환경 등에 따라 계층간의 전환(layer switching)을 수행할 수 있다. 예를 들어, 스케일러블 비디오 코딩 구조에서 해상도에 대한 스케일러빌러티를 지원하는 경우, 계층마다 다른 해상도를 제공할 수 있으며 임의의 시점에서 현재 계층에서 다른 계층으로 계층을 전환하여 해상도를 변경할 수 있다.

계층간 전환(레이어 스위칭)은 현재 계층에서 다른 계층으로 전환하는 것을 말하며, 하위 계층에서 상위 계층으로 계층간 전환, 혹은 상위 계층에서 하위 계층으로 계층간 전환일 수 있다. 계층간 전환은 공간적(spatial) 계층 또는 질적(quality) 계층을 위한 전환 시점(switching point)일 수 있다.

스케일러블 비디오 코딩은 상술한 바와 같이 공간적, 시간적, 화질적(혹은 품질적) 관점에서 스케일러빌러티를 제공할 수 있으며, 이러한 스케일러빌러티를 위한 복수의 계층을 포함할 수 있다.

도 5의 실시예에서는 설명의 편의를 위해 2개의 계층으로 구성된 스케일러블 비디오 코딩 구조를 도시하였다. 하위 계층은 기본 계층일 수 있으며, 상위 계층은 향상 계층일 수 있다. 이때, 계층은 공간적 스케일러블 계층 또는 질적 스케일러블 계층일 수 있다.

예를 들어, 현재 부호화 혹은 복호화가 수행되는 현재 계층(하위 계층)에서 다른 계층(상위 계층)으로 전환할 때, 전환된 계층(상위 계층)에서 전환되는 시점의 픽처가 화면내 예측(인트라 예측)이 수행된 픽처가 아닌 경우에 계층간 전환에 문제가 발생할 수 있다. 다시 말해, 전환된 계층(상위 계층)에서 전환되는 시점의 픽처가 화면간 예측(인터 예측)이 수행된 픽처이며 표시 순서(display order 또는 output order) 상 전환되는 시점의 픽처보다 선행하는 픽처를 참조하는 경우, 전환된 계층에서의 부호화 혹은 복호화가 정상적으로 수행되지 않을 수 있다. 왜냐하면 표시 순서 상 전환되는 시점의 픽처보다 선행하는 픽처는 전환된 계층의 비트스트림 내 존재하지 않거나 DPB(decoded picture buffer) 내 존재하지 않을 수 있으므로, 전환되는 시점의 픽처가 전환되는 시점의 픽처보다 선행하는 픽처를 참조할 수 없는 경우가 발생할 수 있다.

상기와 같이, 현재 부호화 혹은 복호화가 수행되는 현재 계층(하위 계층)에서 다른 계층(상위 계층)으로 계층간 전환이 발생할 때, 전환되는 계층(상위 계층)에서 정상적으로 부호화 혹은 복호화가 수행될 수 있도록 하기 위해서, 본 발명의 실시예에서는 계층간 전환이 가능한 시점에 대한 정보를 제공한다. 도 5에 도시된 바와 같이, 본 발명의 실시예에서는 계층간 전환이 가능한 시점을 지시하기 위한 전환 픽처(switching picture)(510, 520)를 사용할 수 있다.

계층간 전환이 가능한 시점을 지시하기 위한 전환 픽처(510, 520)는 전환 픽처(510, 520)와 동일한 계층(상위 계층)의 픽처들 중에서 표시 순서 상 전환 픽처(510, 520)보다 선행하는 픽처들을 참조 픽처로 사용하지 않는다. 반면, 전환 픽처(510, 520)는 다른 계층(하위 계층)의 픽처들을 참조할 수 있다. 예컨대, 전환 픽처(510, 520)는 전환 픽처(510, 520) 내 부호화 혹은 복호화 대상 블록과 대응하는 위치의 하위 계층의 블록을 참조할 수 있으며, 혹은 전환 픽처(510, 520) 내 부호화 혹은 복호화 대상 블록에 대한 움직임 예측을 통해 획득된 하위 계층의 블록을 참조할 수 있다.

도 6을 참조하면, 하위 계층에서 상위 계층으로 계층간 전환이 발생할 경우, 상위 계층의 부호화 혹은 복호화 대상 블록(610)(이하, ‘대상 블록’이라 함)은 하위 계층을 참조하여 부호화 혹은 복호화를 수행할 수 있다. 하위 계층은 대상 블록(610)이 참조하는 계층이므로 참조 계층이라고 지칭할 수도 있다.

예를 들어, 전환 픽처의 대상 블록(610)은 대상 블록(610)과 대응하는 하위 계층의 대응 블록(co-located block)(620)을 참조 블록으로 사용하여 예측이 수행될 수 있다. 또는 하위 계층의 대응 블록(620) 이외의 위치에 있는 임의의 블록(630)을 참조 블록으로 사용하여 예측이 수행될 수도 있다. 이때, 임의의 블록(630)은 대상 블록(610)에 대한 움직임 예측을 통해 획득된 움직임 벡터를 기반으로 유도된 하위 계층 내 블록일 수 있다.

상술한 바와 같이, 계층간 전환이 발생할 때 정상적인 부호화 혹은 복호화를 수행하기 위해서, 본 발명의 실시예에 따르면 계층간 전환이 가능한 시점을 지시하기 위한 전환 픽처를 사용할 수 있다. 이러한 전환 픽처는 전환 픽처임을 나타내기 위한 지시자 또는 식별자를 통해 알 수 있다. 본 발명의 실시예에서는 전환 픽처임을 나타내기 위한 지시자 또는 식별자로 NAL 유닛 타입을 사용할 수 있다. 즉, 전환 픽처에 대한 NAL 유닛 타입을 정의할 수 있다. 예컨대, 전환 픽처에 대한 NAL 유닛 타입은 LSP(Layer Switching Picture : 계층 전환 픽처)로 정의할 수 있다. 만일 NAL 유닛 타입이 LSP인 경우, LSP에서 하위 계층에서 상위 계층 혹은 상위 계층에서 하위 계층으로 계층간 전환을 수행할 수 있다. 또한, 상기 지사자로 전환 픽처임을 나타내는 플래그(flag)를 전송할 수 있다.

한편, 시간 계층(temporal layer) 전환을 위해서는 TSA(temporal sub-layer switching access) 혹은 STSA(step-wise temporal sub-layer switching access) 픽처를 사용할 수 있다. 이때, 상위 계층과 하위 계층의 TSA 혹은 STSA 픽처의 위치를 일치시킬 수 있다. 다시 말해, 상위 계층이 TSA 혹은 STSA 픽처이면 하위 계층도 TSA 혹은 STSA 픽처일 수 있다.

본 발명의 실시예에서는, 시간 계층 전환과 상술한 본 발명에 따른 공간 계층 혹은 품질 계층과의 계층 전환을 결합한 계층간 전환을 수행할 수도 있다. 예를 들어, SD 15Hz 프레임율을 지원하는 계층에서 HD 30Hz 프레임율을 지원하는 계층으로 전환할 수 있으며, 이때 LSP 다음에 TSA 혹은 STSA 픽처가 동반될 수 있다.

상술한 바와 같이, NAL 유닛 타입은 NAL 유닛에 포함되는 데이터, 예컨대 NAL 유닛에 포함되는 픽처에 따라 특정될 수 있으며, 이러한 NAL 유닛 타입에 대한 정보는 NAL 유닛 헤더에 저장될 수 있다.

도 7의 실시예에서는 설명의 편의를 위해 2개의 계층으로 구성된 스케일러블 비디오 코딩 구조를 도시하였다. 하위 계층(700)은 기본 계층일 수 있으며, 상위 계층(710)은 향상 계층일 수 있다. 이때, 계층은 공간적 스케일러블 계층 또는 질적 스케일러블 계층일 수 있다.

도 7에는 픽처의 코딩 순서(coding order)가 도시되어 있으며, 코딩 순서는 인코딩(부호화) 순서 혹은 디코딩(복호화) 순서일 수 있다. 픽처의 표시 순서(display order 또는 output order)는 왼쪽에 도시된 픽처부터 오른쪽에 도시된 픽처까지 순서대로 정해질 수 있다. 도시된 바와 같이 픽처의 코딩 순서와 표시 순서는 서로 다를 수 있다. 도 7에 도시된 화살표는 픽처가 다른 픽처를 참조하는지 여부에 대한 참조 관계를 나타낸다. 예컨대, 상위 계층(710)의 코딩 순서 6인 픽처는 하위 계층(700)의 코딩 순서 6인 픽처를 참조 픽처로 사용하고, 상위 계층(710)의 코딩 순서 6인 픽처는 상위 계층(710)의 코딩 순서 7, 9, 10, 11, 12인 픽처에 의해 참조 픽처로 사용되고 있다.

도 7에 도시된 바와 같은 스케일러블 비디오 코딩에서는 복호화기 또는 네트워크 전송 환경 등에 따라 영상을 수신하는 계층이 바뀔 수 있다. 예컨대, 네트워크 전송 환경에 따라 복호화기는 하위 계층(700)으로만 영상을 수신하여 복호화를 수행할 수도 있고, 하위 계층(700)에서 상위 계층(710)으로 계층을 전환하여 하위 계층(700)과 함께 상위 계층(710)까지 영상을 수신하여 복호화를 수행할 수도 있다. 이때, 상술한 바와 같이 부호화 혹은 복호화 시 참조 관계로 인하여 계층 전환이 이루어졌을 때 부호화 혹은 복호화가 정상적으로 수행되지 않을 수 있다.

상기와 같은 문제점을 극복하고자 본 발명에서는 공간적 혹은 질적 스케일러빌러티를 지원하는 스케일러블 코딩 구조에서 계층간 전환이 가능한 시점을 알려 주기 위한 NAL 유닛 타입을 제공할 것을 제안하였다. 본 발명의 일 실시예에 따른 NAL 유닛 타입은 LSP(Layer Switching Picture)일 수 있다. LSP(레이어 스위칭 픽처, 혹은 계층 전환 픽처)는 계층간 전환이 가능한 시점이 되는 픽처일 수 있다.

본 발명의 일 실시예에 따른 LSP(715) 및 LSP(715) 이후에 복호화되는 픽처들(713, 717)은 계층간 전환 시 정상적인 부호화 혹은 복호화를 수행하기 위해 다음과 같은 조건을 가질 수 있다.

- LSP(715)는 화면내 예측 모드(intra prediction mode) 및 계층간 예측 모드(inter-layer prediction mode)가 가능한 슬라이스(slice).

이때, 화면내 예측 모드(혹은 인트라 예측 모드)는 현재 부호화 혹은 복호화 대상 블록의 주변에 위치한 이미 부호화 혹은 복호화된 블록을 이용하여 예측을 수행하는 것을 말하며, 계층간 예측 모드(혹은 인터 레이어 예측 모드)는 다른 계층의 정보를 이용하여 현재 부호화 혹은 복호화 대상 블록에 대한 예측을 수행하는 것을 말한다.

LSP(715)의 예측 모드가 계층간 예측 모드일 경우, 도 6에서 상술한 바와 같이 LSP(715)는 다른 계층(예컨대, 하위 계층(700)) 내 LSP(715)와 대응하는(co-located) 위치의 픽처(혹은 블록)을 참조하여 예측을 수행할 수도 있고, 상기 LSP(715)와 대응하는(co-located) 위치의 픽처(혹은 블록) 이외의 위치에 있는 다른 계층(예컨대, 하위 계층(700))의 픽처(혹은 블록)을 참조하여 예측 신호를 생성할 수도 있다. 예컨대, LSP(715)에 대한 움직임 예측을 통해 획득된 다른 계층(예컨대, 하위 계층(700))의 픽처(혹은 블록)를 참조할 수 있다.

- LSP(715)보다 표시 순서는 선행하나 코딩(인코딩/디코딩) 순서는 후행하는 리딩 픽처(leading picture)(713)는 LSP(715)를 참조할 수 있다. 다시 말해, LSP(715)는 리딩 픽처(7413)의 참조 픽처로 사용될 수 있다.

- LSP(715)보다 표시 순서 및 코딩(인코딩/디코딩) 순서가 후행하는 노말 픽처(normal picture)(717)는 LSP(715) 이전에 출력(디스플레이)되는 픽처들을 참조할 수 없다. 다시 말해, 노말 픽처(717)는 LSP(715)를 참조할 수 있으나, LSP(715)보다 표시 순서가 선행하는 픽처들(리딩 픽처 포함)을 참조할 수 없다.

도 8의 실시예에서는 설명의 편의를 위해 2개의 계층으로 구성된 스케일러블 비디오 코딩 구조를 도시하였다. 하위 계층(800)은 기본 계층일 수 있으며, 상위 계층(810)은 향상 계층일 수 있다. 이때, 계층은 공간적 스케일러블 계층 또는 질적 스케일러블 계층일 수 있다.

도 8에는 픽처의 코딩 순서(coding order) 및 표시 순서(display order 또는 output order)가 도시되어 있다. 코딩 순서는 인코딩(부호화) 순서 혹은 디코딩(복호화) 순서일 수 있다. 도시된 바와 같이 픽처의 코딩 순서와 표시 순서는 서로 다를 수 있다. 도 8에 도시된 화살표는 픽처가 다른 픽처를 참조하는지 여부에 대한 참조 관계를 나타낸다.

예를 들어, 계층간 전환이 가능한 시점의 LSP(817)에서 실제로 계층간 전환이 발생했을 경우, LSP(817) 및 LSP(817) 이후에 부호화 혹은 복호화되는 픽처들이 정상적으로 부호화 혹은 복호화가 수행되기 위해서는 LSP(817)에서 계층간 전환이 발생하였음을 알려줄 필요가 있다. 이때, 상기 LSP는 CRA(clean random access) 픽처일 수 있다.

일 예로, LSP(817)에서 계층간 전환이 발생하였음을 알려주기 위해 LSP(817)의 타입을 변경할 수 있다. 예컨대, LSP를 BLA(broken link access) 픽처와 같은 타입으로 변경할 수 있다. 이는 NAL 유닛 타입이 LSP에서 BLA로 변경됨으로써 LSP(817)에서 실제로 계층간 전환이 발생하였음을 인지할 수 있다.

여기서, BLA 픽처는 비트스트림이 스플라이싱(splicing)되거나 중간에 끊어지면 랜덤 억세스 포인트(random access point)로서 동작 가능한 비트스트림 내 위치를 지시하기 위한 픽처이다. BLA 픽처는 부호화 장치에서부터 정해질 수도 있고, 부호화 장치로부터 비트스트림을 수신한 시스템에서 LSP를 BLA 픽처로 변경할 수도 있다. 예를 들어, 비트스트림이 LSP에서 실제로 계층간 전환이 발생되는 경우 시스템(예컨대, 추출기(extractor) 또는 미들 박스(middle box) 등과 같은 시스템 레벨)은 LSP를 BLA 픽처로 변경하여 영상을 복호화하는 복호화 장치에게 제공할 수 있다. 이때 영상에 대한 파라미터 정보가 복호화 장치에 새롭게 제공될 수 있다. 본 발명에서 복호화 장치란 영상을 복호화할 수 있는 디바이스를 의미하며, 도 2의 복호화 장치로 구현될 수도 있고, 영상을 복호화하는 핵심 모듈로 구현될 수도 있다.

만일, LSP(817)에서 NAL 유닛 타입이 LSP에서 BLA로 변경된 경우, LSP(817)와, 표시 순서 및 코딩 순서 상 LSP(817)에 후행하는 노말 픽처(819)는 상술한 바와 같이 다른 계층(하위 계층(800))을 참조하여 부호화 혹은 복호화될 수 있다. 이때, 노말 픽처(819)는 LSP(817) 또는 다른 노말 픽처를 참조할 수는 있으나, LSP(817) 이전에 출력되는 픽처들(예컨대, 811, 813, 815)을 참조할 수는 없다.

한편, 표시 순서 상 LSP(817)에 선행하고 코딩 순서상 LSP(817)에 후행하는 리딩 픽처(813, 815)는 LSP(817), 다른 리딩 픽처, 또는 표시 순서 및 코딩 순서 상 리딩 픽처(813, 815)에 선행하는 과거 픽처(811)를 참조하여 부호화 혹은 복호화될 수 있다. 이때, LSP(817)에서 계층간 전환이 발생한 경우, 과거 픽처(811)는 수신된 비트스트림 내 존재하지 않거나 DPB 내 존재하지 않으므로, 가용하지 않을 수 있다. 따라서, 리딩 픽처(813, 815) 중에서 과거 픽처(811)를 참조하는 리딩 픽처(813)의 경우 복호화 시 정상적으로 복원되지 않을 수 있다. 이러한 경우, 가용하지 않는 픽처를 참조하여 정상적으로 복호화가 불가능한 리딩 픽처(813)는 복호화 과정에서 복호화하지 않고 스킵(skip)될 수 있다. 다시 말해, 복호화가 불가능한 리딩 픽처(813)는 비트스트림으로부터 제거되어 버려질 수 있다.

본 발명의 실시예에 따라 계층간 전환이 발생한 경우, 리딩 픽처(813, 815) 중에서 복호화가 가능한 리딩 픽처(815)는 LSP(817) 또는 다른 리딩 픽처(복호화가 가능한 다른 리딩 픽처)를 참조하여 복호화될 수 있으며, 복호화가 정상적으로 수행되지 않고 스킵되는 리딩 픽처(813)는 비트스트림으로부터 제거되어 복호화 과정 및 출력 과정에서 제외될 수 있다. 또는, 복호화가 가능한 리딩 픽처(815)와 복호화가 불가능한 리딩 픽처(813) 모두 비트스트림으로부터 제거된 다음 복호화 과정을 수행할 수도 있다.

또한, LSP(817)에서 계층간 전환이 발생했을 경우, LSP(817)에서 해당 계층의 SPS(sequence parameter set)가 활성화(activation)될 수 있다.

다른 예로, 계층간 전환이 가능한 시점의 LSP(817)에서 실제로 계층간 전환이 발생했을 경우, 복호화 장치가 입력되는 NAL 유닛을 통해 LSP(817)에서 계층간 전환이 발생하였음을 인지할 수 있다. 예컨대, 복호화 장치는 NAL 유닛 헤더에 저장된 계층을 식별하기 위한 계층 식별자 정보를 통해 계층간 전환이 발생하였는지 여부를 판단할 수 있다. 이때, LSP(817)에서 계층간 전환이 발생했을 경우, LSP(817)에서 해당 계층의 SPS가 활성화될 수 있다.

도 9는 본 발명의 일 실시예에 따른 영상 정보의 인코딩 방법을 개략적으로 나타내는 순서도이다. 도 9의 방법은 상술한 도 1의 부호화 장치에서 수행될 수 있다.

도 9를 참조하면, 부호화 장치는 제1 계층에서 제2 계층으로 계층간 전환이 가능한지 여부를 나타내는 계층간 전환 시점 정보를 부호화한다(S900). 여기서, 제1 계층에서 제2 계층으로 계층간 전환은 하위 계층에서 상위 계층, 혹은 상위 계층에서 하위 계층으로 계층간 전환일 수 있다.

계층간 시점 정보는 계층간 전환이 가능한 시점이 되는 계층 전환 픽처(layer switching picture; LSP)에 대한 정보를 포함할 수 있다. 이러한 계층 전환 픽처에 대한 정보는 NAL 유닛 타입으로 특정될 수 있다. 예컨대, 부호화 장치는 계층 전환 픽처에 대한 NAL 유닛 타입을 NAL 유닛 헤더에 저장한 다음 복호화 장치로 전송할 수 있다. 즉, 부호화 장치는 NAL 유닛 타입을 nal_unit_type 신택스로 부호화하여 NAL 유닛 헤더에 저장할 수 있다.

부호화 장치는 계층 전환 픽처를 부호화할 때, 계층 전환 픽처와 동일한 계층(제2 계층)의 픽처들 중에서 표시 순서 상 계층 전환 픽처에 선행하는 선행 픽처를 참조 픽처로 사용하지 않는다. 반면, 계층 전환 픽처와 다른 계층(제1 계층)의 픽처를 참조하여 부호화를 수행할 수 있다.

계층 전환 픽처가 다른 계층의 픽처를 참조하여 부호화될 때, 즉 계층 전환 픽처가 계층간 예측(inter-layer prediction mode)을 통해 부호화될 때, 상술한 바와 같이 계층 전환 픽처 내 부호화 대상 블록은 부호화 대상 블록에 대응하는 위치에 있는 다른 계층의 대응 블록(co-located block), 또는 부호화 대상 블록에 대한 움직임 예측을 통해 획득된 다른 계층의 블록을 참조하여 부호화될 수 있다.

또한, 부호화 장치는 계층 전환 픽처를 부호화할 때, 계층 전환 픽처 내 부호화 대상 블록의 주변에 위치한 이미 부호화된 블록을 참조하여 예측 신호를 생성하는 화면내 예측(intra prediction) 방법을 사용할 수도 있다.

부호화 장치는 표시 순서 상 계층 전환 픽처에 선행하고 부호화 순서 상 계층 전환 픽처에 후행하는 리딩 픽처를 부호화할 때, 계층 전환 픽처를 참조 픽처로 사용할 수 있다. 리딩 픽처는 상술한 바와 같이, 정상적으로 복호화가 수행되지 않고 스킵되는 제1 리딩 픽처와 정상적으로 복호화 가능한 제2 리딩 픽처를 포함할 수 있다. 부호화 장치는 이러한 제1 리딩 픽처와 제2 리딩 픽처를 복호화 장치에서 알 수 있도록 리딩 픽처에 대한 NAL 유닛 타입으로 특정하여 복호화 장치로 시그널링 할 수 있다.

부호화 장치는 표시 순서 및 부호화 순서 상 계층 전환 픽처에 후행하는 노말 픽처를 부호화할 때, 계층 전환 픽처 또는 다른 노말 픽처를 참조 픽처로 사용할 수 있으나, 표시 순서 상 계층 전환 픽처에 선행하는 픽처를 참조 픽처로 사용하지 않는다.

부호화 장치는 부호화된 정보를 포함하는 비트스트림을 생성하여 전송한다(S910). 이때, 부호화된 정보는 계층간 전환 시점 정보, 즉 계층간 전환이 가능한 시점의 계층 전환 픽처에 대한 NAL 유닛 타입 정보를 포함할 수 있다. 또한, 리딩 픽처가 존재할 경우, 리딩 픽처에 대한 NAL 유닛 타입 정보 등을 더 포함할 수 있다.

도 10은 본 발명의 일 실시예에 따른 영상 정보의 디코딩 방법을 개략적으로 나타내는 순서도이다. 도 10의 방법은 상술한 도 2의 복호화 장치에서 수행될 수 있다.

도 10을 참조하면, 복호화 장치는 제1 계층에서 제2 계층으로 계층간 전환이 가능한지 여부를 나타내는 계층간 전환 시점 정보를 포함하는 비트스트림을 수신한다(S1000). 여기서, 제1 계층에서 제2 계층으로 계층간 전환은 하위 계층에서 상위 계층, 혹은 상위 계층에서 하위 계층으로 계층간 전환일 수 있다.

계층간 시점 정보는 계층간 전환이 가능한 시점이 되는 계층 전환 픽처(layer switching picture; LSP)에 대한 정보를 포함할 수 있다. 이러한 계층 전환 픽처에 대한 정보는 NAL 유닛 타입으로 특정될 수 있다. 따라서, 복호화 장치는 수신된 비트스트림을 파싱하여 NAL 유닛 타입에 대한 정보를 획득하고, 획득된 NAL 유닛 타입을 통해 계층 전환 픽처에 대한 정보를 유도할 수 있다. 예컨대, 복호화 장치는 파싱된 비트스트림으로부터 NAL 유닛 헤더에 저장된 nal_unit_type 신택스를 획득할 수 있으며, nal_unit_type 신택스를 통해 어떤 NAL 유닛 타입인지를 알 수 있다.

복호화 장치는 계층간 전환 시점 정보에 기초하여 비트스트림을 복호화한다(S1010).

이때, 제1 계층에서 제2 계층으로 계층간 전환이 발생하는 경우, 복호화 장치는 비트스트림 내 계층간 전환이 되는 시점의 계층 전환 픽처에 대해서 복호화를 수행할 수 있다. 계층 전환 픽처는 계층 전환 픽처와 동일한 계층(제2 계층)의 픽처들 중에서 표시 순서 상 계층 전환 픽처에 선행하는 선행 픽처를 참조 픽처로 사용하지 않는다. 반면, 계층 전환 픽처와 다른 계층(제1 계층)의 픽처를 참조하여 복호화될 수 있다.

계층 전환 픽처가 다른 계층의 픽처를 참조하여 복호화될 경우, 즉 계층 전환 픽처가 계층간 예측(inter-layer prediction mode)을 통해 복호화될 경우, 상술한 바와 같이 계층 전환 픽처 내 복호화 대상 블록은 복호화 대상 블록에 대응하는 위치에 있는 다른 계층의 대응 블록(co-located block), 또는 복호화 대상 블록에 대한 움직임 예측을 통해 획득된 다른 계층의 블록을 참조하여 복호화될 수 있다.

또한, 복호화 장치는 계층 전환 픽처를 복호화할 경우, 계층 전환 픽처 내 복호화 대상 블록의 주변에 위치한 이미 복호화된 블록을 참조하여 예측 신호를 생성하는 화면내 예측(intra prediction) 방법을 사용할 수도 있다.

복호화 장치는 제1 계층에서 제2 계층으로 계층간 전환이 발생하는 경우, 표시 순서 상 계층 전환 픽처에 선행하고 복호화 순서 상 계층 전환 픽처에 후행하는 리딩 픽처에 대한 참조 픽처로 계층 전환 픽처를 사용할 수 있으며, 표시 순서 및 복호화 순서 상 계층 전환 픽처에 후행하는 노말 픽처에 대한 참조 픽처로 계층 전환 픽처보다 표시 순서가 선행하는 픽처를 사용하지 않는다.

한편, 수신된 비트스트림 내 계층 전환 픽처에서, 계층 전환 픽처에 대한 NAL 유닛 타입이 변경된 경우, 예를 들어 계층 전환 픽처에서 NAL 유닛 타입이 LSP(layer switching picture)에서 BLA(broken link access)로 변경된 경우, 복호화 장치는 제1 계층에서 제2 계층으로 계층간 전환이 발생하였음을 인지할 수 있다.

BLA 픽처는 상술한 바와 같이, 비트스트림이 스플라이싱(splicing)되거나 중간에 끊어지면 랜덤 억세스 포인트(random access point)로서 동작 가능한 비트스트림 내 위치를 지시하기 위한 픽처이다. BLA 픽처는 부호화 장치에서부터 정해질 수도 있고, 부호화 장치로부터 비트스트림을 수신한 시스템에서 랜덤 억세스 또는 계층간 전환이 발생하였을 경우 BLA 픽처로 변경할 수도 있다.

또는, 복호화 장치는 수신된 비트스트림으로부터 파싱된 계층을 식별하기 위한 계층 식별자 정보를 통해 제1 계층에서 제2 계층으로 계층간 전환이 발생하였음을 인지할 수 있다. 계층 식별자 정보는 비트스트림으로부터 파싱된 NAL 유닛 헤더에 저장된 nuh_layer_id 신택스로부터 유도될 수 있다.

상기와 같이 복호화 장치가 계층 전환 픽처에서 제1 계층에서 제2 계층으로 계층간 전환이 발생하였음을 인지한 경우, 복호화 장치는 비트스트림 내 존재하는 리딩 픽처를 복호화 과정 및 출력 과정에서 제외하고 비트스트림을 복호화할 수도 있다.

상술한 바와 같이, 표시 순서 및 복호화 순서 상 리딩 픽처에 선행하는 과거 픽처를 참조 픽처로 사용하는 리딩 픽처의 경우, 정상적으로 복호화가 불가능하다. 왜냐하면 과거 픽처가 비트스트림 또는 DPB 내 존재하지 않기 때문에 비가용한 참조 픽처가 된다. 즉, 리딩 픽처는 상기와 같이 정상적으로 복호화가 수행되지 않고 스킵되는 제1 리딩 픽처와 정상적으로 복호화 가능한 제2 리딩 픽처를 포함할 수 있다. 이러한 리딩 픽처에 대한 정보는 NAL 유닛 타입으로부터 유도될 수 있다. 예컨대, 복호화 장치는 리딩 픽처에 대한 NAL 유닛 타입을 통해 제1 리딩 픽처와 제2 리딩 픽처를 알 수 있다.

만일 NAL 유닛 타입이 제1 리딩 픽처를 지시하는 경우, 복호화 장치는 제1 리딩 픽처를 비트스트림으로부터 제거하여 비트스트림에 대한 복호화를 수행할 수 있다. 또는 NAL 유닛 타입이 제2 리딩 픽처를 지시하는 경우, 제2 리딩 픽처는 정상적으로 복호화 가능한 픽처이므로 복호화 장치는 제2 리딩 픽처에 대한 복호화를 수행할 수 있다. 또는, 복호화 장치는 제1 리딩 픽처와 제2 리딩 픽처 모두 복호화 과정 및 출력 과정에서 제외시킬 수도 있다.

그리고, 계층 전환 픽처에서 제1 계층에서 제2 계층으로 계층간 전환이 발생한 경우, 계층 전환 픽처에서 해당 계층의 SPS(sequence parameter set)가 활성화(activation)될 수 있다.

상술한 본 발명의 실시예들에서는 설명의 편의를 위하여 하위 계층에서 상위 계층으로 계층간 전환에 대해 설명하였으나, 이는 상위 계층에서 하위 계층으로 계층간 전환에 대해서도 적용될 수 있다.

상술한 실시예들에서, 방법들은 일련의 단계 또는 블록으로서 순서도를 기초로 설명되고 있으나, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 당해 기술 분야에서 통상의 지식을 가진 자라면 순서도에 나타난 단계들이 배타적이지 않고, 다른 단계가 포함되거나, 순서도의 하나 또는 그 이상의 단계가 본 발명의 범위에 영향을 미치지 않고 삭제될 수 있음을 이해할 수 있을 것이다.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호범위는 특허청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims

복수의 계층을 지원하는 영상 복호화 방법에 있어서,

제1 계층에서 제2 계층으로 계층간 전환이 가능한지 여부를 나타내는 계층간 전환 시점 정보를 포함하는 비트스트림을 수신하는 단계; 및

상기 계층간 전환 시점 정보에 기초하여 상기 비트스트림을 복호화하는 단계를 포함하며,

상기 계층간 전환 시점 정보는 계층간 전환이 가능한 시점의 계층 전환 픽처(layer switching picture; LSP)에 대한 정보를 포함하며,

상기 계층 전환 픽처에 대한 정보는 상기 비트스트림으로부터 파싱된 NAL(Network Abstraction Layer) 유닛 타입으로부터 유도되는 것을 특징으로 하는 영상 복호화 방법.
제1항에 있어서,

상기 비트스트림을 복호화하는 단계에서, 상기 제1 계층에서 상기 제2 계층으로 계층간 전환이 발생할 경우,

상기 비트스트림에 포함된 계층 전환 픽처는 상기 제2 계층의 픽처들 중에서 표시 순서 상 상기 계층 전환 픽처보다 선행하는 선행 픽처를 참조 픽처로 사용하지 않는 것을 특징으로 하는 영상 복호화 방법.
제1항에 있어서,

상기 비트스트림을 복호화하는 단계에서, 상기 제1 계층에서 상기 제2 계층으로 계층간 전환이 발생할 경우,

상기 비트스트림에 포함된 계층 전환 픽처는 상기 제1 계층의 픽처를 참조 픽처로 사용하는 것을 특징으로 하는 영상 복호화 방법.
제3항에 있어서,

상기 계층 전환 픽처 내 복호화 대상 블록은 상기 복호화 대상 블록에 대응하는 위치에 있는 상기 제1 계층의 대응 블록(co-located block) 또는 상기 복호화 대상 블록에 대한 움직임 예측을 통해 획득된 상기 제1 계층의 블록을 참조하여 복호화되는 것을 특징으로 하는 영상 복호화 방법.
제1항에 있어서,

상기 비트스트림을 복호화하는 단계에서, 상기 제1 계층에서 상기 제2 계층으로 계층간 전환이 발생할 경우,

상기 비트스트림에 포함된 계층 전환 픽처는 화면내 예측(intra prediction) 또는 계층간 예측(inter-layer prediction)을 통해 유도된 예측 신호를 이용하여 복호화되는 것을 특징으로 하는 영상 복호화 방법.
제5항에 있어서,

상기 계층 전환 픽처 내 복호화 대상 블록에 대한 계층간 예측은 상기 복호화 대상 블록에 대응하는 위치에 있는 상기 제1 계층의 대응 블록(co-located block) 또는 상기 복호화 대상 블록에 대한 움직임 예측을 통해 획득된 상기 제1 계층의 블록을 참조하여 예측 신호를 유도하는 것을 특징으로 하는 영상 복호화 방법.
제1항에 있어서,

상기 비트스트림을 복호화하는 단계에서, 상기 제1 계층에서 상기 제2 계층으로 계층간 전환이 발생할 경우,

상기 계층 전환 픽처보다 표시 순서는 선행하고 복호화 순서는 후행하는 리딩 픽처(leading picture)는 상기 계층 전환 픽처를 참조 픽처로 사용하는 것을 특징으로 하는 영상 복호화 방법.
제1항에 있어서,

상기 비트스트림을 복호화하는 단계에서, 상기 제1 계층에서 상기 제2 계층으로 계층간 전환이 발생할 경우,

상기 계층 전환 픽처보다 표시 순서 및 복호화 순서가 후행하는 노말 픽처(normal picture)는 상기 계층 전환 픽처보다 표시 순서가 선행하는 픽처를 참조 픽처로 사용하지 않는 것을 특징으로 하는 영상 복호화 방법.
제1항에 있어서,

상기 비트스트림을 복호화하는 단계에서는,

상기 계층 전환 픽처에 대한 NAL 유닛 타입이 BLA(broken link access) 픽처에 대한 NAL 유닛 타입으로 변경된 경우, 상기 제1 계층에서 상기 제2 계층으로 계층간 전환이 발생하였음을 인지하는 단계를 포함하며,

상기 BLA 픽처는 비트스트림이 스플라이싱(splicing)되거나 중간에 끊어지면 랜덤 억세스 포인트(random access point)로서 동작 가능한 비트스트림 내 위치를 지시하기 위한 픽처인 것을 특징으로 하는 영상 복호화 방법.
제9항에 있어서,

상기 비트스트림을 복호화하는 단계에서는,

상기 제1 계층에서 상기 제2 계층으로 계층간 전환이 발생하였음을 인지한 경우, 상기 BLA 픽처보다 표시 순서는 선행하고 복호화 순서는 후행하는 리딩 픽처(leading picture)를 상기 비트스트림으로부터 제거하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
제10항에 있어서,

상기 리딩 픽처는 복호화가 정상적으로 수행되지 않고 스킵되는 제1 리딩 픽처와 복호화가 정상적으로 수행되는 제2 리딩 픽처를 포함하고,

상기 리딩 픽처를 상기 비트스트림으로부터 제거하는 단계에서는,

상기 제1 리딩 픽처를 복호화 과정 및 출력 과정에서 제외 시키거나, 또는 상기 제1 리딩 픽처 및 상기 제2 리딩 픽처를 복호화 과정 및 출력 과정에서 제외시키는 것을 특징으로 하는 영상 복호화 방법.
제1항에 있어서,

상기 비트스트림을 복호화하는 단계에서는,

상기 비트스트림으로부터 파싱된 계층을 식별하기 위한 계층 식별자 정보를 기반으로 상기 제1 계층에서 상기 제2 계층으로 계층간 전환이 발생하였음을 인지하는 단계를 포함하며,

상기 계층 식별자 정보는 NAL 유닛 헤더에 포함되는 것을 특징으로 하는 영상 복호화 방법.
제1항에 있어서,

상기 비트스트림을 복호화하는 단계에서, 상기 제1 계층에서 상기 제2 계층으로 계층간 전환이 발생할 경우,

상기 제2 계층의 SPS(sequence parameter set)가 활성화(activation)되는 것을 특징으로 하는 영상 복호화 방법.
복수의 계층을 지원하는 영상 복호화 장치에 있어서,

제1 계층에서 제2 계층으로 계층간 전환이 가능한지 여부를 나타내는 계층간 전환 시점 정보를 포함하는 비트스트림을 수신하고, 상기 계층간 전환 시점 정보에 기초하여 상기 비트스트림을 복호화하는 복호화부를 포함하며,

상기 계층간 전환 시점 정보는 계층간 전환이 가능한 시점의 계층 전환 픽처(layer switching picture; LSP)에 대한 정보를 포함하며,

상기 계층 전환 픽처에 대한 정보는 상기 비트스트림으로부터 파싱된 NAL(Network Abstraction Layer) 유닛 타입으로부터 유도되는 것을 특징으로 하는 영상 복호화 장치.
복수의 계층을 지원하는 영상 부호화 방법에 있어서,

제1 계층에서 제2 계층으로 계층간 전환이 가능한지 여부를 나타내는 계층간 전환 시점 정보를 부호화하는 단계; 및

상기 계층간 전환 시점 정보를 포함하는 비트스트림을 전송하는 단계를 포함하며,

상기 계층간 전환 시점 정보는 계층간 전환이 가능한 시점의 계층 전환 픽처(layer switching picture; LSP)에 대한 정보를 포함하며,

상기 계층 전환 픽처에 대한 정보는 NAL(Network Abstraction Layer) 유닛 타입으로 특정되는 것을 특징으로 하는 영상 부호화 방법.
제15항에 있어서,

상기 계층간 전환 시점 정보를 부호화하는 단계에서,

상기 계층 전환 픽처는 상기 제2 계층의 픽처들 중에서 표시 순서 상 상기 계층 전환 픽처보다 선행하는 선행 픽처를 참조 픽처로 사용하지 않고 부호화되는 것을 특징으로 하는 영상 부호화 방법.
제15항에 있어서,

상기 계층간 전환 시점 정보를 부호화하는 단계에서,

상기 계층 전환 픽처는 상기 제1 계층의 픽처를 참조 픽처로 사용하여 부호화되는 것을 특징으로 하는 영상 부호화 방법.
제17항에 있어서,

상기 계층 전환 픽처 내 부호화 대상 블록은 상기 부호화 대상 블록에 대응하는 위치에 있는 상기 제1 계층의 대응 블록(co-located block) 또는 상기 부호화 대상 블록에 대한 움직임 예측을 통해 획득된 상기 제1 계층의 블록을 참조하여 부호화되는 것을 특징으로 하는 영상 부호화 방법.
제15항에 있어서,

상기 계층간 전환 시점 정보를 부호화하는 단계에서,

상기 계층 전환 픽처는 화면내 예측(intra prediction) 또는 계층간 예측(inter-layer prediction)을 통해 유도된 예측 신호를 이용하여 부호화되는 것을 특징으로 하는 영상 부호화 방법.
제19항에 있어서,

상기 계층 전환 픽처 내 부호화 대상 블록에 대한 계층간 예측은 상기 부호화 대상 블록에 대응하는 위치에 있는 상기 제1 계층의 대응 블록(co-located block) 또는 상기 부호화 대상 블록에 대한 움직임 예측을 통해 획득된 상기 제1 계층의 블록을 참조하여 예측 신호를 유도하는 것을 특징으로 하는 영상 부호화 방법.
제15항에 있어서,

상기 계층간 전환 시점 정보를 부호화하는 단계에서,

상기 계층 전환 픽처보다 표시 순서는 선행하고 부호화 순서는 후행하는 리딩 픽처(leading picture)는 상기 계층 전환 픽처를 참조 픽처로 사용하여 부호화되는 것을 특징으로 하는 영상 부호화 방법.
제15항에 있어서,

상기 계층간 전환 시점 정보를 부호화하는 단계에서,

상기 계층 전환 픽처보다 표시 순서 및 부호화 순서가 후행하는 노말 픽처(normal picture)는 상기 계층 전환 픽처보다 표시 순서가 선행하는 픽처를 참조 픽처로 사용하지 않고 부호화되는 것을 특징으로 하는 영상 부호화 방법.
제15항에 있어서,

상기 계층 전환 픽처보다 표시 순서는 선행하고 부호화 순서는 후행하는 리딩 픽처(leading picture)에 대한 정보를 부호화하는 단계를 포함하며,

상기 리딩 픽처는 NAL(Network Abstraction Layer) 유닛 타입으로 특정되며,

상기 리딩 픽처는 복호화가 정상적으로 수행되지 않고 스킵되는 제1 리딩 픽처와 복호화가 정상적으로 수행되는 제2 리딩 픽처를 포함하는 것을 특징으로 하는 영상 부호화 방법.
복수의 계층을 지원하는 영상 부호화 장치에 있어서,

제1 계층에서 제2 계층으로 계층간 전환이 가능한지 여부를 나타내는 계층간 전환 시점 정보를 부호화하고, 상기 계층간 전환 시점 정보를 포함하는 비트스트림을 전송하는 부호화부를 포함하며,

상기 계층간 전환 시점 정보는 계층간 전환이 가능한 시점의 계층 전환 픽처(layer switching picture; LSP)에 대한 정보를 포함하며,

상기 계층 전환 픽처에 대한 정보는 NAL(Network Abstraction Layer) 유닛 타입으로 특정되는 것을 특징으로 하는 영상 부호화 장치.