KR101212227B1

KR101212227B1 - 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 장치 및 방법

Info

Publication number: KR101212227B1
Application number: KR1020100134597A
Authority: KR
Inventors: 김용환; 이주영
Original assignee: 전자부품연구원
Priority date: 2010-12-24
Filing date: 2010-12-24
Publication date: 2012-12-13
Also published as: KR20120072718A

Abstract

액세스 유닛 단위 처리를 이용한 SVC의 복호화 방법이 개시된다. 액세스 유닛 단위 처리를 이용한 SVC의 복호화 방법은 SVC 영상 스트림에서 액세스 유닛(access unit)을 추출하는 단계, 추출된 액세스 유닛에 포함되는 모든 레이어를 분석하여 상위 레이어(enhancement layer)가 레이어간 예측(inter layer perdiction)을 위해 필요로 하는 참조 레이어(reference layer)의 레지듀얼(residual) 데이터를 파악하는 단계, 및 참조 레이어 복호화시 참조 레이어의 레지듀얼 데이터들 중 파악된 레지듀얼만을 공용 레지듀얼 메모리에 저장하는 복호화 단계를 포함한다. 이에 의해 메모리 접근이 줄어들어 복호화 시간이 단축되며, 메모리 소비 또한 줄어든다.

Description

액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 장치 및 방법{Access unit based decoding method and device for SVC}

본 발명은 H.264/AVC(Advanced Video Coding) SVC(Scalable Video Coding) 영상의 복호화에 관한 것으로, 특히 레이어간 예측(inter layer prediction, ILP)을 이용하여 코딩 효율을 높이기 위한 기술에 관한 것이다.

최근 다양한 네트워크를 통하여 다양한 단말기를 대상으로 하는 비디오 커뮤니케이션이 점점 더 관심을 받고 있다. 이러한 산업계의 요구를 받아들여, 하나의 비디오 스트림(stream)에 공간(spatial), 시간(temporal), 화질(quality) 영역에서 여러 해상도(resolution)를 지원하는 스케일러블 비디오 코딩(Scalable Video Coding, SVC)이 H.264/AVC의 amendment 3으로써 2007년 말에 표준화되었다. SVC는 레이어간 예측(inter layer prediction, ILP)을 이용하여 기존의 사이멀캐스트(simulcast) 코딩에 비해 코딩효율을 높인다. 반면, SVC의 ILP를 위해서는 많은 계산 시간이 소요된다. 또한 SVC의 ILP를 위해서는 사이멀캐스트 코딩에 비해 저장하여야 할 데이터가 많아지기 때문에, 메모리 소비가 증가하게 된다. 특히 SVC는 세 종류의 레지듀얼 예측(residual prediction)을 지원하는데, 이를 위해서는 저장되어야 할 데이터의 양이 매우 증가하게 된다. 레지듀얼 예측은 상위 레이어(enhancement layer, EL)의 레지듀얼과 참조 레이어(reference layer, RL)의 레지듀얼의 상관관계를 줄여 코딩 효율을 높일 수 있다. ILP에서 사용하는 세 종류의 레지듀얼은 다음과 같다.

1) transform coefficient level (TCL) : 엔트로피 코딩 결과를 역 스캔(inverse-scan)한 값, 즉 역 양자화(inverse-quantization, Inv-Q) 이전의 값

2) transform coefficient (TC) : Inv-Q 이후의 값

3) pixel residual (PR) : 역변환(inverse-DCT, Inv-DCT) 이후의 값

도 1은 SVC에서 지원하는 세 종류의 레지듀얼 예측을 나타낸 도면이다.

상위 레이어가 공간영역에서 해상도를 가지는 레이어(spatial layer)인 경우, 상위 레이어는 참조 레이어의 PR을 참조하게 된다. 상위 레이어가 화질 영역에서 해상도를 가지는 레이어(quality layer)인 경우, EL 슬라이스 헤더의 tcoeff_level_prediction_flag 값에 따라 그 값이 “0”인 경우에는 참조 레이어의 TC를 “1”인 경우에는 참조 레이어의 TCL을 참조하게 된다. 이와 같이, 상위 레이어의 종류와 상위 레이어 슬라이스 헤더의 tcoeff_level_prediction_flag 값에 따라서 세 종류의 레지듀얼 중 하나만이 예측에 사용된다.

한편, SVC 표준의 참조 소프트웨어인 JSVM(Joint Scalable Video Model)은 NALU(network abstraction layer unit) 단위로 복호화를 수행한다. 즉, 기본 레이어(base layer)에서 타겟 레이어(target layer)까지 낮은 dq_id(=dependency_id*16 + quality_id)를 가지는 레이어 순으로 복호화를 수행하기 때문에, 참조 레이어를 복호하는 시점에서는 상위 레이어의 종류 및 tcoeff_level_prediction_flag 값을 알 수 없다. 따라서 상위 레이어에서는 세 가지의 레지듀얼 중 하나만을 예측에 이용함에도 불구하고, 참조 레이어의 복호화 시점에서 상위 레이어가 세 가지 레지듀얼 중 어느 것을 예측에 이용하는지 알 수 없기 때문에, 세 가지 레지듀얼 데이터를 모두 저장하게 된다. 또한 세 종류의 레지듀얼 데이터를 별도로 저장하기 위한 세 개의 메모리가 필요로 된다. 이는 불필요한 메모리 소비와 메모리 접근(memory access)에 의한 계산량 증가를 가져오게 된다. 특히 각 레지듀얼 메모리의 크기는 픽쳐 메모리의 크기보다 크기 때문에, 레지듀얼을 저장하면서 발생하는 메모리 접근에 의한 계산 시간이 참조 레이어 전체를 복호화하기 위한 시간의 상당 부분을 차지한다. 또한 TCL, TC, PR 데이터에 대해 각각의 메모리를 필요로 하게 되므로, 메모리 소비도 무시할 수 없다.

추가로, 상위 레이어에서 PR을 사용하지 않는 경우에 대해서도 참조 레이어 복호 과정에서 PR을 저장하기 때문에, PR을 구하기 위해서 불필요하게 Inv-DCT를 수행하게 되는 경우가 발생할 수 있다. 그리고 SVC는 상위 레이어가 spatial layer이고 tcoeff_level_prediction_flag 값이 “1”인 경우, 상위 레이어 복호화시 참조 레이어의 인트라 모드(intra mode)를 참조한다. 그런데 JSVM에서는 참조 레이어 복호화 시점에 상위 레이어의 종류 및 tcoeff_level_prediction_flag 값을 알 수 없기 때문에, 상위 레이어가 인트라 모드를 참조하는지에 대한 여부를 판단할 수 없다. 따라서 모든 참조 레이어에 대해서 인트라 모드를 저장하게 되며, 이는 불필요한 메모리 소비 및 메모리 접근에 의한 연산량 증가를 가져온다.

본 발명은 불필요한 메모리 접근을 피하여 복호화 시간을 단축할 수 있으며, 메모리 소비량을 줄일 수 있는 효율적인 SVC 영상 복호화 장치 및 방법을 제공함을 목적으로 한다.

또한 본 발명은 복호화 과정에서 불필요한 연산을 생략할 수 있는 효율적인 SVC 영상 복호화 장치 및 방법을 제공함을 목적으로 한다.

전술한 기술적 과제를 달성하기 위한 본 발명의 일 양상에 따른 액세스 유닛 단위 처리를 이용한 SVC의 복호화 방법은 SVC 영상 스트림에서 액세스 유닛(access unit)을 추출하는 단계, 추출된 액세스 유닛에 포함되는 모든 레이어를 분석하여 상위 레이어(enhancement layer)가 레이어간 예측(inter layer perdiction)을 위해 필요로 하는 참조 레이어(reference layer)로부터 요구되는 레지듀얼(residual) 데이터를 파악하는 단계, 및 참조 레이어 복호화시 참조 레이어의 레지듀얼 데이터들 중 파악된 레지듀얼만을 공용 레지듀얼 메모리에 저장하는 복호화 단계를 포함한다.

참조 레이어로부터 요구되는 레지듀얼을 파악하는 단계는 추출된 액세스 유닛에 포함되는 레이어를 구성하는 모든 슬라이스 NALU(network abstraction layer unit) 중에서 첫 번째 슬라이스 NALU의 헤더를 해석하는 단계, 해석된 NAL 헤더를 통해 상위 레이어로 확인되면 해석된 슬라이스 헤더를 통해 레이어 타입을 판단하는 단계, 및 파악된 레이어 타입과 첫 번째 슬라이스 NALU의 슬라이스 헤더 해석을 통해 파악된 변환 계수 레벨 예측 수행 여부를 나타내는 값을 통해 상위 레이어가 필요로 하는 참조 레이어(reference layer)의 레지듀얼(residual) 데이터를 파악하는 단계를 포함한다.

레이어 타입을 판단하는 단계는 첫 번째 슬라이스 NALU의 슬라이스 헤더 해석을 통해 파악된 상위 레이어의 픽쳐 크기와 추출된 액세스 유닛을 구성하는 참조 레이어 NALU의 슬라이스 헤더 해석을 통해 파악된 참조 레이어의 픽처 크기를 비교하는 단계, 및 비교 결과 상위 레이어의 픽쳐 크기와 참조 레이어의 픽처 크기가 같을 경우는 상위 레이어가 퀄리티 레이어(quality layer)인 것으로 판단하고, 상위 레이어의 픽쳐 크기가 참조 레이어의 픽처 크기보다 클 경우는 상위 레이어가 공간 레이어(spatial layer)인 것으로 판단하는 단계를 포함한다.

한편, 전술한 기술적 과제를 달성하기 위한 본 발명의 일 양상에 따른 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩 방식의 복호화 장치는 참조 레이어(reference layer)의 레지듀얼(residual) 데이터를 저장하기 위한 공용 레지듀얼 메모리, 스케일러블 비디오 코딩 영상 스트림에서 액세스 유닛(access unit)을 추출하는 액세스 유닛 추출부, 추출된 액세스 유닛에 포함되는 모든 레이어의 첫 번째 슬라이스 NALU의 헤더를 분석하여 상위 레이어(enhancement layer)가 레이어간 예측(inter layer perdiction)을 위해 참조 레이어(reference layer)의 레지듀얼(residual) 데이터인 TCL(transform coeffcient level) 데이터와 TC(transform coefficient) 데이터 및 PR(pixel residual) 데이터 중 필요로 하는 레지듀얼 레이터를 파악하는 레지듀얼 파악부, 및 참조 레이어 복호화시 파악된 레지듀얼 데이터만을 공용 레지듀얼 메모리에 저장하는 복호화부를 포함한다.

복호화부는 상위 레이어가 퀄리티 레이어(quality layer)이고 참조 레이어의 복호화 단위인 매크로블록의 타입이 인터(inter)인 경우, 그 매크로블록 복호화시 역 이산 코사인 변환(inverse discrete cosine transform)을 생략한다. 또한 복호화부는 파악된 레지듀얼 데이터가 TCL(transform coeffcient level) 데이터인 경우에만 참조 레이어의 복호화 단위인 매크로블록의 인트라 모드(intra mode)를 저장한다.

액세스 유닛 단위로 복호화를 수행하는 본 발명에 따르면, RL 복호화시 TCL 데이터, TC 데이터, PR 데이터 중 어느 하나의 레지듀얼 데이터만을 저장하면 되므로, 메모리 접근에 의한 연산량 부하를 줄일 수 있다. 또한 기존에는 TCL 데이터, TC 데이터, PR 데이터에 대해 세 개의 메모리를 별도로 가지고 있어야 했으나, 본 발명에 따르면 하나의 공유 레지듀얼 메모리를 이용하여 SVC 영상 스트림을 복호화할 수 있다. 또한 EL이 quality layer이고 RL의 매크로블록 타입이 인터(inter)인 경우 복호화시 Inv-DCT 연산을 수행하지 않아도 되므로, 불필요한 Inv-DCT 연산을 없앨 수 있다. 또한 RL 복호화시 TCL 데이터를 저장하는 경우에만 RL의 복호화 단위인 매크로블록의 인트라 모드를 저장하면 되므로, 메모리 접근의 수와 메모리 소비량을 줄일 수 있다.

도 1은 SVC에서 지원하는 세 종류의 레지듀얼 예측을 나타낸 도면.
도 2는 본 발명의 일 실시예에 따른 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 장치 블록도.
도 3은 SVC 영상의 액세스 유닛을 나타낸 도면.
도 4는 본 발명의 일 실시예에 따른 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 방법 흐름도.
도 5는 본 발명의 일 실시예에 따른 참조 레이어 복호화시 필요한 세 개의 파라미터를 계산하는 방법을 표현한 도면.
도 6은 본 발명의 일 실시예에 따른 참조 레이어의 매크로블록 단위 복호화 예시도.

전술한, 그리고 추가적인 본 발명의 양상들은 첨부된 도면을 참조하여 설명되는 바람직한 실시예들을 통하여 더욱 명백해질 것이다. 이하에서는 본 발명을 이러한 실시예를 통해 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.

도 2는 본 발명의 일 실시예에 따른 액세스 유닛 단위 처리를 이용한 SVC의 복호화 장치 블록도이며, 도 3은 SVC 영상의 액세스 유닛을 나타낸 도면이다.

액세스 유닛 단위 처리를 이용한 SVC의 복호화 장치는 액세스 유닛(access unit, AU) 단위로 복호화를 수행한다. AU 단위 복호화를 위해, 도 2에 도시된 바와 같이 AU 단위 처리를 이용한 SVC의 복호화 장치는 AU 추출부(AU extractor)(210)를 포함한다. AU 추출부(210)는 dq_id(=dependency_id*16 + quality_id)를 이용하여 SVC 영상 스트림에서 AU를 추출한다. 도 3에서 보이는 것과 같이, 하나의 AU는 동일 시간대의 모든 레이어의 슬라이스 NALU를 포함한다. AU 추출부(210)에 의해 AU가 추출되면, 레지듀얼 파악부(221)는 AU에 포함되는 모든 레이어를 분석하여, 레이어 복호화 시 필요한 정보를 얻는다. 즉, 레지듀얼 파악부(221)는 레이어 분석을 통하여 EL이 ILP를 위해 RL의 어떠한 정보를 참조하는지에 대해 파악하는 것이다.

레지듀얼 파악부(221)는 레이어의 모든 슬라이스 NALU 중에서 첫 번째 슬라이스 NALU에 대해서 NAL 헤더 및 슬라이스 헤더(slice header)를 해석(parsing)한다. 레지듀얼 파악부(221)는 해석된 NAL 헤더를 통해 그 레이어가 EL인지 아니면 RL인지를 확인할 수 있다. 또한 레지듀얼 파악부(221)는 해석된 슬라이스 헤더를 통해 레이어의 픽쳐 크기와 참조 레이어 식별자인 ref_layer_dq_id 및 변환 계수 레벨 예측 수행 여부를 나타내는 플래그 값인 tcoeff_level_prediction_flag의 값을 알 수 있다. 단, ref_layer_dq_id와 tcoeff_level_prediction_flag 값은 EL의 슬라이스 NALU인 경우에만 해당한다. NAL 헤더를 통해 그 레이어가 EL로 확인된 경우, 레지듀얼 파악부(221)는 해당 EL이 참조할 RL을 ref_layer_dq_id를 통해 찾는다. 그 다음, 레지듀얼 파악부(221)는 EL의 픽쳐 크기와 RL의 픽쳐 크기를 이용하여 EL의 레이어 타입을 구한다. 여기서 레이어 타입이란 EL이 spatial layer인지 quality layer인지를 나타내는 것이다. EL의 픽쳐 크기와 RL의 픽쳐 크기가 같을 경우는 quality layer가 되며, EL의 픽쳐 크기가 RL의 픽쳐 크기보다 클 경우 spatial layer가 된다.

EL의 레이어 타입과 EL 슬라이스 NALU의 tcoeff_level_prediction_flag 값을 통해, 레지듀얼 파악부(221)는 RL 복호화시 필요한 레지듀얼 데이터가 어떤 데이터인지 파악할 수 있다. 즉, 레지듀얼 파악부(221)는 EL의 레이어 타입이 quality layer이고 tcoeff_level_prediction_flag 값이 ‘1’인 경우 RL 복호화시 저장해야 할 레지듀얼 데이터는 TCL 데이터인 것으로 파악하고, EL의 레이어 타입이 quality layer이고 tcoeff_level_prediction_flag 값이 ‘0’인 경우 RL 복호화시 저장해야 할 레지듀얼 데이터는 TC 데이터인 것으로 파악한다. 그리고 레이어 타입이 spatial layer인 경우, 레지듀얼 파악부(221)는 RL 복호화시 저장해야 할 레지듀얼 데이터는 PR 데이터인 것으로 파악한다.

복호화부(222)는 AU를 구성하는 모든 슬라이스 NALU에 대해 복호화를 수행하는데, 하나의 슬라이스 NALU에 대해서는 매크로블록(macro block, MB) 단위로 복호화를 수행한다. 복호화부(222)는 RL의 MB 복호화 과정에서 레지듀얼 파악부(221)에 의해 파악된 레지듀얼 데이터만을 공용 레지듀얼 메모리(240)에 저장한다. 한편, EL이 quality layer이고 RL의 MB 타입이 인터(inter)인 경우, 복호화부(222)는 MB 복호화시 Inv-DCT를 생략한다. MB 타입이 인터인 경우는 RL의 픽셀 값을 복원하지 않으므로 PR 데이터를 필요로 하지 않게 되고, EL이 quality layer인 경우는 EL에서 PR 데이터를 참조하지 않기 때문이다. 따라서 이 경우는 Inv-DCT를 수행하지 않아도 된다. 또한 복호화부(222)는 레지듀얼 파악부(221)에 의해 파악된 레지듀얼 데이터가 TCL 데이터인 경우에만 MB의 인트라 모드(intra mode)를 저장한다. EL이 ILP를 위해 TCL 데이터를 필요로 하는 경우에만 RL의 인트라 모드를 참조하기 때문이다.

도 4는 본 발명의 일 실시예에 따른 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 방법 흐름도이다.

AU 단위 복호화를 위해, AU 추출부(210)는 SVC 영상 스트림에서 AU를 추출한다(S405). AU 추출부(210)에 의해 AU가 추출되면, 추출된 AU에 포함된 슬라이스 NALU의 개수가 몇 개인지 알 수 있다. 이하에서는 이 슬라이스 NALU의 개수를 numNALs로 표현한다. 이후 추출된 AU에 속하는 모든 레이어에 대한 복호화 수행은 레이어 분석(layer analysis)과 레이어 복호화(layer decoding)의 두 단계로 나뉜다. 우선 레이어 분석 단계에 대해 설명한다.

이 레이어 분석 단계에서는 복호화에 앞서, 하나의 AU에 포함되는 모든 레이어를 분석하여 복호화 단계에서 필요한 정보를 얻는다. 즉, 레이어 분석을 통하여 EL이 ILP를 위해 RL의 어떠한 정보를 참조하는지에 대해 파악하는 것이다. 우선 i에 ‘0’값이 주어지고 numNALs보다 작은지 비교한 후 i 값을 ‘1’ 증가시킨다(S410)(S415). i가 numNALs보다 작으면 추출된 AU에 아직 해석되지 않은 슬라이스 NALU 헤더가 존재함을 의미한다. i가 numNALs보다 작으면, AU 디코더(220)는 첫 번째 슬라이스 NALU인지 아닌지를 판단한다(S420). 첫 번째 슬라이스 NALU이면, AU 디코더(220)는 슬라이스 NALU의 NAL 헤더와 슬라이스 헤더를 해석(parsing)한다(S425). 그 다음, 해석된 NAL 헤더를 통해 EL인지 아닌지를 판단한다(S430). EL 슬라이스 NALU인 경우, AU 디코더(220)는 그 EL이 필요로 하는 RL의 레지듀얼 데이터를 파악하는 과정을 수행한다(S435). 그 과정은 다음과 같다.

우선, AU 디코더(220)는 해당 EL이 참조할 RL을 슬라이스 헤더 해석을 통해 확인된 ref_layer_dq_id를 통해 찾는다. 그 다음, AU 디코더(220)는 EL의 픽쳐의 크기와 RL의 픽쳐의 크기를 이용하여 EL의 레이어 타입을 구한다. RL에 대해서는 EL보다 우선적으로 분석 과정이 수행되므로, RL의 슬라이스 NALU의 슬라이스 헤더 해석으로부터 RL의 픽쳐 크기는 이미 알고 있게 된다. 그리고 레이어 타입이란 EL이 spatial layer인지 quality layer인지를 나타내는 것이다. EL의 픽쳐 크기와 RL의 픽쳐 크기가 같을 경우 quality layer, EL의 픽쳐 크기가 RL의 픽쳐 크기보다 클 경우 spatial layer가 된다.

EL의 레이어 타입이 확인되면, AU 디코더(220)는 EL의 레이어 타입과 슬라이스 헤더 해석을 통해 확인된 EL 슬라이스 NALU의 tcoeff_level_prediction_flag를 이용하여 RL 복호화시 필요한 세 개의 파라미터인 bStoreTCL, bStoreTC, bStorePR을 계산한다. bStroeTCL은 RL 복호화시 TCL 데이터를 저장할 것인지의 여부를 나타내고, bStoreTC는 RL 복호화시 TC 데이터를 저장할 것인지의 여부를 나타내며, bStorePR은 RL 복호화시 PR 데이터를 저장할 것인지의 여부를 나타낸다. 이 같은 세 개의 파라미터를 계산하는 방법은 도 5와 같다.

도 5에서 보이는 것과 같이, 세 개의 파라미터 중 오직 하나의 파라미터만이 “1”이 될 수 있다. 이는 RL 복호화시 세 개의 레지듀얼 데이터인 TCL 데이터, TC 데이터, PR 데이터 중 오직 하나의 레지듀얼 데이터만을 저장하여도 됨을 의미한다. 또한 도 5에서 bStroeTCL은 EL이 spatial layer이고 tcoeff_level_prediction_flag가 “1”일 때 값이 “1”로 설정됨을 보인다. 이러한 bStoreTCL의 값은 RL의 인트라 모드 전체 저장 여부를 결정할 수 있다.

한편, S415 과정에서 i가 numNALs 이상이 되면, AU 디코더(220)는 레이어 복호화 단계를 수행한다. 우선 i에 ‘0’값이 주어지고 numNALs보다 작은지 비교한 후 i 값을 ‘1’ 증가시킨다(S440)(S445). i가 numNALs보다 작으면 추출된 AU에 아직 디코딩되지 않은 슬라이스 NALU가 존재함을 의미한다. i가 numNALs보다 작으면, AU 디코더(220)는 첫 번째 슬라이스 NALU인지 아닌지를 판단한다(S450). 첫 번째 슬라이스 NALU이면 헤더가 이미 레이어 분석 단계에서 해석되었으므로, 헤더 해석 과정을 수행하지 않고 곧바로 복호화를 수행한다(S460). 첫 번째 슬라이스 NALU가 아니면 헤더를 해석한 후 복호화를 수행한다(S455)(S460).

도 6은 본 발명의 일 실시예에 따른 RL의 MB 단위 복호화 절차도이다.

우선 AU 디코더(220)는 MB를 해석하고, bStore TCL을 확인한다(S605)(S610). bStore TCL이 “1”로 설정되어 있으면, AU 디코더(220)는 TCL 데이터를 공용 레지듀얼 메모리(240)에 저장한다(S615). bStore TCL을 확인한 후, AU 디코더(220)는 Inv-Q를 수행하고, Inv-Q가 종료되면 bStoreTC를 확인한다(S620)(S625). bStoreTC가 “1”로 설정되어 있으면, AU 디코더(220)는 TC 데이터를 공용 레지듀얼 메모리(240)에 저장한다(S630). bStore TC를 확인한 후, AU 디코더(220)는 MB의 타입이 인트라(intra)인지 아니면 인터(inter)인지를 확인한다(S635). MB의 타입이 인트라이면, AU 디코더(220)는 Inv-DCT를 수행하고, 인트라 예측 및 복원(Intra prediction and Reconstruction) 과정을 수행한다(S640)(S645). MB의 타입이 인터인 경우, AU 디코더(220)는 bStorePR을 확인한다(S650). bStorePR이 “1”로 설정되어 있으면, AU 디코더(220)는 Inv-DCT를 수행한 후 PR 데이터를 공용 레지듀얼 메모리(240)에 저장한다(S655)(S660).

도 6을 통해 알 수 있듯이, RL 복호화시 TCL 데이터, TC 데이터, PR 데이터 중 하나만이 저장된다. 그리고 bStorePR의 값이 “1”이 아니고 해당 MB의 타입이 인터인 경우, PR 데이터가 필요 없게 된다. MB 타입이 인터인 경우는 RL의 픽셀 값을 복원하지 않으므로 PR 데이터를 필요로 하지 않게 되고, bStorePR이 “1”이 아닌 경우는 EL에서 PR 데이터를 참조하지 않기 때문이다. 따라서 이 경우는 Inv-DCT를 수행하지 않아도 된다. 따라서 본 발명에 따르면, RL 복호화시 TCL 데이터, TC 데이터, PR 데이터 중 어느 하나의 레지듀얼 데이터만을 저장하면 되므로, 메모리 접근에 의한 연산량 부하를 줄일 수 있고, 불필요한 Inv-DCT 연산을 없앨 수 있다. 또한 도 6에서 보이는 것과 같이, 하나의 공유 레지듀얼 메모리를 이용하여 SVC 영상 스트림을 복호화할 수 있다. 또한 RL 복호화시 bStoreTCL 값이 “1”이 될 경우에만 MB의 인트라 모드를 저장한다. 이는 bStoreTCL 값이 “1”이 될 경우에만, EL에서 RL의 인트라 모드를 참조하기 때문이다. 이 같이 일부의 경우에만 인트라 모드를 저장하므로, 메모리 접근의 수와 메모리 소비량을 줄일 수 있다.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

210 : AU 추출부 220 : AU 디코더
221 : 레지듀얼 파악부 222 : 복호화부
230 : 공용 레지듀얼 메모리

Claims

스케일러블 비디오 코딩 영상 스트림에서 액세스 유닛(access unit)을 추출하는 단계;
상기 추출된 액세스 유닛에 포함된 모든 레이어를 분석하여, 참조 레이어(reference layer)의 레지듀얼(residual) 데이터들 중 상위 레이어(enhancement layer)의 레이어간 예측(inter layer prediction)을 위한 레지듀얼(residual) 데이터를 파악하는 단계; 및
상기 참조 레이어를 복호화시 상기 파악된 레지듀얼 데이터만을 공용 레지듀얼 메모리에 저장하는 복호화 단계;
를 포함하는 것을 특징으로 하는 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 방법.
제1항에 있어서, 상기 레지듀얼 데이터를 파악하는 단계는 :
상기 추출된 액세스 유닛에 포함되는 레이어를 구성하는 모든 슬라이스 NALU(network abstraction layer unit) 중에서 첫 번째 슬라이스 NALU의 헤더를 해석하는 단계;
상기 해석된 NAL 헤더를 통해 상위 레이어로 확인되면, 상기 해석된 슬라이스 헤더를 통해 레이어 타입을 파악하는 단계; 및
상기 파악된 레이어 타입과 상기 첫 번째 슬라이스 NALU의 슬라이스 헤더 해석을 통해 파악된 변환 계수 레벨 예측 수행 여부를 나타내는 값을 통해 상기 참조 레이어의 레지듀얼 데이터를 파악하는 단계;
를 포함하는 것을 특징으로 하는 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 방법.
제2항에 있어서, 상기 레이어 타입을 파악하는 단계는 :
상기 첫 번째 슬라이스 NALU의 슬라이스 헤더 해석을 통해 파악된 상기 상위 레이어의 픽쳐 크기와 상기 추출된 액세스 유닛을 구성하는 참조 레이어 NALU의 슬라이스 헤더 해석을 통해 파악된 상기 참조 레이어의 픽처 크기를 비교하는 단계; 및
상기 비교 결과 상기 상위 레이어의 픽쳐 크기와 상기 참조 레이어의 픽처 크기가 같을 경우는 상기 상위 레이어가 퀄리티 레이어(quality layer)인 것으로 판단하고, 상기 상위 레이어의 픽쳐 크기가 상기 참조 레이어의 픽처 크기보다 클 경우는 상기 상위 레이어가 공간 레이어(spatial layer)인 것으로 판단하는 단계;
를 포함하는 것을 특징으로 하는 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 방법.
제1항에 있어서,
상기 복호화 단계는 상기 상위 레이어가 퀄리티 레이어이고 상기 참조 레이어의 복호화 단위인 매크로블록의 타입이 인터(inter)인 경우, 역 이산 코사인 변환(inverse discrete cosine transform)을 생략함을 특징으로 하는 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 방법.
제1항에 있어서,
상기 복호화 단계는 상기 파악된 레지듀얼이 TCL(transform coeffcient level) 데이터인 경우에만 상기 참조 레이어의 복호화 단위인 매크로블록의 인트라 모드를 저장함을 특징으로 하는 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 방법.
참조 레이어(reference layer)의 레지듀얼(residual) 데이터를 저장하기 위한 공용 레지듀얼 메모리;
스케일러블 비디오 코딩 영상 스트림에서 액세스 유닛(access unit)을 추출하는 액세스 유닛 추출부;
상기 추출된 액세스 유닛에 포함된 모든 레이어의 첫 번째 슬라이스 NALU 헤더를 분석하여, 참조 레이어(reference layer)의 레지듀얼 데이터들인 TCL(transform coeffcient level) 데이터와 TC(transform coefficient) 데이터 및 PR(pixel residual) 데이터 중 상위 레이어(enhancement layer)의 레이어간 예측(inter layer prediction)을 위한 레지듀얼 데이터를 파악하는 레지듀얼 파악부; 및
상기 참조 레이어를 복호화시 상기 파악된 레지듀얼 데이터만을 상기 공용 레지듀얼 메모리에 저장하는 복호화부;
를 포함하는 것을 특징으로 하는 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 장치.
제6항에 있어서,
상기 복호화부는 상기 상위 레이어가 퀄리티 레이어(quality layer)이고 상기 참조 레이어의 복호화 단위인 매크로블록의 타입이 인터(inter)인 경우, 그 매크로블록 복호화시 역 이산 코사인 변환(inverse discrete cosine transform)을 생략함을 특징으로 하는 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 장치.
제6항에 있어서,
상기 복호화부는 상기 파악된 레지듀얼 데이터가 TCL(transform coeffcient level) 데이터인 경우에만 상기 참조 레이어의 복호화 단위인 매크로블록의 인트라 모드(intra mode)를 저장함을 특징으로 하는 액세스 유닛 단위 처리를 이용한 스케일러블 비디오 코딩의 복호화 장치.