KR20140092201A

KR20140092201A - 계층적 비디오 부호화에서의 스케일러빌리티 정보 표현방식

Info

Publication number: KR20140092201A
Application number: KR1020130082480A
Authority: KR
Inventors: 강정원; 이하현; 이진호; 최진수; 김진웅
Original assignee: 한국전자통신연구원
Priority date: 2013-01-07
Filing date: 2013-07-12
Publication date: 2014-07-23
Also published as: US20190089965A1; JP6841877B2; US20200007876A1; JP7371181B2; EP4274232A2; CN104969554A; US10455241B2; KR20140093577A; JP2021093742A; CN104969554B; JP2022160676A; US20150365686A1; CN109462764B; US10116946B2; KR20220113668A; US20180063535A1; CN109462764A; US9843814B2; EP4274232A3; EP2942964B1

Abstract

계층적 비디오 부호화에서의 스케일러빌리티 정보 표현방식

Description

계층적 비디오 부호화에서의 스케일러빌리티 정보 표현방식{Video Description for Scalable Coded Video Bitstream}

본 발명은 비디오 비트스트림내에 추출정보(extraction)/계층적 정보(scalability information)을 기술하여 적응적 비디오 전송 및 소비를 가능하게 하는 기술에 관한 것이다.

이종의 통신망 및 다양한 단말로 인해 스케일러빌리티는 현재 비디오 포맷의 중요한 기능이 되었다. 콘텐츠 전달경로(content delivery path)에서의 모든 노드에서 비트스트림을 효과적이며 효율적으로 변환하기 위해서는 비트스트림의 스케일러빌리티 정보가 매우 중요하다. 현재 HEVC(High Efficiency Video Coding) 표준화에서 비트스트림과 관련된 중요한 정보는 Video Parameter Set(VPS)에 기술하도록 되어 있다.

본 발명에서는 계층적 비트스트림내의 추출 및 스케일러빌리티 정보를 기술하는 방법을 제안하며, 그 목적은 1) 다양한 종류의 비트스트림의 스케일러빌리티 정보를 표현하기 위한 유연한 방식을 제공하며 2) 패킷레벨에서의 효율적인 적응변환을 가능하게 하기 위함이다.

본 발명에서는 계층적 비트스트림내의 추출 및 스케일러빌리티 정보를 기술하는 방법을 제안한다.

본 발명은 계층적 비디오 부호화를 이용하여 부호화된 비트스트림의 다양한 스케일러빌리티 정보들 효율적으로 표현하도록 하여, 비트스트림 추출기가 쉽게 원하는 계층을 추출할 수 있도록 한다.

● 비트스트림 특성 표현(Bitstream characteristics)

HEVC 표준화에서 scalable bitstream의 특성을 나타내기 위한 기술(description)이 정의되어있으며[1], 본 발명에서는 이를 다음과 같이 개선하고자 한다.

1)Max. bitrate definition을 위한 time window

현재 scalable representation(스케일러블하게 디코딩 가능한 복원영상을 일컬음)의 최대 비트율(max. bitrate)은 1초 동안의 time window내에서의 bitrate의 upper bound를 나타낸다. 그러나, 어플리케이션에 따라 다른 timescale에서의 peak bitrate이나 picture rate 정보가 필요할 수 있다. 예를 들어, 어떤 어플리케이션은 30초의 window내에서의 정보만 필요할 수 있는 반면, 어떤 어플리케이션은 10초의 window내에서의 peak bitrate 혹은 largest-burst 정보가 필요할 수도 있다. 그래서, 이러한 목적을 위해서 최소한 한 개의 (한 개 이상의) window를 표현할 수 있는 방안을 다음과 같이 제안한다.

첫 번째 실시예는 다음과 같다.

신택스들의 의미는 다음과 같다.

- num _ max _ bit _ rate _ windows _ minus1: num_max_bit_rate_windows_minus1+1은 max. bitrate을 계산하기 위해서 사용된 time window의 수를 나타낸다.

- num _ max _ pic _ rate _ windows _ minus1: num_max_pic_rate_windows_minus1+1은 max. picture rate을 계산하기 위해서 사용된 time window의 수를 나타낸다.

- max _ bit _ rate _ calc _ window[ j ]: 1/100초 단위로 sub-layers의 표현(representation)들의 bitrate에 대한 upper bounds를 계산하기 위해 사용되는 j번째 time window의 크기를 나타낸다. max_bit_rate_calc_window[ 0 ] 의 default값은 100 이다.

- max _ pic _ rate _ calc _ window[ j ]: 1/100초 단위로 sub-layers의 표현(representation)들의 bitrate에 대한 upper bounds를 계산하기 위해 사용되는 j번째 time window의 크기를 나타낸다. max _ pic _ rate _ calc _ window[ 0 ] 의 default값은 25600이다.

- bit _ rate _ info _ present _ flag [i]: “1”인 경우는 i번째 sub-layer에 대한 bit rate에 대한 기술이 존재함을 나타내며, “0”인 경우는 i번째 sub-layer에 대한 bit rate에 대한 기술이 존재하지 않음을 나타낸다. default 값은 “1”이다.

- pic _ rate _ info _ present _ flag [i]: “1”인 경우는 i번째 sub-layer에 대한 picture rate에 대한 기술이 존재함을 나타내며, “0”인 경우는 i번째 sub-layer에 대한 picture rate에 대한 기술이 존재하지 않음을 나타낸다. default 값은 “1”이다.

- avg _ bit _ rate [i]: i번째 sub-layer의 표현(representation)의 average bit rate을 나타낸다.[3]에 기술된 내용과 동일함

- max _ bit _ rate [ i ][ j ]: max_bit_rate_calc_window[j]에 의해 표현된 time window를 사용하여 SVC 표준[3]에 기술된대로 계산한 값으로, i번째 sub layer의 표현(representation)의 bitrate에 대한 upper bound를 나타낸다.

- avg _ pic _ rate [i]: i번째 sub-layer의 표현(representation)의 average picture rate을 나타낸다 (in units of picture per 256 seconds).[3]에 기술된 내용과 동일함

- max _ pic _ rate [ i ][ j ]: max_pic_rate_calc_window[j]에 의해 표현된 time window를 사용하여 SVC 표준[3]에 기술된대로 계산한 값으로, i번째 sub layer의 표현(representation)의 picture rate에 대한 upper bound를 나타낸다.

Bitrate 정보를 기술하는 다른 방법은 leaky bucket model을 사용하는 것으로, leaky bucket model은 고정된 시간 간격대신 고정된 데이터의 양을 이용하여 각각의 비트율 값을 계산한다. 이 방식을 사용하는 경우의 실시예는 다음과 같다.

신택스의 의미는 다음과 같다.

- num _ max _ bit _ rate _ values _ minus1: num_max_bit_rate_values_minus1+1은 해당 신택스 구조에서 명시되는 max. bitrate의 수를 의미한다.

- max _ pic _ rate _ calc _ bucket _ size[ j ]: sub-layer들의 representation들의 비트율에 대한 상한선을 (upper-bound)를 계산하기 위해 사용되는 j번째 leaky bucket의 크기를 kilobits단위로 명시한다.

- num _ max _ pic _ rate _ windows _ minus1: Sub-layer들을 위한 bitrate 정보가 정의되지 않은 경우에는 0의 값을 갖는다.

- max _ pic _ rate _ calc _ window[ j ]: 1/100초 단위로 sub-layers의 표현(representation)들의 bitrate에 대한 upper bounds를 계산하기 위해 사용되는 j번째 time window의 크기를 나타낸다. max_pic_rate_calc_window[ 0 ] 의 default값은 25600이다.

- max _ bit _ rate [ i ][ j ]: i번째 sub-layer의 representation의 비트율에 대한 upper bound를 나타낸다. 의해 표현된 time window를 사용하여 SVC 표준[3]에 기술된대로 계산한 값으로, i번째 sub layer의 표현(representation)의 bitrate에 대한 upper bound를 나타낸다. Max. bitrate은 다음과 같이 계산할 수 있다.

max _ bit _ rate[ i ][ j ] = max _ bit _ rate _ calc _ bucket _ size[ j ] / SmallestInterval[ i ][ j ]

위의 신택스는 VPS extension에 추가할 수도 있으며, SEI message의 형태로 정의될 수도 있다.

same_max_sub_layers_flag[i]와 max_sub_layers_minus1[i]의 의미는 아래의 동일한 이름의 신택스와 같다.

2) 다른 시간 간격을 위한 비트율과 프레임율 정보 (bitrate and picture rate information for different temporal periods)

현재, bitrate과 picture rate 정보는 VPS에서만 기술되도록 되어 있다. 그러나, 부호화된 비디오 신호는 다른 시간 간격(temporal period)에서 다른 bitrate과 picture rate를 가질 수도 있다. 그래서, temporal period에 대한 bitrate과 picture rate의 기술방안을 제안한다. 아래에 제안된 추가 정보는 비디오 콘텐츠의 부분적인 특성을 나타내기 위해서 사용될 수도 있는 반면, VPS에서의 bitrate과 picture rate은 전체 부호화된 시퀀스에 대해서만 유효하다.

이러한 목적으로, 새로운 SEI message “period_characteristics”를 다음과 같이 제안한다.

새로 정의된 SEI message의 의미는 다음과 같다.

비디오 시퀀스의 temporal period의 특성을 나타내며, period characteristics SEI message는 해당 SEI message가 적용되는 period 의 복호화 순서상 가장 첫 번째 access unit에 포함되어야만 한다.

- duration _ flag: “0”은 target temporal period의 길이가 기술되지 않았음을 의미한다.

- period _ duration : 90-KHz clock의 clock tick 단위로 target temporal period의 길이를 나타낸다.

● 계층참조 방식 (Layer referencing)

현재, [2]에서 기술된 계층 참조 방식은 특정계층이 직접적으로 참조하는 계층을 모두 기술할 수 있도록 한다. 그러나, 특정 dimension(s)에 있어서, 특정 계층(예를 들어 quality layer “3”)은 바로 하위 계층(예를 들어, quality layer 2)를 직접적으로 참조하는 것이 명백할 수 있을 것이다. 이러한 목적으로, default direct dependency를 가지는 dimension(s)을 기술하고, default direct dependency를 가지지 않는 dimension(s)에 대해서만 scalable layer의 description loop에서 따로 기술하는 방안을 제안한다.

제안하는 vps_extension()의 syntax는 다음과 같다.

새로 정의되거나 수정된 elements의 의미는 다음과 같다.

- default _ dependency _ flag[ i ]: “1”을 가지는 경우는 scalability dimension i가 default dependency를 가짐을 나타낸다. 이것은, dimension i 에 대해, 기본적으로 dimension_id[i]=n인 계층은 dimension_id[i]=n-1인 계층을 직접적으로 참조함을 의미한다. non-default dependencies인 경우에는 specific_dependency_flag에 의해 참조 계층을 시그널링할 수 있다.

- default _ temp _ dependency _ flag : “1”을 가지는 경우는temporal dimension이 default dependency를 가짐을 의미한다.

- specific _ dependency _ flag[ i ]: “1”을 가지는 경우는 참조 (계층) 관계가 이후에 기술됨을 나타낸다. “0”의 값을 가지는 경우는 계층 i가 default dependency를 가지거나, 간접적인 dependency를 가지거나, 참조계층이 존재하지 않음(no dependency layer)을 의미한다.

Note: 계층 C(layer C) 계층 B를 직접적으로 참조한다는 것은 계층 C를 복호하기 위해서, 디코더는 계층 B의 데이터(non-decoded 혹은 decoded)를 사용해야만 한다는 것을 의미한다. 더해서, 만약 계층 B가 계층A의 데이터를 직접적으로 사용한다면, C는 A를 직접적으로 참조한다고 할 수는 없다.

- num _ direct _ ref _ layers[　i　]: i번째 계층이 직접적으로 참조하는 계층의 수를 명시한다. 명시되지 않은 계층들은 default dependency를 가지거나, 간접적인 dependency를 가지거나, 참조계층이 존재하지 않음(no dependency layer)을 의미한다

- temporal _ dim _ description _ flag[ i ][ j ]: “1”을 가지는 경우는 scalable layer ref _ layer _ id[　i　][　j　]의 temporal sub layer에 대한 자세한 참조관계를 나타내는 것을 의미한다.

- num _ unref _ temp _ layers[ i ][ j ]: scalable layer i 를 위해 참조 계층으로 사용되지 않는 temporal sub layer의 수를 나타낸다.

- unref _ temp _ layer _ id[ i ][ j ][ k ] : scalable layer i 를 위해 참조 계층으로 사용되지 않는 temporal sub layer의 id 값을 나타낸다.

앞에서 제안한 방법은 temporal level (즉, sub layer)마다 다른 참조계층 구조를 표현하기 힘들다. temporal level마다 다른 참조계층 구조가 가능하도록 참조계층을 표현하는 것이 필요하다. 다음은 그 실시예를 나타내는 것으로 각각의 스케일러블 계층이 layer_id와 temporal_id 값에 의해 식별된다.

num _ direct _ ref _ scal _ layers[　i　][ t ] 현재 스케일러블 계층이 (layer_id=i와 temporal_id=t 로 식별되는) 직접적으로 참조하는 참조계층의 수를 명시한다. 여기서 명시되지 않은 계층들은 default dependency를 가지거나 간접적인 참조계층을 가질 수 있다.

ref _ layer _ id[　i　][ t ][　j　] 와 ref _ temporal _ id[　i　][ t ][　j　]는 현재 계층이 직접적으로 참조하는 스케일러블 계층 (layer_id = ref _ layer _ id[　i　][ t ][　j　]와 temporal_id = ref _ layer _ id[　i　][ t ][　j　]에 의해 식별되는) 을 나타낸다.

HEVC version 1의 vps 에서 정의된 모든 operation point에 명시된 모든 계층들(고유의 layer id를 가지는)이 서로간에 직접적인 혹은 간접적인 참조관계가 있다면, direct_depedency_flag에 의해 기술되는 내용을 operation point가 포함하므로 direct_dependency_flag에 의한 시그널링을 생략할 수 있으며, 이를 layer_dependency_info_flag로 알려줄 수 있다.

- layer _ dependency _ info _ flag 1인 경우 layer dependency관련 정보가 VPS extension에 기술되어 있음을 나타내며, 0인 경우는 VPS extension에 기술되지 않음을 나타낸다.

또한, scalability dimension의 기본 type이 [2]에 기술되어 있는데, 추가로 인코딩시 혹은 인코딩한 이후에 선정된 priority 순서대로 콘텐츠를 추출하여 소비할 수 있도록 하는 priority ID와 특정 영역만을 추출하여 볼수 있도록 하는regionID를 추가하는 것을 제안한다.

● profile_tier_level

현재, VPS의 extension part에서 각각의 계층(layer_id 값을 가지는)에 대해 profile_tier_level을 비트스트림에서 최대 (temporal) sub-layer의 수 (즉, vps_max_sub_layers_minus1+1) 만큼을 시그널링 하도록 되어 있다. 그러나, 각각의 계층은 서로 다른 수의 (temporal) sub-layer를 가질 수 있고, 미들박스를 위해서, 각 계층에서의 temporal sub-layer의 개수를 기술하는 것이 더 나을 수 있다. 그래서, profile_tier_level에 대한 시그널링을 위에 기술된 vps_extension()의 syntax에서 회색부분과 같이 수정할 수 있으며, 그 의미는 다음과 같다.

- same _ max _ sub _ layers _ flag[ i ]: “1”인 경우는 layer i의 temporal sub-layer의 최대 수(max. sub-layer 값)가 vps_max_sub_layers_minus1 + 1임을 나타낸다.

- max _ sub _ layers _ minus1[ i ] +1 은 layer i의 최대 temporal sub-layer의 수(max. sub-layer 값)를 나타난다..

same_max_sub_layers_flag[i]와 max_sub_layers_minus1[i]는 앞의 실시예와 같이 profile_tier_level과 함께 시그널링 할 수 도 있고, 다음의 실시예와 같이 따로 시그널링 할 수도 있다.

각 layer 마다의 max. sub-layer의 개수(temporal sub-layer의 최대 개수)는 capability negotiation 또는 extractor에 도움을 줄 수 있다.

향상계층(enhancement layer, 즉, layer_id>0 인 계층)들 마다의 max. sub-layer의 값(개수)을 기술하는 방법은 앞에서 제시한 것과 같이 VPS(video parameter set)에서 시그널링되는 vps_max_sub_layers_minus1+1과 다른 max. sub-layer의 값을 가지는 계층(layer)에 대해서만 해당 계층의 max. sub-layer 값을 시그널링하는 방식이 있으며, 다음의 실시예와 같은 방식들이 존재할 수 있다.

A. 각각의 향상계층(enhancement layer, 즉, layer_id>0 인 계층)에 대응되는 SPS(Sequence parameter set)마다 해당 layer의 max. sub-layer 값을 시그널링 하는 방식

B. VPS(Video parameter set) extension에서 각각의 향상계층(enhancement layer, 즉, layer_id>0 인 계층)의 max. sub-layer 값을 시그널링하는 방식

max_sub_layers_minus1[ i ]: max_sub_layers_minus1[i]+1은 i번째 layer가 가지는 max. sub-layer 값을 나타냄

C. VPS에서 시그널링되는 vps_max_sub_layers_minus1+1과 특정계층의 max. sub-layer 값이 다른 경우에만 해당계층의 SPS에서 max. sub-layer 값을 시그널링하는 방식

일반적인 VPS 신택스는 다음과 같이 전체 비트스트림에서 max. sub layer 값을 vps_max_sub_layers_minus1 의 값을 이용하여 시그널링한다.

향상계층의 SPS에서 해당 계층의 max. sub-layer 값이 vps_max_sub_layers_minus1+1과 동일하지 않은 경우에만 max. sub-layer 값을 시그널링하는 실시예는 다음과 같다.

max _ sub _ layers _ predict _ flag: nuh_layer_id값이 0보다 큰 경우(향상계층인 경우)에 시그널링되며, max_sub_layers_predict_flag 값이 1인 경우, sps_max_sub_layers_minus1은 vps_max_sub_layers_minus1으로 infer 되며, 0인 경우, sps_max_sub_layers_minus은 explicit하게 SPS에 시그널링됨.

추가로, 각 layer 마다의 max. sub-layer 값이 해당 layer에 대응되는 SPS에서 시그널링되는 경우, max. sub-layer 값에 따라 시그널링되는 max. DPB size 및 max. latency 정보가 SPS에서 시그널링될 수도 있으나 (실시예 A-1, D-1), 각 layer마다의 max. sub-layer 값을 VPS extension에서 시그널링 하는 경우에, VPS와 SPS간의 parsing dependency를 없애기 위하여, SPS에서 시그널링 되고 있는 max. DPB size와 max. latency 정보인 sps_max_dec_pic_buffering_minus1, sps_max_num_reorder_pics, sps_max_latency_increase_plus1 값들을 SPS가 아닌 VPS extension에서 다음과 같이 시그널링 할 수도 있다. (실시예 B-1, B-2, C-1, C-2, C-3, C-4, D-2, D-3)

A. 각각의 향상계층(enhancement layer, 즉, layer_id>0 인 계층)에 대응되는 SPS(Sequence parameter set)마다 해당 layer의 max. sub-layer 값을 시그널링 하는 방식의 경우

<실시예 A-1>

B. VPS(Video parameter set) extension에서 각각의 향상계층(enhancement layer, 즉, layer_id>0 인 계층)의 max. sub-layer 값을 독립적으로 시그널링하는 방식

<실시예 B-1>

<실시예 B-2>

C. VPS(Video parameter set) extension에서 각각의 향상계층(enhancement layer, 즉, layer_id>0 인 계층)의 max. sub-layer 값이 vps_max_sub_layers_minus1+1과 다른 경우에만 시그널링하는 방식

실시예 C-1 및 C-2는 모든 계층의 max. DPB size와 max. latency 정보를 VPS extension에서 시그널링 하는 방식이다.

실시예 C-3 및 C-4는 max. sub-layer 값과 vps_max_sub_layers_minus1+1과 다르거나, max. sub-layer값과 vps_max_sub_layers_minus1+1과 같으나 VPS에서 시그널링되는 전체 비트스트림의 max. DPB size와 max. latency 정보와 동일하지 않은 경우에만 해당 계층의 max. DPB size와 max latency 정보를 VPS extension에서 시그널링하는 방식이다.

<실시예 C-1>

<실시예 C-2>

<실시예 C-3>

sub _ layer _ vps _ buf _ ordering _ info _ predict _ flag[i]: i번째 계층(layer)의max. sub-layer 값이 vps_max_sub_layers_minus1+1과 같은 경우에 i번째 계층의 max. DPB size와 max. latency 정보가 VPS에서 시그널링되는 전체 비트스트림의 max. DPB size와 max latency 정보와 동일한지 여부를 나타냄. “1”의 값을 가지는 경우는 동일함을 나타내며, “0”의 값을 가지는 경우는 동일하지 않음을 나타냄. “0”의 값을 가지는 경우 혹은 max. sub-layer 값이 vps_max_sub_layers_minus1+1과 같지 않은 경우에만 해당계층의 max. DPB size와 max. latency 정보가 시그널링됨. sub_layer_vps_buf_ordering_info_predict_flag[i]가 시그널링되지 않는 경우에 그 값은 “0”으로 설정한다.

<실시예 C-3.1>

추가된 신택스들의 의미는 앞의 동일한 이름의 신택스와 같음.

<실시예 C-4>

sub _ layer _ vps _ buf _ ordering _ info _ predict _ flag[i]: i번째 계층(layer)의 max. sub-layer 값이 vps_max_sub_layers_minus1+1과 같은 경우에 i번째 계층의 max. DPB size와 max. latency 정보가 VPS에서 시그널링되는 전체 비트스트림의 max. DPB size와 max latency 정보와 동일한지 여부를 나타냄. “1”의 값을 가지는 경우는 동일함을 나타내며, “0”의 값을 가지는 경우는 동일하지 않음을 나타냄. “0”의 값을 가지는 경우 혹은 max. sub-layer 값이 vps_max_sub_layers_minus1+1과 같지 않은 경우에만 해당계층의 max. DPB size와 max. latency 정보가 시그널링됨. sub_layer_vps_buf_ordering_info_predict_flag[i]가 시그널링되지 않는 경우에 그 값은 “0”으로 설정한다.

<실시예 C-4.1>

D. VPS에서 시그널링되는 vps_max_sub_layers_minus1+1과 특정계층의 max. sub-layer값이 다른 경우에만 해당계층의 SPS에 max. sub-layer 의 개수를 시그널링하는 방식

향상계층의 SPS에서 해당 계층의 max. sub-layer 값이 vps_max_sub_layers_minus1+1과 동일하지 않을 때 max. sub-layer 값을 시그널링하는 경우에, 해당계층의 max. DPB size와 max. latency 정보를 SPS에서 시그널링하는 실시예는 다음과 같다.

<실시예 D-1>

다음의 두 가지 실시예는 향상계층 가운데 vps_max_sub_layers_minus1+1과 동일한 max. sub-layer 값을 가지는 계층(layer)의 max. DPB size와 max. latency 정보를 시그널링 하는 실시예이다.

D-2는 vps_max_sub_layers_minus1+1과 동일한 max. sub-layer 값을 가지는 모든 계층(layer)의 max. DPB size와 max. latency 정보를 시그널링하는 실시예를 나타낸다.

D-3는 vps_max_sub_layers_minus1+1과 동일한 max. sub-layer 값을 가지는 계층(layer)의 max. DPB size와 max latency 정보가 VPS에서 시그널링되는 전체 비트스트림의 max. DPB size와 max. latency 정보와 동일하지 않은 경우에만 해당 계층의 max. DPB size와 max latency 정보를 VPS extension에서 시그널링하는 방식이다.

<실시예 D-2>

max _ sub _ layers _ vps _ predict _ flag[i]: “1”의 값을 가지는 경우는 i번째 계층(layer)의 max. (temporal) sub-layer의 값이 vps_max_sub_layers_minus1+1 인 경우이며, “0”의 값을 가지는 경우는 i번째 계층(layer)의 max. (temporal) sub-layer의 값이 해당 계층의 SPS (해당 계층과 동일한 nuh_layer_id 값을 가지는 SPS)에서 시그널링되는 sps_max_sub_layers_minus1+1의 값을 가지는 것을 의미함.

vps_extension에서는 max. (temporal) sub-layer의 값이 vps_max_sub_layers_minus1+1값을 가지는 계층의 max. DPB size 및 latency 관련 정보를 시그널링하며, max. (temporal) sub-layer 의 값이 vps_max_sub_layers_minus1+1 값과 다른 값을 가지는 계층의 경우는 실시예 D-1과 같이 해당계층의 SPS에서 max. DPB size와 latency 관련 정보를 시그널링한다.

<실시예 D-3>

max _ sub _ layers _ vps _ predict _ flag[i]: “1”의 값을 가지는 경우는 i번째 계층(layer)의 max. (temporal) sub-layer의 값이 vps_max_sub_layers_minus1+1 인 경우이며, “0”의 값을 가지는 경우는 i번째 계층(layer)의 max. (temporal) sub-layer의 값이 해당 계층의 SPS (해당 계층과 동일한 nuh_layer_id 값을 가지는 SPS)에서 시그널링되는 sps_max_sub_layers_minus1+1의 값을 가지는 것을 의미함

sub _ layer _ vps _ buf _ ordering _ info _ predict _ flag[i]: i번째 계층(layer)의 max. sub-layer값이 vps_max_sub_layers_minus1+1과 같은 경우 max. DPB size와 max. latency 정보가 VPS에서 시그널링되는 전체 비트스트림의 max. DPB size와 max latency 정보와 동일한지 여부를 나타냄. “1”의 값을 가지는 경우는 동일함을 나타내며, “0”의 값을 가지는 경우는 동일하지 않음을 나타냄. “0”의 값을 가지는 경우에만 해당계층의 max. DPB size와 max. latency 정보가 시그널링됨.

● Priority information

비트스트림의 각각의 scalable layer의 priority를 나타내기 위한 방법을 제안한다. 위에서 기술하였듯이 VPS 혹은 SEI message (예를 들어 아래와 같이 layer_priority_info message로)로 기술될 수 있다.

새로 정의된 elements의 의미는 다음과 같다.

- priority _ description _ flag : “1”인 경우는 scalable layer의 priority 정보가 제공됨을 의미한다.

- num _ priority _ policies _ minus1 : + 1은 priority setting policy의 수를 나타낸다.

- priority _ id[ i ] [ j ]: layer_id가 i이고 temporal_id가 j인 계층의 priority 값을 나타낸다. 이 element의 값이 낮을수록 priority가 높음을 의미한다.

- priority _ id _ setting _ uri[ PriorityIdSettingUriIdx ]: target access unit set을 위한 NAL unit header에서 priority_id 값을 계산하기 위해 사용된 방법을 기술하는 URI(universal resource identifier)를 나타내는 것으로, UTF-8 character로 인코딩된 null-terminated string의 PriorityIdSettingUriIdx 번재 바이트이다.

만약 layer_priority_info message가 존재한다면, 이 message는 message가 적용되는 주기의 디코딩 순서상 첫번째 access unit에 포함되어야만 한다.

References

[1]. JCTVC-K1003 "High Efficiency Video Coding (HEVC) text specification draft 9"

[2]. JCTVC-K1007 "Solutions considered for NAL unit header and video parameter set for HEVC extensions"

[3]. Annex G of ISO/IEC 14496-10 Advanced Video Coding for Generic Audiovisual Services" 2012.

Claims

계층적 비디오 부호화에서의 스케일러빌리티 정보 표현방식.