WO2015080414A1

WO2015080414A1 - 트릭 플레이 서비스 제공을 위한 방송 신호 송수신 방법 및 장치

Info

Publication number: WO2015080414A1
Application number: PCT/KR2014/011042
Authority: WO
Inventors: 황수진; 오현묵; 서종열; 윤준희
Original assignee: 엘지전자 주식회사
Priority date: 2013-12-01
Filing date: 2014-11-18
Publication date: 2015-06-04
Also published as: EP3076676A4; EP3076676A1; JP2016506182A; CN104823450A; JP6126240B2; CA2891664A1; CN104823450B; MX2015003113A; KR20160091814A; CA2891664C; KR102182166B1; MX343061B; US9860607B2; DE112014000261T5; EP3076676B1; US20160261924A1

Abstract

본 발명은 트릭 플레이를 위한 방송 신호를 송수신하는 방법 및 장치에 관한 것이다. 본 발명의 일 실시예에 따른 방송 신호 송신 방법은 비디오 데이터를 인코딩하여 비디오 단위 스트림을 생성하는 단계, 상기 비디오 단위 스트림을 포함하는 PES (Packetized Elementary Stream)를 생성하는 단계, 상기 생성된 PES를 포함하는 TS (Transport Stream)를 생성하는 단계, 여기서, 상기 TS는 트릭 플레이 수행을 위한 PVR 어시스트 정보를 포함하고, 여기서, 상기 PVR 어시스트 정보는 티어 넘버 정보 및 최대 템포럴 식별 정보를 포함하고, 여기서, 상기 티어 넘버 정보는 RAP가 아닌 픽처의 템포럴 식별 정보 값에 1을 더한 값을 가지는 티어 넘버를 나타내고, 상기 최대 템포럴 식별 정보는 상기 인코딩된 비디오 데이터를 포함하는 비디오 단위 스트림의 최대 템포럴 식별 정보 값을 나타내고, 상기 생성된 TS를 전송하는 단계를 포함한다.

Description

트릭 플레이 서비스 제공을 위한 방송 신호 송수신 방법 및 장치

본 발명은 방송 신호의 송수신에 관한 것이다. 보다 상세하게는, 트릭 플레이 서비스 제공을 위한 방송 신호의 송수신 방법 및/또는 장치에 관한 것이다.

최근 들어 고해상도 고품질 영상서비스에 대한 수요와 관심이 매우 높다. HDTV에 이어 UHDTV(Ultra High Definition TV)가 출시되면서 높은 해상도의 매우 사실적인 고품질 방송서비스가 제공되고, 모바일 시장에서도 기본화면 해상도가 HD급인 스마트폰이 출시되면서 고해상도 및 고품질 영상에 대한 사용자들의 수요가 급증하는 추세이다. 현재 DTV, DMB, DVD, 디지털 캠코더, 영상블랙박스, IPTV, 스마트TV, 스마트폰 등에 이르기까지 다양한 멀티미디어 기기에 사용되는 H.264/AVC 표준은 고해상도 및 고화질 영상서비스를 지원하기에는 한계가 있다. 이에 ITU-T VCEG(Video Coding Experts Group)와 ISO/IEC MPEG(Moving Picture Experts Group)는 H.264/AVC보다 더 높은 압축률과 더 낮은 복잡도의 새로운 차세대 동영상압축 표준의 필요성에 의해, HEVC(High Efficiency Video Coding)라는 표준화 활동을 시작했으며, HEVC 최종 표준안(FDIS: Final Draft International Standard)을 완성하였다. HEVC는 H.264/AVC에 비해 약 35%의 부호화 효율을 보이는 차세대 영상 압축 표준으로 HD급 영상과 UHD급 영상의 방대한 데이터를 효과적으로 압축하기 위한 핵심기술로 주목받고 있다. 전세계적으로 HEVC 기술의 상용화 노력을 통해 최적화된 HEVC 소프트웨어 및 하드웨어 표준이 시장에 등장할 것으로 전망되고 있다.

한편, 트릭 플레이란 임의의 시간의 영상을 재생할 수 있는 기능인 random access 및 2 배속, 4 배속 등과 같은 배속 기능을 제공하는 서비스를 의미한다. HEVC의 random access point와 H.264의 random access point는 차이가 존재하므로 HEVC의 random access point의 범주를 새롭게 정의할 필요가 있다. 또한 HEVC에서는 scalability를 제공하기 때문에 이를 이용하여 트릭 플레이를 제공할 필요가 있다. 또한, 기존 CFF medial file format 스펙은 H.264/AVC의 트릭 플레이에 관한 포맷을 정의하고 있다. 하지만, HEVC로 인코딩된 컨텐츠에 대해서는 정의하고 있지 않아서 HEVC로 인코딩된 컨텐츠의 디코딩 및 트릭 플레이를 위해 새로운 포맷을 제공할 필요가 있다.

트릭 플레이의 수행을 위해 기존 AVC/H.264 기반에서는 비디오 스트림을 구성하는 픽처들을 각 픽처 사이의 dependency에 따라 tier라는 개념을 사용하여 구분하였다. 그리고, 수신측은 특정 tier 값을 갖는 픽처들만을 디코딩 및 디스플레이하여 트릭 플레이 서비스를 제공하였다. 하지만, HEVC에서는 비디오 스트림의 temporal scalability를 기본적으로 제공하고 있으므로 temporal scalability를 이용하여 트릭 플레이 서비스를 제공하는 방법에 대한 연구가 필요하다. 나아가, 사용자가 제공 가능한 최대 배속 정보를 알 수 있다면 트릭 플레이를 이용하는데 편리함을 느낄 것이다. 따라서, 제공 가능한 최대 배속 정보를 사용자에게 제공할 수 있는 방법에 대한 연구가 필요하다.

본 발명이 이루고자 하는 과제는, 전술한 문제점을 해결하기 위한 것으로 트릭 플레이 서비스 제공을 위한 방송 신호를 송수신하는 방법 및/또는 장치를 제공하는 것이다.

나아가, 본 발명이 이루고자 하는 과제는, 트릭 플레이 서비스를 제공하기 위한 트릭 플레이 관련 정보를 제공하는 것이다.

나아가, 본 발명이 이루고자 하는 과제는, 트릭 플레이 관련 정보를 시그널링하는 방법을 제공하는 것이다.

나아가, 본 발명이 이루고자 하는 과제는, 사용자에게 최대 배속 정보를 제공할 수 있는 시그널링 방법을 제공하는 것이다.

나아가, 본 발명이 이루고자 하는 과제는, HEVC에서 기본적으로 제공하는 temporal scalability를 이용하여 트릭 플레이를 제공하는 방법을 제공하는 것이다.

나아가, 본 발명이 이루고자 하는 과제는, 기존에 사용되던 트릭 플레이 관련 정보를 최대한 그대로 사용하면서 보다 나은 트릭 플레이 서비스를 제공하는 방법을 제공하는 것이다.

본 발명의 일 실시예에 따른 방송 신호 송신 방법은 비디오 데이터를 인코딩하여 비디오 단위 스트림을 생성하는 단계, 상기 비디오 단위 스트림을 포함하는 PES (Packetized Elementary Stream)를 생성하는 단계, 상기 생성된 PES를 포함하는 TS (Transport Stream)를 생성하는 단계, 여기서, 상기 TS는 트릭 플레이 수행을 위한 PVR 어시스트 정보를 포함하고, 여기서, 상기 PVR 어시스트 정보는 티어 넘버 정보 및 최대 템포럴 식별 정보를 포함하고, 여기서, 상기 티어 넘버 정보는 RAP가 아닌 픽처의 템포럴 식별 정보 값에 1을 더한 값을 가지는 티어 넘버를 나타내고, 상기 최대 템포럴 식별 정보는 상기 인코딩된 비디오 데이터를 포함하는 비디오 단위 스트림의 최대 템포럴 식별 정보 값을 나타내고, 상기 생성된 TS를 전송하는 단계를 포함할 수 있다.

바람직하게는, 상기 티어 넘버 정보가 나타내는 티어 넘버는 RAP 픽처에서는 0 값을 가질 수 있다.

바람직하게는, 상기 최대 템포럴 식별 정보는 트릭 플레이의 속도에 대한 정보를 제공하는데 사용될 수 있다.

바람직하게는, 상기 PVR 어시스트 정보는 상기 TS의 어댑테이션 필드에 포함될 수 있다.

바람직하게는, 상기 PVR 어시스트 정보는 픽처가 속한 세그먼트에 대한 정보의 존재 여부를 나타내는 세그먼테이션 인포 플래그 정보를 포함할 수 있다.

바람직하게는, 상기 PVR 어시스트 정보는 픽처가 속한 세그먼트의 id를 나타내는 세그먼트 식별자 정보를 포함할 수 있다.

바람직하게는, 상기 PVR 어시스트 정보는 픽처가 속한 프로그램의 id를 나타내는 프로그램 식별자 정보를 포함할 수 있다.

바람직하게는, 상기 PVR 어시스트 정보는 각 세그먼트에서 재생 시간 순서가 첫 번째인 픽처를 식별하는 세그먼트 스타트 플래그 정보 및 각 세그먼트에서 재생 시간 순서가 마지막인 픽처를 식별하는 세그먼트 엔드 플래그 정보 중 적어도 어느 하나를 포함할 수 있다.

바람직하게는, 상기 PVR 어시스트 정보는 각 프로그램에서 재생 시간 순서가 첫 번째인 픽처를 식별하는 프로그램 스타트 플래그 정보 및 각 프로그램에서 재생 시간 순서가 마지막인 픽처를 식별하는 프로그램 엔드 플래그 정보 중 적어도 어느 하나를 포함할 수 있다.

본 발명의 다른 일 실시예에 따른 방송 신호 수신 장치는 TS (Transport Stream)을 수신하는 수신부, 여기서, 상기 TS는 트릭 플레이 수행을 위한 PVR 어시스트 정보를 포함하고, 여기서, 상기 PVR 어시스트 정보는 티어 넘버 정보 및 최대 템포럴 식별 정보를 포함하고, 여기서, 상기 티어 넘버 정보는 RAP가 아닌 픽처의 템포럴 식별 정보 값에 1을 더한 값을 가지는 티어 넘버를 나타내고, 상기 최대 템포럴 식별 정보는 상기 인코딩된 비디오 데이터를 포함하는 비디오 단위 스트림의 최대 템포럴 식별 정보 값을 나타내고, 상기 수신한 TS에서 PES (Packetized Elementary Stream)을 추출하는 제 1 추출부, 상기 추출된 PES에서 비디오 단위 스트림을 추출하는 제 2 추출부, 상기 추출된 비디오 단위 스트림을 디코딩하는 디코더를 포함할 수 있다.

본 발명에 따르면, 사용자에게 트릭 플레이 서비스를 제공할 수 있는 효과가 있다.

본 발명에 따르면, 사용자에게 트릭 플레이 서비스의 제공을 위한 트릭 플레이 관련 정보를 제공할 수 있는 효과가 있다.

본 발명에 따르면, 사용자에게 트릭 플레이 관련 정보를 시그널링하는 방법을 제공할 수 있는 효과가 있다.

본 발명에 따르면, 트릭 플레이 서비스에 있어서 사용자에게 제공 가능한 최대 배속 정보를 제공할 수 있는 효과가 있다.

본 발명에 따르면, HEVC의 temporal scalability를 이용하여 보다 효율적인 트릭 플레이 서비스를 제공할 수 있는 효과가 있다.

본 발명에 따르면, 트릭 플레이 서비스 관련 기존의 시스템을 최대한 유지하면서 보다 효율적인 트릭 플레이 서비스를 제공할 수 있는 효과가 있다.

본 발명에 따르면, HEVC 비디오 스트림의 구조를 그대로 이용하면서 트릭 플레이 서비스를 제공할 수 있는 효과가 있다.

본 발명에 따르면, HEVC 비디오 스트림의 temporal ID 기반의 구조를 이용하여 트릭 플레이 서비스를 제공함으로써 인코딩 단계에서 트릭 플레이에 이용할 특정 픽처를 시그널링하지 않아도 되므로 더 빠른 인코딩 속도를 제공할 수 있는 효과가 있다.

도 1은 본 발명의 일 실시예에 따른 트릭 플레이 방법을 시나리오에 따라 나타낸 도면이다.

도 2는 본 발명의 일 실시예에 따른 HEVC 기반의 스트림을 지원하기 위한 Common File Format (CFF) box structure를 나타낸 도면이다.

도 3은 본 발명의 일 실시예에 따른 "hvcn" 박스의 syntax를 나타낸 도면이다.

도 4는 본 발명의 일 실시예에 따른 Common_Metadata에 포함된 HDR (High Dynamic Range)를 지원하는 element를 나타낸 도면이다.

도 5는 본 발명의 일 실시예에 따른 HEVC 스트림의 경우 random access를 위한 picture type을 나타낸 도면이다.

도 6은 본 발명의 일 실시예에 따라 closed GOP인 경우 트릭 플레이의 방법을 나타낸 도면이다. (시나리오 1-1)

도 7은 본 발명의 일 실시예에 따라 open GOP이고 GOP가 decodable leading picture를 포함하는 경우 트릭 플레이의 방법을 나타낸 도면이다. (시나리오 1-2)

도 8은 본 발명의 일 실시예에 따라 open GOP이고 GOP가 decodable leading picture 및 skipped leading picture를 포함하는 경우 트릭 플레이의 방법을 나타낸 도면이다. (시나리오 1-2)

도 9는 본 발명의 일 실시예에 따라 open GOP이고 GOP가 skipped leading picture를 포함하는 경우 트릭 플레이의 방법을 나타낸 도면이다. (시나리오 1-2)

도 10은 본 발명의 일 실시예에 따라 max_temporal_id가 0인 HEVC 스트림의 트릭 플레이를 지원하기 위한 trick play box의 구성을 나타낸 도면이다. (시나리오 1-2)

도 11은 본 발명의 또 다른 일 실시예에 따라 max_temporal_id가 0인 HEVC 스트림의 트릭 플레이를 지원하기 위한 trick play box의 구성을 나타낸 도면이다. (시나리오 1-2)

도 12는 본 발명의 일 실시예에 따라 max_temporal_id가 0인 HEVC 스트림의 트릭 플레이를 지원하기 위한 trick play box에 포함된 pic_type에 대한 설명을 나타낸 도면이다.

도 13은 본 발명의 일 실시예에 따라 pic_type에 leading picture 관련된 내용이 포함되어 있지 않는 경우, max_temporal_id가 0인 HEVC 스트림의 트릭 플레이를 지원하기 위한 trick play box의 구성을 나타낸 도면이다. (시나리오 1-1)

도 14는 본 발명의 또 다른 일 실시예에 따라 pic_type에 leading picture 관련된 내용이 포함되어 있지 않는 경우, max_temporal_id가 0인 HEVC 스트림의 트릭 플레이를 지원하기 위한 trick play box의 구성을 나타낸 도면이다. (시나리오 1-1)

도 15는 본 발명의 일 실시예에 따른 temporal scalability를 지원하는 HEVC 스트림의 구성을 나타낸 도면이다.

도 16은 본 발명의 일 실시예에 따라 temporal scalability를 지원하는 HEVC 스트림에서 최대 배속을 제한하여 트릭 플레이를 지원하기 위한 trick play box의 구성을 나타낸 도면이다. (시나리오 2)

도 17은 본 발명의 또 다른 일 실시예에 따라 temporal scalability를 지원하는 HEVC 스트림에서 최대 배속을 제한하여 트릭 플레이를 지원하기 위한 trick play box의 구성을 나타낸 도면이다. (시나리오 2)

도 18은 본 발명의 일 실시예에 따른 temporal sub-layer picture type이 TSA인 경우 frame rate의 변경 방법을 나타낸 도면이다.

도 19는 본 발명의 일 실시예에 따른 temporal sub-layer picture type이 STSA인 경우 frame rate의 변경 방법을 나타낸 도면이다. (시나리오 3)

도 20은 본 발명의 일 실시예에 따라 temporal scalability를 지원하는 HEVC 스트림에서 고배속의 트릭 플레이를 지원하기 위한 trick play box의 구성을 나타낸 도면이다. (시나리오 3)

도 21은 본 발명의 또 다른 일 실시예에 따라 temporal scalability를 지원하는 HEVC 스트림에서 고배속의 트릭 플레이를 지원하기 위한 trick play box의 구성을 나타낸 도면이다.

도 22는 본 발명의 일 실시예에 따른 방송 신호 수신 시스템의 구조를 나타낸 도면이다.

도 23은 본 발명의 일 실시예에 따른 수신단의 구조를 나타낸 도면이다.

도 24는 본 발명의 일 실시예에 따른 temporal id와 tier를 복합적으로 이용한 트릭 플레이의 방법을 나타낸 도면이다.

도 25는 본 발명의 일 실시예에 따라, 기존의 tier 개념에 따른 트릭 플레이 방법을 나타낸 도면이다.

도 26은 본 발명의 일 실시예에 따라, 하나의 temporal id를 하나의 tier에 1:1로 매핑하는 방법에 따른 트릭 플레이 방법을 나타낸 도면이다. (시나리오 A-a)

도 27은 본 발명의 또 다른 일 실시예에 따라, 하나의 temporal id를 하나의 tier에 1:1로 매핑하는 방법에 따른 트릭 플레이 방법을 나타낸 도면이다. (시나리오 A-a)

도 28은 본 발명의 일 실시예에 따라, 하나의 temporal id를 하나의 tier에 1:1로 매핑한 결과를 나타낸 도면이다.

도 29는 본 발명의 또 다른 일 실시예에 따라, 하나의 temporal id를 하나의 tier에 1:1로 매핑한 결과를 나타낸 도면이다.

도 30은 본 발명의 일 실시예에 따라, 하나의 temporal id를 여러 개의 tier에 매핑하는 방법에 따른 트릭 플레이의 방법을 나타낸 도면이다. (시나리오 A-b)

도 31은 본 발명의 일 실시예에 따른 temporal id와 tier의 매핑을 위한 정보를 포함한 TS packet의 adaptation field의 구성을 나타낸 도면이다.

도 32는 본 발명의 일 실시예에 따른 HEVC_temporal_id_tier_mapping_info의 구성을 나타낸 도면이다.

도 33은 본 발명의 일 실시예에 따른 HEVC_temporal_id_tier_mapping_info에 포함된 trick_play_speed 필드의 구성을 나타낸 도면이다.

도 34는 본 발명의 일 실시예에 따른 PVR_assist_information의 구성을 나타낸 도면이다.

도 35는 본 발명의 일 실시예에 따른 temporal id frame work가 추가된 PVR_assist_information의 구성을 나타낸 도면이다. (시나리오 B-a-a)

도 36은 본 발명의 또 다른 일 실시예에 따른 temporal id frame work가 추가된 PVR_assist_information의 구성을 나타낸 도면이다. (시나리오 B-a-b)

도 37은 본 발명의 일 실시예에 따른 temporal id를 이용한 트릭 플레이를 지원하기 위한 PVR_assist_information의 구성을 나타낸 도면이다. (시나리오 B-b)

도 38은 본 발명의 일 실시예에 따른 수신 장치를 나타낸 도면이다.

도 39는 본 발명의 일 실시예에 따른 tier framework와 HEVC temporal sub-layer을 비교한 도면이다.

도 40은 본 발명의 또 다른 일 실시예에 따른 PVR_assist_information의 구성을 나타낸 도면이다.

도 41은 본 발명의 일 실시예에 따른 HEVC temporal sub-layer를 이용한 트릭 플레이 방법을 나타낸 도면이다.

도 42는 본 발명의 일 실시예에 따른 방송 신호 송신 방법을 나타낸 도면이다.

도 43은 본 발명의 일 실시예에 따른 방송 신호 수신 장치의 구조를 나타낸 도면이다.

이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 실시예를 상세하게 설명하지만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다.

본 명세서에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 당분야에 종사하는 기술자의 의도 또는 관례 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 그 의미를 기재할 것이다. 따라서 본 명세서에서 사용되는 용어는, 단순한 용어의 명칭이 아닌 그 용어가 가지는 실질적인 의미와 본 명세서의 전반에 걸친 내용을 토대로 해석되어야 함을 밝혀두고자 한다.

본 발명의 이해와 설명의 편의를 위하여, 용어 및 약어에 대하여 아래와 같이 정의한다.

HEVC (High Efficiency Video Coding)은 기존 H.265/AVC 기술과 비교하여 약 2배 높은 압축률을 가지면서 동일한 비디오 품질을 제공하는 고효율 비디오 코딩 표준이다.

temporal scalability은 시간적 스케일러빌리티를 의미하며 같은 공간 해상도에서 프레임 주파수가 다른 것들을 부호화하는 방법을 의미한다.

트릭 플레이란 일정 시간 뒤의 영상을 플레이할 수 있는 ramdom access가 가능하고 배속 기능을 제공하는 기능을 의미한다.

Open GOP는 하나의 GOP내의 picture를 encoding할 때, 해당하는 GOP 이전에 위치한 picture를 reference picture로 이용해 encoding할 수 있는 구조를 의미한다. 즉, leading picture를 포함하는 GOP를 의미한다.

Closed GOP는 하나의 GOP내의 picture를 encoding할 때, 해당하는 GOP 내의 picture만을 reference picture로 사용하는 구조를 의미한다. 즉, Open GOP에서와는 달리 leading picture를 포함하지 않는다.

leading picture는 HEVC에서 IRAP보다 디코딩 순서는 느리지만 재생 순서는 빠른 픽처를 의미한다.

temporal id는 HEVC에서 temporal scalability를 지원하기 위하여 도입된 용어이고, NAL_unit_header의 nuh_temporal_id_plus1에 의하여 시그널링될 수 있다.

tier는 AVC 스트림 또는 mpeg-2 스트림에서 트릭 플레이를 지원하기 위하여 도입된 용어이고, TS packet내에 adaptation field에 포함될 수 있다.

본 발명의 일 실시예에 따르면, HEVC의 temporal scalability의 사용 여부에 따라 트릭 플레이를 위한 시그널링 방법이 정의될 수 있다.

본 발명의 일 실시예에 따른 비디오 스트림이 temporal scalability를 제공하지 않는 스트림인 경우 즉, 비디오 스트림이 temporal_id가 0인 픽처만 포함하는 경우에서 Closed GOP이면 비디오 스트림이 leading picture를 포함하지 않으므로, CFF media file format에 정의된 dependency_level 및 pic_type를 시그널링함으로써 트릭 플레이가 제공될 수 있다. (시나리오 1-1) 반면, Open GOP이면, pic_type에 leading picture type을 포함시키고 dependency_level를 시그널링함으로써 트릭 플레이가 제공될 수 있다. (시나리오 1-2)

본 발명의 일 실시예에 따른 비디오 스트림이 temporal scalability 기반의 스트림인 경우 즉, 비디오 스트림이 temporal_id가 0보다 큰 픽처를 포함하는 경우 dependency_level, pic_type 및 temporal_sub_layer_pic_type을 시그널링함으로써 트릭플레이가 제공될 수 있다. 보다 구체적으로, 스트림에 포함된 temporal_id를 통하여 지원 가능한 배속 level을 시그널링함으로써 트릭 플레이가 제공될 수 있다. (시나리오 2) 또한, 시나리오 2와 마찬가지로 temporal_id를 통하여 지원 가능한 배속 level을 시그널링하고 추가적으로 temporal_id가 0인 픽처들을 이용함으로써 배속을 위한 추가 서비스가 제공될 수 있다. (시나리오 3)

이 도면에 도시된 박스는 비디오 스트림을 구성하는 픽처를 나타내며 박스 안에 기술된 T_ID는 temporal scalability를 지원하기 위한 temporal_id를 의미할 수 있다.

이 도면에서 "NL0", "NL1" 및 "NL2"는 CFF box들의 포함관계를 나타내고 "Format Req."는 해당 박스의 존재 여부 및 개수를 나타내고 "Specification"은 해당 박스가 정의되어 있는 표준서의 부분을 나타내고 "Description"은 해당 박스에 대한 설명을 나타낼 수 있다. "Format Req."가 "+"이면 해당 박스가 하나 이상 존재한다는 것을 의미하고 "0/1"이면 해당 박스가 존재하거나 존재하지 않음을 의미하고 "1"이면 해당 박스가 존재함을 의미하고 "0"이면 해당 박스가 존재하지 않음을 의미할 수 있다.

이 도면은 본 발명의 일 실시예에 따른 CFF box structure로서 기존의 CFF에 HEVC를 위한 새로운 trick play box를 추가한 것이다. 또한, 본 발명의 일 실시예에 따른 CFF box structure는 HEVC 기반의 nal unit을 지원하기 위해 "hvcn"로 약칭되는 storage box를 포함할 수 있다.

본 발명의 일 실시예에 따르면, CFF box structure는 "hvcn"로 약칭되는 nal unit storage box를 포함할 수 있다.

본 발명의 일 실시예에 따르면, 트릭 플레이를 위해서 코덱 별로 nal unit storage box가 정의될 수 있다.

본 발명의 일 실시예에 따르면, 트릭 플레이를 위해서 코덱 별로 nal unit storage box를 정의하지 않고 기존의 "trick" 박스 내부에 기존의 AVC trick box와 별도로 HEVC trick box가 정의될 수 있다. 또한, "trick" 박스의 플래그에 따라 AVC 또는 HEVC trick play가 선택될 수 있다.

이 도면에서 HEVCConfig는 HEVC의 SPS (Sequence Parameter Set) 및 PPS (Picture Parameter Set)를 포함할 수 있고 SPS의 VUI 파라미터 등의 비디오 정보를 포함할 수 있다.

본 발명의 일 실시예에 따른 xml 박스에서 참조하고 있는 Common_Metadata는 HighDynamicRange 엘레먼트를 포함할 수 있다.

본 발명의 일 실시예에 따른 HighDynamicRange 엘레먼트는 xml 스키마에 따라 문자열 값을 가질 수 있고 HighDynamicRange 엘레먼트는 한 개 존재하거나 존재하지 않을 수 있다.

본 발명의 일 실시예에 따른 HighDynamicRange 엘레먼트는 최소 및/또는 최대 밝기 값 (min.luminance and/or max.luminance)을 나타낼 수 있다.

본 발명의 일 실시예에 따른 HighDynamicRange 엘레먼트는 최소 및/또는 최대 밝기 값으로 구분되는 profile 값을 나타낼 수 있다. 예를 들면, HighDynamicRange 엘레먼트는 Conventional capacity (min: 0.1cd/m2, max: 100cd/m2), Mid capacity (min: 0.001cd/m2, max: 1000cd/m2) 또는 High capacity (min: 0.0001cd/m2, max: 10000cd/m2)를 나타낼 수 있다.

이 도면은 HEVC NAL unit type 중, random access 및 트릭 플레이의 수행을 위해 기본이 될 수 있는 픽처의 종류를 나타낸 도면이다.

이 도면에서 음영으로 표시된 picture type (TSA, STSA)은 temporal ID가 0보다 큰 스트림이 포함되는 경우 즉, temporal scalability가 제공되는 경우에 트릭 플레이를 위해 사용될 수 있는 HEVC temporal sub-layer picture type을 나타낼 수 있다. 상술한 음영으로 표시된 picture type은 본 발명의 일 실시예에 따른 시나리오 2 및 3에서 이용될 수 있다.

본 발명의 일 실시예에 따르면 random access point pictures는 IDR (Instantaneous Decoding Refresh), BLA (Broken Link Access) 및/또는 CRA (Clean Random Access)를 포함할 수 있고, leading picture는 RADL (Random Access Decodable Leading Picture) 및/또는 RASL (Random Access Skipped Leading Picture)를 포함할 수 있고, temporal sub-layer access pictures는 TSA (Temporal Sub-layer Access) 및/또는 STSA (Step-wise Temporal Sub-layer Access)를 포함할 수 있다.

IDR (Instantaneous Decoding Refresh) 픽처는 관련된 leading picture를 갖는 경우 및/또는 관련된 leading picture를 갖지 않는 경우를 포함할 수 있다.

BLA (Broken Link Access) 픽처는 관련된 RADL 픽처는 갖지만 관련된 RASL 픽처는 갖지 않는 경우 및/또는 관련된 leading picture를 갖지 않는 경우를 포함할 수 있다.

CRA (Clean Random Access) 픽처는 관련된 leading picture를 갖는 경우를 포함할 수 있다.

TSA (Temporal Sub-layer Access) 픽처는 같은 sub-layer에서 참조되지 않는 경우 및/또는 같은 sub-layer에서 참조되는 경우를 포함할 수 있다.

STSA (Step-wise Temporal Sub-layer Access) 픽처는 같은 sub-layer에서 참조되지 않는 경우 및/또는 같은 sub-layer에서 참조되는 경우를 포함할 수 있다.

이 도면은 비디오 스트림 내에 최대 temporal_id 값이 0이고 closed GOP인 경우에 트릭 플레이를 수행하는 방법을 나타낸 도면이다. 여기서, GOP는 Group Of Picture의 약칭으로서 random access를 가능하게 하기 위한 부호화된 픽처들의 집합을 나타낸다. 여기서, closed GOP는 leading picture를 포함하지 않는 GOP를 의미하고, open GOP는 leading picture를 포함하는 GOP를 의미할 수 있다. 여기서, leading picture란 HEVC에서 IRAP (Intra Random Access Point, AVC codec에서 random access point와 동일한 개념) 보다 디코딩 순서는 느리지만 디스플레이 순서는 빠른 픽처를 나타낼 수 있다.

이 도면에서, 하나의 네모 박스는 하나의 픽처를 나타낼 수 있다. 여기서, 픽처는 프레임 및/또는 화상과 동일한 의미로 사용될 수 있다.

이 도면에서, I1부터 P9까지의 픽처 집합은 하나의 GOP를 나타낼 수 있다. 여기서, I 픽처는 MPEG 부호화 신호에서 사용되는 3가지 픽처 형식중 하나로서 하나의 완전한 픽처를 구성하기 위한 모든 데이터를 포함할 수 있다. 즉, I 픽처는 다른 픽처를 참조하지 않을 수 있다. P 픽처는 현재의 픽처와 재생 순서상 그 앞의 픽처간의 차이를 관찰하여 만들어진 예측정보와 실제 정보와의 차이 값만을 포함할 수 있다. 즉, P 픽처는 재생 순서상 현재의 픽처 앞에 존재하는 픽처를 참조할 수 있다. B 픽처는 현재의 픽처, 재생 순서상 현재의 픽처 앞에 존재하는 픽처 및 현재의 픽처 뒤에 존재하는 픽처간의 차이를 관찰하여 만들어진 예측정보만을 포함할 수 있다. 즉, B 픽처는 현재의 픽처 앞 및 뒤에 존재하는 픽처를 참조할 수 있다. 이 도면에서 도시된 화살표는 픽처들 간에 참조 여부를 나타낼 수 있다. 예를 들어, B3 픽처는 완전한 화상을 만들기 위하여 I1 픽처 및 B5 픽처를 참조할 수 있고, P9 픽처는 I1 픽처를 참조할 수 있다.

이 도면에서, 네모 안의 숫자는 각 픽처의 dependency_level을 나타낼 수 있다. 예를 들어, 첫 번째 픽처는 dependency_level이 1인 픽처를 나타내고, 두 번째 픽처는 dependency_level이 5인 픽처를 나타내고, 세 번째 픽처는 dependency_level이 4인 픽처를 나타낼 수 있다.

본 발명의 일 실시예에 따르면, 2배속 트릭 플레이는 dependency_level 값으로 1 내지 4를 갖는 픽처들을 디코딩함으로써 수행할 수 있다. 4배속 트릭 플레이는 dependency_level 값으로 1 내지 3을 갖는 픽처들을 디코딩함으로써 수행할 수 있다. 8배속 트릭 플레이는 dependency_level 값으로 1 내지 2를 갖는 픽처들을 디코딩함으로써 수행할 수 있다. 16배속 트릭 플레이는 dependency_level 값으로 1을 갖는 픽처들을 디코딩함으로써 수행할 수 있다.

첫 번째 도면은 비디오 스트림을 이루는 픽처들의 디코딩 순서를 나타낸 도면이고, 두 번째 도면은 정상배속 시 비디오 스트림을 이루는 픽처들의 디스플레이 순서를 나타낸 도면이고, 세 번째 도면은 2배속 트릭 플레이 시 비디오 스트림을 이루는 픽처들의 디스플레이 순서를 나타낸 도면이다.

두 번째 도면에서, 표시된 B0부터 B6까지의 픽처들이 decodable leading picture를 나타낼 수 있다.

이 도면에서, GOP에 포함된 leading picture는 decodable leading picture이기 때문에 두 번째 도면에 도시된 바와 같이 화살표 부분부터 디스플레이 될 수 있고, 세 번째 도면에 도시된 바와 같이 트릭 플레이가 수행될 수 있다. 여기서, 2배속 트릭 플레이가 수행되는 경우 각 픽처의 dependency_level에 따라 도면에 표시된 바와 같이 B1, B3, B5, RAP 및 B1 픽처가 디스플레이될 수 있다. 여기서, decodable leading picture는 RADL (Random Access Decodable Leading Picture)을 포함할 수 있다.

두 번째 및 세 번째 도면에서, 표시된 B0부터 B2까지의 픽처들이 skipped leading picture를 나타낼 수 있고, 표시된 B3부터 B6까지의 픽처들이 decodable leading picture를 나타낼 수 있다.

이 도면에서, skipped leading picture는 디스플레이될 수 없고, 트릭 플레이가 수행될 수 없다. 따라서, 두 번째 도면에 도시된 바와 같이 B3 픽처부터 디스플레이될 수 있고, 세 번째 도면에 도시된 바와 같이 B3 픽처부터 트릭 플레이가 수행될 수 있다. 여기서, 2배속 트릭 플레이가 수행되는 경우 각 픽처의 dependency_level에 따라 도면에 표시된 바와 같이 B3, B5, RAP 및 B1 픽처가 디스플레이될 수 있다. 여기서, decodable leading picture는 RADL (Random Access Decodable Leading Picture)을 포함할 수 있고, skipped leading picture는 RASL (Random Access Skipped Leading Picture)를 포함할 수 있다.

두 번째 및 세 번째 도면에서, 표시된 B0부터 B6까지의 픽처들이 skipped leading picture를 나타낼 수 있다.

이 도면에서, skipped leading picture는 디스플레이될 수 없고, 트릭 플레이가 수행될 수 없다. 따라서, 두 번째 도면에서 RAP부터 디스플레이될 수 있고, 2배속 트릭 플레이가 수행되는 경우 세 번째 도면에 도시된 바와 같이 RAP 및 B1 픽처가 디스플레이될 수 있다. 여기서, skipped leading picture는 RASL (Random Access Skipped Leading Picture)를 포함할 수 있다.

이 도면은, 스트림 내의 최대 temporal_id가 0인 스트림을 트릭 플레이 하기 위하여 trick play box의 시그널링 방법을 나타낸 도면이다.

본 발명의 일 실시예에 따르면, "trikhvc"라는 새로운 박스가 정의될 수 있다. 본 발명의 일 실시예에 따른 trikhvc 박스는 sample_count 값만큼 반복되는 for 루프 내에 pic_type 필드 및/또는 dependency_level 필드를 포함할 수 있다.

sample_count는 스트림에 포함된 픽처의 총 개수를 의미할 수 있다. 여기서, 하나의 sample은 하나의 picture를 의미할 수 있다.

pic_type 필드는 HEVC의 NAL_unit_type에서 정의된 픽처의 종류를 나타낼 수 있다. 트릭 플레이에 이용될 수 있는 일부 NAL_unit_type은 본 발명의 일 실시예에 따른 pic_type으로 선택되어 사용될 수 있다. pic_type 필드는 4비트의 값을 나타낼 수 있다.

dependency_level 필드는 해당 픽처의 dependency level을 나타낼 수 있다. 본 발명의 일 실시예에 따른 dependency_level은 트릭 플레이를 수행하는 경우에 이용될 수 있다. dependency_level 필드는 기존 AVC의 trick play box에서 사용되었던 dependency_level 필드와 동일할 수 있다. 예를 들어, dependency_level이 3인 샘플을 포함하여 트릭 플레이를 수행한다는 것은 dependency_level이 1, 2 또는 3에 해당하는 샘플만을 디코딩하고 디스플레이한다는 것을 의미할 수 있다. 따라서, dependency_level은 트릭 플레이를 수행하는데 있어서 버려도 되는 layer의 level을 의미할 수 있다. leading picture가 존재하는 경우에도 decodable leading picture는 dependency_level을 가지며, 수신측은 기존에 트릭 플레이 방법과 동일하게 해당되지 않는 픽처를 건너뛰면서 해당되는 픽처만을 디코딩하고 디스플레이할 수 있다. dependency_level 필드는 6비트의 값을 나타낼 수 있다.

본 발명의 일 실시예에 따르면, 기존에 정의된 "trik"이라는 박스를 이용하여 HEVC 스트림의 트릭 플레이가 수행될 수 있다. 본 발명의 일 실시예에 따르면, flag를 이용하여 AVC 또는 HEVC 트릭 플레이가 선택될 수 있다.

본 발명의 일 실시예에 따른 trik 박스는 flag를 이용해 video codec에 맞게 stream을 분리해서 시그널링 할 수 있다. 또한, sample_count 값만큼 반복되는 for 루프 내에 pic_type 필드 및/또는 dependency_level 필드를 포함할 수 있다.

본 발명의 일 실시예에 따른 flag 값이 0인 경우, trik 박스는 H.264/AVC trick play를 시그널링할 수 있고, flag 값이 1인 경우, trik 박스는 HEVC trick play를 시그널링할 수 있다.

pic_type 필드는 HEVC의 NAL_unit_type에서 정의된 픽처의 종류를 나타낼 수 있다. 트릭 플레이에 이용될 수 있는 일부 NAL_unit_type은 본 발명의 일 실시예에 따른 pic_type으로 선택되어 사용될 수 있다. 본 발명의 일 실시예에 따른 flag 값이 0인 경우, pic_type 필드는 2비트의 값을 나타낼 수 있고, flag 값이 1인 경우, 4비트의 값을 나타낼 수 있다.

본 발명의 일 실시예에 따른 pic_type은 0 내지 15의 값을 가질 수 있다.

pic_type이 0인 경우, pic_type은 관련된 leading picture를 갖지 않는 IDR 픽처를 나타낼 수 있다. 이 경우, nal_unit_type은 IDR_N_LP을 나타낼 수 있다.

pic_type이 1인 경우, pic_type은 관련된 decodable leading picture를 갖는 IDR 픽처를 나타낼 수 있다. 이 경우, nal_unit_type은 IDR_W_RADL을 나타낼 수 있다.

pic_type이 2인 경우, pic_type은 관련된 leading picture를 갖는 BLA 픽처를 나타낼 수 있다. 이 경우, nal_unit_type은 BLA_N_LP을 나타낼 수 있다.

pic_type이 3인 경우, pic_type은 관련된 RADL 픽처를 갖지만 관련된 RASL 픽처를 갖지 않는 BLA 픽처를 나타낼 수 있다. 이 경우, nal_unit_type은 BLA_W_RADL을 나타낼 수 있다.

pic_type이 4인 경우, pic_type은 관련된 RADL 픽처 및 RASL 픽처를 갖는 BLA 픽처를 나타낼 수 있다. 이 경우, nal_unit_type은 BLA_W_LP을 나타낼 수 있다.

pic_type이 5인 경우, pic_type은 관련된 leading picture를 갖는 CRA 픽처를 나타낼 수 있다. 이 경우, nal_unit_type은 CRA_NUT을 나타낼 수 있다.

pic_type이 7인 경우, pic_type은 RADL (Random Access Decodable Leading Picture) 픽처를 나타낼 수 있다. 이 경우, nal_unit_type은 RADL_N 또는 RADL_R을 나타낼 수 있다.

pic_type이 8인 경우, pic_type은 RASL (Random Access Skipped Leading Picture) 픽처를 나타낼 수 있다. 이 경우, nal_unit_type은 RASL_N 또는 RASL_R을 나타낼 수 있다.

pic_type이 9인 경우, pic_type은 정해지지 않은 I 픽처를 나타낼 수 있다.

pic_type 10은 unknown 값에 해당할 수 있다.

pic_type 11 내지 15는 reserved 값에 해당할 수 있다.

pic_type 필드는 HEVC의 NAL_unit_type에서 정의된 픽처의 종류를 나타낼 수 있다. 트릭 플레이에 이용될 수 있는 일부 NAL_unit_type은 본 발명의 일 실시예에 따른 pic_type으로 선택되어 사용될 수 있다. pic_type 필드는 3비트의 값을 나타낼 수 있다.

dependency_level 필드는 해당 픽처의 dependency level을 나타낼 수 있다. 본 발명의 일 실시예에 따른 dependency_level은 트릭 플레이를 수행하는 경우에 이용될 수 있다. dependency_level 필드는 기존 AVC의 trick play box에서 사용되었던 dependency_level 필드와 동일할 수 있다. 예를 들어, dependency_level이 3인 샘플을 포함하여 트릭 플레이를 수행한다는 것은 dependency_level이 1, 2 또는 3에 해당하는 샘플만을 디코딩하고 디스플레이한다는 것을 의미할 수 있다. 따라서, dependency_level은 트릭 플레이를 수행하는데 있어서 버려도 되는 layer의 level을 의미할 수 있다. leading picture가 존재하는 경우에도 decodable leading picture는 dependency_level을 가지며, 수신측은 기존에 트릭 플레이 방법과 동일하게 해당되지 않는 픽처를 건너뛰면서 해당되는 픽처만을 디코딩하고 디스플레이할 수 있다. dependency_level 필드는 5비트의 값을 나타낼 수 있다.

본 발명의 일 실시예에 따른 trik 박스는 falg, sample_count 값만큼 반복되는 for 루프 내에 pic_type 필드 및/또는 dependency_level 필드를 포함할 수 있다.

pic_type 필드는 HEVC의 NAL_unit_type에서 정의된 픽처의 종류를 나타낼 수 있다. 트릭 플레이에 이용될 수 있는 일부 NAL_unit_type은 본 발명의 일 실시예에 따른 pic_type으로 선택되어 사용될 수 있다. 본 발명의 일 실시예에 따른 flag 값이 0인 경우, pic_type 필드는 2비트의 값을 나타낼 수 있고, flag 값이 1인 경우, 3비트의 값을 나타낼 수 있다.

dependency_level 필드는 해당 픽처의 dependency level을 나타낼 수 있다. 본 발명의 일 실시예에 따른 dependency_level은 트릭 플레이를 수행하는 경우에 이용될 수 있다. dependency_level 필드는 기존 AVC의 trick play box에서 사용되었던 dependency_level 필드와 동일할 수 있다. 예를 들어, dependency_level이 3인 샘플을 포함하여 트릭 플레이를 수행한다는 것은 dependency_level이 1, 2 또는 3에 해당하는 샘플만을 디코딩하고 디스플레이한다는 것을 의미할 수 있다. 따라서, dependency_level은 트릭 플레이를 수행하는데 있어서 버려도 되는 layer의 level을 의미할 수 있다. leading picture가 존재하는 경우에도 decodable leading picture는 dependency_level을 가지며, 수신측은 기존에 트릭 플레이 방법과 동일하게 해당되지 않는 픽처를 건너뛰면서 해당되는 픽처만을 디코딩하고 디스플레이할 수 있다. 본 발명의 일 실시예에 따른 flag 값이 0인 경우, dependency_level 필드는 6비트의 값을 나타낼 수 있고, flag 값이 1인 경우, 5비트의 값을 나타낼 수 있다.

본 발명의 또 다른 일 실시예에 따르면, 트릭 플레이를 수행할 때 leading picture는 디스플레이되지 않는다는 제약이 포함되는 경우, pic_type은 아래와 같이 구성될 수 있다. pic_type이 0인 경우, pic_type은 해당 샘플이 unknown 샘플임을 나타낼 수 있고, pic_type이 1인 경우, pic_type은 해당 샘플이 IDR 샘플임을 나타낼 수 있고, pic_type이 2인 경우, pic_type은 해당 샘플이 CRA 샘플임을 나타낼 수 있고, pic_type이 3인 경우, pic_type은 해당 샘플이 BLA 샘플임을 나타낼 수 있고, pic_type이 4인 경우, pic_type은 해당 샘플이 unconstrained I 샘플임을 나타낼 수 있다. 이 경우, HEVC 스트림에 대한 pic_type 및/또는 dependency_level 필드에 할당되는 비트 수가 줄어들 수 있다. 여기서, 샘플은 픽처와 동일한 의미를 나타낼 수 있다.

이 도면에서, 네모 박스는 스트림에 포함되는 픽처를 나타낼 수 있고, T_ID는 temporal id를 나타낼 수 있다.

이 도면은 max_temporal_id가 0보다 큰 즉, temporal scalability를 지원하는 HEVC 스트림에서 트릭 플레이를 지원하기 위하여 최대로 지원할 수 있는 배속을 제한할 수 있도록 시그널링하는 방법을 나타낸 도면이다. 예를 들어, 최대 temporal_id가 2일 경우, 최대 4배속까지만 제공될 수 있다.

본 발명의 일 실시예에 따르면, "trikhvc"라는 새로운 박스가 정의될 수 있다. 본 발명의 일 실시예에 따른 trikhvc 박스는 sample_count 값만큼 반복되는 for 루프 내에 pic_type 필드, temporal_sub_layer_pic_type 필드, max_temporal_id 필드, temporal_id 필드, constraint_trick_play_mode 필드 및/또는 next_temporal_id 필드를 포함할 수 있다.

temporal_sub_layer_pic_type 필드는 해당 픽처가 TSA (Temporal Sub-layer Access) 픽처인지 STSA (Step-wise Temporal Sub-layer Access) 픽처인지를 나타낼 수 있다. temporal_sub_layer_pic_type이 1이면, temporal_sub_layer_pic_type은 해당 픽처가 TSA 픽처임을 나타낼 수 있고, temporal_sub_layer_pic_type이 2이면, temporal_sub_layer_pic_type은 해당 픽처가 STSA 픽처임을 나타낼 수 있고, temporal_sub_layer_pic_type이 3이면, temporal_sub_layer_pic_type은 해당 픽처가 unknown 픽처임을 나타낼 수 있다. HEVC는 temporal scalability를 제공하고 적응적으로 frame rate를 변경할 수 있도록 temporal_sub_layer_access_picture를 구분할 수 있다. 즉, HEVC는 temporal_id가 0이 아닌 layer에서 TSA 픽처 및 STSA 픽처를 기반으로 다이나믹하게 frame rate를 변경시킬 수 있다. TSA와 STSA는 fram rate를 어떻게 및 얼마나 변경할 수 있는지에 대해서 차이가 존재할 수 있다. 즉, TSA와 STSA는 한번에 몇 개의 temporal_id를 건너뛸 수 있는지에 대해서 차이가 존재할 수 있다. 예를 들면, temporal_id가 0인 경우 frame rate는 15p이고, temporal_id가 1인 경우 frame rate는 30p이고, temporal_id가 2인 경우 (max_temporal_id) frame rate는 60p라면, TSA는 temporal_id가 0인 레이어에서 temporal_id가 2인 레이어로 바로 접근할 수 있으므로 방송 시스템은 frame rate가 15p인 서비스를 제공하다가 60p인 서비스를 제공하는 것으로 바로 변경할 수 있다. 반면, STSA는 단계적 접근만을 할 수 있으므로 temporal_id가 0인 레이어에서 temporal_id가 1인 레이어로 먼저 접근하고 그 후에 temporal_id가 2인 레이어로 접근할 수 있다. 따라서, 이 경우 방송 시스템은 점차적으로 frame rate가 15p인 서비스를 제공하다가 30p인 서비스를 제공하고 최종적으로 60p인 서비스를 제공할 수 있다.

max_temporal_id 필드는 스트림에 포함된 최대 temporal_id 값을 나타낼 수 있다.

temporal_id 필드는 HEVC의 nuh_temporal_id_plus1 값을 이용하여 계산된 temporal id 값을 나타낼 수 있다. temporal_id 필드가 가지는 값은 nuh_temporal_id_plus1 값에서 1을 뺀 값을 나타낼 수 있다.

constraint_trick_play_mode 필드는 최대로 제공될 수 있는 배속 정보를 나타낼 수 있다. max_temporal_id 값을 이용하여 max_trick_play_mode (최대로 제공될 수 있는 배속) = 2^(max_temporal_id)이라는 식을 통하여, 본 발명은 최대로 제공 가능한 배속을 시그널링할 수 있다. 예를 들어, 최대 temporal id가 2인 경우 본 발명은 2^2인 4배속을 최대로 제공할 수 있다. 본 발명의 일 실시예에 따르면, 본 발명은 max_trick_play_mode를 상술한 식을 통하여 계산된 값보다 작은 값으로 할당하는 제한을 둘 수 있다. 예를 들어, max_trick_play_mode의 값이 1이면 2배속, 2이면 4배속, 3이면 8배속, 4이면 16배속을 나타낼 수 있다. 여기서, constraint_trick_play_mode는 max_trick_play_mode와 동일한 의미를 가질 수 있다. 본 발명의 일 실시예에는 max_trick_play_mode보다 빠른 배속은 지원할 수 없고, max_trick_play_mode와 동일한 배속 수는 지원할 수 있다. 또한, 본 발명의 일 실시예는 계산된 max_trick_play_mode 값보다 작은 값으로 할당하는 constraint를 signaling 할 수도 있다.

next_temporal_id 필드는 temporal_sub_layer_pic_type에 따라 최대로 변경 가능한 frame rate를 알려주기 위하여, 이동 가능한 temporal_id를 나타낼 수 있다. 예를 들어, max_temporal_id가 2인 스트림에서, temporal_id가 0인 픽처만을 디스플레이하는 4배속의 트릭 플레이를 제공하다가 정상배속 (1배속)으로 되돌리고자 할 때, temporal_sub_layer_pic_type이 TSA이면 next_temporal_id는 max_temporal_id 값을 가질 수 있다. 반면, STSA이면 next_temporal_id는 temporal_id 값에서 1을 더한 값을 가질 수 있다.

본 발명의 일 실시예에 따른 trik 박스는 flag, sample_count 값만큼 반복되는 for 루프 내에 pic_type 필드, dependency_level 필드, temporal_sub_layer_pic_type 필드, max_temporal_id 필드, temporal_id 필드, constraint_trick_play_mode 필드 및/또는 next_temporal_id 필드를 포함할 수 있다.

temporal_sub_layer_pic_type 필드는 해당 픽처가 TSA (Temporal Sub-layer Access) 픽처인지 STSA (Step-wise Temporal Sub-layer Access) 픽처인지를 나타낼 수 있다. temporal_sub_layer_pic_type이 1이면, temporal_sub_layer_pic_type은 해당 픽처가 TSA 픽처임을 나타낼 수 있고, temporal_sub_layer_pic_type이 2이면, temporal_sub_layer_pic_type은 해당 픽처가 STSA 픽처임을 나타낼 수 있고, temporal_sub_layer_pic_type이 3이면, temporal_sub_layer_pic_type은 해당 픽처가 unknown 픽처임을 나타낼 수 있다. HEVC는 temporal scalability를 제공하고 적응적으로 frame rate를 변경할 수 있도록 temporal_sub_layer_access_picture를 구분할 수 있다. 즉, HEVC는 temporal_id가 0이 아닌 layer에서 TSA 픽처 및 STSA 픽처를 기반으로 다이나믹하게 frame rate를 변경시킬 수 있다. TSA와 STSA는 fram rate를 어떻게 및 얼마나 변경할 수 있는지에 대해서 차이가 존재할 수 있다. 즉, TSA와 STSA는 한번에 몇 개의 tempora_id를 건너뛸 수 있는지에 대해서 차이가 존재할 수 있다. 예를 들면, temporal_id가 0인 경우 frame rate는 15p이고, temporal_id가 1인 경우 frame rate는 30p이고, temporal_id가 2인 경우 (max_temporal_id) frame rate는 60p라면, TSA는 temporal_id가 0인 레이어에서 temporal_id가 2인 레이어로 바로 접근할 수 있으므로 방송 시스템은 frame rate가 15p인 서비스를 제공하다가 60p인 서비스를 제공하는 것으로 바로 변경할 수 있다. 반면, STSA는 단계적 접근만을 할 수 있으므로 temporal_id가 0인 레이어에서 temporal_id가 1인 레이어로 먼저 접근하고 그 후에 temporal_id가 2인 레이어로 접근할 수 있다. 따라서, 이 경우 방송 시스템은 점차적으로 frame rate가 15p인 서비스를 제공하다가 30p인 서비스를 제공하고 최종적으로 60p인 서비스를 제공할 수 있다.

constraint_trick_play_mode 필드는 최대로 제공될 수 있는 배속 정보를 나타낼 수 있다. max_temporal_id 값을 이용하여 max_trick_play_mode (최대로 제공될 수 있는 배속) = 2^(max_temporal_id)이라는 식을 통하여, 본 발명은 최대로 제공 가능한 배속을 시그널링할 수 있다. 예를 들어, 최대 temporal id가 2인 경우 본 발명은 2^2인 4배속을 최대로 제공할 수 있다. 본 발명의 일 실시예에 따르면, 본 발명은 max_trick_play_mode를 상술한 식을 통하여 계산된 값보다 작은 값으로 할당하는 제한을 둘 수 있다. 예를 들어, max_trick_play_mode의 값이 1이면 2배속, 2이면 4배속, 3이면 8배속, 4이면 16배속을 나타낼 수 있다. 여기서, constraint_trick_play_mode는 max_trick_play_mode와 동일한 의미를 가질 수 있다.

이 도면에서 도시된 바와 같이, temporal sub-layer picture type이 TSA인 경우 수신측은 temporal_id가 0인 레이어의 스트림만을 디스플레이하다가 즉, 4배속으로 트릭 플레이를 수행하다가 바로 1배속 (정상배속)으로 디스플레이할 수 있다.

이 도면에서 도시된 바와 같이, temporal sub-layer picture type이 TSA인 경우 수신측은 temporal_id가 0인 픽처를 디코딩 및 디스플레이하다가 바로 temporal_id가 2인 픽처를 디코딩 및 디스플레이할 수 있다.

이 도면에서 도시된 바와 같이, temporal sub-layer picture type이 STSA인 경우 수신측은 temporal_id가 0인 레이어의 스트림만을 디스플레이하다가 즉, 4배속으로 트릭 플레이를 수행하다가 바로 1배속 (정상배속)으로 디스플레이할 수 없고, 중간에 2배속으로 디스플레이하는 과정을 거친 후 1배속으로 디스플레이할 수 있다. 따라서, 본 발명의 일 실시예에 따른 temporal sub-layer picture type이 STSA인 경우에는 변환이 가능한 배속수에 대한 제한을 알려주는 방법이 필요할 수 있다. 즉, next_temporal_id를 시그널링해주는 것이 필요할 수 있다.

이 도면에서 도시된 바와 같이, temporal sub-layer picture type이 STSA이고 4배속으로 디스플레이하다가 1배속으로 디스플레이하고자 할 경우 수신측은 temporal_id가 0인 픽처를 디코딩 및 디스플레이하다가 바로 temporal_id가 2인 픽처를 디코딩 및 디스플레이할 수 없고, temporal_id가 1인 픽처를 디코딩 및 디스플레이한 후 temporal_id가 2인 픽처를 디코딩 및 디스플레이할 수 있다.

본 발명의 일 실시예에 따르면, "trikhvc"라는 새로운 박스가 정의될 수 있다. 본 발명의 일 실시예에 따른 trikhvc 박스는 sample_count 값만큼 반복되는 for 루프 내에 pic_type 필드, temporal_sub_layer_pic_type 필드, max_temporal_id 필드, temporal_id 필드, next_temporal_id 필드 및/또는 dependency_level 필드를 포함할 수 있다.

본 발명의 일 실시예에 따르면, 이 도면에 도시된 trick play box는 트릭 플레이에서 지원가능한 최대 배속을 나타내는 max_trick_play_mode 필드를 포함할 수 있다.

본 발명의 일 실시예에 따르면, max_temporal_id가 2인 경우 2배속 트릭 플레이 서비스를 제공하기 위하여 수신측은 temporal_id가 0 및 1인 픽처만을 디코딩할 수 있다. 또한, 4배속 트릭 플레이 서비스를 제공하기 위하여 수신측은 temporal_id가 0인 픽처만을 디코딩 및 디스플레이할 수 있다. 또한, 4배속보다 고배속의 트릭 플레이 서비스를 제공하기 위하여 수신측은 temporal_id가 0인 픽처들 중에서 dependency_level에 따라서 픽처들을 분류하고 해당하는 dependency_level을 갖는 픽처만을 디코딩 및 디스플레이함으로써 4배속보다 고배속의 트릭 플레이 서비스를 제공할 수 있다.

본 발명의 일 실시예에 따른 trik 박스는 flag, sample_count 값만큼 반복되는 for 루프 내에 pic_type 필드, dependency_level 필드, temporal_sub_layer_pic_type 필드, max_temporal_id 필드, temporal_id 필드 및/또는 next_temporal_id 필드를 포함할 수 있다.

본 발명의 일 실시예에 따른 방송 신호 수신 시스템은 player device (22010), storage device (22020), KIC server (22030), license server (22040) 및/또는 download server (22050)을 포함할 수 있다.

player device (22010)는 UHD TV를 포함할 수 있다. player device는 SCSA 어플리케이션 및 traditional file system을 포함할 수 있다.

storage device (22020)는 SD카드, USB 및/또는 SSD 메모리를 포함할 수 있다. storage device는 traditional file system을 포함할 수 있다.

KIC server (22030)는 개인 정보를 식별하는 정보를 포함할 수 있다.

license server (22040)은 컨텐츠의 라이선스 관련된 정보를 포함할 수 있다.

download server (22050)는 컨텐츠 및 컨텐츠와 관련된 정보를 포함할 수 있다.

본 발명의 일 실시예에 따르면, player device는 컨텐츠에 대한 라이선스를 획득하기 위하여 다음과 같은 과정을 거칠 수 있다. 먼저, storage device가 라이선스 파일을 포함하고 있는지 확인하고 라이선스 파일을 포함하고 있으면 라이선스 파일로부터 content key를 획득할 수 있다. storage device가 라이선스 파일을 포함하고 있지 않는 경우 bulk content를 확인하여 bulk content가 라이선스 파일을 포함하는 경우 라이선스 파일로부터 content key를 획득할 수 있다. 그리고, content key를 이용하여 license server로부터 라이선스를 획득할 수 있다.

본 발명의 일 실시예에 따르면, 수신기는 다운로드 받은 컨텐츠를 디스플레이하기 위하여 해당 컨텐츠에 대한 라이선스를 획득할 필요가 있을 수 있다.

본 발명의 일 실시예에 따른 수신단은 UHD 디스플레이부 (23010), 세컨드 디바이스 (23020), UHD 디코딩부 (23030), USB (23040) 및/또는 원격 조종기 (23050)을 포함할 수 있다.

UHD 디스플레이부 (23010)는 UHD 디코딩부 (23030)를 포함할 수 있고 UHD TV를 나타낼 수 있다.

세컨드 디바이스 (23020)는 핸드폰, 테블릿, 노트북 등을 나타낼 수 있다.

UHD 디코딩부 (23030)는 UHD 디스플레이부 (23010)를 포함할 수 있고 UHD TV를 나타낼 수 있다.

USB (23040)는 다른 메모리 디바이스를 나타낼 수도 있다. 본 발명의 일 실시예에 따른 USB는 세컨드 스크린 용 메타데이터, URL 및/또는 재생목록을 저장할 수 있다.

원격 조종기 (23050)는 UHD TV에 적합한 컨트롤러를 나타낼 수 있다.

본 발명의 일 실시예에 따르면, UHD TV는 USB에 포함된 content metadata를 세컨드 디바이스에 전송할 수 있고 세컨드 디바이스의 디스플레이에 표시할 수 있다. 먼저, 사용자는 USB에 세컨드 스크린에 표시할 메타데이터, URL 및/또는 재생목록을 저장할 수 있다. UHD TV와 세컨드 디바이스는 자동적으로 페어링 (pairing)을 할 수 있고 이 때, 양 디바이스는 UPnP 기반의 SSDP를 통하여 연결될 수 있다. USB를 UHD TV에 연결하면, UHD TV는 세컨드 스크린에 표시할 컨텐츠 정보 즉, USB에 포함된 정보를 세컨드 디바이스에게 전송할 수 있다. 세컨드 디바이스는 UHD TV로부터 전송 받은 정보들을 디스플레이할 수 있다.

본 발명의 일 실시예에 따르면, 사용자는 USB에 트릭 플레이에 관한 정보를 저장할 수 있고 트릭 플레이에 관한 정보는 UHD TV와 연결된 세컨드 디바이스를 통하여 디스플레이될 수 있다.

본 발명의 일 실시예에 따르면 tier 값은 temporal id가 0인 픽처에 대해서만 할당될 수 있다.

이 도면에서 도시된 바와 같이, 본 발명의 일 실시예에 따른 수신기는 temporal id가 0, 1, 2 또는 3인 픽처들을 디코딩 및 디스플레이함으로써 정상배속의 트릭 플레이를 수행할 수 있고, temporal id가 0, 1 또는 2인 픽처들을 디코딩 및 디스플레이함으로써 2배속의 트릭 플레이를 수행할 수 있고, temporal id가 0 또는 1인 픽처들을 디코딩 및 디스플레이함으로써 4배속의 트릭 플레이를 수행할 수 있고, temporal id가 0인 픽처들을 모두 디코딩 및 디스플레이함으로써 8배속의 트릭 플레이를 수행할 수 있다. 본 발명은 temporal id가 0인 픽처에 대해서 각기 다른 tier 값을 할당함으로써 8배속보다 더 빠른 트릭 플레이를 수행할 수 있다.

본 발명의 일 실시예에 따르면, 트릭 플레이를 제공하기 위하여 다음과 같은 방법이 이용될 수 있다. PVR_assist_info descriptor를 이용하기 위해서 tier와 temporal id를 매핑함으로써 트릭 플레이가 제공될 수 있다. (시나리오 A) PVR_assist_info descriptor에 temporal id를 이용한 트릭 플레이를 포함함으로써 트릭 플레이가 제공될 수 있다. (시나리오 B) NAL_unit_header의 nuh_temporal_id_plus1 정보를 파싱하여 실제 트릭 플레이를 위해 필요한 패킷만 선택함으로써 트릭 플레이가 제공될 수 있다. (시나리오 C)

본 발명의 일 실시예에 따른 temporal sub-layer 또는 temporal id는 HEVC에서 temporal scalability를 지원하기 위하여 도입된 용어이고, NAL_unit_header의 nuh_temporal_id_plus1에 의하여 시그널링될 수 있다.

본 발명의 일 실시예에 따른 tier는 AVC 스트림 또는 mpeg-2 스트림에서 트릭 플레이를 지원하기 위하여 도입된 용어이고, TS packet내에 adaptation field에 포함될 수 있다.

본 발명의 일 실시예에 따른 기존의 tier는 layer간 dependency를 나타낼 수 있다.

이 도면에 도시된 바와 같이, temporal id가 3인 픽처들은 tier값으로 6을 가질 수 있고, temporal id가 2인 픽처들은 tier값으로 4를 가질 수 있고, temporal id가 1인 픽처들은 tier값으로 3을 가질 수 있고, temporal id가 0인 픽처들 중에서 I 픽처는 tier값으로 1을 가질 수 있고 P 픽처는 tier값으로 2를 가질 수 있다. 즉, temporal id가 0인 픽처들은 같은 temporal id를 갖지만 서로 다른 tier값을 가질 수 있다.

본 발명의 일 실시예에 따르면, max_temporal_id를 갖는 즉, dependency_level이 가장 높은 픽처들은 tier 값으로 6 또는 7을 가질 수 있다. 그리고, 그 이외의 temporal_id를 갖는 픽처들은 tier 값으로 1 내지 5를 가질 수 있다. 이 때, temporal_id가 0인 레이어에 해당하는 픽처들은 픽처의 타입에 따라 tier 값으로 1 또는 2 값을 가질 수 있다.

본 발명의 일 실시예에 따르면, temporal id는 포함하지만 tier 정보는 포함하지 않는 HEVC 스트림을 기반으로 트릭 플레이를 제공하기 위해서 temporal id와 tier를 매핑하는 방법이 사용될 수 있다. (시나리오 A)

본 발명의 일 실시예에 따른 트릭 플레이를 제공하기 위해서 하나의 temporal id를 하나의 tier에 1:1로 매핑하는 방법이 사용될 수 있고, (시나리오 A-a) 하나의 temporal id를 여러 개의 tier에 매핑하는 방법이 사용될 수 있다. (시나리오 A-b)

본 발명의 일 실시예는 상술한 시나리오 A-a 및 시나리오 A-b에 있어서, 기존의 tier가 갖는 의미와 무관하게 temporal id의 값을 그대로 tier에 1:1로 매핑시킬 수 있다.

본 발명의 또 다른 일 실시예는 상술한 시나리오 A-a 및 시나리오 A-b에 있어서, temporal id의 값을 tier에 1:1로 매핑시키되 tier 6,7은 discardable picture라는 기존 tier의 의미를 그대로 유지하여 maximum temporal id는 tier 6 또는 7에 매핑시킬 수 있다.

상술한 시나리오 A에 따르면, 기존의 PVR_assist_info descriptor의 대부분을 그대로 이용할 수 있다는 장점이 있을 수 있다. 다만, 본 발명의 일 실시예는 HEVC 스트림을 기반으로 하기 때문에 PVR_assist_info descriptor에 포함된 일부 필드는 수정될 필요가 있다. 예를 들어, PVR_assist_info descriptor에 포함된 PVR_assist_tier_m_cumulative_frames 필드는 PVR_assist_tier_m 필드를 통하여 tier 1로부터 1.28초당 추출 가능한 최소 프레임의 수의 값을 전달할 수 있다 (This field conveys the value of the intended minimum number of extractable frames per 1.28 sec. from tier 1 through "PVR_assist_teir_m")고 새로 정의될 수 있다.

이 도면은 본 발명의 일 실시예인 시나리오 A-a에 따른 트릭 플레이 방법을 나타낸 도면이다.

이 도면에 도시된 바와 같이, temporal id가 3인 픽처들은 tier 4에 매핑될 수 있고, temporal id가 2인 픽처들은 tier 3에 매핑될 수 있고, temporal id가 1인 픽처들은 tier 2에 매핑될 수 있고, temporal id가 0인 픽처들은 tier 1에 매핑될 수 있다.

본 발명의 일 실시예인 시나리오 A는 8배속 이상의 트릭 플레이를 제공할 수 없다.

본 발명의 일 실시예는 이전 도면과 다르게 temporal id의 값을 tier에 1:1로 매핑시키되 tier 6,7은 discardable picture라는 기존 tier의 의미를 그대로 유지하여 maximum temporal id는 tier 6 또는 7에 매핑시킬 수 있다.

이 도면에 도시된 바와 같이, temporal id가 3인 픽처들은 tier 6에 매핑될 수 있고, temporal id가 2인 픽처들은 tier 3에 매핑될 수 있고, temporal id가 1인 픽처들은 tier 2에 매핑될 수 있고, temporal id가 0인 픽처들은 tier 1에 매핑될 수 있다.

이 도면이 이전 도면과 다른 점은 maximum temporal id인 temporal id 3에 해당하는 픽처들을 tier 6에 매핑하였다는 점일 수 있다.

이 도면은 본 발명의 일 실시예에 따른 시나리오 A-a 에 있어서, 기존의 tier가 갖는 의미와 무관하게 temporal id의 값을 그대로 tier에 1:1로 매핑한 결과를 나타낸 도면이다.

이 도면에 도시된 nuh_temporal_id plus1 필드는 NAL_unit_header에 포함된 필드로서 temporal id에 1을 더한 값을 나타낼 수 있다. 예를 들면, nuh_temporal_id plus1 필드 값이 1이면 temporal id는 0이 될 수 있다. 따라서, 이 도면에 도시된 바와 같이 temporal id가 0인 픽처들은 tier 1에 매핑될 수 있고, temporal id가 1인 픽처들은 tier 2에 매핑될 수 있고, temporal id가 2인 픽처들은 tier 3에 매핑될 수 있고, temporal id가 3인 픽처들은 tier 4에 매핑될 수 있다.

본 발명의 일 실시예에 따르면, temporal id와 매핑한 새로운 tier는 기존에 사용되던 tier의 의미와 다를 수 있다. 기존의 tier 6 및 7은 discardable picture를 의미했었고 tier 7은 reference로 사용되지 않는 픽처를 의미했었다. 하지만, 매핑을 통하여 새롭게 정의되는 tier는 기존의 tier 6 및 7이 가지고 있던 의미를 갖고 있지 않을 수 있다.

본 발명의 일 실시예는 temporal sub-layer와 tier가 동일한 숫자를 갖도록 매핑할 수 있고 트릭 플레이를 수행하는데 상술한 매핑 정보를 이용할 수 있다.

이 도면은 본 발명의 또 다른 일 실시예에 따른 시나리오 A-a에 있어서, temporal id의 값을 tier에 1:1로 매핑시키되 tier 6,7은 discardable picture라는 기존 tier의 의미를 그대로 유지하여 maximum temporal id는 tier 6 또는 7에 매핑한 결과를 나타낸 도면이다.

이 도면에 도시된 nuh_temporal_id plus1 필드는 NAL_unit_header에 포함된 필드로서 temporal id에 1을 더한 값을 나타낼 수 있다. 예를 들면, nuh_temporal_id plus1 필드 값이 1이면 temporal id는 0이 될 수 있다. 따라서, 이 도면에 도시된 바와 같이 temporal id가 0인 픽처들은 tier 1에 매핑될 수 있고, temporal id가 1인 픽처들은 tier 2에 매핑될 수 있고, temporal id가 2인 픽처들은 tier 3에 매핑될 수 있고, temporal id가 3인 픽처들은 tier 6에 매핑될 수 있다.

본 발명의 일 실시예에 따르면, temporal id와 매핑한 새로운 tier는 기존에 사용되던 tier의 의미와 동일할 수 있다. tier 6 및 7은 discardable picture를 의미할 수 있고 tier 6은 reference로 사용되는 픽처를 의미하고 tier 7은 reference로 사용되지 않는 픽처를 의미할 수 있다. 따라서, 상술한 바와 같이 nuh_temporal_id plus1가 4인 픽처들은 tier 6으로 매핑될 수 있다. 여기서, reference로 사용되지 않는 픽처들인 경우에는 tier 7로 매핑될 수 있다.

이 도면에 도시된 바와 같이, maximum temporal id인 temporal id가 1인 픽처들은 tier 4 또는 6에 매핑될 수 있고 temporal id가 0인 나머지 5개의 픽처들은 tier 0 내지 3에 매핑될 수 있다.

본 발명의 일 실시예에 따르면, temporal id와 매핑한 새로운 tier는 기존에 사용되던 tier의 의미와 다를 수 있다. 기존의 tier 6 및 7은 discardable picture를 의미했었고 tier 7은 reference로 사용되지 않는 픽처를 의미했었다. 하지만, 매핑을 통하여 새롭게 정의되는 tier는 기존의 tier 6 및 7이 가지고 있던 의미를 갖고 있지 않을 수 있다. 따라서, 이 도면에 도시된 바와 같이, temporal id가 1인 픽처들은 tier 4에 매핑될 수 있다. (30010)

본 발명의 또 다른 일 실시예에 따르면, temporal id와 매핑한 새로운 tier는 기존에 사용되던 tier의 의미와 동일할 수 있다. tier 6 및 7은 discardable picture를 의미할 수 있고 tier 6은 reference로 사용되는 픽처를 의미하고 tier 7은 reference로 사용되지 않는 픽처를 의미할 수 있다. 따라서, 이 도면에 도시된 바와 같이, temporal id가 1인 픽처들은 tier 6에 매핑될 수 있다. (30020)

본 발명의 일 실시예는 tier 및 nuh_temporal_id_plus1의 값을 트릭 플레이를 위한 속도 정보와 매핑하는 디스크립터를 제공할 수 있다.

본 발명의 일 실시예에 따르면, 기존 트릭 플레이를 위한 정보는 TS 패킷의 adaptation field에 포함되었으므로, temporal id를 포함하는 HEVC 스트림의 트릭 플레이를 위한 정보인 HEVC_temporal_id_tier_mapping_info도 상술한 adaptation field에 포함될 수 있다.

이 도면은 TS packet의 adaptation field에 포함된 data field의 구성을 나타낸 도면이다.

이 도면에 도시된 바와 같이, data_field_tag가 0x00이면 해당 data field는 reserved임을 나타낼 수 있고, 0x01이면 해당 data field는 Announcement switching data field임을 나타낼 수 있고, 0x02이면 AU_information에 대한 data field임을 나타낼 수 있고, 0x03이면 PVR_assist_information에 대한 data field임을 나타낼 수 있고, 0x04이면 TSAP time line을 나타내는 data field임을 나타낼 수 있고, 0x05이면 HEVC_temporal_id_tier_mapping_info에 대한 data field임을 나타낼 수 있다.

본 발명의 일 실시예는 HEVC_temporal_id_tier_mapping_info 디스크립터를 이용하여 temporal id에 tier 값을 매핑하고 PVR_assist_information 디스크립터를 이용하여 tier 기반으로 트릭 플레이를 제공할 수 있다.

본 발명의 일 실시예에 따른 HEVC_temporal_id_tier_mapping_info는 included_temporal_id_flag 필드, temporal_sub_layer_dependency_flag 필드, max_temporal_id_plus1 필드, temporal_id_plus1 필드, curr_tier_num 필드 및/또는 trick_play_speed 필드를 포함할 수 있다.

included_temporal_id_flag 필드는 temporal id를 이용해서 인코딩했는지 여부를 시그널링할 수 있다.

temporal_sub_layer_dependency_flag 필드는 temporal sub-layer 간에 dependency 여부를 나타낼 수 있다. 즉, temporal_sub_layer_dependency_flag 필드는 하위 temporal sub-layer 픽처가 상위 temporal sub-layer 픽처를 참조하지 않는 경우 1을 갖는다.

max_temporal_id_plus1 필드는 최대 temporal id 값을 나타낼 수 있으며 max_temporal_id_plus1 필드가 나타내는 값은 temporal id에 1을 더한 값이다.

temporal_id_plus1 필드는 NAL unit header에 포함된 nuh_temporal_id_plus1이 나타내는 값과 동일한 값을 가질 수 있다.

curr_tier_num 필드는 temporal_id_plus1과 매핑되는 tier 값을 나타낼 수 있다.

trick_play_speed 필드는 temporal id 값에 따라 최대로 제공 가능한 트릭 플레이 속도를 나타낼 수 있다.

if(max_temporal_id_plus1>1) 조건문은 max_temporal_id_plus1이 1보다 큰 경우를 나타낼 수 있다. 즉, temporal scalability가 사용된 스트림임을 나타낼 수 있고, 이 경우 temporal id를 이용하여 트릭 플레이를 제공할 수 있으므로, 본 발명의 일 실시예는 기존의 PVR_assist_information을 이용하기 위해 temporal id를 tier에 매핑시킬 수 있다.

본 발명의 또 다른 일 실시예는 temporal_id_plus1 필드를 for루프 안에 curr_tier_num 필드 및 trick_play_speed 필드와 동일한 레벨에 위치시키고 각 temporal_id에 따른 tier 넘버와 트릭 플레이를 위한 속도를 시그널링할 수 있다. 본 발명의 일 실시예는 상술한 HEVC_temporal_id_tier_mapping_info를 포함한 디스크립터를 이용하여 look up table을 생성할 수 있고 상술한 look up table을 이용하여 PVR_assist_information의 tier 관련 정보를 temporal_id로 해석하여 사용할 수 있다.

본 발명의 또 다른 일 실시예는 상술한 HEVC_temporal_id_tier_mapping_info에서 for 루프를 삭제하고 temporal_id_plus1 필드가 위치한 레벨에 curr_tier_num 필드 및 trick_play_speed 필드를 위치시킬 수 있다. 본 발명의 일 실시예는 상술한 HEVC_temporal_id_tier_mapping_info를 포함한 디스크립터를 각 픽처마다 시그널링할 수 있다.

본 발명의 일 실시예에 따른 trick_play_speed 필드가 0이면 제공 가능한 트릭 플레이의 배속은 1배속일 수 있고, 1이면 제공 가능한 트릭 플레이의 배속은 2배속일 수 있고, 2이면 제공 가능한 트릭 플레이의 배속은 4배속일 수 있고, 3이면 제공 가능한 트릭 플레이의 배속은 8배속일 수 있고, 4이면 제공 가능한 트릭 플레이의 배속은 16배속일 수 있고, 5이면 제공 가능한 트릭 플레이의 배속은 32배속일 수 있고, 6이면 제공 가능한 트릭 플레이의 배속은 64배속일 수 있다.

본 발명의 일 실시예에 따른 PVR_assist_information은 data_field_tag 필드, data_field_length 필드, PVR_assist_tier_pic_num 필드, PVR_assist_block_trick_mode_present_flag 필드, PVR_assist_pic_struct_present_flag 필드, PVR_assist_tier_next_pic_in_tier_present_flag 필드, PVR_assist_substream_info_present_flag 필드, PVR_assist_extension_present_flag 필드, PVR_assist_segmentation_info_present_flag 필드, PVR_assist_tier_m_cumulative_frames_present_flag 필드, PVR_assist_tier_n_mmco_present_flag 필드, PVR_assist_reserved_0 필드, PVR_assist_seg_id 필드, PVR_assist_prg_id 필드, PVR_assist_seg_start_flag 필드, PVR_assist_seg_end_flag 필드, PVR_assist_prg_start_flag 필드, PVR_assist_prg_stop_flag 필드, PVR_assist_scene_change_flag 필드, PVR_assist_tier_m 필드, PVR_assist_tier_m_cumulative_frames 필드 및/또는 PVR_assist_tier_n_mmco 필드를 포함할 수 있다.

data_field_tag 필드는 해당 데이터 필드가 PVR_assist_information임을 나타낼 수 있다. data_field_tag 필드는 0x03을 가질 수 있다.

data_field_length 필드는 data_field_tag 필드 및 data_field_length 필드를 제외한 PVR_assist_information의 길이를 나타낼 수 있다.

PVR_assist_tier_pic_num 필드는 PVR_assist_information와 관련된 픽처의 티어 넘버를 나타낼 수 있다. 최소 티어 넘버는 0일 수 있고, 최대 티어 넘버는 7일 수 있다. 티어 넘버 0은 앞으로 사용을 위해 남겨둘 수 있다. 본 발명의 일 실시예에 따르면 HEVC인 경우, HEVC RAP 픽처의 티어 넘버는 0일 수 있고 HEVC RAP 픽처가 아닌 다른 모든 픽처의 티어 넘버는 temporal id에 1을 더한 값일 수 있다. 본 발명의 일 실시예에 따르면, 이 필드는 비디오 스트림에 포함되는 픽처의 티어 넘버를 나타낼 수 있고, 티어 넘버 정보라고 명명될 수 있다. 여기서, 티어 넘버는 템포럴 서브 레이어를 시그널링하기 위해 사용될 수 있다. PVR_assist_tier_pic_num는 티어 넘버 정보로 명명될 수 있다.

PVR_assist_block_trick_mode_present_flag 필드는 이전의 RAP 픽처에서 이 필드의 값이 1인 경우에 RAP가 아닌 픽처에서 1 값을 가질 수 있다.

PVR_assist_pic_struct_present_flag 필드는 비디오 스트림이 AVC 또는 HEVC 스트림이고 PVR_assist_pict_struct 필드가 존재하는 경우에 1 값을 가질 수 있다.

PVR_assist_tier_next_pic_in_tier_present_flag 필드는 PVR_assist_tier_next_pic_in_tier 필드가 존재하는 경우에 1 값을 가질 수 있다.

PVR_assist_substream_info_present_flag 필드는 PVR_assist_substream_info 필드가 존재하는 경우에 1 값을 가질 수 있다.

PVR_assist_extension_present_flag 필드는 PVR_assist_segmentation_info_present_flag 필드, PVR_assist_tier_m_cumulative_frames_present_flag 필드, PVR_assist_tier_n_mmco_present_flag 필드 및 PVR_assist_temporal_id_info_present_flag 필드 중 어느 하나의 값이 1인 경우에 1 값을 가질 수 있다.

PVR_assist_segmentation_info_present_flag 필드는 PVR_assist_segmentation_info 필드가 존재하는 경우에 1 값을 가질 수 있다. 이 필드는 세그먼테이션 인포 플래그 정보로 명명될 수 있고, 픽처가 속한 세그먼트에 대한 정보의 존재 여부를 나타낼 수 있다.

PVR_assist_tier_m_cumulative_frames_present_flag 필드는 PVR_assist_tier_m 필드 및 PVR_assist_tier_m_cumulative_frames 필드가 존재하는 경우에 1 값을 가질 수 있다. HEVC인 경우, 이 필드는 0 값을 갖는 것이 권장될 수 있다.

PVR_assist_tier_n_mmco_present_flag 필드는 PVR_assist_tier_n_mmco 필드가 존재하는 경우에 1 값을 가질 수 있다. HEVC인 경우, 이 필드는 0 값을 가질 수 있다.

PVR_assist_seg_id 필드는 픽처가 속해있는 세그먼트의 id를 전달할 수 있다. 이 필드는 세그먼트 식별자 정보로 명명될 수 있고, 픽처가 속한 세그먼트의 id를 나타낼 수 있다.

PVR_assist_prg_id 필드는 픽처가 속해있는 프로그램의 id를 전달할 수 있다. 이 필드는 프로그램 식별자 정보로 명명될 수 있고, 픽처가 속한 프로그램의 id를 나타낼 수 있다.

PVR_assist_seg_start_flag 필드는 하나의 세그먼트 안에서 첫 번째 재생 순서를 갖는 픽처인 경우 1 값을 가질 수 있다. 이 필드는 세그먼트 스타트 플래그 정보로 명명될 수 있고, 각 세그먼트에서 재생 시간 순서가 첫 번째인 픽처를 식별할 수 있다.

PVR_assist_seg_end_flag 필드는 하나의 세그먼트 안에서 마지막 재생 순서를 갖는 픽처인 경우 1 값을 가질 수 있다. 이 필드는 세그먼트 앤드 플래그 정보로 명명될 수 있고, 각 세그먼트에서 재생 시간 순서가 마지막인 픽처를 식별할 수 있다.

PVR_assist_prg_start_flag 필드는 하나의 프로그램 안에서 첫 번째 재생 순서를 갖는 픽처인 경우 1 값을 가질 수 있다. 이 필드는 프로그램 스타트 플래그 정보로 명명될 수 있고, 각 프로그램에서 재생 시간 순서가 첫 번째인 픽처를 식별할 수 있다.

PVR_assist_prg_stop_flag 필드는 하나의 프로그램 안에서 마지막 재생 순서를 갖는 픽처인 경우 1 값을 가질 수 있다. 이 필드는 프로그램 엔드 플래그 정보로 명명될 수 있고, 각 프로그램에서 재생 시간 순서가 마지막인 픽처를 식별할 수 있다.

PVR_assist_scene_change_flag 필드는 새로운 장면의 재생 순서상 첫 번째 픽처인 경우 1 값을 가질 수 있다.

PVR_assist_tier_m 필드는 PVR_assist_tier_m_cumulative_frames 필드와 관련된 티어 넘버를 나타낼 수 있다. HEVC인 경우, 이 필드는 존재하지 않을 수 있다.

PVR_assist_tier_m_cumulative_frames 필드는 PVR_assist_tier_m 필드를 통하여 tier 1로부터 초당 추출 가능한 최소 프레임의 수의 값을 전달할 수 있다.

PVR_assist_tier_n_mmco 필드는 트릭 플레이를 수행하는 동안 디코더에 의해 무시될 수 있는 MMCOs 아래의 최소 티어 넘버를 나타낼 수 있다. HEVC인 경우, 이 필드는 존재하지 않을 수 있다.

본 발명의 일 실시예에 따른 PVR_assist_information는 PVR_assist_tier_next_pic_tier 필드를 더 포함할 수 있다. PVR_assist_tier_next_pic_tier 필드는 PVR_assist_tier_pic_num 필드가 나타내는 값과 동일한 티어 넘버를 갖는 픽처들 중 디코딩 순서상 다음 순서 픽처의 상대적인 위치를 나타낼 수 있고, 티어 넥스트 픽처 정보라고 명명될 수 있다.

본 발명의 일 실시예에 따른 PVR_assist_information는 비디오 데이터의 트릭 플레이를 수행하기 위한 메타데이터를 포함하고, PVR 어시스트 정보라고 명명될 수 있다.

본 발명의 일 실시예는 TS packet의 adaptation 필드에 포함되는 기존 PVR_assist_information에 temporal id를 이용한 트릭 플레이를 포함하는 방법을 제공할 수 있다. 즉, 본 발명의 일 실시예는 temporal id frame work를 제공할 수 있다.

본 발명의 일 실시예는 temporal id 기반의 temporal scalability를 지원하기 위하여 기존의 PVR_assist_tier_pic_num과 함께 PVR_assist_temporal_id_plus1을 시그널링할 수 있다.

본 발명의 일 실시예에 따르면, PVR_assist_information는 PVR_assist_information의 구성을 나타낸 이전 도면에서 전술한 모든 필드, PVR_assist_temporal_id_plus1 필드, PVR_assist_temporal_id_info_present_flag 필드 및/또는 PVR_assist_max_temporal_id_plus1 필드를 포함할 수 있다.

이 도면에서 PVR_assist_information의 구성을 나타낸 이전 도면에서 전술한 필드와 동일한 명칭을 갖는 필드는 이전 도면에서 전술한 의미와 동일한 의미를 가질 수 있다.

PVR_assist_temporal_id_plus1 필드는 현재 프레임의 temporal id 값을 나타내고, 실제적으로 NAL unit header에 포함된 nuh_temporal_id_plus1 값과 동일한 값을 나타낼 수 있다.

PVR_assist_temporal_id_info_present_flag 필드는 temporal id 관련된 정보를 포함하는지 여부를 나타낼 수 있다. 이 필드는 PVR_assist_max_temporal_id_plus1 필드가 존재하면 1 값을 나타낼 수 있다. 이 플드는 RAP 픽처마다 제공될 수 있다.

PVR_assist_max_temporal_id_plus1 필드는 최대 temporal id 값을 나타내고 실제적으로, temporal id 최대값에 1을 더한 값을 나타낼 수 있다. 이 필드는 0 내지 6 중 어느 하나의 값을 가질 수 있다. 이 필드는 트릭 플레이의 속도에 대한 정보를 제공하는데 사용될 수 있다.

본 발명의 일 실시예에 따르면, 트릭 플레이의 배속수는 PVR_assist_max_temporal_id_plus1 필드와 PVR_assist_temporal_id_plus1 필드의 값을 이용하여 계산될 수 있다.

본 발명의 일 실시예는 PVR_assist_tier_pic_num 필드를 그대로 사용하고 PVR_assist_tier_pic_num 필드에 PVR_assist_temporal_id_plus1의 의미를 담을 수 있다. 또한, PVR_assist_tier_pic_num_to_temporal_id_flag 필드를 이용하여 tier의 의미가 변경되었음을 알려줄 수 있다.

본 발명의 일 실시예에 따르면, PVR_assist_information는 PVR_assist_information의 구성을 나타낸 이전 도면에서 전술한 모든 필드, PVR_assist_tier_pic_num_to_temporal_id_flag 필드, PVR_assist_temporal_id_info_present_flag 필드 및/또는 PVR_assist_max_temporal_id_plus1 필드를 포함할 수 있다.

이 도면에서 PVR_assist_information의 구성을 나타낸 이전 도면에서 전술한 필드와 동일한 명칭을 갖는 필드는 이전 도면에서 전술한 의미와 동일한 의미를 가질 수 있다. 다만, PVR_assist_tier_pic_num 필드는 본 발명의 일 실시예에 따라 temporal id frame work에 그대로 이용될 수 있다. 즉, PVR_assist_tier_pic_num 필드는 현재 프레임의 temporal id 값을 나타내고, 실제적으로 NAL unit header에 포함된 nuh_temporal_id_plus1 값과 동일한 값을 가질 수 있다.

PVR_assist_tier_pic_num_to_temporal_id_flag 필드는 PVR_assist_tier_pic_num 필드를 temporal id를 나타내는 필드로 사용했다면 1 값을 가질 수 있다.

PVR_assist_temporal_id_info_present_flag 필드는 temporal id 관련된 정보를 포함하는지 여부를 나타낼 수 있다.

PVR_assist_max_temporal_id_plus1 필드는 최대 temporal id 값을 나타내고 실제적으로, temporal id 최대값에 1을 더한 값을 나타낼 수 있다.

본 발명의 일 실시예에 따르면, 트릭 플레이의 배속수는 PVR_assist_max_temporal_id_plus1 필드와 PVR_assist_temporal_id_plus1 필드의 의미를 갖는 PVR_assist_tier_pic_num 필드 값을 이용하여 계산될 수 있다.

본 발명의 또 다른 일 실시예는 PVR_assist_framework라는 2비트 이상의 필드를 PVR_assist_information에 추가하여 PVR을 제공하는 framework의 종류를 구분할 수 있다. 본 발명의 일 실시예는 기존의 tier, substream framework 및 temporal id framework를 구분할 수 있다. 이 경우, 기존에 PVR_assist_information에 포함된 플래그 값들은 사용되지 않을 수 있고 본 발명의 일 실시예는 각 framework에 해당하는 태그 값을 대신하여 조건문을 구성할 수 있다.

본 발명의 일 실시예에 따른 PVR_assist_information는 data_field_tag 필드, data_field_length 필드, PVR_assist_temporal_id_plus1 필드, PVR_assist_substream_info_present_flag 필드, PVR_assist_extension_present_flag 필드, PVR_assist_temporal_id_present_flag 필드, PVR_assist_temporal_sub_layer_dependency_flag 필드, PVR_assist_max_temporal_id_plus1 필드, PVR_assist_curr_tier_num 필드 및/또는 PVR_assist_trick_play_speed 필드를 포함할 수 있다.

PVR_assist_extension_present_flag 필드는 PVR_assist_segmentation_info_present_flag 필드, PVR_assist_tier_m_cumulative_frames_present_flag 필드 및 PVR_assist_tier_n_mmco_present_flag 필드 중 어느 하나의 값이 1인 경우에 1 값을 가질 수 있다.

PVR_assist_temporal_sub_layer_dependency_flag 필드는 temporal sub-layer 간에 dependency 여부를 나타낼 수 있다. 즉, temporal_sub_layer_dependency_flag 필드는 하위 temporal sub-layer 픽처가 상위 temporal sub-layer 픽처를 참조하지 않는 경우 1을 갖는다.

PVR_assist_curr_tier_num 필드는 temporal_id_plus1에 해당하는 tier 값을 나타낼 수 있다.

if(PVR_assist_max_temporal_id_plus1>1) 조건문은 PVR_assist_max_temporal_id_plus1이 1보다 큰 경우를 나타낼 수 있다. 즉, temporal scalability가 사용된 스트림임을 나타낼 수 있고, 이 경우 temporal id를 이용하여 트릭 플레이를 제공할 수 있다.

본 발명의 또 다른 일 실시예는 PVR_assist_temporal_id_plus1 필드를 for루프 안에 PVR_assist_curr_tier_num 필드 및 PVR_assist_trick_play_speed 필드와 동일한 레벨에 위치시키고 각 temporal_id에 따른 tier 넘버와 트릭 플레이를 위한 속도를 시그널링할 수 있다.

본 발명의 또 다른 일 실시예는 기존의 PVR_assist_tier_pic_num 필드를 그대로 두고 상술한 필드 값을 PVR_assist_temporal_id_plus1 필드 값을 나타내도록 변경하여 사용할 수 있다. 이 경우, PVR_assist_tier_pic_num_to_temporal_id_flag 필드를 이용하여 PVR_assist_tier_pic_num 필드의 의미가 변경되었다는 것을 시그널링할 필요가 있다.

본 발명의 또 다른 일 실시예는 tier 없이 temporal id만을 이용하여 트릭 플레이를 제공할 수 있다. 즉, NAL_unit_header의 nuh_temporal_id_plus1 정보를 파싱하여 실제 트릭 플레이를 위해 필요한 패킷만 선택함으로써 트릭 플레이가 제공될 수 있다. (시나리오 C) 예를 들어, temporal id가 0부터 3까지 구성된 스트림을 2배속으로 플레이하고자 할 경우, 본 발명의 일 실시예는 nuh_temporal_id_plus1 값이 1, 2 또는 3인 TS packet만을 system decoder로 전달함으로써 2배속 트릭 플레이를 제공할 수 있다.

본 발명의 일 실시예에 따른 수신 장치는 수신부 (Tuner; 38010), 복조부 (Demodulator; 38020), 트릭 플레이 수행부 (Trick play; 38030), 시스템 디코더/ 역다중화부 (System decoder and Demux; 38040) 및/또는 비디오 디코더 (Video decoder; 38050)를 포함할 수 있다.

수신부 (Tuner; 38010)는 방송망, 케이블망 및/또는 인터넷망을 통하여 전송되는 방송 신호를 수신할 수 있다. 수신부는 TS (Transport Stream)를 수신할 수 있다. 여기서, TS는 트릭 플레이 수행을 위한 PVR 어시스트 정보를 포함할 수 있고, PVR 어시스트 정보는 티어 넘버 정보 및/또는 최대 템포럴 식별 정보를 포함할 수 있다. 상술한 티어 넘버 정보는 RAP가 아닌 픽처의 템포럴 식별 정보 값에 1을 더한 값을 가지는 티어 넘버를 나타낼 수 있고, 상술한 최대 템포럴 식별 정보는 인코딩된 비디오 데이터를 포함하는 비디오 스트림의 최대 템포럴 식별 정보 값을 나타낼 수 있다.

복조부 (Demodulator; 38020)는 변조 기법에 따라 변조된 방송 신호를 복조할 수 있다.

트릭 플레이 수행부 (Trick play; 38030)는 각 시나리오에 따른 방법에 의하여 트릭 플레이를 위한 TS packet을 선별할 수 있다. 본 발명의 일 실시예에 따른, 시나리오 1, 2 및 3에 대한 상세한 설명은 전술하였다.

시스템 디코더/ 역다중화부 (System decoder and Demux; 38040)는 시스템 정보를 디코딩할 수 있고 다중화된 방송 신호를 단위 스트림 별로 분리할 수 있다. 역다중화부는 수신한 방송 신호를 역다중화하여 비디오 스트림을 추출할 수 있다. 본 발명의 일 실시예에 따른 역다중화부는 본 발명의 일 실시예에 따른 제 1 추출부 및/또는 제 2 추출부를 포함할 수 있다. 제 1 추출부는 수신한 TS에서 PES (Packetized Elementary Stream)을 추출할 수 있다. 제 2 추출부는 추출된 PES에서 비디오 단위 스트림을 추출할 수 있다.

비디오 디코더 (Video decoder; 38050)는 비디오 스트림을 디코딩할 수 있다. 비디오 디코더는 시스템 디코더 및 트릭 플레이 수행부를 포함할 수 있고, 비디오 디코더는 PVR 어시스트 정보를 기초로 하여 트릭 플레이를 위해 선별된 비디오 스트림을 디코딩함으로써 비디오 데이터의 트릭 플레이를 수행할 수 있다. 비디오 디코더는 PVR 어시스트 정보에 포함된 템포럴 식별 정보 및 최대 템포럴 식별 정보를 기초로 하여 트릭 플레이를 수행할 수 있다.

본 발명의 일 실시예에 따른 비디오 스트림은 비디오 단위 스트림을 나타낼 수 있다.

본 발명의 일 실시예에 따른 HEVC temporal sub-layer의 계층 구조는 tier system framework와 유사하다. 본 발명의 일 실시예에 따른 temporal id는 tier 넘버에 매칭될 수 있다. 본 발명의 일 실시예에 따른 HEVC temporal sub-layer는 tier system framework와 비슷한 방법에 의하여 PVR을 지원할 수 있다.

본 발명의 일 실시예에 따른 HEVC compliant 인코더/디코더는 HEVC temporal sub-layer를 지원할 수 있다. 본 발명의 일 실시예에 따른 temporal id는 HEVC로 인코딩된 스트림에 존재할 수 있다. 스트림이 temporal sub-layer 구조에 의하여 인코딩된 경우, 트릭 플레이를 위한 어떠한 특별한 인코딩 구조도 필요하지 않을 수 있다. 따라서, 본 발명의 일 실시예에 따른 HEVC temporal sub-layer는 트릭 플레이를 지원하는 경우에 인코딩 부담을 줄일 수 있다.

이 도면에 도시된 바와 같이, tier framework에서 tier 7은 참조되지 않는 discardable 픽처를 의미했고, tier 6는 참조되는 discardable 픽처를 의미했다. 하지만, 본 발명의 일 실시예에 따른 HEVC temporal sub-layer는 참조되는 픽처인지 아닌지를 구분하지 않을 수 있다. tier framework에서 tier 1은 RAP 픽처를 나타내고, tier 2는 P 픽처를 나타냈다. 하지만, 본 발명의 일 실시예에 따른 HEVC temporal sub-layer에서 temporal id 0은 IRAP 픽처를 포함하는 I 픽처, P 픽처 및 B 픽처를 모두 나타낼 수 있다.

본 발명의 일 실시예에 따르면 다른 서브 레이어들이 temporal id 6와 7에 지정될 수 있다. 따라서, tier 넘버 6 및 7과 비교해보면, 본 발명의 일 실시예에 따라 temporal id를 이용하는 경우 추가적인 배속을 지원할 수 있다.

본 발명의 일 실시예에 따르면 더 빠른 배속을 지원하기 위하여 temporal id가 0인 베이스 서브 레이어에서 프레임 구분이 필요할 수 있다.

본 발명의 일 실시예에 따르면, 디코딩 과정 전에 억세스 유닛 (access units; AUs)을 필터링하기 위하여 비디오 레벨에 주어진 temporal id는 시스템 레벨에서 시그널링될 수 있다.

본 발명의 일 실시예에 따르면, temporal id가 0인 베이스 서브 레이어에서 보다 높은 배속을 지원하기 위하여 intra 프레임이 시그널링될 수 있다.

본 발명의 일 실시예에 따른 PVR_assist_information는 data_field_tag 필드, data_field_length 필드, PVR_assist_temporal_id_plus1 필드, PVR_assist_temporal_id_info_present_flag 필드, PVR_assist_intra_picture_flag 필드, PVR_assist_max_temporal_id_plus1 필드, PVR_assist_PB_numbers_in_temporalid_zero 필드, PVR_assist_reserved_0 필드 및/또는 PVR_assist_reserved_byte 필드를 포함할 수 있다.

PVR_assist_temporal_id_plus1 필드는 픽처의 temporal id를 나타낼 수 있다. 실제적으로, temporal id는 이 필드에서 1을 뺀 값을 가질 수 있다. 이 필드의 최소 값은 1이고, 최대 값은 7을 가질 수 있다. HEVC 스트림의 경우, 이 필드의 값은 nuh_temporal_id_plus1 값과 동일한 값을 가질 수 있다.

PVR_assist_temporal_id_info_present_flag 필드는 PVR_assist_max_temporal_id_plus1 필드가 존재하면 1 값을 가질 수 있다. 이 필드는 RAP 픽처에 해당하는 픽처에서만 제공될 수 있다.

PVR_assist_intra_picture_flag 필드는 현재 억세스 유닛이 intra 픽처이면 1 값을 가질 수 있다.

PVR_assist_max_temporal_id_plus1 필드는 최대 temporal id를 나타낼 수 있다. 실제적으로, 최대 temporal id는 이 필드에서 1을 뺀 값을 나타낼 수 있다. 이 필드는 1에서 7까지의 값을 가질 수 있다.

PVR_assist_PB_numbers_in_temporalId_zero 필드는 temporal id가 0인 베이스 서브 레이어에서 intra 프레임들 사이에 존재하는 intra 프레임이 아닌 프레임의 개수를 나타낼 수 있다. 이 필드는 트릭 플레이의 속도를 추측하는데 사용될 수 있다.

PVR_assist_reserved_0 필드는 추후 사용을 위해 남겨진 필드이다.

PVR_assist_reserved_byte 필드는 추후 사용을 위해 남겨진 필드를 나타낼 수 있다.

이 도면에서 첫 번째 그림 (41010)은 하나의 GOP에 해당하는 픽처들을 재생 순서에 따라 정렬해 놓은 그림이다. 첫 번째 그림에서 I는 I 픽처를 나타낼 수 있고, B는 B 픽처를 나타낼 수 있고 P는 P 픽처를 나타낼 수 있다. 또한, 픽처의 종류를 나타내는 알파벳 밑의 숫자는 재생 순서를 나타낼 수 있다. 첫 번째 그림에서 화살표는 픽처들간에 참조 관계를 나타낼 수 있다.

이 도면에서 두 번째 그림 (41020)은 본 발명의 일 실시예에 따른 HEVC temporal sub-layer를 이용하여 트릭 플레이를 제공하는 방법을 나타낸 그림이다. 네모 박스 하나는 하나의 픽처를 나타낼 수 있다. 네모 안의 숫자는 temporal id를 나타낼 수 있다. 네모 안의 x표시는 트릭 플레이 시 디코딩 및 재생되는 픽처를 나타낼 수 있다. 두 번째 그림에 도시된 바와 같이 2 배속부터 8 배속 트릭 플레이까지는 HEVC temporal sub-layer에 의하여 제공될 수 있다.

이 도면에서 세 번째 그림 (41030)은 본 발명의 일 실시예에 따른 base sub-layer 시그널링을 이용하여 트릭 플레이를 제공하는 방법을 나타낸 그림이다. 본 발명의 일 실시예는 intra 픽처만을 디코딩 및 재생함으로써 12 배속, 24 배속 및 48 배속의 트릭 플레이를 제공할 수 있다.

본 발명의 일 실시예는 다음과 같은 과정에 의하여 방송 신호를 송신할 수 있다. 먼저, 본 발명의 일 실시예는 비디오 데이터를 인코딩하여 비디오 단위 스트림을 생성할 수 있다. (S42010) 여기서, 비디오 단위 스트림은 AVC 또는 HEVC 코덱에 의하여 인코딩될 수 있다. 다음으로, 본 발명의 일 실시예는 비디오 단위 스트림을 포함하는 PES (Packetized Elementary Stream)을 생성할 수 있다. (S42020) 다음으로, 본 발명의 일 실시예는 PES를 포함한 TS (Transport Stream)를 생성할 수 있다. (S42030) 여기서, TS는 MPEG-2 TS를 나타낼 수 있다. 본 발명의 일 실시예에 따른 TS는 트릭 플레이 수행을 위한 PVR 어시스트 정보를 포함할 수 있다. PVR 어시스트 정보는 수신기 또는 PVR 장치에서 비디오 데이터의 트릭 플레이를 수행하는데 필요한 정보를 의미할 수 있다. PVR 어시스트 정보에 대한 상세한 설명은 도 34에서 전술하였다. 본 발명의 일 실시예에 따른 PVR 어시스트 정보는 티어 넘버 정보 및/또는 최대 템포럴 식별 정보를 포함할 수 있다. 티어 넘버 정보는 RAP가 아닌 픽처의 템포럴 식별 정보 값에 1을 더한 값을 가지는 티어 넘버를 나타낼 수 있고, 최대 템포럴 식별 정보는 인코딩된 비디오 데이터를 포함하는 비디오 스트림의 최대 템포럴 식별 정보 값을 나타낼 수 있다. 본 발명의 일 실시예에 따른 최대 템포럴 식별 정보는 max_temporal_id 또는 PVR_assist_max_temporal_id로 명명될 수 있다. 최대 템포럴 식별 정보에 대한 상세한 설명은 도 32, 35, 36, 37, 40에서 전술하였다. 티어 넘버는 템포럴 서브 레이어를 시그널링하기 위해 사용될 수 있다. 티어 넘버는 픽처간에 dependency를 나타낼 수 있다. HEVC인 경우, 티어 넘버는 템포럴 식별 정보와 비슷하게 템포럴 서브 레이어를 시그널링하는데 사용될 수 있다. 티어 넘버 정보는 PVR_assist_tier_pic_num으로 명명될 수 있다. 상술한 티어 넘버 정보에 대한 상세한 설명은 도 34, 35, 36, 39, 40에서 전술하였다. 다음으로, 본 발명의 일 실시예는 생성된 TS를 전송할 수 있다. (S42040) 여기서, 본 발명의 일 실시예는 생성된 방송 신호를 지상파 방송망, 케이블망 및 인터넷망 중 적어도 어느 하나를 통하여 전송할 수 있다. 본 발명의 또 다른 일 실시예에 따르면, 비디오 단위 스트림은 하나 이상의 템포럴 서브 레이어를 포함할 수 있고, 여기서 템포럴 서브 레이어는 픽처들의 집합을 나타낼 수 있다. 본 발명의 일 실시예에 따른 인코딩된 비디오 데이터를 포함하는 NAL 유닛의 헤더는 템포럴 식별 플러스 정보를 포함할 수 있다. 여기서 템포럴 식별 플러스 정보는 템포럴 식별 정보에 1을 더한 값을 나타낼 수 있고, 템포럴 식별 정보는 템포럴 서브 레이어를 식별하는 정보를 포함할 수 있다. 본 발명의 일 실시예에 따른 템포럴 식별 플러스 정보는 템포럴 서브 레이어를 식별하기 위해 사용될 수 있다. 템포럴 서브 레이어는 temporal sub-layer로, 템포럴 식별 정보는 temporal id로, 템포럴 식별 플러스 정보는 nuh_temporal_id_plus1으로 명명될 수 있다. 본 발명의 일 실시예에 따르면, PVR 어시스트 정보는 비디오 단위 스트림의 최대 템포럴 식별 정보 값을 나타내는 최대 템포럴 식별 정보를 포함할 수 있다. HEVC로 인코딩된 비디오 스트림은 여러 개의 템포럴 서브 레이어를 가질 수 있고 각 템포럴 서브 레이어는 템포럴 식별 정보에 의해 식별될 수 있다. 본 발명의 일 실시예에 따른 최대 템포럴 식별 정보는 여러 개의 템포럴 서브 레이어 중에 최대 템포럴 식별 정보를 갖는 템포럴 서브 레이어의 템포럴 식별 정보를 의미할 수 있다. 본 발명의 일 실시예에 따르면, PVR 어시스트 정보는 최대 템포럴 식별 정보의 포함 여부를 나타내는 템포럴 식별 플래그 정보를 포함할 수 있고 여기서, 템포럴 식별 플래그 정보는 RAP 마다 제공될 수 있다. 템포럴 식별 플래그 정보는 PVR_assist_temporal_id_info_present_flag로 명명될 수 있다. 템포럴 식별 플래그 정보는 PVR 어시스트 정보 내에 최대 템포럴 식별 정보가 포함되어 있으면 1 값을 가질 수 있다. AVC 스트림인 경우, 템포럴 식별 플래그 정보는 0 값을 가질 수 있다. 본 발명의 일 실시예는 템포럴 식별 플래그 정보를 RAP 마다 제공함으로써 최대 템포럴 식별 정보를 RAP 마다 시그널링할 수 있다. 이에 따라, 본 발명의 일 실시예는 트릭 플레이의 최대 배속 정보를 RAP 마다 시그널링할 수 있다. 이에 대한 상세한 설명은 도 35, 40에서 전술하였다.

본 발명의 또 다른 일 실시예에 따르면, 상술한 티어 넘버 정보가 나타내는 티어 넘버는 RAP 픽처에서는 0 값을 가질 수 있다. 본 발명의 일 실시예에 따른 티어 넘버는 비디오 스트림을 구성하는 각 픽처마다 정해질 수 있다. 본 발명의 일 실시예에 따르면, RAP 픽처에서 티어 넘버는 0을 가질 수 있다. 본 발명의 일 실시예에 따른 RAP 픽처는 HEVC DVB_RAP 픽처를 의미할 수 있다.

본 발명의 또 다른 일 실시예에 따르면, 최대 템포럴 식별 정보는 트릭 플레이의 속도에 대한 정보를 제공하는데 사용될 수 있다. 최대 템포럴 식별 정보는 트릭 플레이의 최대 배속에 대한 정보를 시그널링할 수 있다. 본 발명의 일 실시예는 각 템포럴 식별 정보에 해당하는 트릭 플레이 배속을 시그널링할 수 있다. 최대 템포럴 식별 정보를 시그널링함으로써, 본 발명의 일 실시예는 사용자에게 서비스가 가능한 최대 배속 정보를 알려줄 수 있으며 사용자의 요청을 받아 트릭 플레이의 배속을 결정하여 결정된 배속을 제공할 수 있다. 본 발명의 일 실시예에 따르면, 최대 템포럴 식별 정보는 0 내지 6 중 어느 하나의 값을 가질 수 있다. 따라서, 본 발명의 또 다른 일 실시예에 따라 템포럴 식별 정보 값이 tier 넘버와 일대일 매칭되는 경우 기존에 정의되어 있던 tier 넘버의 범위 내에서 매칭될 수 있다. 기존에 tier 넘버는 0부터 7까지 정의되어 있다. 이에 대한 상세한 설명은 도 35, 40에서 전술하였다.

본 발명의 또 다른 일 실시예에 따르면, 상술한 PVR 어시스트 정보는 TS의 어댑테이션 필드에 포함될 수 있다. 여기서, 어댑테이션 필드는 TS 패킷의 헤더와 페이로드 사이에 존재하는 필드로서 데이터를 포함할 수 있다. 본 발명의 일 실시예에 따르면, 어댑테이션 필드는 프라이빗 데이터 바이트 필드를 포함할 수 있고, 프라이빗 데이터 바이트 필드는 PVR 어시스트 정보를 포함할 수 있다. 여기서, 프라이빗 데이터 바이트 필드는 어댑테이션 필드에 포함되고, 수 개의 데이터 필드를 포함할 수 있다. 상술한 수 개의 데이터 필드 중 하나의 데이터 필드는 PVR 어시스트 정보를 포함할 수 있다.

본 발명의 또 다른 일 실시예에 따르면, 상술한 PVR 어시스트 정보는 픽처가 속한 세그먼트에 대한 정보의 존재 여부를 나타내는 세그먼테이션 인포 플래그 정보를 포함할 수 있다. 이에 대한 상세한 설명은 도 34에 대한 설명 부분에서 전술하였다.

본 발명의 또 다른 일 실시예에 따르면, 상술한 PVR 어시스트 정보는 픽처가 속한 세그먼트의 id를 나타내는 세그먼트 식별자 정보를 포함할 수 있다. 이에 대한 상세한 설명은 도 34에 대한 설명 부분에서 전술하였다.

본 발명의 또 다른 일 실시예에 따르면, 상술한 PVR 어시스트 정보는 픽처가 속한 프로그램의 id를 나타내는 프로그램 식별자 정보를 포함할 수 있다. 이에 대한 상세한 설명은 도 34에 대한 설명 부분에서 전술하였다.

본 발명의 또 다른 일 실시예에 따르면, 상술항 PVR 어시스트 정보는 각 세그먼트에서 재생 시간 순서가 첫 번째인 픽처를 식별하는 세그먼트 스타트 플래그 정보 및 각 세그먼트에서 재생 시간 순서가 마지막인 픽처를 식별하는 세그먼트 엔드 플래그 정보 중 적어도 어느 하나를 포함할 수 있다. 이에 대한 상세한 설명은 도 34에 대한 설명 부분에서 전술하였다.

본 발명의 또 다른 일 실시예에 따르면, 상술한 PVR 어시스트 정보는 각 프로그램에서 재생 시간 순서가 첫 번째인 픽처를 식별하는 프로그램 스타트 플래그 정보 및 각 프로그램에서 재생 시간 순서가 마지막인 픽처를 식별하는 프로그램 엔드 플래그 정보 중 적어도 어느 하나를 포함할 수 있다. 이에 대한 상세한 설명은 도 34에 대한 설명 부분에서 전술하였다.

본 발명의 일 실시예에 따른 방송 신호 수신 장치 (43010)는 수신부 (43020), 제 1 추출부 (43030), 제 2 추출부 (43040) 및/또는 디코더 (43050)을 포함할 수 있다.

수신부는 TS (Transport Stream)를 수신할 수 있다. 여기서, TS는 트릭 플레이 수행을 위한 PVR 어시스트 정보를 포함할 수 있고, PVR 어시스트 정보는 티어 넘버 정보 및/또는 최대 템포럴 식별 정보를 포함할 수 있다. 상술한 티어 넘버 정보는 RAP가 아닌 픽처의 템포럴 식별 정보 값에 1을 더한 값을 가지는 티어 넘버를 나타낼 수 있고, 상술한 최대 템포럴 식별 정보는 인코딩된 비디오 데이터를 포함하는 비디오 스트림의 최대 템포럴 식별 정보 값을 나타낼 수 있다. 이에 대한 상세한 설명은 도 42의 설명 부분에서 전술하였다.

제 1 추출부는 수신한 TS에서 PES (Packetized Elementary Stream)을 추출할 수 있다.

제 2 추출부는 추출된 PES에서 비디오 단위 스트림을 추출할 수 있다.

디코더는 추출된 비디오 단위 스트림을 디코딩할 수 있다.

이 도면에 도시된, 본 발명의 일 실시예에 따른 방송 신호 수신 장치의 구성 중 도 38에 도시된 방송 신호 수신 장치의 구성과 동일한 명칭을 가진 구성은 도 38에 도시된 방송 신호 수신 장치의 구성과 동일한 기능을 수행할 수 있다.

이 도면에 도시된, 본 발명의 일 실시예에 따른 방송 신호 수신 장치의 구성 중 도 42에 도시된 방송 신호 송신 방법의 과정과 대응되는 구성은 도 42에 도시된 방송 신호 송신 방법의 과정과 대응되는 기능을 수행할 수 있다.

설명의 편의를 위하여 각 도면을 나누어 설명하였으나, 각 도면에 서술되어 있는 실시 예들을 병합하여 새로운 실시 예를 구현하도록 설계하는 것도 가능하다. 그리고, 당업자의 필요에 따라, 이전에 설명된 실시 예들을 실행하기 위한 프로그램이 기록되어 있는 컴퓨터에서 판독 가능한 기록 매체를 설계하는 것도 본 발명의 권리범위에 속한다.

본 발명에 따른 장치 및 방법은 상술한 바와 같이 설명된 실시 예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상술한 실시 예들은 다양한 변형이 이루어질 수 있도록 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

한편, 본 발명의 영상 처리 방법은 네트워크 디바이스에 구비된 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

또한, 이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해돼서는 안 될 것이다.

그리고, 당해 명세서에서는 물건 발명과 방법 발명이 모두 설명되고 있으며, 필요에 따라 양 발명의 설명은 보충적으로 적용될 수가 있다.

발명의 실시를 위한 형태는 전술한 바와 같이, 발명의 실시를 위한 최선의 형태로 상술되었다.

본 발명은 방송 산업 전반에서 이용 가능하다.

Claims

비디오 데이터를 인코딩하여 비디오 단위 스트림을 생성하는 단계;

상기 비디오 단위 스트림을 포함하는 PES (Packetized Elementary Stream)를 생성하는 단계;

상기 생성된 PES를 포함하는 TS (Transport Stream)를 생성하는 단계,

여기서, 상기 TS는 트릭 플레이 수행을 위한 PVR 어시스트 정보를 포함하고,

여기서, 상기 PVR 어시스트 정보는 티어 넘버 정보 및 최대 템포럴 식별 정보를 포함하고,

여기서, 상기 티어 넘버 정보는 RAP가 아닌 픽처의 템포럴 식별 정보 값에 1을 더한 값을 가지는 티어 넘버를 나타내고, 상기 최대 템포럴 식별 정보는 상기 인코딩된 비디오 데이터를 포함하는 비디오 단위 스트림의 최대 템포럴 식별 정보 값을 나타내고;

상기 생성된 TS를 전송하는 단계;

를 포함하는 방송 신호 송신 방법.
제 1 항에 있어서,

상기 티어 넘버 정보가 나타내는 티어 넘버는 RAP 픽처에서는 0 값을 갖는 방송 신호 송신 방법.
제 1 항에 있어서,

상기 최대 템포럴 식별 정보는 트릭 플레이의 속도에 대한 정보를 제공하는데 사용되는 방송 신호 송신 방법.
제 1 항에 있어서,

상기 PVR 어시스트 정보는 상기 TS의 어댑테이션 필드에 포함되는 방송 신호 송신 방법.
제 1 항에 있어서,

상기 PVR 어시스트 정보는 픽처가 속한 세그먼트에 대한 정보의 존재 여부를 나타내는 세그먼테이션 인포 플래그 정보를 포함하는 방송 신호 송신 방법.
제 5 항에 있어서,

상기 PVR 어시스트 정보는 픽처가 속한 세그먼트의 id를 나타내는 세그먼트 식별자 정보를 포함하는 방송 신호 송신 방법.
제 5 항에 있어서,

상기 PVR 어시스트 정보는 픽처가 속한 프로그램의 id를 나타내는 프로그램 식별자 정보를 포함하는 방송 신호 송신 방법.
제 5 항에 있어서,

상기 PVR 어시스트 정보는 각 세그먼트에서 재생 시간 순서가 첫 번째인 픽처를 식별하는 세그먼트 스타트 플래그 정보 및 각 세그먼트에서 재생 시간 순서가 마지막인 픽처를 식별하는 세그먼트 엔드 플래그 정보 중 적어도 어느 하나를 포함하는 방송 신호 송신 방법.
제 5 항에 있어서,

상기 PVR 어시스트 정보는 각 프로그램에서 재생 시간 순서가 첫 번째인 픽처를 식별하는 프로그램 스타트 플래그 정보 및 각 프로그램에서 재생 시간 순서가 마지막인 픽처를 식별하는 프로그램 엔드 플래그 정보 중 적어도 어느 하나를 포함하는 방송 신호 송신 방법.
TS (Transport Stream)을 수신하는 수신부,

여기서, 상기 TS는 트릭 플레이 수행을 위한 PVR 어시스트 정보를 포함하고,

여기서, 상기 PVR 어시스트 정보는 티어 넘버 정보 및 최대 템포럴 식별 정보를 포함하고,

여기서, 상기 티어 넘버 정보는 RAP가 아닌 픽처의 템포럴 식별 정보 값에 1을 더한 값을 가지는 티어 넘버를 나타내고, 상기 최대 템포럴 식별 정보는 상기 인코딩된 비디오 데이터를 포함하는 비디오 단위 스트림의 최대 템포럴 식별 정보 값을 나타내고;

상기 수신한 TS에서 PES (Packetized Elementary Stream)을 추출하는 제 1 추출부;

상기 추출된 PES에서 비디오 단위 스트림을 추출하는 제 2 추출부;

상기 추출된 비디오 단위 스트림을 디코딩하는 디코더;

를 포함하는 방송 신호 수신 장치.
제 10 항에 있어서,

상기 티어 넘버 정보가 나타내는 티어 넘버는 RAP 픽처에서는 0 값을 갖는 방송 신호 수신 장치.
제 10 항에 있어서,

상기 최대 템포럴 식별 정보는 트릭 플레이의 속도에 대한 정보를 제공하는데 사용되는 방송 신호 수신 장치.
제 10 항에 있어서,

상기 PVR 어시스트 정보는 상기 TS의 어댑테이션 필드에 포함되는 방송 신호 수신 장치.
제 10 항에 있어서,

상기 PVR 어시스트 정보는 픽처가 속한 세그먼트에 대한 정보의 존재 여부를 나타내는 세그먼테이션 인포 플래그 정보를 포함하는 방송 신호 수신 장치.
제 14 항에 있어서,

상기 PVR 어시스트 정보는 픽처가 속한 세그먼트의 id를 나타내는 세그먼트 식별자 정보를 포함하는 방송 신호 수신 장치.
제 14 항에 있어서,

상기 PVR 어시스트 정보는 픽처가 속한 프로그램의 id를 나타내는 프로그램 식별자 정보를 포함하는 방송 신호 수신 장치.
제 14 항에 있어서,

상기 PVR 어시스트 정보는 각 세그먼트에서 재생 시간 순서가 첫 번째인 픽처를 식별하는 세그먼트 스타트 플래그 정보 및 각 세그먼트에서 재생 시간 순서가 마지막인 픽처를 식별하는 세그먼트 엔드 플래그 정보 중 적어도 어느 하나를 포함하는 방송 신호 수신 장치.
제 14 항에 있어서,

상기 PVR 어시스트 정보는 각 프로그램에서 재생 시간 순서가 첫 번째인 픽처를 식별하는 프로그램 스타트 플래그 정보 및 각 프로그램에서 재생 시간 순서가 마지막인 픽처를 식별하는 프로그램 엔드 플래그 정보 중 적어도 어느 하나를 포함하는 방송 신호 수신 장치.