KR20170142993A - 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법 - Google Patents

방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법 Download PDF

Info

Publication number
KR20170142993A
KR20170142993A KR1020177035184A KR20177035184A KR20170142993A KR 20170142993 A KR20170142993 A KR 20170142993A KR 1020177035184 A KR1020177035184 A KR 1020177035184A KR 20177035184 A KR20177035184 A KR 20177035184A KR 20170142993 A KR20170142993 A KR 20170142993A
Authority
KR
South Korea
Prior art keywords
information
service
component
caption
signaling
Prior art date
Application number
KR1020177035184A
Other languages
English (en)
Other versions
KR102014800B1 (ko
Inventor
오세진
서종열
황수진
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20170142993A publication Critical patent/KR20170142993A/ko
Application granted granted Critical
Publication of KR102014800B1 publication Critical patent/KR102014800B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23614Multiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2362Generation or processing of Service Information [SI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • H04N21/4112Peripherals receiving signals from specially adapted client devices having fewer capabilities than the client, e.g. thin client having less processing power or no tuning capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Library & Information Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 발명의 일 실시예에 따른 방송 신호 전송 방법은 방송 서비스의 서비스 데이터를 생성하는 단계, 상기 서비스 데이터는 상기 방송 서비스에 포함되는 서비스 컴포넌트를 포함함, 상기 방송 서비스를 시그널링하는 서비스 시그널링 정보를 생성하는 단계 및 상기 서비스 데이터 및 상기 서비스 시그널링 정보를 포함하는 방송 신호를 전송하는 단계를 포함할 수 있다.

Description

방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법
본 발명은 방송 신호 송신 장치, 방송 신호 수신 장치, 및 방송 신호 송수신 방법에 관한 것이다.
아날로그 방송 신호 송신이 종료됨에 따라, 디지털 방송 신호를 송수신하기 위한 다양한 기술이 개발되고 있다. 디지털 방송 신호는 아날로그 방송 신호에 비해 더 많은 양의 비디오/오디오 데이터를 포함할 수 있고, 비디오/오디오 데이터뿐만 아니라 다양한 종류의 부가 데이터를 더 포함할 수 있다.
디지털 방송 시스템은 UHD(Ultra High Definition) 이미지, 멀티채널(multi channel, 다채널) 오디오, 및 다양한 부가 서비스를 제공할 수 있다. 그러나, 디지털 방송을 위해서는, 많은 양의 데이터 전송에 대한 데이터 전송 효율, 송수신 네트워크의 견고성(robustness), 및 모바일 수신 장치를 고려한 네트워크 유연성(flexibility)이 향상되어야 한다.
본 발명의 목적에 따라, 여기에 포함되고 대략적으로 기재된 바와 같이, 본 발명은 지상파 방송망과 인터넷 망을 사용하는 차세대 하이브리드 방송을 지원하는 환경에서 차세대 방송 서비스를 효과적으로 지원할 수 있는 시스템 및 관련된 시그널링 방안을 제안한다.
본 발명은 지상파 방송망과 인터넷 망을 사용하는 차세대 하이브리드 방송을 지원하는 환경에서 차세대 방송 서비스를 효과적으로 지원할 수 있다.
본 발명은 방송 서비스에 포함되는 서비스 컴포넌트들에 대하여, 자세한 시그널링을 제공하는 방법을 지원할 수 있다.
본 발명은 방송 서비스를 전달하는 방안에 있어서, 캡션에 대한 정보를 효율적으로 제공하는 방법을 지원할 수 있다.
본 발명에 대해 더욱 이해하기 위해 포함되며 본 출원에 포함되고 그 일부를 구성하는 첨부된 도면은 본 발명의 원리를 설명하는 상세한 설명과 함께 본 발명의 실시예를 나타낸다.
도 1 은 본 발명의 일 실시예에 따른 프로토콜 스택을 도시한 도면이다.
도 2 는 본 발명의 일 실시예에 따른 서비스 디스커버리 과정을 도시한 도면이다.
도 3 은 본 발명의 일 실시예에 따른 LLS (Low Level Signaling) 테이블 및 SLT (Service List Table)를 도시한 도면이다.
도 4 는 본 발명의 일 실시예에 따른, ROUTE 로 전달되는 USBD 및 S-TSID 를 도시한 도면이다.
도 5 는 본 발명의 일 실시예에 따른, MMT 로 전달되는 USBD 를 도시한 도면이다.
도 6 은 본 발명의 일 실시예에 따른 링크 레이어(Link Layer) 동작을 도시한 도면이다.
도 7 은 본 발명의 일 실시예에 따른 LMT (Link Mapping Table) 를 도시한 도면이다.
도 8 은 본 발명의 일 실시예에 따른 차세대 방송 서비스에 대한 방송 신호 송신 장치의 구조를 나타낸다.
도 9 는 본 발명의 일 실시예에 따른 타임 인터리버의 라이팅 (writing) 오퍼레이션을 나타낸다.
도 10 은 본 발명의 일 실시예에 따른 프리퀀시 인터리버에 포함된 각 FFT 모드에 따른 메인-PRBS 제너레이터와 서브-PRBS 제너레이터로 구성된 인터리빙 어드레스 제너레이터의 블록 다이아그램을 나타낸 도면이다.
도 11 은 본 발명의 일 실시예에 따른 하이브리드 방송 수신 장치를 나타낸 도면이다.
도 12 는 본 발명의 일 실시예에 따른 DASH 기반 적응형(Adaptive) 스트리밍 모델의 전반적인 동작을 도시한 도면이다.
도 13 은 본 발명의 일 실시예에 따른 수신기의 블락 다이어그램을 도시한 도면이다.
도 14 는 본 발명의 일 실시예에 따른 미디어 파일의 구조를 도시한 도면이다.
도 15는 본 발명의 일 실시예에 따른 색공간 (color space)에 대한 자막 관련 정보의 신택스를 나타낸 도면이다.
도 16은 본 발명의 일 실시예에 따른 색 확장에 대한 메타데이터를 나타낸 도면이다.
도 17은 본 발명의 일 실시예에 따른 자막의 스크롤링 서포트를 위한 메타데이터를 나타낸다.
도 18은 본 발명의 일 실시예에 따른 자막의 스크롤링 서포트를 위한 메타데이터를 나타낸다.
도 19는 본 발명의 일 실시예에 따른 자막의 3D 서포트 정보를 나타낸다.
도 20은 본 발명의 다른 실시예에 따른 자막의 3D 서포트 정보를 나타낸다.
도 21은 본 발명의 일 실시예에 따른 자막의 프리젠테이션 타이밍 옵셋 정보를 나타낸다.
도 22는 본 발명의 일 실시예에 따른 자막의 프리젠테이션 앵커 타임 정보를 나타낸다.
도 23 및 24는 본 발명의 일 실시예에 따른 자막에 대한 프리젠테이션 앵커 타임을 ISOBMFF를 이용하여 시그널링하는 방법을 나타낸다.
도 25는 본 발명의 일 실시예에 따른 자막에 대한 스케일링 영역 정보를 나타낸다.
도 26은 본 발명의 일 실시예에 따른 자막에 대한 재생 스피드 정보 및 화면 비율 정보를 나타낸다.
도 27 은 본 발명의 일 실시예에 따른 DASH (Dynamic Adaptive Streaming over HTTP) 데이터 모델 (data model)을 나타낸 도면이다.
도 28은 본 발명의 일 실시예에 따른 자막 정보를 MPD 내에 기술하기 위한 방법을 나타낸다.
도 29는 본 발명의 일 실시예에 따른 자막 정보를 MPD 내에 기술하는 디스크립터를 나타낸다.
도 30은 본 발명의 일 실시예에 따른 MPD에 포함된 자막 관련 정보를 나타낸 도면이다.
도 31은 본 발명의 일 실시예에 따른 자막 관련 정보의 세부 정보를 나타낸다.
도 32는 본 발명의 일 실시예에 따른 자막 관련 정보의 세부 정보를 나타낸다.
도 33 은 본 발명의 일 실시예에 따른 MMT 프로토콜 기반의 시그널링 흐름을 도시한 도면이다.
도 34 는 본 발명의 일 실시예에 따른 SLT 를 통한 부트스트래핑 과정을 도시한 도면이다.
도 35는 본 발명의 다른 실시예에 따른 USBD의 일부를 도시한 도면이다.
도 36 은 본 발명의 다른 실시예에 따른 USBD 의 일부를 도시한 도면이다.
도 37 은 본 발명의 일 실시예에 따른 캡션(caption) 정보를 도시한 도면이다.
도 38 은 본 발명의 다른 실시예에 따른 캡션(caption) 정보를 도시한 도면이다.
도 39는 본 발명의 다른 실시예에 따른 캡션(caption) 정보를 도시한 도면이다.
도 40은 본 발명의 일 실시예에 따른 MMT 메시지 형식을 나타낼 수 있다.
도 41은 본 발명의 일 실시예에 따른 시그널링 테이블인 DCI 테이블을 나타낸다.
도 42 는 본 발명의 일 실시예에 따른 MP 테이블의 일부를 도시한 도면이다.
도 43은 본 발명의 일 실시예에 따른 복수의 디스크립터들을 나타낸다.
도 44 는 본 발명의 일 실시예에 따른 캡션 관련 정보를 시그널링하기 위한 방안을 도시한 도면이다.
도 45 는 본 발명의 다른 실시예에 따른 캡션 관련 정보를 시그널링하기 위한 방안을 도시한 도면이다.
도 46 내지 도 48은 본 발명의 다른 실시예에 따른 캡션 관련 정보를 시그널링하기 위한 방안을 도시한 도면이다.
도 49는 본 발명의 일 실시예에 따른 방송 신호를 전송하는 방법을 나타낸 도면이다.
도 50은 본 발명의 일 실시예에 따른 방송 신호를 전송하는 장치를 나타낸 도면이다.
발명의 실시를 위한 최선의 형태
본 발명의 바람직한 실시예에 대해 구체적으로 설명하며, 그 예는 첨부된 도면에 나타낸다. 첨부된 도면을 참조한 아래의 상세한 설명은 본 발명의 실시예에 따라 구현될 수 있는 실시예만을 나타내기보다는 본 발명의 바람직한 실시예를 설명하기 위한 것이다. 다음의 상세한 설명은 본 발명에 대한 철저한 이해를 제공하기 위해 세부 사항을 포함한다. 그러나 본 발명이 이러한 세부 사항 없이 실행될 수 있다는 것은 당업자에게 자명하다.
본 발명에서 사용되는 대부분의 용어는 해당 분야에서 널리 사용되는 일반적인 것들에서 선택되지만, 일부 용어는 출원인에 의해 임의로 선택되며 그 의미는 필요에 따라 다음 설명에서 자세히 서술한다. 따라서 본 발명은 용어의 단순한 명칭이나 의미가 아닌 용어의 의도된 의미에 근거하여 이해되어야 한다.
본 발명은 차세대 방송 서비스에 대한 방송 신호 송신 및 수신 장치 및 방법을 제공한다. 본 발명의 일 실시예에 따른 차세대 방송 서비스는 지상파 방송 서비스, 모바일 방송 서비스, UHDTV 서비스 등을 포함한다. 본 발명은 일 실시예에 따라 비-MIMO (non-Multiple Input Multiple Output) 또는 MIMO 방식을 통해 차세대 방송 서비스에 대한 방송 신호를 처리할 수 있다. 본 발명의 일 실시예에 따른 비-MIMO 방식은 MISO (Multiple Input Single Output) 방식, SISO (Single Input Single Output) 방식 등을 포함할 수 있다. 본 발명은 특정 용도에 요구되는 성능을 달성하면서 수신기 복잡도를 최소화하기 위해 최적화된 피지컬 프로파일 (또는 시스템)을 제안한다.
도 1 은 본 발명의 일 실시예에 따른 프로토콜 스택을 도시한 도면이다.
서비스는 복수개의 레이어를 거쳐 수신기로 전달될 수 있다. 먼저 송신측에서는 서비스 데이터를 생성할 수 있다. 송신측의 딜리버리 레이어에서는 서비스 데이터에 전송을 위한 처리를 수행하고, 피지컬 레이어에서는 이를 방송 신호로 인코딩하여 방송망 또는 브로드밴드를 통해 전송할 수 있다.
여기서 서비스 데이터들은 ISO BMFF (base media file format) 에 따른 포맷으로 생성될 수 있다. ISO BMFF 미디어 파일은 방송망/브로드밴드 딜리버리, 미디어 인캡슐레이션(media encapsulation) 및/또는 동기화 포맷(synchronization format) 으로 사용될 수 있다. 여기서 서비스 데이터는 서비스와 관련된 모든 데이터로서, 리니어 서비스를 이루는 서비스 컴포넌트들, 그에 대한 시그널링 정보, NRT (Non Real Time) 데이터, 기타 파일들 등을 포함하는 개념일 수 있다.
딜리버리 레이어에 대해 설명한다. 딜리버리 레이어는 서비스 데이터에 대한 전송 기능을 제공할 수 있다. 서비스 데이터는 방송망및/또는 브로드밴드를 통해 전달될 수 있다.
방송망을 통한 서비스 딜리버리(broadcast service delivery)에 있어 두가지 방법이 있을 수 있다.
첫번째 방법은 MMT (MPEG Media Transport) 에 근거하여, 서비스 데이터들을 MPU (Media Processing Units) 들로 처리하고, 이를 MMTP (MMT protocol) 를 이용하여 전송하는 것일 수 있다. 이 경우, MMTP 를 통해 전달되는 서비스 데이터에는, 리니어 서비스를 위한 서비스 컴포넌트들 및/또는 그에 대한 서비스 시그널링 정보 등이 있을 수 있다.
두번째 방법은 MPEG DASH 에 근거하여, 서비스 데이터들을 DASH 세그먼트들로 처리하고, 이를 ROUTE (Real time Object delivery over Unidirectional Transport) 를 이용하여 전송하는 것일 수 있다. 이 경우, ROUTE 프로토콜을 통해 전달되는 서비스 데이터에는, 리니어 서비스를 위한 서비스 컴포넌트들, 그에 대한 서비스 시그널링 정보 및/또는 NRT 데이터 등이 있을 수 있다. 즉, NRT 데이터 및 파일 등의 논 타임드(non timed) 데이터는 ROUTE 를 통해서 전달될 수 있다.
MMTP 또는 ROUTE 프로토콜에 따라 처리된 데이터는 UDP / IP 레이어를 거쳐 IP 패킷들로 처리될 수 있다. 방송망을 통한 서비스 데이터 전달에 있어서, SLT (Service List Table) 역시 UDP / IP 레이어를 거쳐 방송망을 통해 전달될 수 있다. SLT 는 LLS (Low Level Signaling) 테이블에 포함되어 전달될 수 있는데, SLT, LLS 테이블에 대해서는 후술한다.
IP 패킷들은 링크 레이어에서 링크 레이어 패킷들로 처리될 수 있다. 링크 레이어는 상위 레이어에서 전달되는 다양한 포맷의 데이터를, 링크 레이어 패킷으로 인캡슐레이션한 후, 피지컬 레이어에 전달할 수 있다. 링크 레이어에 대해서는 후술한다.
하이브리드 서비스 딜리버리(hybrid service delivery) 에 있어서는, 적어도 하나 이상의 서비스 엘레멘트가 브로드밴드 패쓰(path) 를 통해 전달될 수 있다. 하이브리드 서비스 딜리버리의 경우, 브로드밴드로 전달되는 데이터에는, DASH 포맷의 서비스 컴포넌트들, 그에 대한 서비스 시그널링 정보 및/또는 NRT 데이터 등이 있을 수 있다. 이 데이터들은 HTTP/TCP/IP 를 거쳐 처리되고, 브로드밴드 전송을 위한 링크 레이어를 거쳐, 브로드밴드 전송을 위한 피지컬 레이어로 전달될 수 있다.
피지컬 레이어는 딜리버리 레이어(상위 레이어 및/또는 링크 레이어)로부터 전달받은 데이터를 처리하여, 방송망 또는 브로드밴드를 통하여 전송할 수 있다. 피지컬 레이어에 대한 자세한 사항은 후술한다.
서비스에 대해 설명한다. 서비스는 전체적으로 사용자에게 보여주는 서비스 컴포넌트의 컬렉션일 수 있고, 컴포넌트는 여러 미디어 타입의 것일 수 있고, 서비스는 연속적이거나 간헐적일 수 있으며, 서비스는 실시간이거나 비실시간일 수 있고, 실시간 서비스는 TV 프로그램의 시퀀스로 구성될 수 있다.
서비스는 여러 타입을 가질 수 있다. 첫 번째로 서비스는 앱 기반 인헨스먼트를 가질 수 있는 리니어 오디오/비디오 또는 오디오만의 서비스일 수 있다. 두 번째로 서비스는 다운로드된 어플리케이션에 의해 그 재생/구성 등이 제어되는 앱 기반 서비스일 수 있다. 세 번째로 서비스는 ESG (Electronic Service Guide) 를 제공하는 ESG 서비스일 수 있다. 네 번째로 긴급 경보 정보를 제공하는 EA (Emergency Alert) 서비스일 수 있다.
앱 기반 인헨스먼트가 없는 리니어 서비스가 방송망을 통해 전달되는 경우, 서비스 컴포넌트는 (1) 하나 이상의 ROUTE 세션 또는 (2) 하나 이상의 MMTP 세션에 의해 전달될 수 있다.
앱 기반 인헨스먼트가 있는 리니어 서비스가 방송망을 통해 전달되는 경우, 서비스 컴포넌트는 (1) 하나 이상의 ROUTE 세션 및 (2) 0개 이상의 MMTP 세션에 의해 전달될 수 있다. 이 경우 앱 기반 인핸스먼트에 사용되는 데이터는 NRT 데이터 또는 기타 파일 등의 형태로 ROUTE 세션을 통해 전달될 수 있다. 본 발명의 일 실시예에서, 하나의 서비스의 리니어 서비스 컴포넌트(스트리밍 미디어 컴포넌트)들이 두 프로토콜을 동시에 사용해 전달되는 것이 허용되지 않을 수 있다.
앱 기반 서비스가 방송망을 통해 전달되는 경우, 서비스 컴포넌트는 하나 이상의 ROUTE 세션에 의해 전달될 수 있다. 이 경우, 앱 기반 서비스에 사용되는 서비스 데이터는 NRT 데이터 또는 기타 파일 등의 형태로 ROUTE 세션을 통해 전달될 수 있다.
또한, 이러한 서비스의 일부 서비스 컴포넌트 또는 일부 NRT 데이터, 파일 등은 브로드밴드를 통해 전달될 수 있다(하이브리드 서비스 딜리버리).
즉, 본 발명의 일 실시예에서, 하나의 서비스의 리니어 서비스 컴포넌트들은 MMT 프로토콜을 통해 전달될 수 있다. 본 발명의 다른 실시예에서, 하나의 서비스의 리니어 서비스 컴포넌트들은 ROUTE 프로토콜을 통해 전달될 수 있다. 본 발명의 또 다른 실시예에서, 하나의 서비스의 리니어 서비스 컴포넌트 및 NRT 데이터(NRT 서비스 컴포넌트)들은 ROUTE 프로토콜을 통해 전달될 수 있다. 본 발명의 또 다른 실시예에서, 하나의 서비스의 리니어 서비스 컴포넌트들은 MMT 프로토콜을 통해 전달되고, NRT 데이터(NRT 서비스 컴포넌트)들은 ROUTE 프로토콜을 통해 전달될 수 있다. 전술한 실시예들에서, 서비스의 일부 서비스 컴포넌트 또는 일부 NRT 데이터들은 브로드밴드를 통해 전달될 수 있다. 여기서 앱 기반 서비스 내지 앱 기반 인핸스먼트에 관한 데이터들은 NRT 데이터 형태로, ROUTE 에 따른 방송망을 통해 전달되거나 브로드밴드를 통해 전달될 수 있다. NRT 데이터는 로컬리 캐쉬드 데이터(Locally cashed data) 등으로 불릴 수도 있다.
각각의 ROUTE 세션은 서비스를 구성하는 컨텐츠 컴포넌트를 전체적으로 또는 부분적으로 전달하는 하나 이상의 LCT 세션을 포함한다. 스트리밍 서비스 딜리버리에서, LCT 세션은 오디오, 비디오, 또는 클로즈드 캡션 스트림과 같은 사용자 서비스의 개별 컴포넌트를 전달할 수 있다. 스트리밍 미디어는 DASH 세그먼트로 포맷된다.
각각의 MMTP 세션은 MMT 시그널링 메시지 또는 전체 또는 일부 컨텐츠 컴포넌트를 전달하는 하나 이상의 MMTP 패킷 플로우를 포함한다. MMTP 패킷 플로우는 MMT 시그널링 메시지 또는 MPU 로 포맷된 컴포넌트를 전달할 수 있다.
NRT 사용자 서비스 또는 시스템 메타데이터의 딜리버리를 위해, LCT 세션은 파일 기반의 컨텐츠 아이템을 전달한다. 이들 컨텐츠 파일은 NRT 서비스의 연속적 (타임드) 또는 이산적 (논 타임드) 미디어 컴포넌트, 또는 서비스 시그널링이나 ESG 프레그먼트와 같은 메타데이터로 구성될 수 있다. 서비스 시그널링이나 ESG 프레그먼트와 같은 시스템 메타데이터의 딜리버리 또한 MMTP의 시그널링 메시지 모드를 통해 이루어질 수 있다.
수신기에서는 튜너가 주파수들을 스캐닝하다가, 특정 주파수에서 방송 시그널을 감지할 수 있다. 수신기는 SLT 를 추출해 이를 처리하는 모듈로 보낼 수 있다. SLT 파서는 SLT 를 파싱하고 데이터를 획득해 채널 맵에 저장할 수 있다. 수신기는 SLT 의 부트스트랩 정보를 획득하고 ROUTE 또는 MMT 클라이언트에 전달해줄 수 있다. 수신기는 이를 통해 SLS 를 획득할 수 있고, 저장할 수 있다. USBD 등이 획득될 수 있고, 이는 시그널링 파서에 의해 파싱될 수 있다.
도 2 는 본 발명의 일 실시예에 따른 서비스 디스커버리 과정을 도시한 도면이다.
피지컬 레이어의 방송 신호 프레임이 전달하는 브로드캐스트 스트림은 LLS (Low Level Signaling) 을 운반할 수 있다. LLS 데이터는 웰 노운(well known) IP 어드레스/포트로 전달되는 IP 패킷의 페이로드를 통해서 운반될 수 있다. 이 LLS 는 그 타입에 따라 SLT 를 포함할 수 있다. LLS 데이터는 LLS 테이블의 형태로 포맷될 수 있다. LLS 데이터를 운반하는 매 UDP/IP 패킷의 첫번째 바이트는 LLS 테이블의 시작일 수 있다. 도시된 실시예와 달리 LLS 데이터를 전달하는 IP 스트림은, 다른 서비스 데이터들과 함께 같은 PLP 로 전달될 수도 있다.
SLT 는 빠른 채널 스캔을 통하여 수신기가 서비스 리스트를 생성할 수 있게 하고, SLS 를 로케이팅(locating) 하기 위한 액세스 정보를 제공한다. SLT 는 부트스트랩 정보를 포함하는데, 이 부트스트랩 정보는 수신기가 각각의 서비스에 대한 SLS (Service Layer Signaling) 을 획득할 수 있도록 한다. SLS, 즉 서비스 시그널링 정보가 ROUTE 를 통해 전달되는 경우, 부트스트랩 정보는 SLS 를 운반하는 LCT 채널 내지 그 LCT 채널을 포함하는 ROUTE 세션의 데스티네이션 IP 어드레스 및 데스티네이션 포트 정보를 포함할 수 있다. SLS 가 MMT 를 통해 전달되는 경우, 부트스트랩 정보는 SLS 를 운반하는 MMTP 세션의 데스티네이션 IP 어드레스 및 데스티네이션 포트 정보를 포함할 수 있다.
도시된 실시예에서, SLT 가 기술하는 서비스 #1 의 SLS 는 ROUTE 를 통해 전달되고, SLT 는 해당 SLS 가 전달되는 LCT 채널을 포함하는 ROUTE 세션에 대한 부트스트랩 정보(sIP1, dIP1, dPort1) 를 포함할 수 있다. SLT 가 기술하는 서비스 #2 의 SLS 는 MMT 를 통해 전달되고, SLT 는 해당 SLS 가 전달되는 MMTP 패킷 플로우를 포함하는 MMTP 세션에 대한 부트스트랩 정보(sIP2, dIP2, dPort2) 를 포함할 수 있다.
SLS 는 해당 서비스에 대한 특성을 기술하는 시그널링 정보로서, 해당 서비스 및 해당 서비스의 서비스 컴포넌트를 획득하기 위한 정보를 제공하거나, 해당 서비스를 유의미하게 재생하기 위한 수신기 캐패빌리티 정보 등을 포함할 수 있다. 각 서비스에 대해 별개의 서비스 시그널링을 가지면 수신기는 브로드캐스트 스트림 내에서 전달되는 전체 SLS을 파싱할 필요 없이 원하는 서비스에 대한 적절한 SLS를 획득하면 된다.
SLS 가 ROUTE 프로토콜을 통해 전달되는 경우, SLS 는 SLT 가 지시하는 ROUTE 세션의 특정(dedicated) LCT 채널을 통해 전달될 수 있다. 실시예에 따라 이 LCT 채널은 tsi = 0 로 식별되는 LCT 채널일 수 있다. 이 경우 SLS 는 USBD/USD (User Service Bundle Description / User Service Description), S-TSID (Service-based Transport Session Instance Description) 및/또는 MPD (Media Presentation Description) 를 포함할 수 있다.
여기서 USBD 내지 USD 는 SLS 프래그먼트 중 하나로서, 서비스의 구체적 기술적 정보들을 기술하는 시그널링 허브로서 역할할 수 있다. USBD 는 서비스 식별 정보, 디바이스 캐패빌리티 정보 등을 포함할 수 있다. USBD 는 다른 SLS 프래그먼트(S-TSID, MPD 등) 에의 레퍼런스 정보(URI 레퍼런스)를 포함할 수 있다. 즉, USBD/USD 는 S-TSID 와 MPD 를 각각 레퍼런싱할 수 있다. 또한 USBD 는 수신기가 전송 모드(방송망/브로드밴드)를 결정할 수 있게 해주는 메타데이터 정보를 더 포함할 수 있다. USBD/USD 의 구체적 내용들에 대해서는 후술한다.
S-TSID 는 SLS 프래그먼트 중 하나로서, 해당 서비스의 서비스 컴포넌트를 운반하는 전송 세션에 대한 전체적인 세션 디스크립션 정보를 제공할 수 있다. S-TSID 는 해당 서비스의 서비스 컴포넌트가 전달되는 ROUTE 세션 및/또는 그 ROUTE 세션들의 LCT 채널에 대한 전송 세션 디스크립션 정보를 제공할 수 있다. S-TSID 는 하나의 서비스와 관련된 서비스 컴포넌트들의 컴포넌트 획득(acquisition) 정보를 제공할 수 있다. S-TSID 는, MPD 의 DASH 레프리젠테이션(Representation) 과 해당 서비스 컴포넌트의 tsi 간의 매핑을 제공할 수 있다. S-TSID 의 컴포넌트 획득 정보는 tsi, 관련 DASH 레프리젠테이션의 식별자의 형태로 제공될 수 있으며, 실시예에 따라 PLP ID 를 포함하거나 포함하지 않을 수 있다. 컴포넌트 획득 정보를 통해 수신기는 한 서비스의 오디오/비디오 컴포넌트들을 수집하고 DASH 미디어 세그먼트들의 버퍼링, 디코딩 등을 수행할 수 있다. S-TSID 는 전술한 바와 같이 USBD 에 의해 레퍼런싱될 수 있다. S-TSID 의 구체적 내용들에 대해서는 후술한다.
MPD 는 SLS 프래그먼트 중 하나로서, 해당 서비스의 DASH 미디어 프리젠테이션에 관한 디스크립션을 제공할 수 있다. MPD 는 미디어 세그먼트들에 대한 리소스 식별자(resource identifier) 를 제공하고, 식별된 리소스들에 대한 미디어 프리젠테이션 내에서의 컨텍스트 정보를 제공할 수 있다. MPD 는 방송망을 통해 전달되는 DASH 레프리젠테이션(서비스 컴포넌트)를 기술하고, 또한 브로드밴드를 통해 전달되는 추가적인 DASH 레프리젠테이션을 기술할 수 있다(하이브리드 딜리버리). MPD 는 전술한 바와 같이 USBD 에 의해 레퍼런싱될 수 있다.
SLS 가 MMT 프로토콜을 통해 전달되는 경우, SLS 는 SLT 가 지시하는 MMTP 세션의 특정(dedicated) MMTP 패킷 플로우을 통해 전달될 수 있다. 실시예에 따라 SLS 를 전달하는 MMTP 패킷들의 packet_id 는 00 의 값을 가질 수 있다. 이 경우 SLS 는 USBD/USD 및/또는 MMT Package (MP) 테이블을 포함할 수 있다.
여기서 USBD 는 SLS 프래그먼트의 하나로서, ROUTE 에서의 그것과 같이 서비스의 구체적 기술적 정보들을 기술할 수 있다. 여기서의 USBD 역시 다른 SLS 프래그먼트에의 레퍼런스 정보(URI 레퍼런스)를 포함할 수 있다. MMT 의 USBD 는 MMT 시그널링의 MP 테이블을 레퍼런싱할 수 있다. 실시예에 따라 MMT 의 USBD 는 S-TSID 및/또는 MPD 에의 레퍼런스 정보 또한 포함할 수 있다. 여기서의 S-TSID 는 ROUTE 프로토콜을 통해 전달되는 NRT 데이터를 위함일 수 있다. MMT 프로토콜을 통해 리니어 서비스 컴포넌트가 전달되는 경우에도 NRT 데이터는 ROUTE 프로토콜을 통해 전달될 수 있기 때문이다. MPD 는 하이브리드 서비스 딜리버리에 있어서, 브로드밴드로 전달되는 서비스 컴포넌트를 위함일 수 있다. MMT 의 USBD 의 구체적 내용들에 대해서는 후술한다.
MP 테이블은 MPU 컴포넌트들을 위한 MMT 의 시그널링 메시지로서, 해당 서비스의 서비스 컴포넌트를 운반하는 MMTP 세션에 대한 전체적인 세션 디스크립션 정보를 제공할 수 있다. 또한 MP 테이블은 이 MMTP 세션을 통해 전달되는 에셋(Asset) 에 대한 디스크립션을 포함할 수 있다. MP 테이블은 MPU 컴포넌트들을 위한 스트리밍 시그널링 정보로서, 하나의 서비스에 해당하는 에셋들의 리스트와 이 컴포넌트들의 로케이션 정보(컴포넌트 획득 정보)를 제공할 수 있다. MP 테이블의 구체적인 내용은 MMT 에서 정의된 형태이거나, 변형이 이루어진 형태일 수 있다. 여기서 Asset 이란, 멀티미디어 데이터 엔티티로서, 하나의 유니크 ID 로 연합되고 하나의 멀티미디어 프리젠테이션을 생성하는데 사용되는 데이터 엔티티를 의미할 수 있다. Asset 은 하나의 서비스를 구성하는 서비스 컴포넌트에 해당할 수 있다. MP 테이블을 이용하여 원하는 서비스에 해당하는 스트리밍 서비스 컴포넌트(MPU) 에 접근할 수 있다. MP 테이블은 전술한 바와 같이 USBD 에 의해 레퍼런싱될 수 있다.
기타 다른 MMT 시그널링 메시지가 정의될 수 있다. 이러한 MMT 시그널링 메시지들에 의해 MMTP 세션 내지 서비스에 관련된 추가적인 정보들이 기술될 수 있다.
ROUTE 세션은 소스 IP 어드레스, 데스티네이션 IP 어드레스, 데스티네이션 포트 넘버에 의해 식별된다. LCT 세션은 페어런트 ROUTE 세션의 범위 내에서 유일한 TSI (transport session identifier)에 의해 식별된다. MMTP 세션은 데스티네이션 IP 어드레스 및 데스티네이션 포트 넘버에 의해 식별된다. MMTP 패킷 플로우는 페어런트 MMTP 세션의 범위 내에서 유일한 packet_id에 의해 식별된다.
ROUTE 의 경우 S-TSID, USBD/USD, MPD 또는 이 들을 전달하는 LCT 세션을 서비스 시그널링 채널이라 부를 수도 있다. MMTP 의 경우, USBD/UD, MMT 시그널링 메시지들 또는 이들을 전달하는 패킷 플로우를 서비스 시그널링 채널이라 부를 수도 있다.
도시된 실시예와는 달리, 하나의 ROUTE 또는 MMTP 세션은 복수개의 PLP 를 통해 전달될 수 있다. 즉, 하나의 서비스는 하나 이상의 PLP 를 통해 전달될 수도 있다. 도시된 것과 달리 실시예에 따라 하나의 서비스를 구성하는 컴포넌트들이 서로 다른 ROUTE 세션들을 통해 전달될 수도 있다. 또한, 실시예에 따라 하나의 서비스를 구성하는 컴포넌트들이 서로 다른 MMTP 세션들을 통해 전달될 수도 있다. 실시예에 따라 하나의 서비스를 구성하는 컴포넌트들이 ROUTE 세션과 MMTP 세션에 나뉘어 전달될 수도 있다. 도시되지 않았으나, 하나의 서비스를 구성하는 컴포넌트가 브로드밴드를 통해 전달(하이브리드 딜리버리)되는 경우도 있을 수 있다.
도 3 은 본 발명의 일 실시예에 따른 LLS (Low Level Signaling) 테이블 및 SLT (Service List Table)를 도시한 도면이다.
도시된 LLS 테이블의 일 실시예(t3010) 은, LLS_table_id 필드, provider_id 필드, LLS_table_version 필드 및/또는 LLS_table_id 필드에 따른 정보들을 포함할 수 있다.
LLS_table_id 필드는 해당 LLS 테이블의 타입을 식별하고, provider_id 필드는 해당 LLS 테이블에 의해 시그널링되는 서비스들과 관련된 서비스 프로바이더를 식별할 수 있다. 여기서 서비스 프로바이더는 해당 브로드캐스트 스트림의 전부 또는 일부를 사용하는 브로드캐스터로서, provider_id 필드는 해당 브로드캐스트 스트림을 사용중인 복수의 브로드캐스터들 중 하나를 식별할 수 있다. LLS_table_version 필드는 해당 LLS 테이블의 버전 정보를 제공할 수 있다.
LLS_table_id 필드의 값에 따라, 해당 LLS 테이블은 전술한 SLT, 컨텐트 어드바이저리 레이팅(Content advisory rating) 에 관련된 정보를 포함하는 RRT(Rating Region Table), 시스템 타임과 관련된 정보를 제공하는 SystemTime 정보, 긴급 경보와 관련된 정보를 제공하는 CAP (Common Alert Protocol) 메시지 중 하나를 포함할 수 있다. 실시예에 따라 이들 외에 다른 정보가 LLS 테이블에 포함될 수도 있다.
도시된 SLT 의 일 실시예(t3020) 는, @bsid 속성, @sltCapabilities 속성, sltInetUrl 엘레멘트 및/또는 Service 엘레멘트를 포함할 수 있다. 각 필드들은 도시된 Use 컬럼의 값에 따라 생략되거나, 복수개 존재할 수 있다.
@bsid 속성은 브로드캐스트 스트림의 식별자일 수 있다. @sltCapabilities 속성은 해당 SLT 가 기술하는 모든 서비스들을 디코딩하고 유의미하게 재생하는데 요구되는 캐패빌리티 정보를 제공할 수 있다. sltInetUrl 엘레멘트는 해당 SLT 의 서비스들을 위한 ESG 내지 서비스 시그널링 정보를 브로드밴드를 통해 얻기 위해 사용되는 베이스 URL 정보를 제공할 수 있다. sltInetUrl 엘레멘트는 @urlType 속성을 더 포함할 수 있는데, 이는 해당 URL 을 통해 얻을 수 있는 데이터의 타입을 지시할 수 있다.
Service 엘레멘트는 해당 SLT 가 기술하는 서비스들에 대한 정보를 포함하는 엘레멘트일 수 있으며, 각각의 서비스들에 대해 Service 엘레멘트가 존재할 수 있다. Service 엘레멘트는 @serviceId 속성, @sltSvcSeqNum 속성, @protected 속성, @majorChannelNo 속성, @minorChannelNo 속성, @serviceCategory 속성, @shortServiceName 속성, @hidden 속성, @broadbandAccessRequired 속성, @svcCapabilities 속성, BroadcastSvcSignaling 엘레멘트 및/또는 svcInetUrl 엘레멘트를 포함할 수 있다.
@serviceId 속성은 해당 서비스의 식별자이고, @sltSvcSeqNum 속성은 해당 서비스에 대한 SLT 정보의 시퀀스 넘버를 나타낼 수 있다. @protected 속성은 해당 서비스의 유의미한 재생을 위해 필요한 적어도 하나의 서비스 컴포넌트가 보호(protected)되고 있는지 여부를 지시할 수 있다. @majorChannelNo 속성과 @minorChannelNo 속성은 각각 해당 서비스의 메이저 채널 넘버와 마이너 채널 넘버를 지시할 수 있다.
@serviceCategory 속성은 해당 서비스의 카테고리를 지시할 수 있다. 서비스의 카테고리로는 리니어 A/V 서비스, 리니어 오디오 서비스, 앱 기반 서비스, ESG 서비스, EAS 서비스 등이 있을 수 있다. @shortServiceName 속성은 해당 서비스의 짧은 이름(Short name)을 제공할 수 있다. @hidden 속성은 해당 서비스가 테스팅 또는 독점적(proprietary) 사용을 위한 서비스인지 여부를 지시할 수 있다. @broadbandAccessRequired 속성은 해당 서비스의 유의미한 재생을 위하여 브로드밴드 억세스가 필요한지 여부를 지시할 수 있다. @svcCapabilities 속성은 해당 서비스의 디코딩과 유의미한 재생을 위하여 필요한 캐패빌리티 정보를 제공할 수 있다.
BroadcastSvcSignaling 엘레멘트는 해당 서비스의 브로드캐스트 시그널링에 관련된 정보들을 제공할 수 있다. 이 엘레멘트는 해당 서비스의 방송망을 통한 시그널링에 대하여, 로케이션, 프로토콜, 어드레스 등의 정보를 제공할 수 있다. 자세한 사항은 후술한다.
svcInetUrl 엘레멘트는 해당 서비스를 위한 시그널링 정보를 브로드밴드를 통해 액세스하기 위한 URL 정보를 제공할 수 있다. sltInetUrl 엘레멘트는 @urlType 속성을 더 포함할 수 있는데, 이는 해당 URL 을 통해 얻을 수 있는 데이터의 타입을 지시할 수 있다.
전술한 BroadcastSvcSignaling 엘레멘트는 @slsProtocol 속성, @slsMajorProtocolVersion 속성, @slsMinorProtocolVersion 속성, @slsPlpId 속성, @slsDestinationIpAddress 속성, @slsDestinationUdpPort 속성 및/또는 @slsSourceIpAddress 속성을 포함할 수 있다.
@slsProtocol 속성은 해당 서비스의 SLS 를 전달하는데 사용되는 프로토콜을 지시할 수 있다(ROUTE, MMT 등). @slsMajorProtocolVersion 속성 및 @slsMinorProtocolVersion 속성은 각각 해당 서비스의 SLS 를 전달하는데 사용되는 프로토콜의 메이저 버전 넘버 및 마이너 버전 넘버를 지시할 수 있다.
@slsPlpId 속성은 해당 서비스의 SLS 를 전달하는 PLP 를 식별하는 PLP 식별자를 제공할 수 있다. 실시예에 따라 이 필드는 생략될 수 있으며, SLS 가 전달되는 PLP 정보는 후술할 LMT 내의 정보와, SLT 의 부트스트랩 정보를 조합하여 확인될 수도 있다.
@slsDestinationIpAddress 속성, @slsDestinationUdpPort 속성 및 @slsSourceIpAddress 속성은 각각 해당 서비스의 SLS 를 전달하는 전송 패킷의 데스티네이션 IP 어드레스, 데스티네이션 UDP 포트 및 소스 IP 어드레스 를 지시할 수 있다. 이들은 SLS 가 전달되는 전송세션(ROUTE 세션 또는 MMTP 세션)을 식별할 수 있다. 이들은 부트스트랩 정보에 포함될 수 있다.
도 4 는 본 발명의 일 실시예에 따른, ROUTE 로 전달되는 USBD 및 S-TSID 를 도시한 도면이다.
도시된 USBD 의 일 실시예(t4010) 은, bundleDescription 루트 엘레멘트를 가질 수 있다. bundleDescription 루트 엘레멘트는 userServiceDescription 엘레멘트를 가질 수 있다. userServiceDescription 엘레멘트는 하나의 서비스에 대한 인스턴스일 수 있다.
userServiceDescription 엘레멘트는 @globalServiceID 속성, @serviceId 속성, @serviceStatus 속성, @fullMPDUri 속성, @sTSIDUri 속성, name 엘레멘트, serviceLanguage 엘레멘트, capabilityCode 엘레멘트 및/또는 deliveryMethod 엘레멘트를 포함할 수 있다. 각 필드들은 도시된 Use 컬럼의 값에 따라 생략되거나, 복수개 존재할 수 있다.
@globalServiceID 속성은 해당 서비스의 글로벌하게 유니크한(globally unique) 식별자로서, ESG 데이터와 링크되는데 사용될 수 있다(Service@globalServiceID). @serviceId 속성은 SLT 의 해당 서비스 엔트리와 대응되는 레퍼런스로서, SLT 의 서비스 ID 정보와 동일할 수 있다. @serviceStatus 속성은 해당 서비스의 상태를 지시할 수 있다. 이 필드는 해당 서비스가 액티브인지 인액티브(inactive) 상태인지 여부를 지시할 수 있다.
@fullMPDUri 속성은 해당 서비스의 MPD 프래그먼트를 레퍼런싱할 수 있다. MPD 는 전술한 바와 같이 방송망 또는 브로드밴드를 통해 전달되는 서비스 컴포넌트에 대한 재생 디스크립션을 제공할 수 있다. @sTSIDUri 속성은 해당 서비스의 S-TSID 프래그먼트를 레퍼런싱할 수 있다. S-TSID 는 전술한 바와 같이 해당 서비스를 운반하는 전송 세션에의 액세스와 관련된 파라미터들을 제공할 수 있다.
name 엘레멘트는 해당 서비스의 이름을 제공할 수 있다. 이 엘레멘트는 @lang 속성을 더 포함할 수 있는데, 이 필드는 name 엘레멘트가 제공하는 이름의 언어를 지시할 수 있다. serviceLanguage 엘레멘트는 해당 서비스의 이용 가능한(available) 언어들을 지시할 수 있다. 즉, 이 엘레멘트는 해당 서비스가 제공될 수 있는 언어들을 나열할 수 있다.
capabilityCode 엘레멘트는 해당 서비스를 유의미하게 재생하기 위해 필요한 수신기 측의 캐패빌리티 또는 캐패빌리티 그룹 정보를 지시할 수 있다. 이 정보들은 서비스 아나운스먼트(announccement) 에서 제공되는 캐패빌리티 정보 포맷과 호환될 수 있다.
deliveryMethod 엘레멘트는 해당 서비스의 방송망 또는 브로드밴드를 통해 액세스되는 컨텐츠들에 대하여, 전송 관련 정보들을 제공할 수 있다. deliveryMethod 엘레멘트는 broadcastAppService 엘레멘트 및/또는 unicastAppService 엘레멘트를 포함할 수 있다. 이 엘레멘트들은 각각 basePattern 엘레멘트를 하위 엘레멘트로 가질 수 있다.
broadcastAppService 엘레멘트는 방송망을 통해 전달되는 DASH 레프리젠테이션에 대한 전송 관련 정보를 포함할 수 있다. 이 DASH 레프리젠테이션들은 해당 서비스 미디어 프리젠테이션의 모든 피리오드(Period)에 걸친 미디어 컴포넌트들을 포함할 수 있다.
이 엘레멘트의 basePattern 엘레멘트는 수신기가 세그먼트 URL 과 매칭하는데 사용되는 캐릭터 패턴을 나타낼 수 있다. 이는 DASH 클라이언트가 해당 레프리젠테이션의 세그먼트들을 요청하는데 사용될 수 있다. 매칭된다는 것은 해당 미디어 세그먼트가 방송망을 통해 전달된다는 것을 암시할 수 있다.
unicastAppService 엘레멘트는 브로드밴드를 통해 전달되는 DASH 레프리젠테이션에 대한 전송 관련 정보를 포함할 수 있다. 이 DASH 레프리젠테이션들은 해당 서비스 미디어 프리젠테이션의 모든 피리오드(Period)에 걸친 미디어 컴포넌트들을 포함할 수 있다.
이 엘레멘트의 basePattern 엘레멘트는 수신기가 세그먼트 URL 과 매칭하는데 사용되는 캐릭터 패턴을 나타낼 수 있다. 이는 DASH 클라이언트가 해당 레프리젠테이션의 세그먼트들을 요청하는데 사용될 수 있다. 매칭된다는 것은 해당 미디어 세그먼트가 브로드밴드를 통해 전달된다는 것을 암시할 수 있다.
도시된 S-TSID 의 일 실시예(t4020) 은, S-TSID 루트 엘레멘트를 가질 수 있다. S-TSID 루트 엘레멘트는 @serviceId 속성 및/또는 RS 엘레멘트를 포함할 수 있다. 각 필드들은 도시된 Use 컬럼의 값에 따라 생략되거나, 복수개 존재할 수 있다.
@serviceId 속성은 해당 서비스의 식별자로서, USBD/USD 의 해당 서비스를 레퍼런싱할 수 있다. RS 엘레멘트는 해당 서비스의 서비스 컴포넌트들이 전달되는 ROUTE 세션들에 대한 정보를 기술할 수 있다. 이러한 ROUTE 세션의 개수에 따라, 이 엘레멘트는 복수개 존재할 수 있다. RS 엘레멘트는 @bsid 속성, @sIpAddr 속성, @dIpAddr 속성, @dport 속성, @PLPID 속성 및/또는 LS 엘레멘트를 더 포함할 수 있다.
@bsid 속성은 해당 서비스의 서비스 컴포넌트들이 전달되는 브로드캐스트 스트림의 식별자일 수 있다. 이 필드가 생략된 경우, 디폴트 브로드캐스트 스트림은 해당 서비스의 SLS 를 전달하는 PLP 를 포함하는 브로드캐스트 스트림일 수 있다. 이 필드의 값은 SLT 의 @bsid 속성과 같은 값일 수 있다.
@sIpAddr 속성, @dIpAddr 속성 및 @dport 속성은 각각 해당 ROUTE 세션의 소스 IP 어드레스, 데스티네이션 IP 어드레스 및 데스티네이션 UDP 포트를 나타낼 수 있다. 이 필드들이 생략되는 경우, 디폴트 값들은 해당 SLS 를 전달하는, 즉 해당 S-TSID 를 전달하고 있는 현재의, ROUTE 세션의 소스 IP 어드레스, 데스티네이션 IP 어드레스 및 데스티네이션 UDP 포트값들일 수 있다. 현재 ROUTE 세션이 아닌, 해당 서비스의 서비스 컴포넌트들을 전달하는 다른 ROUTE 세션에 대해서는, 본 필드들이 생략되지 않을 수 있다.
@PLPID 속성은 해당 ROUTE 세션의 PLP ID 정보를 나타낼 수 있다. 이 필드가 생략되는 경우, 디폴트 값은 해당 S-TSID 가 전달되고 있는 현재 PLP 의 PLP ID 값일 수 있다. 실시예에 따라 이 필드는 생략되고, 해당 ROUTE 세션의 PLP ID 정보는 후술할 LMT 내의 정보와, RS 엘레멘트의 IP 어드레스 / UDP 포트 정보들을 조합하여 확인될 수도 있다.
LS 엘레멘트는 해당 서비스의 서비스 컴포넌트들이 전달되는 LCT 채널들에 대한 정보를 기술할 수 있다. 이러한 LCT 채널의 개수에 따라, 이 엘레멘트는 복수개 존재할 수 있다. LS 엘레멘트는 @tsi 속성, @PLPID 속성, @bw 속성, @startTime 속성, @endTime 속성, SrcFlow 엘레멘트 및/또는 RepairFlow 엘레멘트를 포함할 수 있다.
@tsi 속성은 해당 LCT 채널의 tsi 정보를 나타낼 수 있다. 이를 통해 해당 서비스의 서비스 컴포넌트가 전달되는 LCT 채널들이 식별될 수 있다. @PLPID 속성은 해당 LCT 채널의 PLP ID 정보를 나타낼 수 있다. 실시예에 따라 이 필드는 생략될 수 있다. @bw 속성은 해당 LCT 채널의 최대 대역폭를 나타낼 수 있다. @startTime 속성은 해당 LCT 세션의 스타트 타임을 지시하고, @endTime 속성은 해당 LCT 채널의 엔드 타임을 지시할 수 있다.
SrcFlow 엘레멘트는 ROUTE 의 소스 플로우에 대해 기술할 수 있다. ROUTE 의 소스 프로토콜은 딜리버리 오브젝트를 전송하기 위해 사용되며, 한 ROUTE 세션 내에서 적어도 하나 이상의 소스 플로우를 설정(establish)할 수 있다. 이 소스 플로우들은 관련된 오브젝트들을 오브젝트 플로우로서 전달할 수 있다.
RepairFlow 엘레멘트는 ROUTE 의 리페어 플로우에 대해 기술할 수 있다. 소스 프로토콜에 따라 전달되는 딜리버리 오브젝트들은 FEC (Forward Error Correction) 에 따라 보호될 수 있는데, 리페어 프로토콜은 이러한 FEC 프로텍션을 가능케 하는 FEC 프레임워크(framework)를 정의할 수 있다.
도 5 는 본 발명의 일 실시예에 따른, MMT 로 전달되는 USBD 를 도시한 도면이다.
도시된 USBD 의 일 실시예는, bundleDescription 루트 엘레멘트를 가질 수 있다. bundleDescription 루트 엘레멘트는 userServiceDescription 엘레멘트를 가질 수 있다. userServiceDescription 엘레멘트는 하나의 서비스에 대한 인스턴스일 수 있다.
userServiceDescription 엘레멘트는 @globalServiceID 속성, @serviceId 속성, Name 엘레멘트, serviceLanguage 엘레멘트, contentAdvisoryRating 엘레멘트, Channel 엘레멘트, mpuComponent 엘레멘트, routeComponent 엘레멘트, broadbandComponent 엘레멘트 및/또는 ComponentInfo 엘레멘트를 포함할 수 있다. 각 필드들은 도시된 Use 컬럼의 값에 따라 생략되거나, 복수개 존재할 수 있다.
@globalServiceID 속성, @serviceId 속성, Name 엘레멘트 및/또는 serviceLanguage 엘레멘트는 전술한 ROUTE 로 전달되는 USBD 의 해당 필드들과 같을 수 있다. contentAdvisoryRating 엘레멘트는 해당 서비스의 컨텐트 어드바이저리(advisory) 레이팅을 나타낼 수 있다. 이 정보들은 서비스 아나운스먼트(announccement) 에서 제공되는 컨텐트 어드바이저리 레이팅 정보 포맷과 호환될 수 있다. Channel 엘레멘트는 해당 서비스와 관련된 정보들을 포함할 수 있다. 이 엘레멘트의 자세한 내용에 대해서는 후술한다.
mpuComponent 엘레멘트는 해당 서비스의 MPU 로서 전달되는 서비스 컴포넌트들에 대한 디스크립션을 제공할 수 있다. 이 엘레멘트는 @mmtPackageId 속성 및/또는 @nextMmtPackageId 속성을 더 포함할 수 있다. @mmtPackageId 속성은 해당 서비스의 MPU 로서 전달되는 서비스 컴포넌트들의 MMT 패키지(Package) 를 레퍼런싱할 수 있다. @nextMmtPackageId 속성은 시간상 @mmtPackageId 속성이 레퍼런싱하는 MMT 패키지 다음으로 사용될 MMT 패키지를 레퍼런싱할 수 있다. 이 엘레멘트의 정보들을 통해 MP 테이블이 레퍼런싱될 수 있다.
routeComponent 엘레멘트는 ROUTE 로 전달되는 해당 서비스의 서비스 컴포넌트들에 대한 디스크립션을 포함할 수 있다. 리니어 서비스 컴포넌트들이 MMT 프로토콜로 전달되는 경우라 하더라도, NRT 데이터들은 전술한 바와 같이 ROUTE 프로토콜에 따라 전달될 수 있다. 이 엘레멘트는 이러한 NRT 데이터들에 대한 정보들을 기술할 수 있다. 이 엘레멘트의 자세한 내용에 대해서는 후술한다.
broadbandComponent 엘레멘트는 브로드밴드로 전달되는 해당 서비스의 서비스 컴포넌트들에 대한 디스크립션을 포함할 수 있다. 하이브리드 서비스 딜리버리에 있어서, 한 서비스의 일부 서비스 컴포넌트 또는 기타 파일들은 브로드밴드를 통해 전달될 수 있다. 이 엘레멘트는 이러한 데이터들에 대한 정보들을 기술할 수 있다. 이 엘레멘트는 @fullMPDUri 속성을 더 포함할 수 있다. 이 속성은 브로드밴드로 전달되는 서비스 컴포넌트들에 대해 기술하는 MPD 를 레퍼런싱할 수 있다. 하이브리드 서비스 딜리버리 이외에도, 터널 내의 주행 등으로 인해 방송 신호가 약화되는 경우에 있어, 방송망-브로드밴드 간의 핸드오프(handoff) 를 지원하기 위해 본 엘레멘트가 필요할 수 있다. 방송 신호가 약해지는 경우, 브로드밴드를 통해 서비스 컴포넌트를 획득하다가, 다시 방송 신호가 강해지면 방송망을 통해 서비스 컴포넌트를 획득하여 서비스의 연속성이 보장될 수 있다.
ComponentInfo 엘레멘트는 해당 서비스의 서비스 컴포넌트들에 대한 정보를 포함할 수 있다. 서비스의 서비스 컴포넌트들의 개수에 따라, 이 엘레멘트는 복수개 존재할 수 있다. 이 엘레멘트는 각 서비스 컴포넌트의 타입, 롤(role), 이름, 식별자, 프로텍션 여부 등의 정보들을 기술할 수 있다. 이 엘레멘트의 자세한 정보에 대해서는 후술한다.
전술한 Channel 엘레멘트는 @serviceGenre 속성, @serviceIcon 속성 및/또는 ServiceDescription 엘레멘트를 더 포함할 수 있다. @serviceGenre 속성은 해당 서비스의 장르를 지시하고, @serviceIcon 속성은 해당 서비스를 대표하는 아이콘(icon) 의 URL 정보를 포함할 수 있다. ServiceDescription 엘레멘트는 해당 서비스의 서비스 디스크립션을 제공하는데, 이 엘레멘트는 @serviceDescrText 속성 및/또는 @serviceDescrLang 속성을 더 포함할 수 있다. 이 속성들은 각각 해당 서비스 디스크립션의 텍스트 및 그 텍스트에 사용되는 언어를 지시할 수 있다.
전술한 routeComponent 엘레멘트는 @sTSIDUri 속성, @sTSIDDestinationIpAddress 속성, @sTSIDDestinationUdpPort 속성, @sTSIDSourceIpAddress 속성, @sTSIDMajorProtocolVersion 속성 및/또는 @sTSIDMinorProtocolVersion 속성을 더 포함할 수 있다.
@sTSIDUri 속성은 S-TSID 프래그먼트를 레퍼런싱할 수 있다. 이 필드는 전술한 ROUTE 로 전달되는USBD 의 해당 필드와 같을 수 있다. 이 S-TSID 는 ROUTE 로 전달되는 서비스 컴포넌트들에 대한 액세스 관련 정보를 제공할 수 있다. 이 S-TSID 는 MMT 프로토콜에 따라 리니어 서비스 컴포넌트들이 전달되는 상황에서, ROUTE 프로토콜에 따라 전달되는 NRT 데이터들을 위해 존재할 수 있다.
@sTSIDDestinationIpAddress 속성, @sTSIDDestinationUdpPort 속성 및 @sTSIDSourceIpAddress 속성은 각각 전술한 S-TSID 를 운반하는 전송 패킷의 데스티네이션 IP 어드레스, 데스티네이션 UDP 포트, 소스 IP 어드레스를 나타낼 수 있다. 즉, 이 필드들은 전술한 S-TSID 를 운반하는 전송 세션(MMTP 세션 또는 ROUTE 세션)을 식별할 수 있다.
@sTSIDMajorProtocolVersion 속성 및 @sTSIDMinorProtocolVersion 속성은 전술한 S-TSID 를 전달하는데 사용되는 전송 프로토콜의 메이저 버전 넘버 및 마이너 버전 넘버를 지시할 수 있다.
전술한 ComponentInfo 엘레멘트는 @componentType 속성, @componentRole 속성, @componentProtectedFlag 속성, @componentId 속성 및/또는 @componentName 속성을 더 포함할 수 있다.
@componentType 속성은 해당 컴포넌트의 타입을 지시할 수 있다. 예를 들어 이 속성은 해당 컴포넌트가 오디오, 비디오, 클로즈드캡션 컴포넌트인지를 지시할 수 있다. @componentRole 속성은 해당 컴포넌트의 롤(역할)을 지시할 수 있다. 예를 들어 이 속성은 해당 컴포넌트가 오디오 컴포넌트인 경우 메인 오디오, 뮤직, 코멘터리 등인지를 지시할 수 있다. 해당 컴포넌트가 비디오 컴포넌트인 경우 프라이머리 비디오인지 등을 지시할 수 있다. 해당 컴포넌트가 클로즈드 캡션 컴포넌트인 경우 노말 캡션인지 이지리더(easy reader) 타입인지 등을 지시할 수 있다.
@componentProtectedFlag 속성은 해당 서비스 컴포넌트가 프로텍티드되었는지, 예를 들어 암호화되었는지를 지시할 수 있다. @componentId 속성은 해당 서비스 컴포넌트의 식별자를 나타낼 수 있다. 이 속성의 값은 이 서비스 컴포넌트에 해당하는 MP 테이블의 asset_id (에셋 ID) 와 같은 값일 수 있다. @componentName 속성은 해당 서비스 컴포넌트의 이름을 나타낼 수 있다.
도 6 은 본 발명의 일 실시예에 따른 링크 레이어(Link Layer) 동작을 도시한 도면이다.
링크 레이어는 피지컬 레이어와 네트워크 레이어 사이의 레이어일 수 있다. 송신 측에서는 네트워크 레이어에서 피지컬 레이어로 데이터를 전송하고, 수신 측에서는 피지컬 레이어에서 네트워크 레이어로 데이터를 전송할 수 있다(t6010). 링크 레이어의 목적은 피지컬 레이어에 의한 처리를 위해 모든 입력 패킷 타입을 하나의 포맷으로 압축(abstracting)하는 것, 아직 정의되지 않은 입력 패킷 타입에 대한 유연성(flexibility) 및 추후 확장 가능성을 보장하는 것일 수 있다. 또한 링크 레이어는 입력 패킷의 헤더의 불필요한 정보를 압축하는 옵션을 제공함으로써, 입력 데이터가 효율적으로 전송될 수 있도록 할 수 있다. 링크 레이어의 오버헤드 리덕션, 인캡슐레이션 등의 동작은 링크 레이어 프로토콜이라 불리고, 해당 프로토콜을 이용하여 생성된 패킷은 링크 레이어 패킷이라 불릴 수 있다. 링크 레이어는 패킷 인캡슐레이션(packet encapsulation), 오버헤드 리덕션(Overhead Reduction) 및/또는 시그널링 전송(Signaling Transmission) 등의 기능을 수행할 수 있다.
송신측 기준으로, 링크 레이어(ALP)는 입력 패킷에 대하여 오버헤드 리덕션 과정을 수행한 후 이들을 링크 레이어 패킷으로 인캡슐레이션할 수 있다. 또한 실시예에 따라 링크 레이어는 오버헤드 리덕션 과정을 수행하지 아니하고, 링크 레이어 패킷으로 인캡슐레이션할 수도 있다. 링크 레이어 프로토콜의 사용으로 인해 피지컬 레이어 상에서 데이터의 전송에 대한 오버헤드가 크게 감소할 수 있으며, 본 발명에 따른 링크 레이어 프로토콜은 IP 오버헤드 리덕션 및/또는 MPEG-2 TS 오버헤드 리덕션을 제공할 수 있다.
도시된, IP 패킷이 입력패킷으로 입력되는 경우에 있어서(t6010), 링크 레이어는 IP 헤더 압축, 어댑테이션 및/또는 인캡슐레이션 과정을 차례로 수행할 수 있다. 실시예에 따라 일부 과정은 생략될 수 있다. 먼저, RoHC 모듈이 IP 패킷 헤더 압축을 수행하여 불필요한 오버헤드를 줄이고, 어댑테이션 과정을 통해 컨텍스트 정보가 추출되고 대역 외로 전송될 수 있다. IP 헤더 압축과 어댑테이션 과정을 통칭하여 IP 헤더 압축이라 부를 수도 있다. 이 후 인캡슐레이션 과정을 통해 IP 패킷들이 링크 레이어 패킷들로 인캡슐레이션될 수 있다.
MPEG 2 TS 패킷이 입력패킷으로 입력되는 경우에 있어서, 링크 레이어는 TS 패킷에 대한 오버헤드 리덕션 및/또는 인캡슐레이션 과정을 차례로 수행할 수 있다. 실시예에 따라 일부 과정은 생략될 수 있다. 오버헤드 리덕션에 있어, 링크 레이어는 싱크 바이트 제거, 널 패킷 삭제 및/또는 공통(common) 헤더 제거 (압축)을 제공할 수 있다. 싱크 바이트 제거를 통해 TS 패킷당 1 바이트의 오버헤드 리덕션이 제공될 수 있다. 수신측에서 재삽입될 수 있는 방식으로 널 패킷 삭제가 수행될 수 있다. 또한 연속된 헤더들 간의 공통되는 정보들이 수신측에서 복구될 수 있는 방식으로 삭제(압축)될 수 있다. 각 오버헤드 리덕션 과정 중 일부는 생략될 수 있다. 이 후 인캡슐레이션 과정을 통해 TS 패킷들이 링크 레이어 패킷들로 인캡슐레이션될 수 있다. TS 패킷의 인캡슐레이션에 대한 링크 레이어 패킷 구조는 다른 타입의 패킷들과는 다를 수 있다.
먼저 IP 헤더 압축(IP Header Compression) 에 대해서 설명한다.
IP 패킷은 고정된 헤더 포맷을 가지고 있으나, 통신 환경에서 필요한 일부 정보는 브로드캐스트 환경에서 불필요할 수 있다. 링크 레이어 프로토콜은 IP 패킷의 헤더를 압축함으로써 브로드캐스트 오버헤드를 줄이는 메커니즘을 제공할 수 있다.
IP 헤더 압축은 헤더 컴프레서/디컴프레서 및/또는 어댑테이션 모듈을 포함할 수 있다. IP 헤더 컴프레서(RoHC 컴프레서)는 RoHC 방식에 기초하여 각 IP 패킷 헤더의 크기를 감소시킬 수 있다. 이 후 어댑테이션 모듈은 컨텍스트 정보를 추출하고 각 패킷 스트림으로부터 시그널링 정보를 생성할 수 있다. 수신기는 해당 패킷 스트림에 관련된 시그널링 정보를 파싱하고 컨텍스트 정보를 그 패킷 스트림에 붙일(attach) 수 있다. RoHC 디컴프레서는 패킷 헤더를 복구하여 원래의 IP 패킷을 재구성할 수 있다. 이하, IP 헤더 압축이란, 헤더 컴프레서에 의한 IP 헤더 압축만을 의미할 수도 있고, IP 헤더 압축과 어댑테이션 모듈에 의한 어댑테이션 과정을 합한 개념을 의미할 수도 있다. 디컴프레싱(decompressing) 에 대해서도 마찬가지이다.
이하, 어댑테이션(Adaptation) 에 대해서 설명한다.
단방향 링크를 통한 전송의 경우, 수신기가 컨텍스트의 정보를 갖고 있지 않으면, 디컴프레서는 완전한 컨텍스트를 수신할 때까지 수신된 패킷 헤더를 복구할 수 없다. 이는 채널 변경 지연 및 턴 온 딜레이 (turn-on delay)를 초래할 수 있다. 따라서 어댑테이션 기능을 통해, 컴프레서/디컴프레서 간의 컨피규레이션 파라미터와 컨텍스트 정보가 대역 외로 전송될 수 있다. 어댑테이션 펑션(function)은 컨텍스트 정보 및/또는 컨피규레이션 파라미터들을 이용하여 링크 레이어 시그널링을 생성(construction) 할 수 있다. 어댑테이션 펑션은 예전(previous) 컨피규레이션 파라미터 및/또는 컨텍스트 정보를 이용하여 각각의 피지컬 프레임을 통해 주기적으로 링크 레이어 시그널링을 전송할 수 있다.
압축된 IP 패킷들로부터 컨텍스트 정보가 추출되는데, 어댑테이션 모드에 따라 다양한 방법이 사용될 수 있다.
모드 #1 은 압축된 패킷 스트림에 대해 어떠한 동작도 수행하지 않는 모드로서, 어댑테이션 모듈이 버퍼로서 동작하는 모드일 수 있다.
모드 #2 는 압축된 패킷 스트림 중, IR 패킷을 검출하여 컨텍스트 정보(스태틱 체인)을 추출하는 모드일 수 있다. 추출후 IR 패킷은 IR-DYN 패킷으로 전환되고, IR-DYN 패킷은 원래의 IR 패킷을 대체하여 패킷 스트림 내에서 같은 순서로 전송될 수 있다.
모드 #3 (t6020) 는 압축된 패킷 스트림 중, IR 및 IR-DYN 패킷을 검출하고 컨텍스트 정보를 추출하는 모드일 수 있다. IR 패킷으로부터 스태틱 체인 및 다이나믹 체인이, IR-DYN 패킷으로부터 다이나믹 체인이 추출될 수 있다. 추출후 IR 및 IR-DYN 패킷은 일반 압축 패킷으로 전환될 수 있다. 전환된 패킷은 원래의 IR 및 IR-DYN 패킷을 대체하여 패킷 스트림 내에서 같은 순서로 전송될 수 있다.
각 모드에서, 컨텍스트 정보가 추출되고 남은 패킷들은, 압축된 IP 패킷을 위한 링크 레이어 패킷 구조에 따라 인캡슐레이션 되어 전송될 수 있다. 컨텍스트 정보들은, 링크 레이어 시그널링으로서, 시그널링 정보를 위한 링크 레이어 패킷 구조에 따라 인캡슐레이션 되어 전송될 수 있다.
추출된 컨텍스트 정보는 RDT (RoHC-U Description Table) 에 포함되어 RoHC 패킷 플로우와 별도로 전송될 수 있다. 컨텍스트 정보는 다른 시그널링 정보와 함께 특정(specific) 피지컬 데이터 경로를 통해 전송될 수 있다. 특정 피지컬 데이터 경로란, 실시예에 따라, 일반적인 PLP 중 하나를 의미할 수도 있고, LLS (Low Level Signaling) 이 전달되는 PLP 를 의미할 수도 있고, 지정된(dedicated) PLP 일 수도 있고, L1 시그널링 패쓰(path)를 의미할 수도 있다. 여기서 RDT 는 컨텍스트 정보(스태틱 체인 및/또는 다이나믹 체인) 및/또는 헤더 컴프레션과 관련된 정보를 포함하는 시그널링 정보일 수 있다. 실시예에 따라 RDT 는 컨텍스트 정보가 바뀔 때마다 전송될 수 있다. 또한 실시예에 따라 RDT 는 매 피지컬 프레임에서 전송될 수 있다. 매 피지컬 프레임에서 RDT 를 전송하기 위해서, 예전(previous) RDT 가 재사용(re-use)될 수 있다.
수신기는 패킷 스트림을 획득하기 앞서, 최초 PLP 를 선택해 SLT, RDT, LMT 등의 시그널링 정보를 먼저 획득할 수 있다. 수신기는 이 시그널링 정보들이 획득되면, 이 들을 조합하여 서비스 - IP 정보 - 컨텍스트 정보 - PLP 간의 매핑을 획득할 수 있다. 즉, 수신기는 어떤 서비스가 어느 IP 스트림들로 전송되는지, 어떤 PLP 로 어떤 IP 스트림들이 전달되는지 등을 알 수 있고, 또한 PLP 들의 해당 컨텍스트 정보들을 획득할 수 있다. 수신기는 특정 패킷 스트림을 운반하는 PLP 를 선택하여 디코딩 할 수 있다. 어댑테이션 모듈은 컨텍스트 정보를 파싱하고 이를 압축된 패킷들과 합칠 수 있다. 이를 통해 패킷 스트림이 복구될 수 있고, 이는 RoHC 디컴프레서로 전달될 수 있다. 이후 디컴프레션이 시작될 수 있다. 이 때 수신기는 어댑테이션 모드에 따라, IR 패킷을 디텍팅하여 최초 수신된 IR 패킷으로부터 디컴프레션을 시작하거나(모드 1), IR-DYN 패킷을 디텍팅하여 최초 수신된 IR-DYN 패킷으로부터 디컴프레션을 시작하거나(모드 2), 아무 일반 압축 패킷(compressed packet)으로부터 디컴프레션을 시작할 수 있다(모드 3).
이하, 패킷 인캡슐레이션에 대해서 설명한다.
링크 레이어 프로토콜은 IP 패킷, TS 패킷 등의 모든 타입의 인풋 패킷들을 링크 레이어 패킷으로인캡슐레이션할 수 있다. 이를 통해 피지컬 레이어는 네트워크 레이어의 프로토콜 타입과는 독립적으로 하나의 패킷 포맷만 처리하면 된다(여기서 네트워크 레이어 패킷의 일종으로 MPEG-2 TS 패킷을 고려). 각 네트워크 레이어 패킷 또는 입력 패킷은 제네릭 링크 레이어 패킷의 페이로드로 변형된다.
패킷 인캡슐레이션 과정에서 분할(segmentation) 이 활용될 수 있다. 네트워크 레이어 패킷이 지나치게 커서 피지컬 레이어에서 처리하지 못하는 경우, 네트워크 레이어 패킷은 두 개 이상의 세그먼트들로 나누어질 수 있다. 링크 레이어 패킷 헤더는 송신 측에서 분할을 실행하고 수신 측에서 재결합을 실행하기 위한 필드들을 포함할 수 있다. 각 세그먼트들은 원래 위치와 같은 순서로 링크 레이어 패킷으로 인캡슐레이션될 수 있다.
패킷 인캡슐레이션 과정에서 연쇄(concatenation) 또한 활용될 수 있다. 링크 레이어 패킷의 페이로드가 여러 네트워크 레이어 패킷을 포함할 정도로 네트워크 레이어 패킷이 충분히 작은 경우, 연쇄가 수행될 수 있다. 링크 레이어 패킷 헤더는 연쇄를 실행하기 위한 필드들을 포함할 수 있다. 연쇄의 경우 각 입력 패킷들은 원래의 입력 순서와 같은 순서로 링크 레이어 패킷의 페이로드로 인캡슐레이션될 수 있다.
링크 레이어 패킷은 헤더와 페이로드를 포함할 수 있고, 헤더는 베이스 헤더, 추가(additional) 헤더 및/또는 옵셔널 헤더가 포함될 수 있다. 추가 헤더는 연쇄나 분할 등의 상황에 따라 더 추가될 수 있는데, 추가헤더에는 상황에 맞춘 필요한 필드들이 포함될 수 있다. 또한 추가적인 정보의 전달을 위해 옵셔널 헤더가 더 추가될 수도 있다. 각각의 헤더 구조는 기 정의되어 있을 수 있다. 전술한 바와 같이 입력 패킷이 TS 패킷인 경우에는, 다른 패킷들과는 다른 링크 레이어 헤더 구조가 사용될 수 있다.
이하, 링크 레이어 시그널링에 대해서 설명한다.
링크 레이어 시그널링은 IP 레이어보다 하위 레벨에서 동작할 수 있다. 수신측에서는 LLS, SLT, SLS 등의 IP 레벨 시그널링보다, 링크 레이어 시그널링을 더 빠르게 획득할 수 있다. 따라서 링크 레이어 시그널링은 세션 설정(establishment) 이전에 획득될 수 있다.
링크 레이어 시그널링에는 인터널 링크 레이어 시그널링과 익스터널 링크 레이어 시그널링이 있을 수 있다. 인터널 링크 레이어 시그널링은 링크 레이어에서 생성된 시그널링 정보일 수 있다. 전술한 RDT 나 후술할 LMT 등이 여기에 해당할 수 있다. 익스터널 링크 레이어 시그널링은 외부 모듈 또는 외부 프로토콜, 상위 레이어로부터 전달받은 시그널링 정보일 수 있다. 링크 레이어는 링크 레이어 시그널링을 링크 레이어 패킷으로 인캡슐레이션하여 전달할 수 있다. 링크 레이어 시그널링을 위한 링크 레이어 패킷 구조(헤더 구조)가 정의될 수 있는데, 이 구조에 따라 링크 레이어 시그널링 정보가 인캡슐레이션될 수 있다.
도 7 은 본 발명의 일 실시예에 따른 LMT (Link Mapping Table) 를 도시한 도면이다.
LMT 는 PLP 로 운반되는 상위 레이어 세션들의 리스트를 제공할 수 있다. 또한 LMT 는 상위 레이어 세션들을 전달하는 링크 레이어 패킷들을 프로세싱하기 위한 추가적인 정보들을 제공할 수 있다. 여기서 상위 레이어 세션은 멀티캐스트(multicast) 라고 불릴 수도 있다. LMT 를 통해 특정 PLP 를 통해 어떠한 IP 스트림들, 어떠한 전송 세션들이 전송되고 있는지에 대한정보가 획득될 수 있다. 반대로 특정 전송 세션이 어느 PLP 로 전달되는지에 대한 정보를 획득할 수 있다.
LMT 는 LLS 를 운반하는 것으로 식별된 어떤 PLP 로도 전달될 수 있다. 여기서 LLS 가 전달되는 PLP 는 피지컬 레이어의 L1 디테일 시그널링 정보의 LLS 플래그에 의해 식별될 수 있다. LLS 플래그는 각각의 PLP 에 대하여, 해당 PLP 로 LLS 가 전달되는지 여부를 지시하는 플래그 필드일 수 있다. 여기서 L1 디테일 시그널링 정보는 후술할 PLS2 데이터에 해당할 수 있다.
즉, LMT 는 LLS 와 함께, 같은 PLP 로 전달될 수 있다. 각각의 LMT 들은 전술한 바와 같이 PLP 들과 IP 어드레스/포트간의 매핑을 기술할 수 있다. 전술한 바와 같이 LLS 는 SLT 를 포함할 수 있는데, LMT 가 기술하는 이 IP 어드레스/포트들은, 해당 LMT 와 같은 PLP 로 전달되는 SLT 가 기술하는, 모든(any) 서비스와 관련된 모든(any) IP 어드레스/포트들일 수 있다.
실시예에 따라 전술한 SLT, SLS 등에서의 PLP 식별자 정보가 활용되어, SLT, SLS 가 지시하는 특정전송 세션이 어느 PLP 로 전송되고 있는지에 대한 정보가 확인될 수 있다.
다른 실시예에 따라 전술한 SLT, SLS 등에서의 PLP 식별자 정보는 생략되고, SLT, SLS 가 지시하는 특정 전송 세션에 대한 PLP 정보는 LMT 내의 정보를 참조함으로써 확인될 수 있다. 이 경우 수신기는 LMT 와 다른 IP 레벨 시그널링 정보들을 조합하여, 알고자 하는 PLP 를 식별할 수 있다. 이 실시예에 있어서도 SLT, SLS 등에서의 PLP 정보는 생략되지 않고, SLT, SLS 등에 남아있을 수 있다.
도시된 실시예에 따른 LMT 는, signaling_type 필드, PLP_ID 필드, num_session 필드 및/또는 각각의 세션들에 대한 정보들을 포함할 수 있다. 도시된 실시예의 LMT 는 하나의 PLP 에 대해서, 그 PLP 로 전송되는 IP 스트림들을 기술하고 있지만, 실시예에 따라 LMT 에 PLP 루프가 추가되어, 복수개의 PLP 에 대한 정보가 기술될 수도 있다. 이 경우 LMT 는, 전술한 바와 같이, 함께 전달되는 SLT 가 기술하는 모든 서비스와 관련된 모든 IP 어드레스/포트들에 대한 PLP 들을, PLP 루프로 기술할 수 있다.
signaling_type 필드는 해당 테이블에 의해 전달되는 시그널링 정보의 타입을 지시할 수 있다. LMT 에 대한 signaling_type 필드의 값은 0x01로 설정될 수 있다. signaling_type 필드는 생략될 수 있다. PLP_ID 필드는 기술하고자 하는 대상 PLP 를 식별할 수 있다. PLP 루프가 사용되는 경우, 각각의 PLP_ID 필드는 각각의 대상 PLP 를 식별할 수 있다. PLP_ID 필드부터는 PLP 루프 내에 포함될 수 있다. 이하 언급되는 PLP_ID 필드는 PLP 루프 중의 PLP 하나에 대한 식별자이며, 이하 설명되는 필드들은 그 해당 PLP 에 대한 필드들일 수 있다.
num_session 필드는 해당 PLP_ID 필드에 의해 식별되는 PLP 로 전달되는 상위 레이어 세션들의 개수를 나타낼 수 있다. num_session 필드가 나타내는 개수에 따라, 각각의 세션들에 대한 정보들이 포함될 수 있다. 이정보에는 src_IP_add 필드, dst_IP_add 필드, src_UDP_port 필드, dst_UDP_port 필드, SID_flag 필드, compressed_flag 필드, SID 필드 및/또는 context_id 필드가 있을 수 있다.
src_IP_add 필드, dst_IP_add 필드, src_UDP_port 필드 및 dst_UDP_port 필드는 해당 PLP_ID 필드에 의해 식별되는 PLP 로 전달되는 상위 레이어 세션들 중, 해당 전송 세션에 대한 소스 IP 어드레스, 데스티네이션 IP 어드레스, 소스 UDP 포트, 데스티네이션 UDP 포트를 나타낼 수 있다.
SID_flag 필드는 해당 전송 세션을 전달하는 링크 레이어 패킷이 그 옵셔널 헤더에 SID 필드를 갖는지 여부를 지시할 수 있다. 상위 레이어 세션을 전달하는 링크 레이어 패킷은 그 옵셔널 헤더에 SID 필드를 가질 수 있고, 그 SID 필드 값은 후술할 LMT 내의 SID 필드와 동일할 수 있다.
compressed_flag 필드는 해당 전송 세션을 전달하는 링크 레이어 패킷의 데이터들에 헤더 컴프레션이 적용되었는지 여부를 지시할 수 있다. 또한 본 필드의 값에 따라 후술할 context_id 필드의 존부가 결정될 수 있다. 헤더 컴프레션이 적용된 경우(compressed_flag = 1), RDT 가 존재할 수 있고, 그 RDT 의 PLP ID 필드는 본 compressed_flag 필드와 관련된 해당 PLP_ID 필드와 같은 값을 가질 수 있다.
SID 필드는 해당 전송 세션을 전달하는 링크 레이어 패킷들에 대한 SID (sub stream ID) 를 지시할 수 있다. 이 링크 레이어 패킷들은, 그 옵셔널 헤더에 본 SID 필드와 같은 값을 가지는 SID 를 포함하고 있을 수 있다. 이를 통해 수신기는 링크 레이어 패킷을 전부 파싱할 필요 없이, LMT 의 정보와 링크 레이어 패킷 헤더의 SID 정보를 이용하여, 링크 레이어 패킷들을 필터링할 수 있다.
context_id 필드는 RDT 내의 CID(context id) 에 대한 레퍼런스를 제공할 수 있다. RDT 의 CID 정보는 해당되는 압축 IP 패킷 스트림에 대한 컨텍스트 ID 를 나타낼 수 있다. RDT 는 해당 압축 IP 패킷 스트림에 대한 컨텍스트 정보들을 제공할 수 있다. 본 필드를 통해 RDT 와 LMT 가 연관될 수 있다.
전술한, 본 발명의 시그널링 정보/테이블의 실시예들에 있어서, 각각의 필드, 엘레멘트, 속성들은 생략되거나 다른 필드로 대체될 수 있으며, 실시예에 따라 추가적인 필드, 엘레멘트, 속성들이 추가될 수도 있다.
본 발명의 일 실시예에서, 한 서비스의 서비스 컴포넌트들이 복수개의 ROUTE 세션을 통해 전달될 수 있다. 이 경우, SLT 의 부트스트랩 정보를 통하여 SLS 가 획득될 수 있다. 이 SLS 의 USBD 를 통해 S-TSID 와 MPD 가 레퍼런싱될 수 있다. S-TSID 는 SLS 가 전달되고 있는 ROUTE 세션 뿐 아니라, 서비스 컴포넌트들이 전달되고 있는 다른 ROUTE 세션에 대한 전송 세션 디스크립션 정보 또한 기술할 수 있다. 이를 통해 복수개의 ROUTE 세션을 통해 전달되는 서비스 컴포넌트들이 모두 수집될 수 있다. 이러한 사항은 한 서비스의 서비스 컴포넌트들이 복수개의 MMTP 세션을 통해 전달되는 경우에도 유사하게 적용될 수 있다. 참고로, 하나의 서비스 컴포넌트는 복수개의 서비스에 의해 동시에 사용될 수도 있다.
본 발명의 또 다른 실시예에서, ESG 서비스에 대한 부트스트래핑은 방송망 또는 브로드밴드에 의해 수행될 수 있다. 브로드밴드를 통한 ESG 획득을 통해, SLT 의 URL 정보가 활용될 수 있다. 이 URL 로 ESG 정보 등이 요청될 수 있다.
본 발명의 또 다른 실시예에서, 한 서비스의 서비스 컴포넌트가 하나는 방송망으로 하나는 브로드밴드로 전달될 수 있다(하이브리드). S-TSID 는 방송망으로 전달되는 컴포넌트들에 대해 기술해, ROUTE 클라이언트가 원하는 서비스 컴포넌트들을 획득케 할 수 있다. 또한 USBD 는 베이스 패턴 정보를 가지고 있어, 어느 세그먼트들이(어느 컴포넌트들이) 어느 경로로 전달되는지 기술할 수 있다. 따라서 수신기는 이를 이용해, 브로드밴드 서버로 요청해야될 세그먼트는 무엇인지, 방송 스트림에서 찾아야될 세그먼트는 무엇인지 알 수 있다.
본 발명의 또 다른 실시예에서, 서비스에 대한 스케일러블(scalable) 코딩이 수행될 수 있다. USBD 는 해당 서비스를 렌더링하기 위해 필요한 모든 캐패빌리티 정보를 가질 수 있다. 예를 들어 한 서비스가 HD 또는 UHD 로 제공되는 경우, USBD 의 캐패빌리티 정보는 “HD 또는 UHD” 값을 가질 수 있다. 수신기는 MPD 를 이용하여 UHD 또는 HD 서비스를 렌더링하기 위하여 어느 컴포넌트가 재생되어야 하는지 알 수 있다.
본 발명의 또 다른 실시예에서, SLS 를 전달하는 LCT 채널로 전달되는 LCT 패킷들의 TOI 필드를 통해, 해당 LCT 패킷들이 어느 SLS 프래그먼트를 전달하고 있는지(USBD, S-TSID, MPD 등..) 가 식별될 수 있다.
본 발명의 또 다른 실시예에서, 앱 기반 인핸스먼트/ 앱 기반 서비스에 사용될 앱 컴포넌트들은 NRT 컴포넌트로서 방송망을 통해 전달되거나 브로드밴드를 통해 전달될 수 있다. 또한 앱 기반 인핸스먼트에 대한 앱 시그널링은 SLS 와 함께 전달되는 AST (Application Signaling Table) 에 의해 수행될 수 있다. 또한 앱이 수행할 동작에 대한 시그널링인 이벤트는 SLS 와 함께 EMT (Event Message Table) 형태로 전달되거나, MPD 내에 시그널링되거나, DASH 레프리젠테이션 내에 box 형태로 인밴드(in-band) 시그널링될 수 있다. AST, EMT 등은 브로드밴드를 통해 전달될 수도 있다. 수집된 앱 컴포넌트들과 이러한 시그널링 정보들을 이용해 앱 기반 인핸스먼트 등이 제공될 수 있다.
본 발명의 또 다른 실시예에서, 긴급 경보를 위해 CAP 메시지가 전술한 LLS 테이블에 포함되어 제공될 수 있다. 긴급 경보를 위한 리치 미디어(Rich Media) 컨텐츠 역시 제공될 수 있다. 리치 미디어는 CAP 메시지에 의해 시그널링될 수 있으며, 리치 미디어가 존재하는 경우 이는 SLT 에 의해 시그널링되는 EAS 서비스로서 제공될 수 있다.
본 발명의 또 다른 실시예에서, MMT 프로토콜에 따라 리니어 서비스 컴포넌트들이 방송망을 통해 전달될 수 있다. 이 경우 해당 서비스에 대한 NRT 데이터(예를 들어 앱 컴포넌트)들은 ROUTE 프로토콜에 따라 방송망을 통해 전달될 수 있다. 또한 해당 서비스에 대한 데이터가 브로드밴드를 통해 전달될 수도 있다. 수신기는 SLT 의 부트스트랩 정보를 이용해 SLS 를 전달하는 MMTP 세션에 접근할 수 있다. MMT 에 따른 SLS 의 USBD 는 MP 테이블을 레퍼런싱하여, 수신기가 MMT 프로토콜에 따라 전달되는 MPU 로 포맷된 리니어 서비스 컴포넌트들을 획득케 할 수 있다. 또한, USBD 는 S-TSID 를 더 레퍼런싱하여, 수신기가 ROUTE 프로토콜에 따라 전달되는 NRT 데이터를 획득케 할 수 있다. 또한, USBD 는 MPD 를 더 레퍼런싱하여, 브로드밴드를 통해 전달되는 데이터에 대한 재생 디스크립션을 제공할 수 있다.
본 발명의 또 다른 실시예에서, 수신기는 그 컴패니언 디바이스에 스트리밍 컴포넌트 및/또는 파일 컨텐트 아이템(파일 등)을 획득할 수 있는 로케이션 URL 정보를, 웹소켓 등의 방법을 통해 전달할 수 있다. 컴패니언 디바이스의 어플리케이션은 이 URL 로 HTTP GET 등을 통해 요청하여 해당 컴포넌트, 데이터 등을 획득할 수 있다. 그 밖에 수신기는 시스템 타임 정보, 긴급 경보 정보 등의 정보를 컴패니언 디바이스 측에 전달할 수 있다.
도 8은 본 발명의 일 실시예에 따른 차세대 방송 서비스에 대한 방송 신호 송신 장치의 구조를 나타낸다.
본 발명의 일 실시예에 따른 차세대 방송 서비스에 대한 방송 신호 송신 장치는 인풋 포맷 블록 (Input Format block) (1000), BICM (bit interleaved coding & modulation) 블록(1010), 프레임 빌딩 블록 (Frame building block) (1020), OFDM (orthogonal frequency division multiplexing) 제너레이션 블록 (OFDM generation block)(1030), 및 시그널링 생성 블록(1040)을 포함할 수 있다. 방송 신호 송신 장치의 각 블록의 동작에 대해 설명한다.
본 발명의 일 실시예에 따른 입력 데이터는 IP 스트림/패킷 및 MPEG2-TS이 주요 입력 포맷이 될 수 있으며, 다른 스트림 타입은 일반 스트림으로 다루어진다.
인풋 포맷 블록(1000)은 각각의 입력 스트림을 독립적인 코딩 및 변조가 적용되는 하나 또는 다수의 데이터 파이프로 디멀티플렉싱 할 수 있다. 데이터 파이프는 견고성(robustness) 제어를 위한 기본 단위이며, 이는 QoS (Quality of Service)에 영향을 미친다. 하나 또는 다수의 서비스 또는 서비스 컴포넌트가 하나의 데이터 파이프에 의해 전달될 수 있다. 데이터 파이프는 하나 또는 다수의 서비스 또는 서비스 컴포넌트를 전달할 수 있는 서비스 데이터 또는 관련 메타데이터를 전달하는 물리 계층(physical layer)에서의 로지컬 채널이다.
QoS가 본 발명의 일 실시예에 따른 차세대 방송 서비스에 대한 방송 신호 송신 장치에 의해 제공되는 서비스의 특성에 의존하므로, 각각의 서비스에 해당하는 데이터는 서로 다른 방식을 통해 처리되어야 한다.
BICM 블록(1010)은 MIMO가 적용되지 않는 프로파일 (또는 시스템)에 적용되는 처리 블록 및/또는 MIMO가 적용되는 프로파일(또는 시스템)의 처리 블록을 포함할 수 있으며, 각각의 데이터 파이프를 처리하기 위한 복수의 처리 블록을 포함할 수 있다.
MIMO가 적용되지 않는 BICM 블록의 처리 블록은 데이터 FEC 인코더, 비트 인터리버, 컨스텔레이션 매퍼(mapper), SSD (signal space diversity) 인코딩 블록, 타임 인터리버를 포함할 수 있다. MIMO가 적용되는 BICM 블록의 처리 블록은 셀 워드 디멀티플렉서 및 MIMO 인코딩 블록을 더 포함한다는 점에서 MIMO가 적용되지 않는 BICM의 처리 블록과 구별된다.
데이터 FEC 인코더는 외부 코딩(BCH) 및 내부 코딩(LDPC)을 이용하여 FECBLOCK 절차를 생성하기 위해 입력 BBF에 FEC 인코딩을 실행한다. 외부 코딩(BCH)은 선택적인 코딩 방법이다. 비트 인터리버는 데이터 FEC 인코더의 출력을 인터리빙하여 LDPC 코드 및 변조 방식의 조합으로 최적화된 성능을 달성할 수 있다. 컨스텔레이션 매퍼는 QPSK, QAM-16, 불균일 QAM (NUQ-64, NUQ-256, NUQ-1024) 또는 불균일 컨스텔레이션 (NUC-16, NUC-64, NUC-256, NUC-1024)을 이용해서 비트 인터리버 또는 셀 워드 디멀티플렉서로부터의 셀 워드를 변조하여 파워가 정규화된 컨스텔레이션 포인트를 제공할 수 있다. NUQ가 임의의 형태를 갖는 반면, QAM-16 및 NUQ는 정사각형 모양을 갖는 것이 관찰된다. NUQ 및 NUC는 모두 각 코드 레이트(code rate)에 대해 특별히 정의되고, PLS2 데이터의 파라미터 DP_MOD에 의해 시그널링 된다. 타임 인터리버는 데이터 파이프 레벨에서 동작할 수 있다. 타임 인터리빙의 파라미터는 각각의 데이터 파이프에 대해 다르게 설정될 수 있다.
본 발명의 타임 인터리버는 BICM 체인(BICM chain) 블록과 프레임 빌더(Frame Builder) 사이에 위치할 수 있다. 이 경우, 본 발명의 타임 인터리버는 PLP (Physical Layer Pipe) 모드에 따라 컨볼루션 인터리버(Convolution Interleaver, CI)와 블록 인터리버(Block Interleaver, BI)를 선택적으로 사용하거나, 모두 사용할 수 있다. 본 발명의 일 실시예에 따른 PLP는 상술한 DP와 동일한 개념으로 사용되는 피지컬 패스(physical path)로서, 호칭은 설계자의 의도에 따라 변경 가능하다. 본 발명의 일 실시예에 따른 PLP 모드는 방송 신호 송신기 또는 방송 신호 송신 장치에서 처리하는 PLP 개수에 따라 싱글 PLP(single PLP) 모드 또는 멀티플 PLP(multiple PLP)모드를 포함할 수 있다. 본 발명에서는 PLP 모드에 따라 서로 다른 타임 인터리빙 방법을 적용하는 타임 인터리빙을 하이브리드 타임 인터리빙(Hybrid Time Interleaving)이라 호칭할 수 있다.
하이브리드 타임 인터리버는 블록 인터리버(BI)와 컨볼루션 인터리버(CI)를 포함할 수 있다. PLP_NUM=1인 경우, 블록 인터리버는 적용되지 않고(블록인터리버 오프(off)), 컨볼루션 인터리버만 적용된다. PLP_NUM>1인 경우, 블록 인터리버와 컨볼루션 인터리버가 모두 적용(블록 인터리버 온(on))될 수 있다. PLP_NUM>1인 경우 적용되는 컨볼루션 인터리버의 구조 및 동작은 PLP_NUM=1인 경우 적용되는 컨볼루션 인터리버의 구조 및 동작과 다를 수 있다. 하이브리드 타임 디인터리버는 상술한 하이브리드 타임 인터리버의 역동작에 상응하는 동작을 수행할 수 있다.
셀 워드 디멀티플렉서는 MIMO 처리를 위해 단일 셀 워드 스트림을 이중 셀 워드 스트림으로 분리하는 데 사용된다. MIMO 인코딩 블록은 MIMO 인코딩 방식을 이용해서 셀 워드 디멀티플렉서의 출력을 처리할 수 있다. 본 발명의 MIMO 인코딩 방식은 수신기 측에서의 비교적 작은 복잡도 증가로 용량 증가를 제공하기 위한 FR-SM (full-rate spatial multiplexing)으로 정의 될 수 있다. MIMO 처리는 데이터 파이프 레벨에서 적용된다. 컨스텔레이션 매퍼 출력의 페어(pair, 쌍)인 NUQ (e1,i 및 e2,i)는 MIMO 인코더의 입력으로 공급되면 MIMO 인코더 출력 페어(pair, 쌍)(g1,i 및 g2,i)은 각각의 송신 안테나의 동일한 캐리어 k 및 OFDM 심볼 l에 의해 전송된다.
프레임 빌딩 블록(1020)은 하나의 프레임 내에서 입력 데이터 파이프의 데이터 셀을 OFDM 심볼로 매핑하고 주파수 영역 다이버시티를 위해 주파수 인터리빙을 수행할 수 있다.
본 발명의 일 실시예에 따른 프레임은 프리앰블, 하나 이상의 FSS (frame signaling symbol), 노멀 데이터 심볼로 분리된다. 프리앰블은 신호의 효율적인 송신 및 수신을 위한 기본 전송 파라미터의 집합을 제공하는 특별한 심볼이다. 프리앰블은 프레임의 기본 전송 파라미터 및 전송 타입을 시그널링 할 수 있다. 특히 프리앰블은 EAS (emergency alert service)이 현재 프레임에 제공되는지 여부를 지시할 수 있다. FSS의 주된 목적은 PLS 데이터를 전달하는 것이다. 고속 동기화 및 채널 추정, PLS 데이터의 고속 디코딩을 위해, FSS는 노멀 데이터 심볼보다 고밀도의 파일럿 패턴을 갖는다.
프레임 빌딩 블록은 데이터 파이프와 해당하는 PLS 데이터 사이의 타이밍을 조절하여 송신기 측에서 데이터 파이프와 해당하는 PLS 데이터 간의 동시성(co-time)을 보장하기 위한 딜레이 컴펜세이션(delay compensation, 지연보상) 블록, PLS, 데이터 파이프, 보조 스트림, 및 더미 셀 등을 프레임 내에서 OFDM 심볼의 액티브(active) 캐리어에 매핑하기 위한 셀 매퍼 (cell mapper) 및 프리퀀시 인터리버 (frequency interleaver)를 포함할 수 있다.
프리퀀시 인터리버는 셀 매퍼로부터 의해 수신된 데이터 셀을 랜덤하게 인터리빙하여 주파수 다이버시티를 제공할 수 있다. 또한, 프리퀀시 인터리버는 단일 프레임에서 최대의 인터리빙 이득을 얻기 위해 다른 인터리빙 시드(seed) 순서를 이용하여 두 개의 순차적인 OFDM 심볼로 구성된 OFDM 심볼 페어(pair, 쌍)에 대응하는 데이터 또는 OFDM 심볼 하나에 대응하는 데이터에 대해 동작할 수 있다.
OFDM 제너레이션 블록(1030)은 프레임 빌딩 블록에 의해 생성된 셀에 의해 OFDM 캐리어를 변조하고, 파일럿을 삽입하고, 전송을 위한 시간 영역 신호를 생성한다. 또한, 해당 블록은 순차적으로 가드 인터벌을 삽입하고, PAPR 감소 처리를 적용하여 최종 RF 신호를 생성한다.
시그널링 생성 블록(1040)은 각 기능 블록의 동작에 사용되는 물리 계층(physical layer) 시그널링 정보를 생성할 수 있다. 본 발명의 일 실시예에 따른 시그널링 정보는 PLS 데이터를 포함할 수 있다. PLS는 수신기에서 피지컬 레이어(physical layer) 데이터 파이프에 접속할 수 있는 수단을 제공한다. PLS 데이터는 PLS1 데이터 및 PLS2 데이터로 구성된다.
PLS1 데이터는 PLS2 데이터를 디코딩하는 데 필요한 파라미터뿐만 아니라 시스템에 관한 기본 정보를 전달하는 고정된 사이즈, 코딩, 변조를 갖는 프레임에서 FSS로 전달되는 PLS 데이터의 첫 번째 집합이다. PLS1 데이터는 PLS2 데이터의 수신 및 디코딩을 가능하게 하는 데 요구되는 파라미터를 포함하는 기본 송신 파라미터를 제공한다. PLS2 데이터는 데이터 파이프 및 시스템에 관한 더욱 상세한 PLS 데이터를 전달하며 FSS로 전송되는 PLS 데이터의 두 번째 집합이다. PLS2 시그널링은 PLS2 스태틱(static, 정적) 데이터(PLS2-STAT 데이터) 및 PLS2 다이나믹(dynamic, 동적) 데이터(PLS2-DYN 데이터)의 두 종류의 파라미터로 더 구성된다. PLS2 스태틱(static, 정적) 데이터는 프레임 그룹의 듀레이션 동안 스태틱(static, 정적)인 PLS2 데이터이고, PLS2 다이나믹(dynamic, 동적) 데이터는 프레임마다 다이나믹(dynamic, 동적)으로 변화하는 PLS2 데이터이다.
PLS2 데이터는 FIC_FLAG 정보를 포함할 수 있다. FIC (Fast Information Channel)은 빠른 서비스 획득 및 채널 스캔(fast service acquisition and channel scanning)을 가능하게 하는 크로스-레이어 (cross-layer) 정보를 전송하기 위한 데디케이티드 채널(dedicated channel)이다. FIC_FLAG 정보는 1비트의 필드로서, FIC((fast information channel, 고속 정보 채널)가 현 프레임 그룹에서 사용되는지 여부를 나타낸다. 해당 필드의 값이 1로 설정되면, FIC는 현 프레임에서 제공된다. 해당 필드의 값이 0으로 설정되면, FIC는 현 프레임에서 전달되지 않는다.BICM 블록(1010)은 PLS 데이터의 보호를 위한 BICM 블록을 포함할 수 있다. PLS 데이터의 보호를 위한 BICM 블록은 PLS FEC 인코더, 비트 인터리버, 및 컨스텔레이션 매퍼를 포함할 수 있다.
PLS FEC 인코더는 PLS1 데이터 및 PLS2 데이터를 스크램블링하기 위한 스크램블러, PLS 보호를 위한 쇼트닝된 BCH 코드를 이용하여 스크램블링된 PLS 1,2 데이터에 외부 인코딩을 수행하고, BCH 인코딩 후에 제로 비트를 삽입하기 위한 BCH 인코딩/제로 삽입 블록, LDPC 코드를 이용하여 인코딩을 수행하기 위한 LDPC 인코딩 블록, 및 LDPC 패리티 펑처링(puncturing) 블록을 포함할 수 있다. PLS1 데이터에 대해서만, 제로 삽입의 출력 비트가 LDPC 인코딩 전에 퍼뮤테이션(permutation) 될 수 있다.. 비트 인터리버는 각각의 쇼트닝 및 펑처링된 PLS1 데이터 및 PLS2 데이터를 인터리빙하고, 컨스텔레이션 매퍼는 비트 인터리빙된 PLS1 데이터 및 PLS2 데이터를 컨스텔레이션에 매핑할 수 있다.
본 발명의 일 실시예에 따른 차세대 방송 서비스에 대한 방송 신호 수신 장치는 도 8을 참조하여 설명한 차세대 방송 서비스에 대한 방송 신호 송신 장치의 역과정을 수행할 수 있다.
본 발명의 일 실시예에 따른 차세대 방송 서비스에 대한 방송 신호 수신 장치는 방송 신호 송신 장치에 의해 실행되는 절차의 역과정에 해당하는 복조를 실행하는 동기 및 복조 모듈 (synchronization & demodulation module), 입력 신호 프레임을 파싱하고, 사용자에 의해 선택된 서비스가 전송되는 데이터를 추출하는 프레임 파싱 모듈 (frame parsing module), 입력 신호를 비트 영역 데이터로 변환한 후, 필요에 따라 비트 영역 데이터들을 디인터리빙하고, 전송 효율을 위해 적용된 매핑에 대한 디매핑을 실행하고, 디코딩을 통해 전송 채널에서 발생한 에러를 정정하는 디매핑 및 디코딩 모듈 (demapping & decoding module), 방송 신호 송신 장치에 의해 적용되는 다양한 압축/신호 처리 절차의 역과정을 실행하는 출력 프로세서 (output processor) 및 동기 및 복조 모듈에 의해 복조된 신호로부터 PLS 정보를 획득, 처리하는 시그널링 디코딩 모듈 (signaling decoding module)을 포함할 수 있다. 프레임 파싱 모듈, 디매핑 및 디코딩 모듈, 출력 프로세서는 시그널링 디코딩 모듈로부터 출력된 PLS 데이터를 이용하여 그 기능을 실행할 수 있다.
이하 타임 인터리버를 설명한다. 본 발명의 일 실시예에 따른 타임 인터리빙 그룹은 하나의 프레임에 직접 매핑되거나 PI개의 프레임에 걸쳐 확산된다. 또한 각각의 타임 인터리빙 그룹은 하나 이상(NTI개)의 타임 인터리빙 블록으로 분리된다. 여기서 각각의 타임 인터리빙 블록은 타임 인터리버 메모리의 하나의 사용에 해당한다. 타임 인터리빙 그룹 내의 타임 인터리빙 블록은 서로 다른 개수의 XFECBLOCK을 포함할 수 있다. 일반적으로, 타임 인터리버는 프레임 생성 과정 이전에 데이터 파이프 데이터에 대한 버퍼로도 작용될 수 있다.
본 발명의 일 실시예에 따른 타임 인터리버는 트위스트된 행-열 블록 인터리버이다. 본 발명의 일 실시예에 따른 트위스트된 행-열 블록 인터리버는 첫 번째 XFECBLOCK을 타임 인터리빙 메모리의 첫 번째 열에 열 방향으로 기입하고, 두 번째 XFECBLOCK은 다음 열에 기입하고 동일한 방식으로 타임 인터리빙 블록 내의 나머지 XFECBLOCK들을 기입할 수 있다. 그리고 인터리빙 어레이에서, 셀은 첫 번째 행으로부터 (가장 왼쪽 열을 시작으로 행을 따라 오른쪽으로) 마지막 행까지 대각선 방향 판독될 수 있다. 이 경우, 타임 인터리빙 블록 내의 XFECBLOCK 개수에 상관없이 수신기 측에서 단일 메모리 디인터리빙을 달성하기 위해, 트위스트된 행-열 블록 인터리버용 인터리빙 어레이는 버츄얼 XFECBLOCK을 타임 인터리빙 메모리에 삽입할 수 있다. 이 경우, 수신기 측에서 단일 메모리 디인터리빙을 달성하기 위해 버츄얼 XFECBLOCK은 다른 XFECBLOCK 가장 앞에 삽입되어야 한다.
도 9는 본 발명의 일 실시예에 따른 타임 인터리버의 라이팅 (writing) 오퍼레이션을 나타낸다.
도면의 왼쪽에 도시된 블록은 TI 메모리 어드레스 어레이(memory address array)를 나타내며, 도면의 오른쪽에 도시된 블록은 연속한 두 개의 TI 그룹들에 대해 각각 버츄얼(virtual) FEC 블록들이 TI 그룹의 가장 앞에 각각 2개 및 1개가 삽입된 경우의 라이팅 (writing) 오퍼레이션을 나타낸다.
본 발명의 일 실시예에 따른 프리퀀시 인터리버는 심볼 페어에 대응하는 데이터들에 적용하기 위한 인터리빙 어드레스를 생성하기 위한 인터리빙 어드레스 제너레이터를 포함할 수 있다.
도 10은 본 발명의 일 실시예에 따른 프리퀀시 인터리버에 포함된 각 FFT 모드에 따른 메인-PRBS 제너레이터와 서브-PRBS 제너레이터로 구성된 인터리빙 어드레스 제너레이터의 블록 다이아그램을 나타낸 도면이다.
(a)는 8K FFT 모드에 대한 인터리빙 어드레스 제너레이터의 블록 다이아그램을 나타내고, (b)는 16K FFT 모드에 대한 인터리빙 어드레스 제너레이터의 블록 다이아그램을 나타내고, (c)는 32K FFT 모드에 대한 인터리빙 어드레스 제너레이터의 블록 다이아그램을 나타낸다.
OFDM 심볼 페어에 대한 인터리빙 과정은 하나의 인터리빙 시퀀스를 이용하며 다음과 같이 설명된다. 우선, 하나의 OFDM 심볼 Om,l 에서 인터리빙 될 사용 가능한 데이터 셀(셀 매퍼로부터의 출력 셀)은 l = 0, …, Nsym-1 에 대해 Om,l =[xm,l,0,…,xm,l,p,…,xm,l,Ndata-1] 로 정의된다. 이때 xm,l,p 는 m번째 프레임에서 l 번째 OFDM 심볼의 p 번째 셀이고, Ndata 는 데이터 셀의 개수이다. 프레임 시그널링 심볼에 대해 Ndata = CFSS 이고, 노멀 데이터에 대해 Ndata = Cdata 이며, 프레임 엣지 심볼에 대해 Ndata = CFES 이다. 또한, 인터리빙된 데이터 셀은 l = 0, …, Nsym-1 에 대해 Pm,l =[vm,l,0,…,vm,l,Ndata-1] 로 정의된다.
OFDM 심볼 페어에 대해, 인터리빙 된 OFDM 심볼 페어는 각 페어의 첫 번째 OFDM 심볼에 대해 vm,l,Hi(p) = xm,l,p, p=0,…,Ndata-1 로 주어지고, 각 페어의 두 번째 OFDM 심볼에 대해 vm,l,p = xm,l,Hi(p), p=0,…,Ndata-1 로 주어진다. 이때 Hl(p) 는 PRBS 제너레이터 및 서브-PRBS 제너레이터의 사이클릭 시프트 값(심볼 오프셋)을 기반으로 생성된 인터리빙 어드레스이다.
도 11 은 본 발명의 일 실시예에 따른 하이브리드 방송 수신 장치를 나타낸 도면이다.
하이브리드 방송 시스템은 지상파 방송망 및 인터넷 망을 연동하여 방송 신호를 송신할 수 있다. 하이브리드 방송 수신 장치는 지상파 방송망 (브로드캐스트) 및 인터넷 망 (브로드밴드)을 통해 방송 신호를 수신할 수 있다. 하이브리드 방송 수신 장치는 피지컬 레이어 모듈, 피지컬 레이어 I/F 모듈, 서비스/컨텐트 획득 컨트롤러, 인터넷 억세스 제어 모듈, 시그널링 디코더, 서비스 시그널링 매니저, 서비스 가이드 매니저, 어플리케이션 시그널링 매니저, 경보 신호 매니저, 경보 신호 파서, 타겟팅 신호 파서, 스트리밍 미디어 엔진, 비실시간 파일 프로세서, 컴포넌트 싱크로나이저, 타겟팅 프로세서, 어플리케이션 프로세서, A/V 프로세서, 디바이스 매니저, 데이터 셰어링 및 커뮤니케이션 유닛, 재분배 모듈, 컴패니언 디바이스 및/또는 외부 모듈들을 포함할 수 있다.
피지컬 레이어 모듈 (Physical Layer Module(s))은 지상파 방송 채널을 통하여 방송 관련 신호를 수신 및 처리하고 이를 적절한 형태로 변환하여 피지컬 레이어 I/F 모듈로 전달할 수 있다.
피지컬 레이어 I/F 모듈 (Physical Layer I/F Module(s))은 Physical layer Module로 부터 획득된 정보로부터 IP 데이터 그램을 획득할 수 있다. 또한, 피지컬 레이어 I/F 모듈은 획득된 IP 데이터그램 등을 특정 프레임(예를 들어 RS Frame, GSE 등) 으로 변환할 수 있다.
서비스/컨텐트 획득 컨트롤러 (Service/Content Acquisition Controller)는 broadcast 및/또는 broadband 채널을 통한 서비스, 콘텐츠 및 이와 관련된 시그널링 데이터 획득을 위한 제어 동작을 수행할 수 있다.
인터넷 억세스 제어 모듈(Internet Access Control Module(s))은 Broadband 채널을 통하여 서비스, 콘텐츠 등을 획득하기 위한 수신기 동작을 제어할 수 있다.
시그널링 디코더 (Signaling Decoder)는 broadcast 채널 등을 통하여 획득한 시그널링 정보를 디코딩할 수 있다.
서비스 시그널링 매니저 (Service Signaling Manager)는 IP 데이터 그램 등으로부터 서비스 스캔 및 서비스/콘텐츠 등과 관련된 시그널링 정보 추출, 파싱 및 관리할 수 있다.
서비스 가이드 매니저 (Service Guide Manager)는 IP 데이터 그램 등으로 부터 announcement 정보를 추출하고 SG(Service Guide) database 관리하며, service guide를 제공할 수 있다.
어플리케이션 시그널링 매니저 (App Signaling Manager)는 IP 데이터 그램 등으로 부터 애플리케이션 획득 등과 관련된 시그널링 정보 추출, 파싱 및 관리할 수 있다.
경보 신호 파서 (Alert Signaling Parser)는 IP 데이터 그램 등으로 부터 alerting 관련된 시그널링 정보 추출 및 파싱, 관리할 수 있다.
타겟팅 신호 파서 (Targeting Signaling Parser)는 IP 데이터 그램 등으로 부터 서비스/콘텐츠 개인화 혹은 타겟팅 관련된 시그널링 정보 추출 및 파싱, 관리할 수 있다. 또한 타겟팅 신호 파서는 파싱된 시그널링 정보를 타겟팅 프로세서로 전달할 수 있다.
스트리밍 미디어 엔진 (Streaming Media Engine)은 IP 데이터그램 등으로 부터 A/V 스트리밍을 위한 오디오/비디오 데이터 추출 및 디코딩할 수 있다.
비실시간 파일 프로세서 (Non-real time File Processor)는 IP 데이터그램 등으로 부터 NRT 데이터 및 application 등 파일 형태 데이터 추출 및 디코딩, 관리할 수 있다.
컴포넌트 싱크로나이저 (Component Synchronizer)는 스트리밍 오디오/비디오 데이터 및 NRT 데이터 등의 콘텐츠 및 서비스를 동기화할 수 있다.
타겟팅 프로세서 (Targeting Processor)는 타겟팅 신호 파서로부터 수신한 타겟팅 시그널링 데이터에 기초하여 서비스/콘텐츠의 개인화 관련 연산을 처리할 수 있다.
어플리케이션 프로세서 (App Processor)는 application 관련 정보 및 다운로드 된 application 상태 및 디스플레이 파라미터 처리할 수 있다.
A/V 프로세서 (A/V Processor)는 디코딩된 audio 및 video data, application 데이터 등을 기반으로 오디오/비디오 랜더링 관련 동작을 수행할 수 있다.
디바이스 매니저 (Device Manager)는 외부 장치와의 연결 및 데이터 교환 동작을 수행할 수 있다. 또한 디바이스 매니저는 연동 가능한 외부 장치의 추가/삭제/갱신 등 외부 장치에 대한 관리 동작을 수행할 수 있다.
데이터 셰어링 및 커뮤니케이션 유닛 (Data Sharing & Comm.)은 하이브리드 방송 수신기와 외부 장치 간의 데이터 전송 및 교환에 관련된 정보를 처리할 수 있다. 여기서, 전송 및 교환 가능한 데이터는 시그널링, A/V 데이터 등이 될 수 있다.
재분배 모듈 (Redistribution Module(s))은 방송 수신기가 지상파 방송 신호를 직접 수신 하지 못하는 경우 차세대 방송 서비스 및 콘텐츠에 대한 관련 정보를 획득할 수 있다. 또한 재분배 모듈은 방송 수신기가 지상파 방송 신호를 직접 수신 하지 못하는 경우 차세대 방송 시스템에 의한 방송 서비스 및 콘텐츠 획득을 지원할 수 있다.
컴패니언 디바이스 (Companion device(s))는 본 발명의 방송 수신기에 연결되어 오디오, 비디오, 또는 시그널링 포함데이터를 공유할 수 있다. 컴패니언 디바이스는 방송 수신기와 연결된 외부 장치를 지칭할 수 있다.
외부 모듈 (External Management)는 방송 서비스/콘텐츠 제공을 위한 모듈을 지칭할 수 있으며 예를들어 차세대 방송 서비스/컨텐츠 서버가 될 수 있다. 외부 모듈은 방송 수신기와 연결된 외부 장치를 지칭할 수 있다.
도 12 는 본 발명의 일 실시예에 따른 DASH 기반 적응형(Adaptive) 스트리밍 모델의 전반적인 동작을 도시한 도면이다.
본 발명은 캡션을 포함하는 컨텐트를 제공하는 차세대 미디어 서비스 제공 방안을 제안한다. 캡션 정보가 제공되는 경우에 있어, 본 발명은 이와 관련한 메타데이터 및 그 전달방안을 제안한다. 이를 통해 적응적으로 컨텐트가 조정될 수 있고, 컨텐트가 캡션과 함께 제공될 수 있다.
UHD 방송 등의 경우, 기존의 컨텐트들이 표현하지 못했던 밝기가 표현될 수 있어, 고도의 현장감이 제공될 수 있다. HDR 의 도입으로 컨텐트 영상의 밝기의 표현 범위가 증가되어, 컨텐트의 장면별 특성의 차이가 이전보다 커질 수 있다. 또한 HDR과 함께 캐션을 효과적으로 디스플레이에 나타내기 위하여, 메타데이터가 정의되고 이 것들이 수신기로 전달될 수 있다. 수신기에서는 전달받은 메타데이터들을 기반으로, 서비스 프로바이더가 의도한 바에 따라 또는 수신기의 성능에 따라 적절하게 컨텐트의 영상이 제공될 수 있다.
본 발명은 ISOBMFF 등의 미디어 파일을 기반으로, 캡션을 디스플레이하는 방법 등을 시그널링하는 방안을 제안한다. 본 발명은 비디오 트랙(스트림)과 관련된 캡션 정보를 저장하고 시그널링하는 방안을 제안한다. 본 발명은 비디오 샘플, 비디오 샘플 그룹 또는 비디오 샘플 엔트리에 관련된 캐션 정보르 저장하고 시그널링하는 방안을 제안한다.
본 발명에 따른 캡션 정보의 저장/전달 방안은, 3D를 지원하는 컨텐트의 생성에 있어 활용될 수 있다. 즉, 캡션을 지원하는 컨텐트에 대한 미디어 파일의 생성, MPEG DASH 상에서 동작하는 DASH 세그먼트의 생성 또는 MPEG MMT 상에서 동작하는 MPU 생성시에, 본 발명의 방안이 활용될 수 있다. 수신기(DASH 클라이언트, MMT 클라이언트 등을 포함)는, 디코더 등에서 캡션 정보(플래그, 파라미터, 박스 등등)를 획득하여, 이를 기반으로 해당 컨텐트를 효과적으로 제공할 수 있다.
도시된 실시예에 따른 DASH 기반 적응형 스트리밍 모델은, HTTP 서버와 DASH 클라이언트 간의 동작을 기술하고 있다. 여기서 DASH (Dynamic Adaptive Streaming over HTTP) 는, HTTP 기반 적응형 스트리밍을 지원하기 위한 프로토콜로서, 네트워크 상황에 따라 동적으로 스트리밍을 지원할 수 있다. 이에 따라 AV 컨텐트 재생이 끊김없이 제공될 수 있다.
먼저 DASH 클라이언트는 MPD 를 획득할 수 있다. MPD 는 HTTP 서버 등의 서비스 프로바이더로부터 전달될 수 있다. MPD 는 전술한 딜리버리 실시예에 따라 전달될 수도 있다. DASH 클라이언트는 MPD 에 기술된 세그먼트에의 접근 정보를 이용하여 서버로 해당 세그먼트들을 요청할 수 있다. 여기서 이 요청은 네트워크 상태를 반영하여 수행될 수 있다.
DASH 클라이언트는 해당 세그먼트를 획득한 후, 이를 미디어 엔진에서 처리하여 화면에 디스플레이할 수 있다. DASH 클라이언트는 재생 시간 및/또는 네트워크 상황 등을 실시간으로 반영하여, 필요한 세그먼트를 요청, 획득할 수 있다(Adaptive Streaming). 이를 통해 컨텐트가 끊김없이 재생될 수 있다.
MPD (Media Presentation Description) 는 DASH 클라이언트로 하여금 세그먼트를 동적으로 획득할 수 있도록 하기 위한 상세 정보를 포함하는 파일로서 XML 형태로 표현될 수 있다. 이 MPD 는 실시예에 따라 전술한 MPD 와 같을 수 있다.
DASH 클라이언트 컨트롤러(DASH Client Controller) 는 네트워크 상황을 반영하여 MPD 및/또는 세그먼트를 요청하는 커맨드를 생성할 수 있다. 또한, 이 컨트롤러는 획득된 정보를 미디어 엔진 등등의 내부 블락에서 사용할 수 있도록 제어할 수 있다.
MPD 파서(Parser) 는 획득한 MPD 를 실시간으로 파싱할 수 있다. 이를 통해, DASH 클라이언트 컨트롤러는 필요한 세그먼트를 획득할 수 있는 커맨드를 생성할 수 있게 될 수 있다.
세그먼트 파서(Parser) 는 획득한 세그먼트를 실시간으로 파싱할 수 있다. 세그먼트에 포함된 정보들에 따라 미디어 엔진 등의 내부 블락들은 특정 동작을 수행할 수 있다.
HTTP 클라이언트는 필요한 MPD 및/또는 세그먼트 등을 HTTP 서버에 요청할 수 있다. 또한 HTTP 클라이언트는 서버로부터 획득한 MPD 및/또는 세그먼트들을 MPD 파서 또는 세그먼트 파서로 전달할 수 있다.
미디어 엔진(Media Engine) 은 세그먼트에 포함된 미디어 데이터를 이용하여 컨텐트를 화면상에 표시할 수 있다. 이 때, MPD 의 정보들이 활용될 수 있다.
도 13 은 본 발명의 일 실시예에 따른 수신기의 블락 다이어그램을 도시한 도면이다.
도시된 실시예에 따른 수신기는 튜너 (Tuner), 피지컬 레이어 컨트롤러 (Physical Layer Controller), 피지컬 프레임 파서 (Physical Frame Parser), 링크 레이어 프레임 프로세서 (Link Layer Frame Processor), IP/UDP 데이터그램 필터 (IP/UDP Datagram Filter), DTV 컨트롤 엔진 (DTV Control Engine), ROUTE 클라이언트 (Route Client), 세그먼트 버퍼 컨트롤 (Segment Buffer Control), MMT 클라이언트 (MMT Client), MPU 리컨트스럭션 (MPU reconstruction), 미디어 프로세서 (Media Processor), 시그널링 파서 (Signaling Parser), DASH 클라이언트 (DASH Client), ISO BMFF 파서 (ISO BMFF Parser), 미디어 디코더 (Media Decoder) 및/또는 HTTP 억세스 클라이언트 (HTTP Access Client) 를 포함할 수 있다. 수신기의 각 세부 블락(block)들은 하드웨어인 프로세서일 수 있다.
Tuner는 지상파 방송 채널을 통하여 방송 신호를 수신 및 처리하고 이를 적절한 형태 (Physical Frame 등)로 변환할 수 있다. Physical Layer Controller는 수신하고자 하는 방송 채널의 RF 정보 등을 이용하여 Tuner, Physical Frame Parser 등의 동작을 제어할 수 있다. Physical Frame Parser는 수신된 Physical Frame을 파싱하고 이와 관련된 프로세싱을 통하여 Link Layer Frame 등을 획득할 수 있다.
Link Layer Frame Processor는 Link Layer Frame으로 부터 Link Layer signaling 등을 획득하거나 IP/UDP 데이터그램 획득하고 관련된 연산을 수행할 수 있다. IP/UDP Datagram Filter는 수신된 IP/UDP 데이터 그램들로부터 특정 IP/UDP 데이터 그램을 필터링할 수 있다. DTV Control Engine은 각 구성 간의 인터페이스를 담당하며 파라미터 등의 전달을 통해 각 구성의 동작을 제어할 수 있다.
Route Client는 실시간 오브젝트 전송을 지원하는 ROUTE (Real-Time Object Delivery over Unidirectional Transport) 패킷을 처리하고 여러 패킷들을 수집 및 처리하여 하나 이상의 ISOBMFF (ISO Base Media File Format) 오브젝트를 생성할 수 있다. Segment Buffer Control는 Route Client와 Dash Client 간의 세그먼트 (segment) 전송 관련한 버퍼를 제어할 수 있다.
MMT Client는 실시간 오브젝트 전송을 지원하는 MMT (MPEG Media Transport) 전송 프로토콜 패킷을 처리하고 여러 패킷을 수집 및 처리할 수 있다. MPU reconstruction는 MMTP 패킷으로부터 MPU (Media Processing Unit)을 재구성할 수 있다. Media Processor는 재구성된 MPU를 수집하고 처리할 수 있다.
Signaling Parser는 DTV 방송 서비스 관련 시그널링 (Link Layer/ Service Layer Signaling) 획득 및 파싱하고 이를 기반으로 채널 맵 등을 생성 및/또는 관리할 수 있다. 이 구성은 로우 레벨 시그널링, 서비스 레벨 시그널링을 처리할 수 있다.
DASH Client는 실시간 스트리밍 혹은 적응적 스트리밍 관련 연산 및 획득된 DASH Segment 등을 처리할 수 있다. ISO BMFF Parser는 ISO BMFF 오브젝트로부터 오디오/비디오의 데이터 및 관련 파라미터 등을 추출할 수 있다. Media Decoder는 수신된 audio 및 video data를 decoding 및/또는 presentation 처리할 수 있다. HTTP Access Client는 HTTP 서버로부터 특정 정보를 요청하고 요청에 대한 응답을 처리할 수 있다.
도 14 는 본 발명의 일 실시예에 따른 미디어 파일의 구조를 도시한 도면이다.
오디오 또는 비디오 등의 미디어 데이터를 저장하고 전송하기 위하여, 정형화된 미디어 파일 포맷이 정의될 수 있다. 실시예에 따라 본 발명의 미디어 파일은 ISO BMFF (ISO base media file format) 를 기반으로한 파일 포맷을 가질 수 있다.
본 발명에 따른 미디어 파일은 적어도 하나 이상의 박스를 포함할 수 있다. 여기서 박스(box)는 미디어 데이터 또는 미디어 데이터에 관련된 메타데이터 등을 포함하는 데이터 블락 내지 오브젝트일 수 있다. 박스들은 서로 계층적 구조를 이룰 수 있으며, 이에 따라 데이터들이 분류되어 미디어 파일이 대용량 미디어 데이터의 저장 및/또는 전송에 적합한 형태를 띄게 될 수 있다. 또한 미디어 파일은, 사용자가 미디어 컨텐츠의 특정지점으로 이동하는 등, 미디어 정보에 접근하는데 있어 용이한 구조를 가질 수 있다.
본 발명에 따른 미디어 파일은 ftyp 박스, moov 박스 및/또는 mdat 박스를 포함할 수 있다.
ftyp 박스(파일 타입 박스)는 해당 미디어 파일에 대한 파일 타입 또는 호환성 관련 정보를 제공할 수 있다. ftyp 박스는 해당 미디어 파일의 미디어 데이터에 대한 구성 버전 정보를 포함할 수 있다. 복호기는 ftyp 박스를 참조하여 해당 미디어 파일을 구분할 수 있다.
moov 박스(무비 박스)는 해당 미디어 파일의 미디어 데이터에 대한 메타 데이터를 포함하는 박스일 수 있다. moov 박스는 모든 메타 데이터들을 위한 컨테이너 역할을 할 수 있다. moov 박스는 메타 데이터 관련 박스들 중 최상위 계층의 박스일 수 있다. 실시예에 따라 moov 박스는 미디어 파일 내에 하나만 존재할 수 있다.
mdat 박스(미디어 데이터 박스) 는 해당 미디어 파일의 실제 미디어 데이터들을 담는 박스일 수 있다. 미디어 데이터들은 오디오 샘플 및/또는 비디오 샘플들을 포함할 수 있는데, mdat 박스는 이러한 미디어 샘플들을 담는 컨테이너 역할을 할 수 있다.
실시예에 따라 전술한 moov 박스는 mvhd 박스, trak 박스 및/또는 mvex 박스 등을 하위 박스로서 더 포함할 수 있다.
mvhd 박스(무비 헤더 박스)는 해당 미디어 파일에 포함되는 미디어 데이터의 미디어 프리젠테이션 관련 정보를 포함할 수 있다. 즉, mvhd 박스는 해당 미디어 프리젠테이션의 미디어 생성시간, 변경시간, 시간규격, 기간 등의 정보를 포함할 수 있다.
trak 박스(트랙 박스)는 해당 미디어 데이터의 트랙에 관련된 정보를 제공할 수 있다. trak 박스는 오디오 트랙 또는 비디오 트랙에 대한 스트림 관련 정보, 프리젠테이션 관련 정보, 액세스 관련 정보 등의 정보를 포함할 수 있다. trak 박스는 트랙의 개수에 따라 복수개 존재할 수 있다.
trak 박스는 실시예에 따라 tkhd 박스(트랙 헤더 박스)를 하위 박스로서 더 포함할 수 있다. tkhd 박스는 trak 박스가 나타내는 해당 트랙에 대한 정보를 포함할 수 있다. tkhd 박스는 해당 트랙의 생성시간, 변경시간, 트랙 식별자 등의 정보를 포함할 수 있다.
mvex 박스(무비 익스텐드 박스)는 해당 미디어 파일에 후술할 moof 박스가 있을 수 있음을 지시할 수 있다. 특정 트랙의 모든 미디어 샘플들을 알기 위해서, moof 박스들이 스캔되어야할 수 있다.
본 발명에 따른 미디어 파일은, 실시예에 따라, 복수개의 프래그먼트로 나뉘어질 수 있다(t14010). 이를 통해 미디어 파일이 분할되어 저장되거나 전송될 수 있다. 미디어 파일의 미디어 데이터들(mdat 박스)은 복수개의 프래그먼트로 나뉘어지고, 각각의 프래그먼트는 moof 박스와 나뉘어진 mdat 박스를 포함할 수 있다. 실시예에 따라 프래그먼트들을 활용하기 위해서는 ftyp 박스 및/또는 moov 박스의 정보가 필요할 수 있다.
moof 박스(무비 프래그먼트 박스)는 해당 프래그먼트의 미디어 데이터에 대한 메타 데이터를 제공할 수 있다. moof 박스는 해당 프래그먼트의 메타데이터 관련 박스들 중 최상위 계층의 박스일 수 있다.
mdat 박스(미디어 데이터 박스)는 전술한 바와 같이 실제 미디어 데이터를 포함할 수 있다. 이 mdat 박스는 각각의 해당 프래그먼트에 해당하는 미디어 데이터들의 미디어 샘플들을 포함할 수 있다.
실시예에 따라 전술한 moof 박스는 mfhd 박스 및/또는 traf 박스 등을 하위 박스로서 더 포함할 수 있다.
mfhd 박스(무비 프래그먼트 헤더 박스)는 분할된 복수개의 프래그먼트들 간의 연관성과 관련한 정보들을 포함할 수 있다. mfhd 박스는 시퀀스 넘버(sequence number) 를 포함하여, 해당 프래그먼트의 미디어 데이터가 분할된 몇 번째 데이터인지를 나타낼 수 있다. 또한, mfhd 박스를 이용하여 분할된 데이터 중 누락된 것은 없는지 여부가 확인될 수 있다.
traf 박스(트랙 프래그먼트 박스)는 해당 트랙 프래그먼트에 대한 정보를 포함할 수 있다. traf 박스는 해당 프래그먼트에 포함되는 분할된 트랙 프래그먼트에 대한 메타데이터를 제공할 수 있다. traf 박스는 해당 트랙 프래그먼트 내의 미디어 샘플들이 복호화/재생될 수 있도록 메타데이터를 제공할 수 있다. traf 박스는 트랙 프래그먼트의 개수에 따라 복수개 존재할 수 있다.
실시예에 따라 전술한 traf 박스는 tfhd 박스 및/또는 trun 박스 등을 하위 박스로서 더 포함할 수 있다.
tfhd 박스(트랙 프래그먼트 헤더 박스)는 해당 트랙 프래그먼트의 헤더 정보를 포함할 수 있다. tfhd 박스는 전술한 traf 박스가 나타내는 트랙 프래그먼트의 미디어 샘플들에 대하여, 기본적인 샘플크기, 기간, 오프셋, 식별자 등의 정보를 제공할 수 있다.
trun 박스(트랙 프래그먼트 런 박스)는 해당 트랙 프래그먼트 관련 정보를 포함할 수 있다. trun 박스는 미디어 샘플별 기간, 크기, 재생시점 등과 같은 정보를 포함할 수 있다.
전술한 미디어 파일 내지 미디어 파일의 프래그먼트들은 세그먼트들로 처리되어 전송될 수 있다. 세그먼트에는 초기화 세그먼트(initialization segment) 및/또는 미디어 세그먼트(media segment) 가 있을 수 있다.
도시된 실시예(t14020)의 파일은, 미디어 데이터는 제외하고 미디어 디코더의 초기화와 관련된 정보 등을 포함하는 파일일 수 있다. 이 파일은 예를 들어 전술한 초기화 세그먼트에 해당할 수 있다. 초기화 세그먼트는 전술한 ftyp 박스 및/또는 moov 박스를 포함할 수 있다.
도시된 실시예(t14030)의 파일은, 전술한 프래그먼트를 포함하는 파일일 수 있다. 이 파일은 예를 들어 전술한 미디어 세그먼트에 해당할 수 있다. 미디어 세그먼트는 전술한 moof 박스 및/또는 mdat 박스를 포함할 수 있다. 또한, 미디어 세그먼트는 styp 박스 및/또는 sidx 박스를 더 포함할 수 있다.
styp 박스(세그먼트 타입 박스) 는 분할된 프래그먼트의 미디어 데이터를 식별하기 위한 정보를 제공할 수 있다. styp 박스는 분할된 프래그먼트에 대해, 전술한 ftyp 박스와 같은 역할을 수행할 수 있다. 실시예에 따라 styp 박스는 ftyp 박스와 동일한 포맷을 가질 수 있다.
sidx 박스(세그먼트 인덱스 박스) 는 분할된 프래그먼트에 대한 인덱스를 나타내는 정보를 제공할 수 있다. 이를 통해 해당 분할된 프래그먼트가 몇번째 프래그먼트인지가 지시될 수 있다.
실시예에 따라(t14040) ssix 박스가 더 포함될 수 있는데, ssix 박스(서브 세그먼트 인덱스 박스)는 세그먼트가 서브 세그먼트로 더 나뉘어지는 경우에 있어, 그 서브 세그먼트의 인덱스를 나타내는 정보를 제공할 수 있다.
미디어 파일 내의 박스들은, 도시된 실시예(t14050)와 같은 박스 내지 풀 박스(FullBox) 형태를 기반으로, 더 확장된 정보들을 포함할 수 있다. 이 실시예에서 size 필드, largesize 필드는 해당 박스의 길이를 바이트 단위 등으로 나타낼 수 있다. version 필드는 해당 박스 포맷의 버전을 나타낼 수 있다. type 필드는 해당 박스의 타입 내지 식별자를 나타낼 수 있다. flags 필드는 해당 박스와 관련된 플래그 등을 나타낼 수 있다.
도 15는 본 발명의 일 실시예에 따른 색공간 (color space)에 대한 자막 관련 정보의 신택스를 나타낸 도면이다. 방송 신호와 함께 전송되는 자막 관련 정보는 다음과 같은 사항들이 고려될 수 있다. 첫째로, 디자인의 호환성 (Compatibility of design)이 고려될 수 있다. 자막 정보는 미디어 컨텐트에 대한 디자인 호환성을 가져야 하며, 디자인 호환성이란 해당 자막 정보가 복수의 서로 다른 어플리케이션에 대해 별도의 작업 없이도 공통적으로 사용될 수 있는 특성으로 정의될 수 있다. 즉, 디자인 호환성은 자막 정보가 1회적으로 구현 (single implementation)되면, 해당 자막 정보가 복수의 어플리케이션들에 대해 복수 회 적용될 수 있음을 나타낼수 있다. 둘째로, 텍스트의 시인성 (visibility of tex)이 고려될 수 있다. 자막 정보에 포함된 텍스트의 가시성은 자막을 제작하는 사람이 의도한 바 대로 유지될 수 있어야 한다. 셋째로 개인화 (personalization)가 고려될 수 있다. 자막 정보는 사용자의 설정 (setting)에 기초하여 자막의 속성, 예를 들어 폰트 사이즈, 색상 등을 나타내는 속성이 변경될 수 있다. 이러한 고려 사항들에 기초하여 본 발명에서는 방송 시스템을 위한 자막 정보를 생성하기 위해 TTML의 한 종류인 SMPTE-TT (society of motion picture and television engineers (SMPTE) timed text) 를 사용하는 것을 제안할 수 있다. 자막 정보는 자막 텍스트뿐만 아니라, 자막 텍스트를 위한 메타 데이터를 더 포함할 수 있다. 아래에서는 TTML 내에서 메타데이터를 추가하여 전달하는 시그널링 방법에 대해 설명한다. 이러한 메타 데이터는 자막의 시인성을 위한 정보, 자막의 사용자 제어(user control)를 위한 정보, 자막의 프리젠테이션 타이밍 정보를 포함할 수 있다. 자막의 시인성을 위한 정보는 자막 제작자에 의해 의도된 컬러 스페이스 (intended color space), 3D 자막 서포트 정보, 스크롤링 정보를 포함할 수 있다. 자막의 사용자 제어를 위한 정보는 자막에 대한 사용자 제어가 가능한 경우, 자막 영역 (caption regions)의 사이즈 내에서 변이 (variation)를 허용하기 위한 정보를 포함할 수 있다. 또한 자막의 프리젠테이션 타이밍 정보는 프리젠테이션의 기준 시점 (anchor time)을 나타낼 수 있다.
인텐디드 컬러 스페이스 (intended color space)에 대한 정보는 다음과 같은 효과를 제공할 수 있다. 인텐디드 컬러 스페이스는 자막 제작자가 sRGB (standard RGB) 외의 다른 색공간을 사용할 수 있도록 한다. 인텐디드 컬러 스페이스에 대한 정보는 자막 텍스트 및 자막 영역을 위한 색공간을 정의하는 정보를 구체화할 수 있다. 여기서 자막 영역의 색공간은 foreground 및 background의 색상에 대해 각각 정의될 수 있다. 인텐디드 컬러 스페이스에 대한 정보를 정의하는 방법은 두 가지가 있을 수 있다. 첫째로, 기존에 명명된 색공간의 이름을 기술하는 방법이다. 예를 들어 BT. 2020, DCI-P3와 같이 기존에 정의된 색공간의 이름을 메타데이터 내에서 기술할 수 있다. 도시된 바와 같이, 색공간에 대한 메타 데이터가 “BT709” 또는 “BT2020”를 기술하는 경우, 색공간 BT709 또는 BT2020에 대해 이미 정의된 색공간 수치들이 색공간 정보로써 이용될 수 있다. 예를 들어 메타데이터 내에 BT709 가 기술된 경우, xRed, yRed, xGreen, yGreen, xBlue, yBlue, xWhite, yWhite 는 각각 6400, 3300, 3000, 6000, 1500, 600, 3127, 3290의 값을 가질 수 있다. 둘째로, 컬러 스페이스와 연관된 red, green, blue, 및 white 포인트의 CIExy coordinate을 직접 기술할 수도 있다. 이 방법은 색공간의 플렉서블한 기술을 위한 보다 일반적인 접근 방법이 될 수 있다. 도시된 신택스에서 xRed, yRed, xGreen, yGreen, xBlue, yBlue, xWhite, yWhite 는 컬러 스페이스와 연관된 red, green, blue, 및 white 포인트의 CIExy coordinate의 오리지널 밸류의 10000 배의 값으로 나타내질 수 있다.
도 16은 본 발명의 일 실시예에 따른 색 확장에 대한 메타데이터를 나타낸 도면이다. 전술한 컬러 스페이스에 대한 정보와 함께, 전술한 foreground 및 background의 색상을 기술하기 위해 색 확장 (color extension)에 대한 메타데이터가 추가로 정의될 수 있다. 이 경우 인텐디드 컬러 스페이스에 대한 정보는 8비트 이상을 포함할 수 있다. foreground 에 대한 색확장 정보는 메타데이터 내에서 tts:colorExt 로 정의될 수 있다. 컬러 정보를 위해 8 비트 이상이 사용되는 경우, tts:colorExt 어트리뷰트는 특정 위치로 이동(flow)되는 컨텐트에 의해 생성되는 영역과 관련된 마크의 foreground color를 정의하기 위해 사용될 수 있다. (tts:colorExt This attribute is used to is used to specify a property that defines the foreground color of marks associated with an area generated by content flowed into a region when more than 8 bits are used for color.) tts:colorExt의 밸류는 <colorExt>에 의해 정의 될 수 있으며, 적용대상은 span이 될 수 있다. background 에 대한 색확장 정보는 메타데이터 내에서 tts:backgroundColorExt 로 정의될 수 있다. 이 어트리뷰트는 sRGB 이외의 다른 색공간이 적용가능한 경우, 어떤 영역의 백그라운드 컬러를 정의하기 위해 사용되거나, 또는 어떤 영역으로 이동(flow)되는 컨텐트에 의해 생성되는 area의 백그라운드 컬러를 정의하기 위해 사용될 수 있다. (tts:backgroundColorExt This attribute is used to specify a property that defines the background color of a region or an area generated by content flowed into a region when other color space rather than SRGB color space is applicable.) tts: backgroundColorExt 의 밸류는 <colorExt>에 의해 정의 될 수 있으며, 적용대상은 body, div, p, region, span 이 될 수 있다. 도면 하단에 도시된 <colorExt>는 색 확장에 적용되는 색상의 밸류를 나타낼 수 있으며, 그 크기에 따라 r-value, g-value, b-value 및/또는 a-value를 나타낼 수 있다.
도 17은 본 발명의 일 실시예에 따른 자막의 스크롤링 서포트를 위한 메타데이터를 나타낸다. 스크롤링 서포트 정보는 자막 제작자가 의도한 스크롤 효과 (intended scroll effect)에 대한 디스크립션을 제공할 수 있다. 스크롤링 서포트 정보는 자연스럽고 부드러운 스크롤링 효과를 위한 정보를 포함할 수 있다. 여기서 스크롤링이란 이전 시점의 자막 패러그래프를 제거하고 새로운 자막 패러그래프를 디스플레이하는 것을 의미할 수 있다. 자막의 스크롤링 서포트를 위한 메타데이터는 스크롤 방향 및 스크롤의 양(amount)을 기술할 수 있다. 여기서 스크롤의 양은 셀 또는 픽셀 단위가 사용될 수 있다. 도면 상단은 자막 영역에 실제로 디스플레이되는 자막을 나타내고, 도면 하단은 자막 메타데이터를 나타낸다. 자막 메타데이터에서는 스크롤 디렉션에 대해 bottom2top을 정의하고 있으며, 스크롤의 양은 line 1으로 정의하고 있다. 따라서 자막에 대한 스크롤이 요구되는 경우, 자막은 line 1 씩 아래에서 위쪽 방향 (bottom to top)으로 스크롤될 수 있다. 자막 메타데이터는 00:00:00 부터 00:00:08 까지 “The snow glows white on the mountain”, 00:00:04 부터 00:00:12 까지 “not a footprint to be seen”, 00:00:08 부터 00:00:16 까지 "A kingdom of isolation and it looks like Queen”이 디스플레이됨을 기술하고 있다. 따라서 도면 상단에 도시된 바와 같이, 0s에서 4s까지는 제1 자막 영역에 패러그래프 “The snow glows white on the mountain”가 디스플레이되고, 4s부터 8s까지는 “The snow glows white on the mountain” 및 “not a footprint to be seen”가 디스플레이될 수 있다. 또한 8s에서 12s까지는 “not a footprint to be seen” 및 “A kingdom of isolation and it looks like Queen”이 디스플레이될 수 있다. 특히 8s 에서는 새롭게 “A kingdom of isolation and it looks like Queen” 패러그래프가 추가되므로, 스크롤 방향 및 스크롤 양에 대한 정보에 기초하여 아래에서 위쪽 방향으로 1 line이 스크롤될 수 있다. 결과적으로 이전 시점의 패러그래프인 “The snow glows white on the mountain”가 제1 자막 영역에서 스크롤 아웃될 수 있다.
도 18은 본 발명의 일 실시예에 따른 자막의 스크롤링 서포트를 위한 메타데이터를 나타낸다. tts:scrollDirection은 자막 영역 내에서 자막 켄텐트의 스크롤링 방향을 정의하는 요소들을 기술할 수 있다. 그 값은 <scrollDirection>에 의해 표현될 수 있으며, “Top2Bottom”, “Bottom2Top”, “Left2Right”, “Right2Left”의 값을 가질 수 있다. Top2Bottom의 경우 자막 스크롤 방향은 위에서 아래로 정의될 수 있으며, Bottom2Top의 경우 아래에서 위로, Left2Right의 경우 좌에서 우로, Right2Left의 경우 우에서 좌로 정의될 수 있다. tts:scrollDirection의 적용범위는 자막 영역 전체에 대해 적용될 수 있다.
tts:scrollType은 자막 영역 내에서 컨텐트의 스크롤링 타입을 정의하는 요소들을 기술할 수 있다. 그 값은 < scrollType>에 의해 표현될 수 있으며, 스크롤되는 단위가 line 인지 또는 pixel 인지를 나타낼 수 있고, 스크롤되는 단위의 수도 함께 기술할 수 있다. 즉, scrollType이 Line 1 인 경우, 스크롤 타입은 line 단위로 1 line 씩 스크롤됨을 나타낼 수 있다. tts: scrollType의 적용범위는 자막 영역 전체에 대해 적용될 수 있다.
tts:scrollSpeed는 자막 영역 내에서 컨텐트의 스크롤링 스피드를 정의하는 요소들을 기술할 수 있다. 그 값은 < scrollSpeed>에 의해 표현될 수 있으며, 스크롤 스피드를 소수점 첫째 자리까지의 초단위로 표현할 수 있다. tts: scrollSpeed의 적용범위는 자막 영역 전체에 대해 적용될 수 있다.
스크롤 방향과 스크롤 타입은 도면 하단에 도시된 바와 같이 tts:Scroll 내에서 각각 <scrollDirection>과 <scrollType>로써 함께 정의될 수도 있다.
도 19는 본 발명의 일 실시예에 따른 자막의 3D 서포트 정보를 나타낸다. 자막에 대한 3D 서포트 정보는 자막 제작자로 하여금 3D 비디오 상에 캡션 영역을 정확히 위치시킬 수 있게 한다. 자막에 대한 디스패러트 정보는 3D 켄텐트에 대해 적용될 수 있다. 자막 메타데이터에 포함된 3D 서포트 정보는 자막 영역의 디스패러티 값을 기술할 수 있다. 도면 좌측에 도시된 바와 같이 자막 영역 (caption region)은 디스패러티 값이 정의되지 않는 경우, screen plane에 해당하는 zero dispairy 평면에 위치할 수 있다. 하지만 자막 영역에 대한 디스패러티 값이 메타데이터 내에 기술된 경우, 디스패러티 파라미터로부터 도출된 depth value에 따라 자막 영역은 특정 depth에 위치하고 표현될 수 있다. Positive disparity 값을 가지는 경우 해당 자막 텍스트 플레인은 screen plane 보다 뒤쪽에 위치할 수 있으며 반대로 negative disparity 값을 가지는 경우 screen plance 보다 앞쪽에 위치할 수 있다.
여기서, 자막 영역의 디스패러티 밸류가 퍼센티지 (percentage) 포맷으로 기술되는 경우, 디스패러티는 디스플레이된 이미지의 가로 해상도 (width resolution)에 의존할 수 있다. 메타데이터 내의 tts:disparity 는 자막 영역으로 이동하는 컨텐트에 의해 생성된 부분과 관련된 자막의 디스패러티 정보를 정의하는 요소를 기술할 수 있다. (This attribute is used to specify a property that defines the disparity (offset) value between the corresponding closed captions associated with an area generated by content flowed into a region.) tts:disparity는 ttm:disparity, ttp:disparity 등으로 기술될 수도 있으며, tts:zIndexExt를 통해 z 축 방향의 값으로 정의될 수도 있다. 도시된 바와 같이 tts:disparity는 밸류로써 <disparity>를 가질 수 있다. < disparity >는 스칼라 값 또는 percentage 값으로 정의될 수 있다.
도 20은 본 발명의 다른 실시예에 따른 자막의 3D 서포트 정보를 나타낸다. 전술한 바와 같이 자막의 디스패러티 정보는 tts:zIndexExt를 통해서도 시그널링될 수 있다. 도면 좌측에 도시된 바와 같이 tts:zIndex 어트리뷰트는 특정 영역의 디스패러티, 즉 오프셋 값을 정의하는 요소를 기술하기 위해 사용될 수 있다. tts:zIndex 어트리뷰트는 밸류로써 전술한 <disparity> 값을 가질 수 있으며, 영역에 대해 적용될 수 있다. 도면 우측은 자막 정보 내에서 tts:disparity가 적용된 예를 나타낸다.
tts:disparity는 각 영역별로 적용될 수 있다. 도시된 바와 같이 region id 1을 갖는 영역에 대해서 tts:disparity는 0으로 설정될 수 있으며, region id 2을 갖는 영역에 대해서 tts:disparity는 -10%으로 설정될 수 있다. 따라서 region id 1을 갖는 영역에 디스플레이되는 패러그래프 “I passed by his garden, and marked, with one eye, How the Owl and the Panther were sharing a pie.”는 해당 영역에 디스패러티 0이 적용되므로 zero dispairy로 디스플레이될 수 있다. 또한 region id 2를 갖는 영역에 디스플레이되는 패러그래프 “The Panther took pie-crust, and gravy, and meat, While the Owl had the dish as its share of the treat.”은 해당 영역에 디스패러티 -10%가 적용되므로 영상의 가로 해상도의 10%에 해당하는 값만큼 스크린 플레인(screen plane)으로부터 앞쪽에 디스플레이될 수 있다.
도 21은 본 발명의 일 실시예에 따른 자막의 프리젠테이션 타이밍 옵셋 정보를 나타낸다. TTML 내에서 자막 텍스트의 프리젠테이션 타임을 조정하고, 다양한 시청 모드들에서의 다른 미디어와 자막의 동기화를 위해 프리젠테이션 타이밍 옵셋 정보를 시그널링할 수 있다. 프리젠테이션 타이밍 옵셋 정보는 자막 텍스트의 프리젠테이션 타임의 앵커 포인트 (타임)를 기술할 수 있다. 자막 텍스트는 프리젠테이션 타임의 앵커 포인트에 관련되어 재생 시간이 결정될 수 있다. TTML 내의 메타데이터는 미디어 타임 내에서의 프리젠테이션 타임의 앵커 포인트를 기술할 수 있다. 특히 SMPTE-TT에서 타임 베이스는 미디어 (media)가 될 수 있다. 여기서 타임 베이스의 “smpte” 및 “clock”는 사용되지 않을 수 있다. 도면 상단에 도시된 바와 같이 시간에 대한 표현 방법, <time expression>은 offset-time 또는 clock- time 이 될 수 있다. offset-time이 사용되는 경우, 그 단위 (metric)는 틱 (tick, t)이 될 수 있다. 프레임 레이트는 별도로 정의되지 않는 경우 30 fps가 될 수 있다.
만약 <time expression>이 clock-time을 사용하거나, tick metric을 사용하지 않는 offset-time을 사용하는 경우, 프리젠테이션 타임 M은 다음과 같이 정의될 수 있다.
M = referenceBegin + 3600 * hours + 60 * minutes + seconds + ((frames + (subFrames / subFrameRate)) / effectiveFrameRate)
여기서 referenceBegin은 가장 가까이 위치한 초기 타임 컨테이너(the nearest ancestor time container)가 패럴렐 (parallel, par) 또는 시퀀셜 (sequential, seq) 시맨틱을 사용하였는지 여부에 따라 결정될 수 있다. 만약 패럴렐이거나 또는 prior sibling timed element가 존재하지 않은 경우의 시퀀셜이면, referenceBegin은 가장 가까이 위치한 초기 타임 컨테이너의 시작 부분에 대응하는 미디어 타임일 수 있다. 또는 이 타임 컨테이너가 Root Temporal Extent 인 경우에는 referenceBegin는 0일 수 있다. 그렇지 않은 경우, 즉, 시퀀셜이고 prior sibling timed element가 존재하는 경우, referenceBegin는 immediate prior sibling timed element의 액티브 엔드 (active end)에 대응하는 미디어 타임일 수 있다. hours, minutes, seconds, frames, subFrames 컴포넌트들은 <time expression> 내에 해당 값들이 존재하는 경우 적용될 수 있으며, 존재하지 않는 경우 0으로 설정될 수 있다. subFrameRate 는 ttp:subFrameRate parameter의 계산된 값이며, effectiveFrameRate (in frames per second) 는 frameRate * frameRateMultipler 로 계산될 수 있다. frameRate 는 ttp:frameRate parameter의 계산된 값이다. frameRateMultipler 는 ttp:frameRateMultiplier parameter의 계산된 값이다.
다른 실시예로써, <time expression>이 tick metric을 사용하는 offset-time을 사용하는 경우, 프리젠테이션 타임 M은 다음과 같이 정의될 수 있다.
M = referenceBegin + ticks / tickRate
여기서 referenceBegin는 전술한 바와 같으며, ticks는 <time expression>에서 기술된 값과 같다. 또한 tickRate는 ttp:tickRate parameter의 계산된 값과 같다.
도 22는 본 발명의 일 실시예에 따른 자막의 프리젠테이션 앵커 타임 정보를 나타낸다. 이전 도면에서 referenceBegin은 프리젠테이션 앵커 타임을 의미할 수 있다. 프리젠테이션 앵커 타임은 TTML내에서 시그널링될 수 있다. ttp:presentationAnchorTime 또는 ttm:presentationAnchorTime은 다큐먼트 인스턴스의 프리젠테이션 타임의 시작을 기술하는 어트리뷰트를 포함할 수 있다. 프리젠테이션 앵커 타임은 자막과 다른 미디어 데이터와의 동기화에 사용될 수 있으며, 전술한 프리젠테이션 타임 옵셋와 함께 사용되어 각 자막 텍스트의 디스플레이 시점을 산출하는데 이용될 수 있다. 프리젠테이션 앵커 타임을 기술하는 방법은 전술한 <time expression> 방식을 사용할 수 있다.
도 23 및 24는 본 발명의 일 실시예에 따른 자막에 대한 프리젠테이션 앵커 타임을 ISOBMFF를 이용하여 시그널링하는 방법을 나타낸다. 전술한 도면에서 프리젠테이션 앵커 타임 정보는 TTML 내에서 함께 전송되었으나, 본 실시예에 따르면 ISOBMFF의 특정 box 내에서 시그널링될 수 있다. 도면에서 composition_time_offset은 트랙 또는 무비 프래그먼트 내의 샘플들 중에서 가장 빠른 프리젠테이션 타임의 프리젠테이션 타임 옵셋을 기술할 수 있다. (composition_time_offset : specifies presentation time offset of earliest presentation time of any sample in movie fragment or track) 도 23에 도시된 바와 같이 composition_time_offset은 트랙 헤더 박스 (tkhd), 트랙 익스텐드 박스 (trex), 트랙 프래그먼트 헤더 박스 (tfhd)에 포함되어 전송될 수 있다. 또한 tfhd 에 대한 tf_flag가 추가적으로 정의될 수 있으며, 0x000004 값을 갖는 경우 해당 트랙의 composition_time_offset 정보가 존재함을 나타낼 수 있다.
또한 도 24에 도시된 바와 같이, composition_time_offset은 세그먼트 인덱스 박스 (sidx) 및 트랙 런 박스 (trun)에도 각각 포함되어 전송될 수 있다. 또한 trun 에 대한 tr_flag가 추가적으로 정의될 수 있으며, 0x000008 값을 갖는 경우 해당 트랙의 composition_time_offset 정보가 존재함을 나타낼 수 있다.
도 25는 본 발명의 일 실시예에 따른 자막에 대한 스케일링 영역 정보를 나타낸다. 스케일링 영역 정보는 자막 제작자로 하여금 정의된 영역을 넘어서 자막 영역이 얼마나 확장될 수 있는지를 정의하도록 할 수 있다. 다시 말하면, 이는 내재적으로 자막이 위치하면 안되는 영역을 기술할 수 있다. 즉, 스케일링 영역 정보를 이용하여 자막 영역의 확장 정도를 제한함으로써 자막 영역이 일부 컨텐트에 오버랩되는 정도를 제한할 수 있는 효과가 있다. 자막 영역의 스케일링 한계에 대한 정보는 제품 간접 광고 (product placement advertisement, PPL)를 보호하기 위한 수단으로 사용될 수 있다. 스케일링 영역 정보는 자막 영역에 대해 허락된 스케일링 팩터들을 정의하는 요소를 기술할 수 있다. 스케일링 영역 정보는 자막 영역의 확장 방향을 기술할 수 있으며, 오리지널 크기와 관련된 확장 비율을 기술할 수 있다. 도면에서, ttp:regionScaleDirection 는 자막 영역의 스케일링 방향을 정의할 수 있다. ttp:regionScaleDirection 의 자막 영역의 스케일링 방향에 대한 정보는 tts:regionScaleDirection 또는 ttm:regionScaleDirection을 이용하여 정의될 수도 있다. ttp:regionScaleDirection 의 밸류는 <scaleDirection>에 의해 정의될 수 있으며, 구체적으로 “Top”, “Bottom”, “TopNBottom”, “Left”, ”Right”, “LeftNRight” 또는 “All”의 값을 가질 수 있다. 즉, 자막 영역은 위쪽, 아래쪽, 위아래방향, 좌측, 우측, 좌우방향, 또는 전방향으로 확장 스케일링 될 수 있다.
ttp:regionScaleLimit 은 자막 영역의 스케일링 한계를 정의할 수 있다. ttp:regionScaleLimit의 자막 영역의 스케일링 한계에 대한 정보는 tts:regionScaleLimit 또는 ttm:regionScaleLimit을 이용하여 정의될 수도 있다. ttp:regionScaleLimit의 밸류는 <scale>에 의해 정의될 수 있다. 구체적으로 <scale>은 스칼라 값 또는 퍼센티지 값을 가질 수 있으며, 스칼라 값은 유닛의 수로 표현될 수 있으며 퍼센티지 값은 %로 표현될 수 있다. 여기서, 유닛은 픽셀, em, c의 값을 가질 수 있다. 여기서 em은 현재 사용하고 있는 텍스트의 크기를 기준으로 한 상대적인 단위를 의미할 수 있다.
자막 영역의 스케일링 방향 및 스케일링 한계에 대한 정보는 도시된 바와 같이 <regionScale > 내에서 함께 정의될 수 있으며, 각각 < scaleDirection > 및 <scale> 에 의해 정의될 수 있다. 여기서, ttp:regionScaleLimit 밸류는 ttp:regionScaleDirection의 밸류에 따라 다르게 해석될 수 있다. 예를 들어, ttp:regionScaleDirection가 “Top”으로 설정된 경우, 자막 영역은 영역의 높이에 관계되어 위쪽으로 확장될 수 있다.
도 26은 본 발명의 일 실시예에 따른 자막에 대한 재생 스피드 정보 및 화면 비율 정보를 나타낸다.
전술한 정보 외에도 자막의 재생 스피드 (Play-out speed)에 대한 메타데이터가 TTML 내에서 시그널링 될 수 있다. 자막의 재생 스피드 정보는 ttp:playOutSpeed 에 의해 정의될 수 있으며, 실시예에 따라 ttm:playOutSpeed 또는 tts:playOutSpeed에 의해 정의될 수도 있다. 자막의 재생 스피드 정보는 자막에 대한 의도된 재생 스피드(intended play-out speed)를 자막 영역 내에서의 분당 단어 수로 정의할 수 있다. 이 정보는 읽는 속도가 느린 사용자들을 위해 수신장치가 자막 출력 속도를 조절할 수 있도록 한다.
또한 화면 비율 (Aspect ratio)에 대한 메타데이터가 TTML 내에서 시그널링 될 수 있다. 화면 비율 정보는 컨텐트 제작자가 컨텐트의 제작 시 타겟한 디스플레이의 화면 비율을 표현하는데 사용될 수 있다. 자막의 화면 비율 정보는 ttp:displayAspectRatio 에 의해 정의될 수 있으며, 실시예에 따라 ttm:displayAspectRatio 또는 tts:displayAspectRatio 에 의해 정의될 수도 있다. 이 정보는 다른 타입의 디스플레이를 위해 수신장치가 자막 텍스트 영역을 조절할 수 있도록 한다. 화면 비율 정보는 화면의 가로 세로 정보를 포함할 수 있다.
또한 대체 화면 비율 (alternative Aspect ratio)에 대한 메타데이터가 TTML 내에서 시그널링 될 수 있다. 대체 화면 비율 정보는 컨텐트 제작자가 컨텐트의 제작 시 타겟한 디스플레이의 대체 화면 비율을 표현하는데 사용될 수 있다. 자막의 대체 화면 비율 정보는 ttp:alternativeAspectRatio에 의해 정의될 수 있으며, 이 정보는 다른 타입의 디스플레이를 위해 수신장치가 자막 텍스트 영역을 조절할 수 있도록 한다. 대체 화면 비율 정보는 대체 화면의 가로 세로 정보를 포함할 수 있다.
UHD의 경우 루트 컨테이너 영역은 active video일 수 있다. tts:extent 및 tts:origin을 위한 레퍼런스는 active video일 수 있다. 또한 UHD 해상도 측면에서 전술한 자막 관련 정보의 포맷은 퍼센티지 포맷 또는 tts:extent 에서 c 또는 em 유닛으로 표현되는 <length>를 갖는 스칼라 포맷을 사용할 수 있다. tts:extent에서 px 유닛으로 표현되는 <length>를 갖는 스칼라 포맷에 대한 사용은 권장되지 않는다. 픽셀 기반의 경우 하나의 글자 중 일부만이 디스플레이되는 경우가 발생할 수 있기 때문이다. 만약 tts:extent에서 px 유닛으로 표현되는 <length>를 갖는 스칼라 포맷이 사용되는 경우, tts:origin 및 tts:extent 밸류들의 합은 해상도의 width 및 height를 넘지 않아야 한다.
또한 UHD에서 자막의 오리지널 타겟 프레임 레이트가 비디오의 프레임 레이트와 다른 경우, 자막 프리젠테이션의 시작/종료 시간은 미디어 타임에 매핑될 수 있다. 또한 모든 비디오/오디오 프리젠테이션 타임을 미디어 타임에 매핑될 수 있다. 또한 폰트 사이즈 (font size) 제어와 관련하여, tts:overflow 는 “visible”로 설정되고, tts:wrapOption “wrap”으로 설정되고, ttp:regionScaleDirection 이 설정되고, ttp:regionScaleType 이 설정되는 것이 권장된다.
도 27 은 본 발명의 일 실시예에 따른 DASH (Dynamic Adaptive Streaming over HTTP) 데이터 모델 (data model)을 나타낸 도면이다.
본 발명의 일 실시예에 따른 송신 장치는 MPEG DASH 내에서, 디스패러티 정보를 시그널링함으로써 DASH 기반의 클라이언트가 3D 비디오 서비스를 제공하도록 할 수 있다. 즉, 본 발명의 일 실시예에 따른 송신 장치는 3D 비디오 컨텐트에 대한 디스패러티 정보를 시그널링할 수 있다. 본 발명의 일 실시예에 따르면, MPEG DASH 내에서의 디스패러티 컨피규레이션 정보에 대한 시그널링은 DASH 기반의 시스템에 적용될 수 있다. 예를 들어, ATSC 3.0, DVB IPTV, DASG 기반의 스트리밍 시스템 등에 적용될 수 있다.
본 발명의 일 실시예에 따른 DASH 데이터 모델에 따르면, 미디어 프리젠테이션 (Media Presentation)에 대한 정보를 포함하는 MPD는 하나 이상의 피리어드 (Period)에 대한 정보를 포함할 수 있다. 하나의 피리어드 (Period)는 하나 이상의 어댑테이션 세트 (Adaptation Set)에 대한 정보를 포함할 수 있다. 하나의 어댑테이션 세트 (Adaptation Set)에 대한 정보는 하나 이상의 레프리젠테이션 (Representation)에 대한 정보를 포함할 수 있다. 하나의 레프리젠테이션에 대한 정보는 하나 이상의 세그먼트 (Segment)에 대한 정보를 포함할 수 있다. 세그먼트에 대한 정보는 이니셜라이제이션 세그먼트 (Initialization Segment) 및 하나 이상의 미디어 세그먼트 (Media Segment)에 대한 정보를 포함할 수 있다.
도면 하단에 도시된 실시예는 MPD를 보다 구체적으로 설명한 도면이다.
MPD는 Period 엘리먼트, AdaptationSet 엘리먼트, Representation 엘리먼트, SubRepresentation 엘리먼트, ContentComponent 엘리먼트 및/또는 SegmentBase 엘리먼트 사이의 관계로 표현될 수 있다. MPD 엘리먼트는 @id, @profile, @type @availabilityStartTime, @minBufferTime @suggestedPresentationDelay, ProgramInformation(0..N), Location(0..N), Period(0..N) 및/또는 Metrics(0..N)를 포함한다. 여기서, @profile 및/또는 @minBufferTime는 필수적인 (mandatory) 필드일 수 있다. Period 엘리먼트는 @id, @start, @duration, AssetIdentifier(0..1), EventStream(0..N), AdaptationSet(0..N) 및/또는 Subset(0..N)를 포함한다. AdaptationSet 엘리먼트는 @id, @group, @min(max)Bandwidth, @min(max)Width, @min(max)Height, @min(max)FrameRate, Common, Accessibility(0..N), Role(0..N), Rating(0..N), Viewpoint(0..N), ContentComponent(0..N) 및/또는 Representation(0..N)를 포함한다. Representation 엘리먼트는 @id, @bandwidth, @dependencyId, Common, BaseURL(0..N), SegmentBase(0..1), SegmentList(0..1), SegmentTemplate(0..1) 및/또는 SubRepresentation(0..N)를 포함한다. 여기서, @id 및/또는 @bandwidth는 필수적인 (mandatory) 필드일 수 있다. SubRepresentation 엘리먼트는 @level, @dependencyLevel, @bandwidth, @contentComponent 및/또는 Common을 포함한다. ContentComponent 엘리먼트는 @id, @lang, @contentType, @par, Accessibility(0..N), Role(0..N), Rating(0..N) 및/또는 Viewpoint(0..N)를 포함한다. 여기서, AdaptationSet에 @lang, @contentType 및/또는 @par가 존재하지 않는 경우, 이 필드들은 ContentComponent에서 정의되거나 정의되지 않을 수 있다. SegmentBase 엘리먼트는 @timescale, @presentationTimeOffset, @timeShiftBufferDepth, @availabilityTimeOffset, Initialization(0..1) 및/또는 RepresentationIndex(0..1)를 포함한다. 본 발명의 일 실시예에 따른 DASH 데이터 모델은 Common 어트리뷰트 및 엘리먼트를 포함한다. Commmon 어트리뷰트 및 엘리먼트는 @mimeType,@width, @height, @sar, @framerate, @audiosamplingRate, @codec, @startWithSAP, FramePacking (0..N), AudioChannelConfiguration(0..N), ContentProtection(0..N), EssentialProperty(0..N), SupplementalProperty(0..N) 및/또는 InbandEventStream(0..N)를 포함한다. 상술한 Common 어트리뷰트 및 엘리먼트는 AdaptationSet, Representation 및/또는 SubRepresentation 내에 포함되어 적용될 수 있다.
이 도면 및 상술한 설명에서, 필드 이름 앞에 @가 붙는 필드는 어트리뷰트를 나타내고, @가 없는 필드는 엘리먼트를 나타낸다. 또한, 엘리먼트 이름 뒤에 (0..N)은 해당 엘리먼트가 최소 0개 및 최대 N개 존재함을 나타낸다. 여기서, N은 한계가 정해지지 않았음을 나타낸다. 본 발명의 일 실시예에 따르면, MPD 내의 엘리먼트 또는 어트리뷰트에 대한 설명은 DASH 표준에서 정의된 내용을 따른다. MPD는 스트리밍 서비스를 제공하기 위해 미디어 프레젠테이션에 대한 디스크립션이다. Period는 미디어 프레젠테이션의 인터벌을 나타낸다. 모든 피리어드의 연속하는 시퀀스는 미디어 프레젠테이션을 구성한다. Segment는 MPD에 의해 설명되는 URL 및 바이트 레인지와 연관된 데이터의 유닛을 나타낸다. Adaptation Set은 하나 이상의 미디어 콘텐트 컴포넌트들의 교환가능한 인코딩된 버전들의 세트를 나타낸다. Representation은 전송 포맷 내의 하나 이상의 미디어 스트림의 집합 및 인켑슐레이션을 나타낸다. Sub-Representation은 MPD에 의해 기술되는 Representation의 일부를 나타낸다.
아래에서는 전술한 MPEG Dynamic Adaptive Streaming over HTTP (이하 DASH) 등을 기반으로 스트리밍 서비스시 자막 (closed caption/subtitle) 관련 시그널링 방안을 제안할 수 있다. 특히, MPD 상에서 자막 (closed caption/subtitle) 에 대한 3D support, scrolling, presentation timing offset, scaling factors를 시그널링하는 방안에 대해 설명할 수 있다.
도 28은 본 발명의 일 실시예에 따른 자막 정보를 MPD 내에 기술하기 위한 방법을 나타낸다. 본 발명에서 MPEG Dynamic Adaptive Streaming over HTTP (이하 DASH) 등을 기반으로 스트리밍 서비스 제공 시 closed caption 을 제공할 수 있도록 하기 위한 시그널링 방안 등을 제안한다. 이는 DASH 등을 통해 방송서비스가 전달되거나 인터넷을 통하여 스트리밍 되는 경우 DASH Media Presentation Description (이하 MPD) 등에서 도시된 바와 같은 형태의 SupplementalProperty descriptor 또는 EssentialProperty descriptor 등을 통하여 자막 (closed caption/subtitle) 관련 정보 등을 시그널링 할 수 있다. 실시예에 따라 자막 관련 정보는 다른 desciptor 혹은 element 로 표현될 수도 있다. 이러한 디스크립터 또는 엘리먼트는 MPD의 AdaptationSet, Representation, SubRepresentation 등에 하위 정보로써 포함될 수 있다. 디스크립터는 @schemeIdUri, @ value, @id 정보를 포함할 수 있다.
도 29는 본 발명의 일 실시예에 따른 자막 정보를 MPD 내에 기술하는 디스크립터를 나타낸다. Closed caption/subtitle 관련 정보는 도시된 바와 같은 형태로 MPD를 통해 시그널링 될 수 있다. 자막 관련 정보 디스크립터는 자막 관련 정보를 나타내는 @schmeIdUri를 포함할 수 있으며, 예를 들어 urn:mpeg:dash:closed-caption:201x 과 같이 설정될 수 있다. 이는 Closed caption/subtitle 컨피겨레이션 스킴을 위한 스킴 아이디를 나타낼 수 있다. @value는 language, accessibility, aspect_ratio, alternative_aspect_ratio, scaling_support, scrolling_support, Playout_speed, extended_color_use, 3D_support 및/또는 3D_disparity 정보를 포함할 수 있다. language 정보는 Closed caption/subtitle 의 언어 정보를 나타낼 수 있다. 이는 language code per ISO 639.2/B 등으로 나타낼 수 있다. 이는 하나 이상의 언어 코드를 포함할 수도 있다. accessibility 정보는 closed caption/subtitle 등의 대상 사용자 등을 가리킬 수 있으며 구체적으로 0 : normal , 1: easy reader, 2: visually impaired, 3: hearing impaired 을 나타낼 수 있다. aspect_ratio 정보는 Closed caption/subtitle author 가 의도한 aspect ratio를 나타낼 수 있다. 예를 들어, 이는 4:3, 16:9, 21:9 등으로 나타낼 수 있다. alternative_aspect_ratio 정보는 Closed caption/subtitle 의 호환가능한 aspect ratio 을 나타낼 수 있다. 이는 4:3, 16:9, 21:9 등으로 나타낼 수 있다. scaling_support 정보는 Closed caption/subtitle 의 오리지널 closed caption/subtitle 영역이 수신기 상에서 presentation 시 경우에 따라 확장 가능한지 여부를 나타낼 수 있다. 또는 확장에 따른 세부 파라미터를 closed caption/subtitle 등에 포함하는지 여부를 나타낼 수 있다. 해당 영역이 수신기 상에서 presentation 시 확장이 가능한 경우 해당 정보는 1로 설정될 수 있다. scrolling_support 정보는 Closed caption/subtitle 이 closed caption/subtitle 영역 상에서 스크롤링될 수 있는지 또는 이에 따른 세부 파라미터가 closed caption/subtitle 내에 포함되어 있는지 여부 등을 나타낼 수 있다. Scrolling 이 가능한 경우 해당 정보는 '1' 로 설정될 수 있다. Playout_speed 정보는 Closed caption/subtitle 이 수신기 상에서 presentation 될 때, 오리지널 closed caption/subtitle 영역에서 play-out 되는 속도를 나타낼 수 있다., extended_color_use 정보는 Closed caption/subtitle 이 8비트 이상으로 구성된 color 값을 사용하는 지 여부를 나타낼 수 있다. 3D_support 정보는 Closed caption/subtitle 이 3D 를 지원하는지 여부 등을 나타낼 수 있다. 3D 을 지원하는 경우 해당 정보의 값은 '1'로 설정될 수 있다. 3D_disparity 정보는 Closed caption/subtitle 이 3D 를 지원하는 경우, 스크린 대비 caption 의 3D location of the front-most closed caption/subtitle 을 나타낼 수 있다. 즉, 비디오 내의 여러 closed caption 영역에 대한 disparity 중 가장 앞쪽에 해당되는 값 (minimum disparity)을 명시할 수 있다. 음의 값을 가지는 경우 스크린을 기준으로 앞으로 튀어 나오는 효과의 정도를 나타낼 수 있으며 양의 값을 가지는 경우 반대로 사용될 수 있다.
도 30은 본 발명의 일 실시예에 따른 MPD에 포함된 자막 관련 정보를 나타낸 도면이다. 전술한 방법을 통하여 DASH MPD 상에서 자막과 관련된 시그널링을 도시된 바와 같이 기술할 수 있다. 도시된 바와 같이 자막 관련 정보는 schemeIdUri="mpeg:dash:closed-caption:201x"로 정의 되는 SupplementalProperty 로써 기술될 수 있으며 도면에서는 AdaptationSet 내에서 기술되고 있으나 실시예에 따라 Representation, SubRepresentation 등에 포함될 수도 있다.
도 31은 본 발명의 일 실시예에 따른 자막 관련 정보의 세부 정보를 나타낸다. MPD는 Closed caption/subtitle 이 scrolling 등을 지원하는 경우 도면 상단에 도시된 형태로 세부 파라미터 등을 시그널링 할 수 있다. 스크롤링 관련 세부 파라미터는 @schmeIdUri를 포함할 수 있으며, 예를 들어 urn:mpeg:dash:closed-caption-scroll:201x 과 같이 설정될 수 있다. 이는 Closed caption/subtitle 스크롤링 컨피겨레이션 스킴을 위한 스킴 아이디를 나타낼 수 있다. @value는 Scrolling_direction, scrolling_type, scrolling_amount 및/또는 scrolling_speed 정보를 포함할 수 있다. Scrolling_direction 정보는 Closed caption/subtitle 의 closed caption/subtitle 영역이 수신기 상에서 스크롤링 되는 방향 정보 등을 나타낼 수 있다. 구체적으로 해당 정보는 “Top2Bottom” , “Bottom2Top” , “Left2Right” , “Right2Left” 등의 값을 가질 수 있다. 이와 관련된 설명은 전술한 바와 같다. scrolling_type 정보는 Closed caption/subtitle 의 closed caption/subtitle 영역이 수신기 상에서 스크롤링 지원 시 scrolling 의 진행 형태 등을 나타낼 수 있다. 예를 들어 이는 line (혹은 cell) 단위로 scrolling 이 진행되는지 혹은 pixel 단위로 scrolling 이 진행되는지 등을 나타낼 수 있다. scrolling_amount 정보는 Closed caption/subtitle 의 closed caption/subtitle 영역이 수신기 상에서 스크롤링 지원 시 scrolling 되는 정도 등을 나타낼 수 있다. 이는 cell 수 혹은 pixel number 등으로 나타낼 수 있다. scrolling_speed 정보는 Closed caption/subtitle 이 오리지널 closed caption/subtitle 영역이 수신기 상에서 스크롤링 지원 시 scrolling 속도 등을 나타낼 수 있다. 이는 second (필요시 소수 점 이하까지 표현가능) 단위 등으로 표현될 수 있다.
MPD는 Closed caption/subtitle 의 오리지널 closed caption/subtitle 영역이 수신기 상에서 presentation 시 경우에 따라 확장 가능한 경우 도면 하단에 도시된 형태로 세부 파라미터 등을 시그널링 할 수 있다. 스케일링 관련 세부 파라미터는 @schmeIdUri를 포함할 수 있으며, 예를 들어 urn:mpeg:dash:closed-caption-scale:201x 과 같이 설정될 수 있다. 이는 Closed caption/subtitle 스케일링 컨피겨레이션 스킴을 위한 스킴 아이디를 나타낼 수 있다. @value는 scale_direction 및/또는 scale_limit 정보를 포함할 수 있다. scale_direction 정보는 Closed caption/subtitle 의 closed caption/subtitle 영역에 대한 확장 가능한 방향 정보 등을 나타낼 수 있다. 구체적으로 해당 정보는 “Top”, “Bottom” , “TomNBottom” , “Left”, “Right” , “LeftNRight”, “All” 등의 값을 가질 수 있다. 이에 대한 설명은 전술한 바와 같다. scale_limit 정보는 Closed caption/subtitle 의 closed caption/subtitle 영역에 대해 확장 가능한 경우 이에 대한 확장 limit 정도 등을 나타낼 수 있다. 이는 cell, pixel 수 등으로 나타내거나 퍼센트 정도 등으로 나타낼 수 있다. 이에 대한 자세한 설명은 전술한 바와 같다.
도 32는 본 발명의 일 실시예에 따른 자막 관련 정보의 세부 정보를 나타낸다. MPD는 Closed caption/subtitle 내에 포함된 presentation timing 에 대한 presentation anchor time 을 도면 상단에 도시된 바와 같이 시그널링 할 수 있다. 더 나아가 비디오/오디오 컴포넌트 등에 대한 presentation anchor time 을 나타낼 수 있다. 앵커 타임 관련 세부 파라미터는 @schmeIdUri를 포함할 수 있으며, 예를 들어 urn:mpeg:dash:anchor_presentation:201x 과 같이 설정될 수 있다. 이는 Closed caption/subtitle 을 포함하는 미디어 에센스의 프리젠테이션 앵커 타임을 위한 스킴 아이디를 나타낼 수 있다. @value는 Time_format 및/또는 Time_value 정보를 포함할 수 있다. Time_format 정보는 Presentation anchor time 에 대한 포멧 정보를 나타낼 수 있다. 이는 UTC, clock, offset, PTP 등의 값을 가질 수 있다. 또한 Time_value 정보는 resentation anchor time 값을 포함할 수 있다. 이는 상기 time_format 에 따라 서로 다른 형태로 나타낼 수 있다. 예를 들어, time_format이 clock 인 경우, 시 : 분: 초. (소수점 이하 초 혹은 frame)의 형태로 나타낼 수 있다. 이는 hours ":" minutes ":" seconds ( fraction | ":" frames ( "." sub-frames ) )의 형태로 나타낼 수 있다. 다른 실시예로써, time_format 이 offset 인 경우에는 tick_rate : tick_rate 기반 tick 수 의 형태로 나타낼 수 있다.
MPD는 Closed caption/subtitle 내에 포함된 presentation timing 에 대한 offset 을 도면 하단과 같은 형태로 시그널링 할 수 있다. 더 나아가 비디오/오디오 컴포넌트 등에 대한 presentation offset 을 나타낼 수 있다. 프리젠테이션 타이밍 옵셋 관련 세부 파라미터는 @schmeIdUri를 포함할 수 있으며, 예를 들어 urn:mpeg:dash:presentation_offset:201x 과 같이 설정될 수 있다. 이는 Closed caption/subtitle 을 포함하는 미디어 에센스의 프리젠테이션 옵셋을 위한 스킴 아이디를 나타낼 수 있다. @value는 Time_format 및/또는 Time_value 정보를 포함할 수 있다. Time_format 정보는 Presentation timing offset 에 대한 포멧 정보를 나타낼 수 있다. 이는 clock, offset 등의 값을 가질 수 있다. 또한 Time_value 정보는 Presentation timing offset 값을 포함할 수 있다. 이는 상기 time_format 에 따라 서로 다른 형태로 나타낼 수 있다. 예를 들어, time_format이 clock 인 경우, 시 : 분: 초. (소수점 이하 초 혹은 frame)의 형태로 나타낼 수 있다. 이는 hours ":" minutes ":" seconds ( fraction | ":" frames ( "." sub-frames ) )의 형태로 나타낼 수 있다. 다른 실시예로써, time_format 이 offset 인 경우에는 tick_rate : tick_rate 기반 tick 수 의 형태로 나타낼 수 있다. Closed caption/subtitle 이 timed text 기반인 경우, 자막 정보는 closed caption 에 대한 presentation 시작 및 끝에 대한 정보를 포함하고 있다. 수신기는 위의 시그널링 정보를 기반으로 Closed caption/subtitle 내에 포함된 presentation timing 을 조절 할 수 있도록 한다.
도 33 은 본 발명의 일 실시예에 따른 MMT 프로토콜 기반의 시그널링 흐름을 도시한 도면이다.
먼저, SLT 를 획득하고 이를 이용하여 SLS 를 획득하는 과정은 동일할 수 있다. MMT 기반의 시그널링의 경우, SLS 는 USBD 및/또는 MMTP 메시지들을 포함할 수 있다. USBD 로부터 해당 서비스와 연관된 MMT 패키지(Package)에 대한 정보가 획득될 수 있다. 이를 이용하여 서비스 시그널링 채널 등으로부터 MPT (MP Table) 메시지가 획득될 수 있다. MPT 메시지를 통하여 해당 서비스의 서비스 컴포넌트들이 획득될 수 있다. 도시된 실시예에서, 스케일러블 코딩 컨텐트의 베이스 레이어에 대한 에셋(Asset) 및/또는 인핸스먼트 레이어에 대한 에셋에 대한 정보가 획득될 수 있다. 또한 각 에셋을 획득할 수 있는 경로(전송 세션 등…) 이 획득될 수 있다. 여기서 에셋은 서비스의 서비스 컴포넌트에 해당할 수 있다. 해당 경로를 통하여 MPU 들을 획득하고 이를 디코딩하여 재생할 수 있다. 자세한 부트스트래핑 과정은 전술한 바와 같다.
실시예에 따라, MPT 메시지 외의 다른 MMTP 메시지들이 정의될 수 있다. 이들 메시지를 통해 해당 서비스에 대한 부가적인 정보들이 전달될 수 있다. 예를 들어 스케일러블 코딩 관련 정보, 3D 관련 정보, HDR 관련 정보, 컬러 개밋 관련 정보, 서비스 컴포넌트에 대한 부가 정보 등등이 이들 메시지를 통해 전달될 수 있다. 실시예에 따라, 브로드밴드를 통해 전달되는 서비스 컴포넌트들을 위한 MPD, 또는 앱 시그널링을 위한 테이블, 이벤트 정보 역시 이 메시지를 통해 전달될 수 있다.
도 34 는 본 발명의 일 실시예에 따른 SLT 를 통한 부트스트래핑 과정을 도시한 도면이다.
전술한 바와 같이 SLT 의 부트스트랩 정보를 통하여 SLS 부트스트래핑이 수행될 수 있다. 전술한 것과 같이 SLT 는 IP/UDP 로 처리되어 전송될 수도 있고, 실시예에 따라 IP/UDP 처리되지 않고 전송될 수도 있다. 일반적으로 SLT 등의 LLS (Low Level Signaling) 은 해당 전송에서 가장 강건한(robust) 방법에 의해 전달될 수 있다.
SLS 가 ROUTE 프로토콜에 의해 전송되는 경우, 수신기는 SLT 의 부트스트랩 정보를 통하여 해당 SLS 에 접근할 수 있다. ROUTE SLS 의 정보를 이용하여 해당 서비스의 서비스 컴포넌트들이 획득될 수 있다. 여기서 SLS, 서비스 컴포넌트들은 ROUTE, UDP, IP 프로토콜에 의해 전송될 수 있다.
SLS 가 MMT 프로토콜에 의해 전송되는 경우, 수신기는 SLT 의 부트스트랩 정보를 통하여 해당 SLS 에 접근할 수 있다. MMTP SLS 의 정보를 이용하여 해당 서비스의 서비스 컴포넌트들이 획득될 수 있다. MMTP SLS 에는 USBD 및/또는 MMTP 메시지가 포함될 수 있다. 전술한 바와 같이 USBD 는 MMTP 메시지를 레퍼런싱할 수 있고, MMTP 메시지 중 MPT 메시지는 MMT 프로토콜에 의해 전달되는 스트리밍 컴포넌트들을 획득하기 위한 정보들을 제공할 수 있다. MMT 의 USBD 는 ROUTE 프로토콜로 전달되는 해당 서비스의 NRT 컴포넌트들을 획득하기 위한 S-TSID 를 더 레퍼런싱할 수 있다. 전술한 MPT 메시지 외에도, 다른 정보들을 제공하기 위한 다른 MMTP 메시지들이 정의될 수 있다. 여기서 SLS, 스트리밍 컴포넌트들은 MMT, UDP, IP 프로토콜에 의해 전송될 수 있다. 여기서 NRT 컴포넌트들은 ROUTE, UDP, IP 프로토콜에 의해 전송될 수 있다. 자세한 부트스트래핑 과정은 전술한 바와 같다.
도 35는 본 발명의 다른 실시예에 따른 USBD의 일부를 도시한 도면이다. ROUTE, MMT 혹은 3GPP 등을 위한 USD(User service description) 처럼 서비스에 대한 정보를 포함하고 있는 서비스 시그널링 정보는 도시된 바와 같이 서비스 레벨 정보를 시그널링 할 수 있다. 이에 대한 syntax 는 도시된 바와 같을 수 있다. 도시된 element 혹은 attribute 들은 MMT 시그널링 정보(예를 들어 MP Table 등) 혹은 3GPP 의 서비스 시그널링, ROUTE 시그널링의 일부로 포함될 수도 있다. 각 정보들에 대한 설명은 도 4 내지 5에서 설명한 바와 동일할 수 있다.
도 36 은 본 발명의 다른 실시예에 따른 USBD 의 일부를 도시한 도면이다. 본 발명은 방송 서비스 내지는 서비스에 포함되는 서비스 컴포넌트들의 캐패빌리티 정보를 시그널링하는 방안을 제안한다. 또한 본 발명은 서비스/서비스 컴포넌트에 대한 비디오/오디오/클로즈드캡션 정보를 시그널링하는 방안을 제안한다. 또한 본 발명은 서비스/서비스 컴포넌트에 대한 SMPTE-TT 또는 CEA-809 기반 클로즈드캡션에 대한 정보를 시그널링하는 방안을 제안한다. 전술한 정보들은 실시예에 따라 SLT 또는 다른 서비스 시그널링 정보에 포함되어 전달될 수 있다. 실시예에 따라 이 정보들은 ROUTE 또는 MMT 에 따른 USBD 에 포함되어 전달될 수도 있다. 또한 실시예에 따라, 이 정보들은 ROUTE SLS 중 하나로서 정의되어 다른 SLS 들과 함께 전달될 수도 있고, MMTP SLS 중 하나로 정의되어 전술한 MMTP 메시지 중 하나에 포함되어 전달될 수도 있다. 실시예에 따라 이 정보들은 MPD 내에 포함되어 전달될 수 있으며, 이 경우, 전술한 에센셜 프로퍼티 (EssentialProperty) 및/또는 서플멘탈 프로퍼티 (SupplementalProperty) 에 포함되어 전달될 수도 있다. 실시예에 따라 이 정보들은 MMTP 메시지 중 전술한 MPT 메시지에 포함되거나, 따로 정의된 MMTP 메시지 중 하나에 포함되어 전달될 수도 있다. 실시예에 따라 이 정보들은 XML 또는 바이너리 형태의 다양한 디스크립터로 정의되어 전달될 수도 있고, 엘레멘트로 구성되어, ROUTE, MMT, 3GPP 등에 따른 시그널링 정보에 포함되어 전달될 수도 있다. 이 정보들에 대해서는 자세히 후술한다.
전술한 ROUTE 또는 MMT 의 USBD 는, 실시예에 따라 ComponentInfo 엘레멘트를 포함할 수 있다. ComponentInfo 엘레멘트에 대해서는 전술한 바와 같다. 실시예에 따라 ComponentInfo 엘레멘트는 도시된 필드들을 더 포함하도록 확장될 수 있다.
도시된 실시예에서, ComponentInfo 엘레멘트는 @componentType, @componentRole, @componentGroupId, @essentialIndicator, @dependentComponentID, @protocolType, @rt, @targetDevice, @componentCodec, @componentProfile, @componentLang, @width, @height, Accessibility, Capability, Rating, Targeting, ComponentDescription 및/또는 ComponentProperty 를 더 포함할 수 있다. 실시예에 따라 이 추가된 필드들 중 일부만이 ComponentInfo 엘레멘트에 추가될 수도 있다.
@componentType은 컴포넌트의 종류를 나타낼 수 있으며, 해당 어트리뷰트가 2로 설정된 경우, 자막 컴포넌트임을 나타낼 수 있다.
@componentRole 는 컴포넌트의 종류 또는 역할 (role)을 인디케이트하는 어트리뷰트일 수 있다. 본 발명과 관련하여 @componentRole은 컴포넌트로써 자막을 포함하는 비디오가 해당 컴포넌트에 포함되어 있음을 나타낼 수 있다. 이 경우 @componentRole은 11로 설정될 수 있다. 또한 @componentRole은 자막 컴포넌트를 위해 사용될수 있다. 전술한 @componentType이 2의 값을 갖는 경우, @componentRole을 0일 때 main, 1일 때 alternate, 2일 때 supplementary, 3일 때 Normal, 4일 때 Easy reader, 5일 때 textual description (a textual description describing video component)임을 나타낼 수 있다.
@componentGroupId 는 컴포넌트 그룹의 식별자일 수 있다. 여기서 컴포넌트 그룹은 컴포넌트들의 컬렉션일 수 있다. 컴포넌트 그룹에 포함되는 컴포넌트들은 같은 씬(scene) 을 나타내거나, 프리젠테이션을 생성키 위해 조합되는 컴포넌트들일 수 있다. 예를 들어 완성된 오디오를 제공하기 위해 사용되는 뮤직, 다이어로그, 음향이펙트들을 포함하는 서비스 컴포넌트들은 하나의 컴포넌트 그룹으로 묶일 수 있다. 또한 3D 영상의 좌영상, 우영상을 포함하는 서비스 컴포넌트들은 하나의 컴포넌트 그룹으로 묶일 수 있다.
@essentialIndicator 는 해당 컴포넌트가 해당 서비스에 있어 필수적인 컴포넌트인지 여부를 지시할 수 있다. 이 필드가 1 인 경우 해당 컴포넌트는 해당 서비스에 있어 필수적인 컴포넌트일 수 있다. @dependentComponentID 는 종속적인 컴포넌트(들)에 대한 식별자(들)을 지시할 수 있다. 예를 들어 인핸스드 비디오 컴포넌트에 있어 이 필드는 베이스 비디오 컴포넌트(들)의 식별자(들)을 나타낼 수 있다.
@protocolType 은 해당 컴포넌트를 전달하는 전송 프로토콜을 지시할 수 있다. 예를 들어 ROUTE 또는 MMT 프로토콜이 지시될 수 있다. @rt 는 해당 컴포넌트가 실시간 컴포넌트인지 아닌지를 지시할 수 있다.
@targetDevice 는 해당 컴포넌트가 타겟하는 타겟 디바이스를 지시할 수 있다. 예를 들어 이 필드의 값이 0, 1, 2 3 인 경우, 해당 컴포넌트는 각각 프라이머리 디바이스, 컴패니언 디바이스, 프라이머리&컴패니언 디바이스, 프라이머리 스크린의 인셋 을 위한 컴포넌트임이 지시될 수 있다.
@componentCodec 는 해당 컴포넌트를 위한 코덱 정보를 제공할 수 있다. @componentProfile 는 해당 컴포넌트의 프로파일을 지시할 수 있다. @componentLang 는 해당 컴포넌트에서 사용되는 언어를 지시할 수 있다. 이 필드는 특히 오디오, 클로즈드 캡션 컴포넌트에 있어 사용될 수 있다. @width 는 해당 비디오 컴포넌트이 전달하는 비디오 미디어 프리젠테이션의 수평 넓이를 나타낼 수 있다. @height 는 해당 비디오 컴포넌트이 전달하는 비디오 미디어 프리젠테이션의 수직 높이를 나타낼 수 있다.
Accessibility 는 해당 컴포넌트의 접근성(accessibility) 관련 정보를 제공할 수 있다. Capability 는 해당 컴포넌트의 캐패빌리티 관련 정보를 제공할 수 있다. Rating 는 해당 컴포넌트의 레이팅 관련 정보를 제공할 수 있다. Targeting 는 해당 컴포넌트의 타겟팅 또는 개인화(personalization) 관련 정보를 제공할 수 있다. ComponentDescription 는 해당 컴포넌트의 컴포넌트 디스크립션 정보를 제공할 수 있다. 이 정보에는 코덱에 종속적인 인코딩 파라미터(codec dependent encoding parameters) 가 포함될 수 있다. ComponentProperty 는 해당 컴포넌트를 처리하기 위한 컴포넌트 속성들을 제공할 수 있다.
또한 ComponentInfo 엘레멘트 내의 전술한 @componentType 필드는 해당 컴포넌트의 타입을 지시할 수 있는데 0, 1, 2, 3 의 값을 가지는 경우, 해당 컴포넌트는 각각 오디오, 비디오, 캡션, 어플리케이션 컴포넌트임이 지시될 수 있다.
또한 @componentRole 필드는 해당 컴포넌트의 역할(role) 을 지시할 수 있다. 이 역할은 지시된 컴포넌트 타입에 따라 지시될 수 있는데, 오디오 컴포넌트인 경우, 본 필드가 1, 2, 3, 4, 5, 6, 7 의 값을 가지면, 해당 오디오 컴포넌트는 각각 컴플리트 메인(complete main), 뮤직, 이펙트, 다이아로그, 코멘터리, 비쥬얼리 임페어드(visually impaired), 히어링 임페어드(hearing impaired), 보이스 오버(voice over), 섭셋(subset) 의 역할을 할 수 있다. 여기서 비쥬얼리/히어링 임페어드란 각각 해당 오디오 컴포넌트가 시각/청각 장애인을 위한 오디오 컴포넌트임을 의미할 수 있다. 보이스 오버란 해당 오디오 컴포넌트가 비디오 컴포넌트를 디스크라이빙하는 역할을 함을 의미할 수 있다.
비디오 컴포넌트인 경우, 본 필드의 값에 따라 해당 비디오 컴포넌트는 프라이머리 비디오, 대체 카메라 뷰, 수화, 3D 좌영상, 3D 우영상, 3D 비디오 깊이(depth) 정보, 캡션 포함 비디오 등의 역할을 함이 지시될 수 있다. 캡션 컴포넌트인 경우, 본 필드의 값에 따라 해당 캡션 컴포넌트는 메인, 대체, 서플멘터리, 노멀, 이지리더 등의 역할을 함을 의미할 수 있다.
실시예에 따라 전술한 ROUTE 또는 MMT 의 USBD 의 나머지 부분도 변경될 수 있다. 이러한 변경들은 각각의 경우의 수에 따라 서로 조합될 수 있다. 실시예에 따라 USBD 는 @providerid, @serviceCategory, @spIndicator, @serviceStatus, @shortServiceName 및/또는 capabilityCode 를 더 포함할 수 있다.
@providerid 는 해당 서비스의 서비스 프로바이더를 식별할 수 있다. @serviceCategory 는 해당 서비스의 카테고리를 지시할 수 있다. @spIndicator 는 전술한 @protected 속성과 같을 수 있다. @serviceStatus 는 전술한 @servicestatus 속성과 같을 수 있다. @shortServiceName 는 해당 서비스의 쇼트(short) 네임을 지시할 수 있다. capabilityCode 는 해당 서비스의 유의미한 미디어 프리젠테이션을 수신기가 제공하기 위하여 필요한 캐패빌리티 내지 캐패빌리티 그룹을 지시할 수 있다.
실시예에 따라 USBD 는 전술한 Channel 엘레멘트에 @majorChannelNo, @minorChannelNo 및/또는 @serviceLang 을 더 포함할 수 있다.
@majorChannelNo, @minorChannelNo 는 해당 서비스의 메이저/마이너 채널 넘버를 지시할 수 있다. @serviceLang 는 해당 서비스의 주요 사용 언어(primary language) 를 지시할 수 있다.
실시예에 따라 USBD 는 전술한 routeComponent, broadbnadComponet 대신 dashComponent 엘레멘트를 더 포함할 수 있다. dashComponent 엘레멘트는 @fullMPDUri, @sTSIDUri 및/또는 deliveryMethod 엘레멘트를 포함할 수 있다.
@fullMPDUri 는 방송망 또는 브로드밴드를 통해 전달되는 서비스 컴포넌트들을 위한 MPD 에의 레퍼런스 정보를 제공할 수 있다. @sTSIDUri 는 해당 서비스의 서비스 컴포넌트에 대한 전송 세션 관련 정보를 제공할 수 있다. deliveryMethod 는 해당 서비스의 서비스 컴포넌트들의 전송 관련 정보들을 제공할 수 있다. 전술한 바와 같이 방송망/브로드밴드를 통해 전달되는 컴포넌트들 각각에 대한 엘레멘트 및/또는 그에 대한 basePattern 정보가 더 포함될 수 있다.
도 37 은 본 발명의 일 실시예에 따른 캡션(caption) 정보를 도시한 도면이다. 캡션 정보는 해당 서비스 컴포넌트가 클로즈드 캡션 스트림 컴포넌트인 경우, 그와 관련된 캡션 디스크립션 정보를 포함할 수 있다. 캡션 정보는 전술한 실시예에 따른 디스크립터들 중 하나의 형태를 가지거나, 엘레멘트의 형태를 가질 수 있다. 이는 전술한 componentProperty 엘레멘트 등으로 나타내어질 수도 있다. 도시된 실시예에서 캡션 정보는 디스크립터 형태로 정의될 수 있다. @schemeIdUri 는 해당 디스크립터가 캡션 정보에 관련한 캡션 스킴을 가짐을 식별하기 위한 URI 일 수 있다. 이 경우, @schemeIdUri 는 urn:atsc3.0:caption:201x 의 값을 가질 수 있다. @value 는 캡션 스킴에 따라 그 의미가 정의되는 값(value)들을 가질 수 있다. 이 값에 대해서는 후술한다. @id 는 해당 디스크립터의 식별자를 나타낼 수 있다. 동일한 식별자를 가지는 경우, 동일한 스킴 ID, 값(value), 파라미터를 포함할 수 있다.
상단에 도시된 실시예는 전술한 @value 의 각 파라미터들을 나타낼 수 있다. caption_codec 은 해당 캡션 컴포넌트의 인코딩 타입을 나타낼 수 있다. 실시예에 따라 “CEA-608”, “CEA-708”, “SMPTE-TT” 등이 지시될 수 있다. lang 은 해당 캡션 컴포넌트의 언어정보를 포함할 수 있다. caption_service_number 는 해당 캡션 컴포넌트의 타입이 CEA-708인 경우, 해당 캡션의 서비스 넘버를 포함할 수 있다. easy_reader_flag 는 해당 캡션 컴포넌트가 이지 리더 타입인지 여부를 지시할 수 있다. aspect_ratio 는 해당 캡션 컴포넌트의 디스플레이 종횡비(display aspect ratio)를 나타낼 수 있다. 실시예에 따라 “4:3” 혹은 “16:9” 등이 지시될 수 있다. 3D supported 는 해당 캡션 컴포넌트가 3D 를 지원하는지 여부를 나타낼 수 있다. 실시예에 따라 캡션 정보는, 전술한 @value 의 각 파라미터들을 서브 필드로 가지는 캡션 엘레멘트 형태로 정의될 수도 있다.
예를 들어 closed caption stream component 가 SMPTE-TT 을 기반으로 영어 자막을 포함하는 경우 도면 좌측 하단에 도시된 바와 같이 시그널링 될 수 있다. USBD/USD 내의 컴포넌트 인포 엘리먼트는 @componentType가 0x03의 값으로 설정되고, @componentRole이 main으로 설정되어 자막 관련 컴포넌트가 포함되어 있음을 나나탤 수 있다. 또한 컴포넌트 인포 엘리먼트는 해당 컴포넌트에 대한 컴포넌트 디스크립션 엘리먼트를포함할 수 있다. 여기서 컴포넌트 디스크립션 엘리먼트는 도면 오른쪽 하단에 도시된 바와 같이, "urn:atsc3.0:caption:201x“ 의 스킴 ID 를 가지고 @value 는 각각 “SMPTE-TT, ENG, , false, 4:3,false" 의 값을 가질 수 있다. 이 @value 의 파라미터들은 순서대로, 전술한 파라미터들의 정의에 따른 의미를 가질 수 있다.
또한 HEVC 비디오 스트림 컴포넌트의 비트스트림 내에 CEA-708 등을 기반으로 클로즈드 캡션 데이터가 포함된 경우, 앞서 설명된 HEVC 비디오 데이터 관련 정보들과 함께, 클로즈드 캡션 관련 정보들이 전술한 방법에 의해 함께 시그널링될 수 있다.
도 38 은 본 발명의 다른 실시예에 따른 캡션(caption) 정보를 도시한 도면이다. 캡션 정보는 해당 서비스 컴포넌트가 클로즈드 캡션 스트림 컴포넌트인 경우, 그와 관련된 캡션 디스크립션 정보를 포함할 수 있다. 캡션 정보는 전술한 실시예에 따른 디스크립터들 중 하나의 형태를 가지거나, 엘레멘트의 형태를 가질 수 있다. 이는 전술한 componentProperty 엘레멘트 등으로 나타내어질 수도 있다. 더 나아가 DASH 에서 Representation/AdaptationSet 등이 closed caption/subtitle 을 포함하는 경우 DASH MPD 의 Essential Property Descriptor혹은 supplemental Property Descriptor 등으로서 아래의 형태를 포함 할 수도 있다. 도시된 실시예에서 캡션 정보는 디스크립터 형태로 정의될 수 있다. @schemeIdUri 는 해당 디스크립터가 캡션 정보에 관련한 캡션 스킴을 가짐을 식별하기 위한 URI 일 수 있다. 이 경우, @schemeIdUri 는 urn:atsc3.0:caption:201x 의 값을 가질 수 있다. @value 는 캡션 스킴에 따라 그 의미가 정의되는 값(value)들을 가질 수 있다. 이 값에 대해서는 후술한다. 도시된 실시예는 전술한 @value 의 각 파라미터들을 나타낼 수 있다. caption_codec 은 해당 캡션 컴포넌트의 인코딩 타입을 나타낼 수 있다. 실시예에 따라 “CEA-608”, “CEA-708”, “SMPTE-TT” 등이 지시될 수 있다. lang 은 해당 캡션 컴포넌트의 언어정보를 포함할 수 있다. caption_service_number 는 해당 캡션 컴포넌트의 타입이 CEA-708인 경우, 해당 캡션의 서비스 넘버를 포함할 수 있다. accessibility는 해당 캡션 컴포넌트가 포함하는 closed caption/subtitle 의 대상 사용자 등을 가리킬 수 있으며 이에 대한 정보는 다음과 같은 값을 가질 수 있다. 구체적으로 0 : normal , 1: easy reader, 2: visually impaired, 3: hearing impaired 를 나타낼 수 있다. aspect_ratio 는 해당 캡션 컴포넌트의 디스플레이 종횡비(display aspect ratio)를 나타낼 수 있다. 실시예에 따라 “4:3”, “16:9”, “21:9” 등이 지시될 수 있다. alternative_aspect_ratio는 해당 캡션 컴포넌트의 호환 가능한 디스플레이 종횡비(display aspect ratio)를 나타낼 수 있다. 실시예에 따라 “4:3”, “16:9”, “21:9” 등이 지시될 수 있다. scaling_support는 Closed caption/subtitle 의 오리지널 closed caption/subtitle 영역이 수신기 상에서 presentation 될 때, 경우에 따라 확장 가능한지를 나타낼 수 있다. 또는 확장에 따른 세부 파라미터를 closed caption/subtitle 등이 포함하는지 여부를 나타낼 수 있다. 해당 영역이 수신기 상에서 presentation 시 확장이 가능한 경우 '1' 을 가질 수 있다. scrolling_support는 Closed caption/subtitle 의 오리지널 closed caption/subtitle 영역이 수신기 상에서 스크롤링이 지원 가능한지를 나타낼 수 있다. 또는 이에 따른 세부 파라미터가 closed caption/subtitle 내에 포함되어 있는지 여부 등을 나타낼 수 있다. Scrolling 이 가능한 경우 해당 정보는 '1' 을 가질 수 있다. playout_speed는 Closed caption/subtitle 의 오리지널 closed caption/subtitle 영역이 수신기 상에서 presentation 시 play-out 되는 속도를 나타낼 수 있다. extended_color_use는 Closed caption/subtitle 이 8비트 이상으로 구성된 color 값을 사용하는 지 여부를 나타낼 수 있다. 3D supported 는 해당 캡션 컴포넌트가 3D 를 지원하는지 여부를 나타낼 수 있다. 3D_disparity는 Closed caption/subtitle 이 3D 를 지원하는 경우 스크린 대비 caption 의 3D location of the front-most closed caption/subtitle 을 나타낼 수 있다. 3D_disparity 가 음의 값을 가지는 경우 스크린을 기준으로 앞으로 튀어 나오는 효과의 정도를 나타낼 수 있으며 양의 값을 가지는 경우 반대로 사용될 수 있다. 비디오 내의 여러 closed caption 영역에 대한 disparity 중 가장 앞쪽에 해당되는 값 (minimum disparity)을 명시할 수 있다. 실시예에 따라 캡션 정보는, 전술한 @value 의 각 파라미터들을 서브 필드로 가지는 캡션 엘레멘트 형태로 정의될 수도 있다.
도 39는 본 발명의 다른 실시예에 따른 캡션(caption) 정보를 도시한 도면이다. 캡션 정보는 해당 서비스 컴포넌트가 클로즈드 캡션 스트림 컴포넌트인 경우, 그와 관련된 캡션 디스크립션 정보를 포함할 수 있다. 캡션 정보는 전술한 실시예에 따른 디스크립터들 중 하나의 형태를 가지거나, 엘레멘트의 형태를 가질 수 있다. 이는 전술한 componentProperty 엘레멘트 등으로 나타내어질 수도 있다. 더 나아가 DASH 에서 Representation/AdaptationSet 등이 closed caption/subtitle 을 포함하는 경우 DASH MPD 의 Essential Property Descriptor혹은 supplemental Property Descriptor 등으로서 아래의 형태를 포함 할 수도 있다. 도시된 실시예에서는 도 38에 비해 추가적으로 포함된 정보에 대해서만 설명하도록 한다. 그 외의 정보들은 전술한 바와 같다. 도시된 실시예에서 캡션 정보는 디스크립터 형태로 정의될 수 있다. @schemeIdUri 는 해당 디스크립터가 캡션 정보에 관련한 캡션 스킴을 가짐을 식별하기 위한 URI 일 수 있다. 이 경우, @schemeIdUri 는 urn:atsc3.0:caption:201x 의 값을 가질 수 있다. @value 는 캡션 스킴에 따라 그 의미가 정의되는 값(value)들을 가질 수 있다. 추가된 @value들은 다음과 같다. Profile은 XML 기반 Timed text 등을 사용하여 closed caption 을 나타내는 형식을 나타낼 수 있다. 예를 들어, TTML, IMSC, EBU-TT-D 등을 나타낼 수 있다. profile_version은 전술한 profile 이 가리키는 형식의 버전 정보를 나타낼 수 있다. 즉, profile 이 TTML 을 가리키는 경우 TTML1 혹은 TTML2, IMSC 을 사용하는 경우 IMSC1 혹은 IMSC2 등을 나타낼 수 있다. sub-profile은 앞선 profile 이 가리키는 형식 내 세부 프로파일을 가리킬 수 있다. 예를 들어 IMSC 인 경우 image-only profile, text-only profile 등을 나타낼 수 있다. 즉, caption/subtitle 이 이미지만 포함하고 있는지, 텍스트만 포함하고 있는지, 더 나아가 이미지와 텍스트가 혼합되어 있는지 등을 나타낼 수 있다. WCG_support는 Closed caption/subtitle 이 wide color gamut을 사용하는 지 여부를 나타낼 수 있다. Color_gamut은 Closed caption/subtitle 이 사용하는 color gamut 에 대한 정보를 나타낼 수 있다. 이는 color gamut 의 종류 (BT 709, BT2020 등), 더 나아가 red, green, blue, white point 의 CIExy coordinate 값을 포함할 수도 있다. HDR_support는 Closed caption/subtitle 이 HDR content 을 포함하는지 여부를 나타낼 수 있다. HDR은 Closed caption/subtitle 이 사용하는HDR 관련 파라미터들의 조합을 나타내는 식별자를 포함할 수 있다. 실시 예로 다음과 같은 값을 가질 수 있다. 0의 경우, non-specified를 나타낼 수 있다. 1의 경우, EOTF : SMPTE ST2084, bit depth: 12bit/pixel, peak luminance : 10000nit, codec : HEVC dual codec (HEVC+HEVC), metadata는 SMPTE ST 2086, SMPTE ST 2094 을 사용함을 나타낼 수 있다. 2의 경우, EOTF : SMPTE ST2084, bit depth: 10bit/pixel, peak luminance : 4000nit, codec : HEVC single codec, metadata는 SMPTE ST 2086, SMPTE ST 2094 사용함을 나타낼 수 있다. 3의 경우, EOTF : BBC EOTF, bit depth: 10bit/pixel, peak luminance : 1000nit, codec : HEVC single codec임을 나타낼 수 있다. 4-255의 경우, reserved for future use임을 나타낼 수 있다. 이에 추가적으로 OETF_type, max_mastering_display_luminance, min_mastering_display_luminance, average_frame_luminance_level, max_frame_pixel_luminance 등을 나타내는 밸류들을 포함할 수도 있다.
도 40은 본 발명의 일 실시예에 따른 MMT 메시지 형식을 나타낼 수 있다. 전술한 Component Description 혹은 Component property element 는 DASH MPD 의 Essential Property Descriptor혹은 supplemental Property Descriptor 등으로서 나타내어질 수 있으며 이는 MPD 에 포함되어 전달될 수도 있다. 또한 다른 실시예로써 본 발명에 제안하는 descriptor 등은 도시된 mmt_atsc3_message 의 message payload 등에 포함되어 전달될 수도 있다. mmt_atsc3_message 는 다음의 정보를 포함할 수 있다. message_id 는 mmt_atsc3_message 를 유니크하게 식별하는 식별자를 나타낸다. Version은 메시지의 정보가 변경될 때마다 1씩 증가하여 해당 메시지의 버전을 나타낸다. Length 는 mmt_atsc3_message의 길이를 바이트 단위로 나타낸다. service_id 는 mmt_atsc3_message의 페이로드에 포함된 서비스를 식별하는 식별자이다. atsc3_message_content_type 은 mmt_atsc3_message 의 페이로드에 포함된 메시지 컨텐트의 타임을 식별하는 식별자이다. atsc3_message_content_version 은 atsc3_message 컨텐트 내의 정보 변화가 있는지 나타내는 버전 정보이다. atsc3_message_content_compression 은 atsc3_message에 포함된 데이터에 적용된 컴프레션의 타입을 나타낸다. URI_length 는 메시지 페이로드와 서비스 관계를 식별하는 URI의 길이를 나타낸다. URI_byte 는 해당 메시지에 의해 운반되는 컨텐트와 관련된 URI를 나타낸다. atsc3_message_content_length 는 해당 메시지에 의해 운반되는 컨텐트의 길이를 나타낸다. atsc3_message_content_byte 는 해당 메시지에 의해 운반되는 컨텐트의 바이트를 나타낸다.
도 41은 본 발명의 일 실시예에 따른 시그널링 테이블인 DCI 테이블을 나타낸다. MMT 시그널링은 방송 서비스의 컴포넌트 consumption 을 위해 요구되는 디바이스 capabilities 에 대한 정보를 제공하는 시그널링 테이블인 DCI Table (Device Capabilities Information Table)을 포함할 수 있다. DCI 테이블은 table_id, version, length, number_of_assets, asset_id(), mime_type(), codec_complexity_flag 정보를 포함할 수 있다. DCI 테이블은 codec_complexity_flag가 1로 설정되고, 각 asset의 top 레벨 mime_type() 이 비디오인 경우 video_codec_complexity에 대한 video_average_bitrate, video_maximum_bitrate, horizontal_resolution, vertical_resolution, temporal_resolution, video_minimum_buffer_size 과 같은 정보를 더 포함할 수 있다. DCI 테이블은 codec_complexity_flag가 1로 설정되고, 각 asset의 top 레벨 mime_type() 이 오디오인 경우 audio_codec_complexity에 대한 audio_average_bitrate, audio_maximum_bitrte, audio_minimum_buffer_size와 같은 정보를 더 포함할 수 있다. DCI 테이블은 codec_complexity_flag가 0으로 설정된 경우, download_capability에 대한 required_storage 정보를 더 포함할 수 있다. 또한 DCI 테이블은 asset_descriptors 를 더 포함할 수 있으며, 그 안에 num_asset_descriptors 정보를 더 포함할 수 있다. DCI 테이블은 num_asset_descriptors 만큼의 asset_descriptors 를 포함할 수 있으며, 각 asset_descriptors의 내용을 포함하는 asset_descriptors_byte 정보를 더 포함할 수 있다.
table_id 정보는 DCI 테이블의 식별자를 나타낼 수 있다. version 정보는 DCI 테이블의 버전 정보를 나타낼 수 있다. length 정보는 해당 필드에 뒤따르는 필드들의 길이정보를 나타낼 수 있다. number_of_assets 정보는 DCI 테이블이 기술하는 asset의 개수를 나타낼 수 있다. asset_id()는 각 asset의 식별자를 나타내고, mime_type() 정보는 각 asset의 mime 타입을 나타낼 수 있다. codec_complexity_flag는 코덱 복잡도를 나타내는 플래그 정보이다. video_average_bitrate 정보는 비디오 데이터의 평균 비트레이트를 나타내고, video_maximum_bitrate 정보는 비디오 데이터의 최대 비트레이트를 나타낼 수 있다. horizontal_resolution 정보는 수평 해상도, vertical_resolution, 정보는 수직 해상도, temporal_resolution 정보는 시간 해상도를 나타낼 수 있다. video_minimum_buffer_size 정보는 비디오 데이터를 위한 최소 버퍼 사이즈를 나타낼 수 있다. audio_average_bitrate 정보는 오디오 데이터의 평균 비트레이트를 나타내고, audio_maximum_bitrate 정보는 오디오 데이터의 최대 비트레이트를 나타낼 수 있다. audio_minimum_buffer_size 정보는 오디오 데이터를 위한 최소 버퍼 사이즈를 나타낼 수 있다. download_capability는 다운로드에 필요한 캐퍼빌러티를 정의하고, 다운로드에 필요한 스토리지 크기를 나타내는 required_storage 정보를 포함할 수 있다. num_asset_descriptors 정보는 asset descriptor 의 개수를 나타낼 수 있다. asset_descriptors_byte 정보는 mime_type() 의 값 등에 따라 asset 관련 세부 정보 등을 포함하는asset level descriptor 을 포함 할 수 있다.
도 42 는 본 발명의 일 실시예에 따른 MP 테이블의 일부를 도시한 도면이다. MMT 상에서 서비스를 구성하는 asset (컴포넌트에 해당) 에 대한 정보를 MP 테이블을 이용하여 시그널링 할 수 있다. 전술한 MPT 메시지는 MP 테이블을 전달할 수 있다. 전술한 바와 같이, 접근성, 3D, 캡션 등등의 정보들은 MMTP 메시지를 통해 전달될 수도 있다. 도시된 바와 같이 MPT 메시지 내에 일부로서 포함되어 전달될 수도 있고, 별개로 정의되는 MMTP 메시지를 통해 MMT 시그널링으로서 전달될 수도 있다. 이 정보들 및 전달 형태에 대해서는 자세히 후술한다.
이 정보들은 MPT 메시지 또는 기타 MMTP 메시지 내에 디스크립터 형태로 전달될 수 있으며, 실시예에 따라 이 디스크립터들은 에셋(asset) 디스크립터에 해당할 수도 있다. 또한, 이 디스크립터들은 SDT 또는 EIT 등의 DVB SI 서비스 시그널링에 포함되어 전달되거나, 함께 전달될 수도 있다.
실시예에 따라, MMT 상에서, 서비스 컴포넌트(에셋(asset)에 해당)에 대한 정보는 도시된 바와 같이 시그널링될 수 있다. MMTP 메시지에 후술할 필드들이 더 추가될 수 있다.
service type 필드는 해당 서비스 컴포넌트 또는 asset이 포함된 서비스의 타입에 대한 정보를 나타낼 수 있다. mime_type_len 필드는 mime_type의 길이를 나타낼 수 있다. mime_type () 필드는 해당 asset의 mime_type 을 나타낼 수 있다. MMT 상에서 서비스를 구성하는 asset 의 mime_type () 은, RFC 6381 과 같이, 코덱, 해당 코덱의 세부 정보를 signaling할 수 있다. 예를 들어, general_profile_space, general_profile_idc, general_profile_compatibility_flags, general_tier_flag, general_level_idc 등을 포함할 수 있고, 추가적으로 Scalable(Layered) HEVC 등의 경우에는 서브 레이어 관련된 정보 등을 시그널링 할 수 있다.
asset_role_flag 필드는 해당 서비스 컴포넌트(에셋)에 대한 역할(role) 정보가 포함되는지 여부를 지시할 수 있다. asset_target_flag 필드는 해당 서비스 컴포넌트에 대한 타겟 스크린 정보가 포함되는지 여부를 지시할 수 있다. asset_group_flag 필드는 해당 서비스 컴포넌트가 특정 컴포넌트 그룹에 소속되는지 여부를 지시할 수 있다. 특정 컴포넌트 그룹에 포함되는 경우, 본 필드의 값이 1 이될 수 있다. rt_flag 필드는 해당 서비스 컴포넌트가 실시간/비실시간으로 전송되는지 여부를 지시할 수 있다. 본 필드 값이 1 인 경우 해당 서비스 컴포넌트는 실시간으로 전송될 수 있다.
asset_role 필드는 해당 서비스 컴포넌트의 역할(role)을 나타낼 수 있다. 예를 들어 본 필드의 값이 0, 1, 2, 3, 4, 5, 6, 7 인 경우, 해당 서비스 컴포넌트는 프라이머리 비디오, 대체 카메라 뷰, 다른 대체 비디오 컴포넌트, 수화, 팔로우 서브젝트 비디오(Follow subject video), 3D 좌영상, 3D 우영상, 3D 깊이 정보 등의 역할을 함이 지시될 수 있다.
asset_target 필드는 해당 서비스 컴포넌트가 타겟하는 타겟 디바이스를 지시할 수 있다. 전술한 @targetDevice 의 정의와 같을 수 있다. asset_group_id 필드는 해당 서비스 컴포넌트가 포함되는 컴포넌트 그룹의 식별자를 제공할 수 있다. 컴포넌트 그룹에 대해서는 전술한 바와 같다.
도 43은 본 발명의 일 실시예에 따른 복수의 디스크립터들을 나타낸다. 도시된 descriptor 들은 전술한 MMT 의 MP table , DCI Table 등의 서비스 시그널링 테이블에서 asset descriptor 등으로 전달될 수 있으며 이는 DVB SI (SDT 또는 EIT)등 서비스 시그널링의 일부로서 전달될 수도 있다. 도면 상단에 도시된 바와 같이 accessibility_descriptor 는 각 컴포넌트와 관련된 asssessiblity 에 대한 정보를 하기와 같은 형태로 시그널링 할 수 있다. accessibility_descriptor 는 다음의 필드들을 포함할 수 있다. descriptor_tag 필드는 accessibility_descriptor 에 대한 식별자 일 수 있다. descriptor_length 필드는 해당 accessibility_descriptor 의 길이를 나타낼 수 있다. num_of_accessiblity 필드는 뒤 따르는 accessiblity_code 의 개수를 나타낼 수 있다. accessiblity_code필드는 연관된 accessbility 에 대한 정보를 포함할 수 있다. 이는 다음과 같은 값을 포함할 수 있다. 0x00 : visually impaired, 0x01 : hearing impaired, 0x02: 3D supported. 0x03-0xFF : reserved for future use
capability_descriptor는 컴포넌트와 관련된 capability에 대한 정보를 도면 중간에 도시된 형태로 시그널링 할 수 있다. capability_descriptor는 다음의 필드들을 포함할 수 있다. num_capability_codes 필드는 해당 descriptor 가 포함하는capability 코드의 개수를 나타낼 수 있다. essential_indicator 필드는 뒤따르는 capability code 가 서비스/컴포넌트를 재생하는데 있어서 반드시 지원되어야 하는 지 여부를 가리키는 플래그일 수 있다. 또한 그 값이 1인 경우 뒤따르는 capability code 가 서비스/컴포넌트 재생에 반드시 필요한 속성임을 가리킬 수 있다. capability_category 필드는 capability 가 적용되는 대상 등을 나타내거나 capability 의 category 을 나타낼 수 있다. capability_code 필드는 서비스/컴포넌트에 대한 capability 코드를 나타낼 수 있다.
asset_group_descriptor는 하나 이상의 컴포넌트들이 모여 하나의 scene을 구성하는 경우 해당 컴포넌트 그룹인 asset group 에 대한 정보를 도면 하단에 도신된 형태로 시그널링 할 수 있다. asset_group_descriptor는 다음의 필드들을 포함할 수 있다. asset_group_id 필드는 asset group 에 대한 식별자 일 수 있다. num_of_accessiblity 필드는 해당 asset group 에 포함되는 asset 의 개수를 나타낼 수 있다. asset_id() 필드는 각 asset 의 식별자를 나타낼 수 있다.
도 44 는 본 발명의 일 실시예에 따른 캡션 관련 정보를 시그널링하기 위한 방안을 도시한 도면이다.
MMT asset 이 closed caption stream component 인 경우 앞서 명시한 MMT 의 MP table , DCI Table 등의 asset _descriptor 로서 도시된 closed caption descriptor 가 포함될 수 있다. 또는 asset_type 이 HEVC video stream 에 해당하는 값을 가지면서 asset descriptor 로서 하기 closed caption descriptor 을 가지는 경우 HEVC video bitstream 내에 closed caption 데이터가 포함되었음을 나타낼 수도 있다.
이는 MMT 의 다른 시그널링 테이블에 포함될 수도 있다. 도시된 바와 같이 방송 서비스의 캡션 (caption) 과 관련된 정보들이 전술한 테이블을 통해 시그널링될 수 있다. closed caption descriptor은 다음과 같은 필드들을 포함할 수 있다. descriptor_tag 필드는 해당 descriptor 가 closed caption stream 대한 정보를 포함하는 descriptor임을 나타내는 식별자 일 수 있다. descriptor_length 필드는 해당 descriptor 의 길이를 나타낼 수 있다. caption_lang 필드는 closed caption component 에서 사용하는 언어 정보를 포함할 수 있다. caption_codec 필드는 closed caption component 의 encoding 포멧 정보 등을 나타낼 수 있다. 이는 실시 예로 다음과 같은 값을 가질 수 있다. 0x01 : CEA-608, 0x02 : CEA-708, 0x03 : SMPTE timed text, 0x04 : EBU-TT-D, 0x05 : CFF-TT 0x06~ 0x1F : reserved for future use. easy_reader 필드는 closed caption component 데이터가 easy reader type 인지 여부를 나타내는 플래그일 수 있다. wide_aspect_ratio 필드는 closed caption component 데이터가 wide display aspect ratio 지원 여부를 나타낼 수 잇는 플래그이며 이에 대한 실시 예로 디음과 같은 값을 가질 수 있다. 0x01-4:3, 0x02-16:9, 0x03-0x04 : reserved for future use. 3d_supported 필드는 해당 closed caption component 가 3D 를 지원하는지 여부를 나타낼 수 있다. url_flag 필드는 뒤따르는 해당 closed caption component 와 연관된 캡션 정보 및 데이터를 획득할 수 있는 URL이 존재하는 지 여부를 나타낼 수 있으며 값이 1인 경우 URL_length, URL_text 필드 등이 존재할 수 있다. caption_service_number 필드는 closed caption component 의 encoding 포멧이 CEA-708 과 동일한 경우 캡션 서비스와 연관된 서비스 넘버를 포함할 수 있다. URL_length 필드는 뒤따르는 URL_text()의 길이를 나타낼 수 있다. URL_text 필드는 해당 closed caption component 와 연관된 캡션 정보 및 데이터를 획득할 수 있는 URL 을 포함할 수 있다. 이를 통하여 broadband 을 통해 해당 캡션 서비스 데이터를 획득할 수 있다. 실시예에 따라 방송 프로그램 관련 정보의 각 값/필드/정보들은 생략되거나 다른 형태로 구성될 수 있다.
도 45 는 본 발명의 다른 실시예에 따른 캡션 관련 정보를 시그널링하기 위한 방안을 도시한 도면이다. MMT asset 이 closed caption stream component 인 경우 앞서 명시한 MMT 의 MP table , DCI Table 등의 asset _descriptor 로서 도시된 closed caption descriptor 가 포함될 수 있다. 또는 asset_type 이 HEVC video stream 에 해당하는 값을 가지면서 asset descriptor 로서 하기 closed caption descriptor 을 가지는 경우 HEVC video bitstream 내에 closed caption 데이터가 포함되었음을 나타낼 수도 있다.
이는 MMT 의 다른 시그널링 테이블에 포함될 수도 있다. 도시된 바와 같이 방송 서비스의 캡션 (caption) 과 관련된 정보들이 전술한 테이블을 통해 시그널링될 수 있다. closed caption descriptor은 전술한 도 44에 포함된 필드에 추가적으로 다음과 같은 필드들을 포함할 수 있다. 중복된 설명은 생략하기로 한다. target_accessiblity 필드는 closed caption 등의 대상 사용자 등을 가리킬 수 있으며 이에 대한 정보는 다. 이는 다음과 같은 값을 가질 수 있다. 0 : normal , 1: easy reader, 2: visually impaired, 3: hearing impaired. aspect_ratio 필드는 Closed caption author 가 의도한 aspect ratio 을 나타낼 수 있다. 이에 대한 실시 예로 다음과 같은 값을 가질 수 있다. 0x01-4:3, 0x02-16:9, 0x03 : 21:9, 0x04- : reserved for future use. alternative_aspect_ratio_flag 필드는 Closed caption 의 호환 가능한 aspect ratio 정보가 포함되는지 여부를 나타낼 수 있다. scrolling_supported 필드는 Closed caption 의 영역 내에서 scroll 기능이 지원 가능한지 여부를 나타내는 플래그일 수 있다. scaling_supported 필드는 Closed caption 의 원래 closed caption 영역이 수신기 상에서 presentation 시 경우에 따라 확장 가능한지 여부를 나타내는 플래그일 수 있다. playout_speed_flag 필드는 closed caption 에 대한 playout 속도 정보가 포함되었는지를 나타내는 플래그일 수 있다. xtended_color_use 필드는 closed caption 의 8비트 이상으로 구성된 color 값을 사용하는지 여부를 나타낼 수 있다. min_disparity 필드는 closed caption 이 3D 를 지원하는 경우 스크린 대비 caption 의 3D location of the front-most closed caption/subtitle 을 나타낼 수 있다. 음의 값을 가지는 경우 스크린을 기준으로 앞으로 튀어 나오는 효과의 정도를 나타낼 수 있으며 양의 값을 가지는 경우 반대로 사용될 수 있다. 비디오 내의 여러 closed caption 영역에 대한 disparity 중 가장 앞쪽에 해당되는 값 (minimum disparity)을 명시할 수 있다. scroll_direction 필드는 Closed caption/subtitle 의 closed caption/subtitle 영역이 수신기 상에서 스크롤링 되는 방향 정보 등을 나타낼 수 있다. 이는 “Top2Bottom” , “Bottom2Top” , “Left2Right” , “Right2Left” 등의 값을 나타낼 수 있다. scroll_type 필드는 Closed caption/subtitle 의 closed caption/subtitle 영역이 수신기 상에서 스크롤링 지원 시 scrolling 의 진행 형태 등을 나타낼 수 있다. 예를 들어 이는 line (혹은 cell) 단위로 scrolling 이 진행되는지 혹은 pixel 단위로 scrolling 이 진행되는지 등을 나타낼 수 있다. scroll_amount 필드는 Closed caption/subtitle 의 closed caption/subtitle 영역이 수신기 상에서 스크롤링 지원 시 scrolling 되는 정도 등을 나타낼 수 있다. 이는 cell 수 혹은 pixel number 등으로 나타낼 수 있다. scroll_speed 필드는 Closed caption/subtitle 의 closed caption/subtitle 영역이 수신기 상에서 스크롤링 지원 시 scrolling 되는 속도 등을 나타낼 수 있다. 이는 second (필요시 소수 점 이하까지 표현가능) 단위 등으로 표현될 수 있다. scale_direction 필드는 Closed caption/subtitle 의 closed caption/subtitle 영역에 대한 확장 가능한 방향 정보 등을 나타낼 수 있다. 이는 “Top”, “Bottom”, “TomNBottom”, “Left”, “Right”, “LeftNRight”, “All” 등의 값을 가질 수 있다. Scale_limit_format 필드는 Closed caption/subtitle 의 closed caption/subtitle 영역에 대해 확장 가능한 경우 이에 대한 확장 limit 정도에 대한 단위를 나타낼 수 있다. 이는 cell, pixel 단위 등으로 나타내거나 퍼센트 등으로 나타낼 수 있다. Scale_limit_value 필드는 Closed caption/subtitle 의 closed caption/subtitle 영역에 대해 확장 가능한 경우 이에 대한 확장 limit 정도 등을 나타낼 수 있다. Playout_speed 필드는 Closed caption/subtitle 이 원래 closed caption/subtitle 영역이 수신기 상에서 presentation 시 play-out 되는 속도를 나타낼 수 있다. 이는 second (필요시 소수 점 이하까지 표현가능) 단위 등으로 표현될 수 있다.
도 46 내지 도 48은 본 발명의 다른 실시예에 따른 캡션 관련 정보를 시그널링하기 위한 방안을 도시한 도면이다. MMT asset 이 closed caption stream component 인 경우 앞서 명시한 MMT 의 MP table , DCI Table 등의 asset _descriptor 로서 도시된 closed caption descriptor 가 포함될 수 있다. 또는 asset_type 이 HEVC video stream 에 해당하는 값을 가지면서 asset descriptor 로서 하기 closed caption descriptor 을 가지는 경우 HEVC video bitstream 내에 closed caption 데이터가 포함되었음을 나타낼 수도 있다.
이는 MMT 의 다른 시그널링 테이블에 포함될 수도 있다. 도 46 내지 도 47에 도시된 바와 같이 방송 서비스의 캡션 (caption) 과 관련된 정보들이 전술한 테이블을 통해 시그널링될 수 있다. closed caption descriptor은 전술한 도 44 및 도 45에 포함된 필드에 추가적으로 다음과 같은 필드들을 포함할 수 있다. 중복된 설명은 생략하기로 한다. Profile 필드는 캡션/subtite 의 encoding 된 형식 내 프로파일 정보를 나타낼 수 있다. 예를 들어 캡션/subtitle을 XML 기반 timed text 등으로 encoding 된 경우, Timed text 등을 사용하여 closed caption 을 나타내는 형식 (예를 들어, TTML, IMSC, EBU-TT-D 등을 나타낼 수 있다. Profile_version 필드는 앞선 profile 이 가리키는 형식의 버전 정보를 나타낼 수 있다. 즉, profile 이 TTML 을 가리키는 경우 TTML1 혹은 TTML2, IMSC 을 사용하는 경우 IMSC1 혹은 IMSC2 등을 나타낼 수 있다 Sub-profile 필드는 앞선 profile 이 가리키는 형식 내 세부 프로파일을 가리킬 수 있다. 예를 들어 IMSC 인 경우 image-only profile, text-only profile 등을 나타낼 수 있다. 혹은 caption/subtitle 이 이미지만 포함하고 있는지, 텍스트만 포함하고 있는지, 더 나아가 이미지와 텍스트가 혼합되어 있는지 등을 나타낼 수 있다. wcg_use 필드는 Closed caption/subtitle 이 wide color gamut을 사용하는 지 여부를 나타낼 수 있다. color_gamut_included 필드는 Closed caption/subtitle 이 사용한 color gamut 관련 정보를 포함하는지 여부를 나타낼 수 있다. hdr_use 필드는 Closed caption/subtitle 이 HDR content 를 포함하는지 여부를 나타낼 수 있다.
color_gamut_type 필드는 color gamut 의 타입, 즉, encoding/decoding 시 사용한(사용할 수 있는) color primaries에 대한 chromaticity coordinates 을 가리킬 수 있다. color_primary_flag 필드는 encoding/decoding 시 사용한 또는 사용할 수 있는 color primaries 의 chromaticity coordinates 에 대한 세부 정보가 존재하는지 여부를 나타내는 플래그일 수 있다. color_primaryRx필드는 encoding/decoding 시 사용한 또는 사용할 수 있는 color primaries 의 R-color 의 x 좌표값을 나타낼 수 있다. color_primaryRy필드는 encoding/decoding 시 사용한 또는 사용할 수 있는 color primaries 의 R-color 의 y 좌표값을 나타낼 수 있다. color_primaryGx필드는 encoding/decoding 시 사용한 또는 사용할 수 있는 color primaries 의 G-color 의 x 좌표값을 나타낼 수 있다. color_primaryGy encoding/decoding 시 사용한 또는 사용할 수 있는 color primaries 의 G-color 의 y 좌표값을 나타낼 수 있다. color_primaryBx필드는 encoding/decoding 시 사용한 또는 사용할 수 있는 color primaries 의 B-color 의 x 좌표값을 나타낼 수 있다. color_primaryBy필드는 encoding/decoding 시 사용한 또는 사용할 수 있는 color primaries 의 B-color 의 y 좌표값을 나타낼 수 있다. color_whitePx필드는 encoding/decoding 시 사용한 또는 사용할 수 있는 color primaries 의 white point 의 x 좌표값을 나타낼 수 있다. color_whitePy필드는 encoding/decoding 시 사용한 또는 사용할 수 있는 color primaries의 white point 의 y 좌표값을 나타낼 수 있다. hdr_param_set 필드는 caption/subtitle 내 포함된 HDR 콘텐츠의 HDR 관련 파라미터들의 조합을 나타내는 식별자를 나타낼 수 있다. 실시 예로 도 48에 도시된 바와 같은 값을 가질 수 있다. hdr_config_flag 필드는 caption/subtitle 내 HDR 콘텐츠 의 HDR 파라미터에 대한 세부 정보의 포함 여부를 나타내는 플래그 일 수 있다. 해당 값이 '1'인 경우, OETF_type, max_mastering_display_luminance, min_mastering_display_luminance, average_frame_luminance_level, max_frame_pixel_luminance 필드 값이 존재할 수 있다.
OETF_type필드는 caption/subtite 내 HDR 콘텐츠에 적용된 opto-electronic transfer function 에 대한 식별자를 나타낼 수 있다. 이에 대한 값은 다음과 같을 수 있다. 0: reserved, 1: ITU-R BT.1886, 2: ITU-R REC.709, 3:ITU-R BT.2020, 4-255 : reserved for future use. max_mastering_display_luminance필드는 mastering display 의 peak luminance 값을 나타낼 수 있다. 이는 100 에서 10000 사이 값을 가질 수 있다. min_mastering_display_luminance필드는 mastering display 의 minimum luminance 값(fractional value)을 나타낼 수 있다. 이는 0 에서 1.0 사이 값을 가질 수 있다. average_frame_luminance_level필드는 caption/subtite 내 HDR 콘텐츠의 luminance level 의 평균 값들 중 최대값을 나타낼 수 있다. max_frame_pixel_luminance필드는 caption/subtite 내 HDR 콘텐츠각각의 pixel luminance 의 최대값들 중 가장 큰 값을 나타낼 수 있다.
도 49는 본 발명의 일 실시예에 따른 방송 신호를 전송하는 방법을 나타낸 도면이다. 방송 신호 전송 방법은 서비스 데이터를 생성할 수 있다 (DS49010). 서비스 데이터는 방송 신호를 통해 전송되는 비디오, 오디오 데이터 뿐만 아니라 자막 데이터를 포함할 수 있다. 방송 신호 전송 방법은 서비스 데이터를 시그널링하는 시그널링 정보를 생성할 수 있다 (DS49020). 본 발명의 시그널링 정보는 전술한 서비스 레벨 시그널링 정보를 포함할 수 있으며, 전술한 자막 관련 정보를 포함할 수 있다. 본 자막 관련 정보에 대한 시그널링 정보는 도 15 내지 도 48에서 설명한 바와 같다. 방송 신호 전송 방법은 서비스 데이터 및 시그널링 정보를 포함하는 방송 신호를 전송할 수 있다 (DS49030). 여기서 시그널링 정보는 자막에 대한 정보를 포함할 수 있다. 자막에 대한 정보는 도 15 내지 도 48에서 전술한 바와 같이, 자막 텍스트 데이터와 함께 전송되는 메타데이터의 형태로 전송될 수 있다. 이 경우, 자막에 대한 정보는 서비스 데이터에 포함되어 함께 전송될 수 있다. 또한, 자막에 대한 정보는 별도의 테이블 또는 디스크립터로써 SDT 또는 EIT 등의 DVB SI 서비스 시그널링에 포함되어 전달되거나, 함께 전달될 수도 있다. 또한 자막에 대한 정보는 전술한 ISOBMFF 내의 box에 포함되어 전송될 수 있다. 이 경우에도 자막에 대한 정보는 서비스 데이터에 포함되어 함께 전송될 수 있다. 또한 자막에 대한 정보는 별도의 테이블 또는 디스크립터에 포함되어 별도의 시그널링 정보로써 전송될 수 있다. 예를 들어, 전술한 바와 같이 MPEG-DASH의 MPD에 포함되거나, MMT 의 MP table, DCI Table 등의 asset _descriptor 로써 포함되어 전송될 수 있다. 자막에 대한 정보는 전술한 바와 같이 스크롤 방향, 스크롤 속도, 스크롤 타입, 스케일링, 3D 디스패러티, 색공간, 화면 비율, 및/또는 프리젠테이션 앵커 타임 관련 정보를 포함할 수 있다.
도 50은 본 발명의 일 실시예에 따른 방송 신호를 전송하는 장치를 나타낸 도면이다. 방송 신호 전송 장치는 서비스 데이터 생성부(D50010)를 통해 서비스 데이터를 생성할 수 있다. 서비스 데이터는 방송 신호를 통해 전송되는 비디오, 오디오 데이터뿐만 아니라 자막 데이터를 포함할 수 있다. 방송 신호 전송 장치는 시그널링 생성부(D50020)를 통해 서비스 데이터를 시그널링하는 시그널링 정보를 생성할 수 있다. 서비스 데이터 생성부(D50010) 및 시그널링 생성부(D50020)는 각각의 프로세서로 구현되어 동작할 수 있으며, 실시예에 따라 하나의 프로세서 내에 통합되어 구현되고 동작할 수 있다. 본 발명의 시그널링 정보는 전술한 서비스 레벨 시그널링 정보를 포함할 수 있으며, 전술한 자막 관련 정보를 포함할 수 있다. 본 자막 관련 정보에 대한 시그널링 정보는 도 15 내지 도 48에서 설명한 바와 같다. 방송 신호 전송 방법은 전송부(D50030)를 이용하여 서비스 데이터 및 시그널링 정보를 포함하는 방송 신호를 전송할 수 있다. 여기서 시그널링 정보는 자막에 대한 정보를 포함할 수 있다. 자막에 대한 정보는 도 15 내지 도 48에서 전술한 바와 같이, 자막 텍스트 데이터와 함께 전송되는 메타데이터의 형태로 전송될 수 있다. 이 경우, 자막에 대한 정보는 서비스 데이터에 포함되어 함께 전송될 수 있다. 또한 자막에 대한 정보는 전술한 ISOBMFF 내의 box에 포함되어 전송될 수 있다. 이 경우에도 자막에 대한 정보는 서비스 데이터에 포함되어 함께 전송될 수 있다. 또한 자막에 대한 정보는 별도의 테이블 또는 디스크립터에 포함되어 별도의 시그널링 정보로써 전송될 수 있다. 예를 들어, 전술한 바와 같이 MPEG-DASH의 MPD에 포함되거나, MMT 의 MP table, DCI Table 등의 asset _descriptor 로써 포함되어 전송될 수 있다. 또한, 자막에 대한 정보는 별도의 테이블 또는 디스크립터로써 SDT 또는 EIT 등의 DVB SI 서비스 시그널링에 포함되어 전달되거나, 함께 전달될 수도 있다. 자막에 대한 정보는 전술한 바와 같이 스크롤 방향, 스크롤 속도, 스크롤 타입, 스케일링, 3D 디스패러티, 색공간, 화면 비율, 및/또는 프리젠테이션 앵커 타임 관련 정보를 포함할 수 있다.
본 발명의 실시예들에 따른 모듈, 유닛 또는 블락은 메모리(또는 저장 유닛)에 저장된 연속된 수행과정들을 실행하는 프로세서/하드웨어일 수 있다. 전술한 실시예에 기술된 각 단계 또는 방법들은 하드웨어/프로세서들에 의해 수행될 수 있다. 또한, 본 발명이 제시하는 방법들은 코드로서 실행될 수 있다. 이 코드는 프로세서가 읽을 수 있는 저장매체에 쓰여질 수 있고, 따라서 본 발명의 실시예들에 따른 장치(apparatus)가 제공하는 프로세서에 의해 읽혀질 수 있다.
설명의 편의를 위하여 각 도면을 나누어 설명하였으나, 각 도면에 서술되어 있는 실시 예들을 병합하여 새로운 실시 예를 구현하도록 설계하는 것도 가능하다. 그리고, 당업자의 필요에 따라, 이전에 설명된 실시 예들을 실행하기 위한 프로그램이 기록되어 있는 컴퓨터에서 판독 가능한 기록 매체를 설계하는 것도 본 발명의 권리범위에 속한다.
본 발명에 따른 장치 및 방법은 상술한 바와 같이 설명된 실시 예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상술한 실시 예들은 다양한 변형이 이루어질 수 있도록 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
한편, 본 발명의 영상 처리 방법은 네트워크 디바이스에 구비된 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
발명의 실시를 위한 형태
다양한 실시예가 본 발명을 실시하기 위한 최선의 형태에서 설명되었다.
본 발명은 일련의 방송 신호 제공 분야에서 이용된다.
본 발명의 사상이나 범위를 벗어나지 않고 본 발명에서 다양한 변경 및 변형이 가능함은 당업자에게 자명하다. 따라서, 본 발명은 첨부된 청구항 및 그 동등 범위 내에서 제공되는 본 발명의 변경 및 변형을 포함하는 것으로 의도된다.

Claims (14)

  1. 방송 서비스의 서비스 데이터를 생성하는 단계, 상기 서비스 데이터는 상기 방송 서비스에 포함되는 서비스 컴포넌트를 포함함;
    상기 방송 서비스를 시그널링하는 서비스 시그널링 정보를 생성하는 단계; 및
    상기 서비스 데이터 및 상기 서비스 시그널링 정보를 포함하는 방송 신호를 전송하는 단계; 를 포함하는 방송 신호 전송 방법.
  2. 제 1 항에 있어서,
    상기 서비스 컴포넌트는 캡션 컨포넌트를 포함하고, 상기 서비스 시그널링 정보는 상기 캡션 컨포넌트에 대한 메타데이터를 포함하는 방송 신호 전송 방법.
  3. 제 2 항에 있어서,
    상기 캡션 컨포넌트에 대한 메타 데이터는 상기 캡션 컨포넌트에 대한 스크롤 정보, 스케일링 정보, 3D 디스패러티 정보 및 색공간 정보를 포함하는 방송 신호 전송 방법.
  4. 제 2 항에 있어서, 상기 캡션 컨포넌트에 대한 메타데이터는 상기 서비스 시그널링 정보에 포함된 USBD (User Service Bundle Description), 미디어 프리젠테이션 디스크립터 (Media Presentation Descriptor, MPD) 또는 MMT (MPEG Media Transport) 패키지 테이블에 포함되어 전송되는 방송 신호 전송 방법.
  5. 제 4 항에 있어서,
    상기 USBD 는 상기 방송 서비스의 상기 서비스 컴포넌트에 대한 컴포넌트 정보들을 포함하고,
    상기 컴포넌트 정보는 해당 서비스 컴포넌트의 타입을 지시하는 컴포넌트 타입 정보 및 상기 해당 서비스 컴포넌트의 타입에 따라 상기 해당 서비스 컴포넌트의 역할을 지시하는 컴포넌트 역할(role) 정보를 포함하고,
    상기 컴포넌트 역할 정보는 상기 방송 서비스의 캡션 컴포넌트가 일반 사용자 또는 이지 리더 (Easy reader)를 위한 컴포넌트인지 여부를 지시하는 방송 신호 전송 방법.
  6. 제 2 항에 있어서, 상기 캡션 컨포넌트에 대한 메타데이터는 상기 서비스 데이터에 포함되어 전송되고, 상기 메타데이터는 프리젠테이션 앵커 타임에 대한 정보를 더 포함하는 신호 전송 방법.
  7. 제 4 항에 있어서, 상기 방송 서비스의 상기 서비스 시그널링 정보가 ROUTE (Real-Time Object Delivery over Unidirectional Transport) 프로토콜에 의해 전달되는 경우,
    상기 USBD 는 상기 방송 서비스의 서비스 데이터에 대한 리소스 식별자들 및 상기 리소스의 컨텍스트(context) 정보를 포함하는 상기 MPD를 레퍼런싱하는 정보를 더 포함하고,
    상기 MPD 는 상기 방송 서비스에 대한 캡션 정보 및 3D 관련 정보를 더 포함하는 방송 신호 전송 방법.
  8. 방송 서비스의 서비스 데이터를 생성하는 서비스 데이터 생성부, 상기 서비스 데이터는 상기 방송 서비스에 포함되는 서비스 컴포넌트를 포함함;
    상기 방송 서비스를 시그널링하는 서비스 시그널링 정보를 생성하는 시그널링 생성부; 및
    상기 서비스 데이터 및 상기 서비스 시그널링 정보를 포함하는 방송 신호를 전송하는 전송부; 를 포함하는 방송 신호 전송 장치.
  9. 제 8 항에 있어서,
    상기 서비스 컴포넌트는 캡션 컨포넌트를 포함하고, 상기 서비스 시그널링 정보는 상기 캡션 컨포넌트에 대한 메타데이터를 포함하는 방송 신호 전송 장치.
  10. 제 9 항에 있어서,
    상기 캡션 컨포넌트에 대한 메타 데이터는 상기 캡션 컨포넌트에 대한 스크롤 정보, 스케일링 정보, 3D 디스패러티 정보 및 색공간 정보를 포함하는 방송 신호 전송 장치.
  11. 제 9 항에 있어서, 상기 캡션 컨포넌트에 대한 메타데이터는 상기 서비스 시그널링 정보에 포함된 USBD (User Service Bundle Description), 미디어 프리젠테이션 디스크립터 (Media Presentation Descriptor, MPD) 또는 MMT (MPEG Media Transport) 패키지 테이블에 포함되어 전송되는 방송 신호 전송 장치.
  12. 제 11 항에 있어서,
    상기 USBD 는 상기 방송 서비스의 상기 서비스 컴포넌트에 대한 컴포넌트 정보들을 포함하고,
    상기 컴포넌트 정보는 해당 서비스 컴포넌트의 타입을 지시하는 컴포넌트 타입 정보 및 상기 해당 서비스 컴포넌트의 타입에 따라 상기 해당 서비스 컴포넌트의 역할을 지시하는 컴포넌트 역할(role) 정보를 포함하고,
    상기 컴포넌트 역할 정보는 상기 방송 서비스의 캡션 컴포넌트가 일반 사용자 또는 이지 리더 (Easy reader)를 위한 컴포넌트인지 여부를 지시하는 방송 신호 전송 장치.
  13. 제 9 항에 있어서, 상기 캡션 컨포넌트에 대한 메타데이터는 상기 서비스 데이터에 포함되어 전송되고, 상기 메타데이터는 프리젠테이션 앵커 타임에 대한 정보를 더 포함하는 신호 전송 장치.
  14. 제 11 항에 있어서, 상기 방송 서비스의 상기 서비스 시그널링 정보가 ROUTE (Real-Time Object Delivery over Unidirectional Transport) 프로토콜에 의해 전달되는 경우,
    상기 USBD 는 상기 방송 서비스의 서비스 데이터에 대한 리소스 식별자들 및 상기 리소스의 컨텍스트(context) 정보를 포함하는 상기 MPD를 레퍼런싱하는 정보를 더 포함하고,
    상기 MPD 는 상기 방송 서비스에 대한 캡션 정보 및 3D 관련 정보를 더 포함하는 방송 신호 전송 장치.
KR1020177035184A 2015-07-06 2016-07-01 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법 KR102014800B1 (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201562189164P 2015-07-06 2015-07-06
US62/189,164 2015-07-06
US201562190750P 2015-07-10 2015-07-10
US201562190747P 2015-07-10 2015-07-10
US62/190,747 2015-07-10
US62/190,750 2015-07-10
US201562221102P 2015-09-21 2015-09-21
US62/221,102 2015-09-21
PCT/KR2016/007133 WO2017007192A1 (ko) 2015-07-06 2016-07-01 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법

Publications (2)

Publication Number Publication Date
KR20170142993A true KR20170142993A (ko) 2017-12-28
KR102014800B1 KR102014800B1 (ko) 2019-08-27

Family

ID=57685621

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177035184A KR102014800B1 (ko) 2015-07-06 2016-07-01 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법

Country Status (4)

Country Link
US (3) US10356451B2 (ko)
KR (1) KR102014800B1 (ko)
CN (3) CN112019884B (ko)
WO (1) WO2017007192A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210025508A (ko) * 2019-08-27 2021-03-09 한국전자통신연구원 Atsc 3.0 기반의 방송 콘텐츠 전송 장치 및 방법과, 방송 콘텐츠 수신 장치 및 방법

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6610019B2 (ja) * 2015-06-16 2019-11-27 ソニー株式会社 受信装置、送信装置、及び、データ処理方法
WO2017051808A1 (ja) 2015-09-25 2017-03-30 日立マクセル株式会社 放送受信装置
US10708647B2 (en) * 2015-09-25 2020-07-07 Maxell, Ltd. Broadcast receiving apparatus
US10582276B2 (en) * 2016-04-13 2020-03-03 Sharp Kabushiki Kaisha Signaling ratings information
CN116744012A (zh) * 2016-10-05 2023-09-12 杜比实验室特许公司 与源颜色体积信息的处理相关的计算机可读存储介质
US11606528B2 (en) 2018-01-03 2023-03-14 Saturn Licensing Llc Advanced television systems committee (ATSC) 3.0 latency-free display of content attribute
US11611803B2 (en) * 2018-12-31 2023-03-21 Dish Network L.L.C. Automated content identification for binge watching of digital media
US11706465B2 (en) 2019-01-15 2023-07-18 Sony Group Corporation ATSC 3.0 advertising notification using event streams
CN114128301B (zh) * 2019-07-19 2024-04-16 Lg电子株式会社 广播信号发送设备、广播信号发送方法、广播信号接收方法和广播信号接收设备
US11368730B2 (en) * 2019-08-27 2022-06-21 Electronics And Telecommunications Research Institute Apparatus and method for transmitting broadcast content based on ATSC 3.0, and apparatus and method for receiving broadcast content based ATSC 3.0
JP7434762B2 (ja) * 2019-09-10 2024-02-21 富士フイルムビジネスイノベーション株式会社 情報処理装置およびプログラム
US11616822B2 (en) * 2019-09-30 2023-03-28 Tencent America LLC Session-based information for dynamic adaptive streaming over HTTP
WO2021116839A1 (en) * 2019-12-11 2021-06-17 Sony Group Corporation Advanced television systems committee (atsc) 3.0 latency-free display of content attribute
CN113127785A (zh) * 2021-05-18 2021-07-16 深圳Tcl新技术有限公司 字幕处理方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130088741A (ko) * 2010-06-27 2013-08-08 엘지전자 주식회사 디지털 수신기 및 디지털 수신기에서의 캡션 데이터 처리 방법
WO2013133477A1 (ko) * 2012-03-05 2013-09-12 Jeon Jeong-Hwan 온라인 생방송을 위한 실시간 다국어 자막 서비스 시스템 및 그 방법
JP2014534696A (ja) * 2011-10-13 2014-12-18 サムスン エレクトロニクス カンパニー リミテッド マルチメディアサービス送受信方法及び装置
US20150074129A1 (en) * 2013-09-12 2015-03-12 Cisco Technology, Inc. Augmenting media presentation description and index for metadata in a network environment

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100565614B1 (ko) * 2003-09-17 2006-03-29 엘지전자 주식회사 캡션 송수신 방법
EP2112830A1 (en) * 2008-04-23 2009-10-28 Koninklijke KPN N.V. Method of processing an electronic service quide and electronic service quide broadcaster
US20100002134A1 (en) * 2008-07-03 2010-01-07 Sony Corporation Communication system with display status
KR101493696B1 (ko) 2008-09-25 2015-02-25 삼성전자주식회사 통합 메타데이터 생성 방법 및 그 장치
CA2745021C (en) * 2008-12-02 2014-10-28 Lg Electronics Inc. Method for displaying 3d caption and 3d display apparatus for implementing the same
WO2010107167A1 (en) * 2009-03-19 2010-09-23 Lg Electronics Inc. Transmitting/receiving system and method of processing data in the transmitting/receiving system
KR101652808B1 (ko) * 2009-03-19 2016-09-01 엘지전자 주식회사 송/수신 시스템 및 데이터 처리 방법
US9319448B2 (en) * 2010-08-10 2016-04-19 Qualcomm Incorporated Trick modes for network streaming of coded multimedia data
US9549197B2 (en) * 2010-08-16 2017-01-17 Dolby Laboratories Licensing Corporation Visual dynamic range timestamp to enhance data coherency and potential of metadata using delay information
EP2429197B1 (en) * 2010-09-09 2012-11-14 Advanced Digital Broadcast S.A. A method and a system for generating a signal for a video display unit
EP2432232A1 (en) * 2010-09-19 2012-03-21 LG Electronics, Inc. Method and apparatus for processing a broadcast signal for 3d (3-dimensional) broadcast service
WO2012144867A2 (ko) * 2011-04-20 2012-10-26 엘지전자 주식회사 방송 서비스 전송 방법, 그 수신 방법 및 그 수신 장치
WO2012150791A2 (en) * 2011-05-01 2012-11-08 Samsung Electronics Co., Ltd. Method and apparatus for transmitting/receiving broadcast service in digital broadcasting system, and system thereof
US9584238B2 (en) * 2011-06-24 2017-02-28 Nokia Corporation Accessing service guide information in a digital video broadcast system
US20130169762A1 (en) * 2011-07-15 2013-07-04 Hitachi Consumer Electronics, Ltd. Receiving apparatus, receiving method and transmitting apparatus
EP3490256B1 (en) 2013-01-02 2021-07-21 Dolby Laboratories Licensing Corporation Backward-compatible coding for ultra high definition video signals with enhanced dynamic range
JPWO2014196335A1 (ja) * 2013-06-07 2017-02-23 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US9674251B2 (en) * 2013-06-17 2017-06-06 Qualcomm Incorporated Mediating content delivery via one or more services
US10902474B2 (en) * 2014-03-24 2021-01-26 Qualcomm Incorporated Targeted advertisement insertion for streaming media data
KR102459246B1 (ko) * 2014-08-01 2022-10-27 소니그룹주식회사 수신 장치, 수신 방법, 송신 장치 및 송신 방법
MX366870B (es) * 2014-10-10 2019-07-29 Sony Corp Dispositivo de recepción, método de recepción, dispositivo de transmisión, y método de transmisión.
US10171849B1 (en) * 2015-07-08 2019-01-01 Lg Electronics Inc. Broadcast signal transmission device, broadcast signal reception device, broadcast signal transmission method, and broadcast signal reception method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130088741A (ko) * 2010-06-27 2013-08-08 엘지전자 주식회사 디지털 수신기 및 디지털 수신기에서의 캡션 데이터 처리 방법
JP2014534696A (ja) * 2011-10-13 2014-12-18 サムスン エレクトロニクス カンパニー リミテッド マルチメディアサービス送受信方法及び装置
WO2013133477A1 (ko) * 2012-03-05 2013-09-12 Jeon Jeong-Hwan 온라인 생방송을 위한 실시간 다국어 자막 서비스 시스템 및 그 방법
US20150074129A1 (en) * 2013-09-12 2015-03-12 Cisco Technology, Inc. Augmenting media presentation description and index for metadata in a network environment

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210025508A (ko) * 2019-08-27 2021-03-09 한국전자통신연구원 Atsc 3.0 기반의 방송 콘텐츠 전송 장치 및 방법과, 방송 콘텐츠 수신 장치 및 방법

Also Published As

Publication number Publication date
US11178436B2 (en) 2021-11-16
US20190281330A1 (en) 2019-09-12
CN112019884A (zh) 2020-12-01
KR102014800B1 (ko) 2019-08-27
CN107852516A (zh) 2018-03-27
US10356451B2 (en) 2019-07-16
CN112019883A (zh) 2020-12-01
CN107852516B (zh) 2020-10-13
CN112019884B (zh) 2022-04-19
WO2017007192A1 (ko) 2017-01-12
CN112019883B (zh) 2022-04-22
US20200213639A1 (en) 2020-07-02
US20180205975A1 (en) 2018-07-19
US10638172B2 (en) 2020-04-28

Similar Documents

Publication Publication Date Title
US11178436B2 (en) Broadcast signal transmission device, broadcast signal reception device, broadcast signal transmission method, and broadcast signal reception method
US11323755B2 (en) Broadcast signal transmission device, broadcast signal reception device, broadcast signal transmission method, and broadcast signal reception method
JP6633739B2 (ja) 放送信号送信装置、放送信号受信装置、放送信号送信方法、及び放送信号受信方法
US10171849B1 (en) Broadcast signal transmission device, broadcast signal reception device, broadcast signal transmission method, and broadcast signal reception method
US10349095B2 (en) Transmission device for processing video data related to HDR/SDR and method for controlling the same
US20210112290A1 (en) Broadcast signal transmitting/receiving apparatus and method
US10873495B2 (en) Apparatus and method for transmitting or receiving broadcast signal
KR20170138994A (ko) 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법
US10666549B2 (en) Broadcast signal transmission apparatus, broadcast signal reception apparatus, broadcast signal transmission method and broadcast signal reception method
KR102023018B1 (ko) 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법
US10237591B2 (en) Broadcast signal transmission device, broadcast signal reception device, broadcast signal transmission method, and broadcast signal reception method
EP3300375A1 (en) Broadcast signal transmitting apparatus, broadcast signal receiving apparatus, broadcast signal transmitting method, and broadcast signal receiving method
US20210119853A1 (en) Apparatus and method for transmitting or receiving broadcast signal
KR20160074671A (ko) 방송 전송 장치, 방송 전송 장치의 동작 방법. 방송 수신 장치 및 방송 수신 장치의 동작 방법
EP3448043A1 (en) Broadcast signal transmission/reception method and apparatus for providing high-quality media in dash-based system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant