KR20130032843A - Media data transmission apparatus and method, and media data reception apparatus and method in mmt system - Google Patents

Media data transmission apparatus and method, and media data reception apparatus and method in mmt system Download PDF

Info

Publication number
KR20130032843A
KR20130032843A KR1020120105350A KR20120105350A KR20130032843A KR 20130032843 A KR20130032843 A KR 20130032843A KR 1020120105350 A KR1020120105350 A KR 1020120105350A KR 20120105350 A KR20120105350 A KR 20120105350A KR 20130032843 A KR20130032843 A KR 20130032843A
Authority
KR
South Korea
Prior art keywords
sampling time
time information
information
layer
sampling
Prior art date
Application number
KR1020120105350A
Other languages
Korean (ko)
Inventor
유정주
김창기
김태정
정영호
홍진우
서광덕
이홍래
Original Assignee
연세대학교 원주산학협력단
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 원주산학협력단, 한국전자통신연구원 filed Critical 연세대학교 원주산학협력단
Priority to PCT/KR2012/007617 priority Critical patent/WO2013042998A1/en
Publication of KR20130032843A publication Critical patent/KR20130032843A/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • H04N7/52Systems for transmission of a pulse code modulated video signal with one or more other pulse code modulated signals, e.g. an audio signal or a synchronizing signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]

Abstract

PURPOSE: A media data transmitting device for an MMT system, a method thereof, a media data receiving device, and a method thereof are provided to supply basic timing information required for maintaining synchronization between different media. CONSTITUTION: A receiving unit(510) receives a delivery layer packet. A depacketizing unit(520) generates encapsulation layer data by depacketizing the delivery layer packet. A decapsulating unit(530) generates an encoded media stream by decapsulating the encapsulation layer data and extracts timing information. A decoder(550) decodes the encoded media stream. [Reference numerals] (505) Output device; (510) Receiving unit; (520) Depacketizing unit; (530) Decapsulating unit; (540) Buffer; (550) Decoder; (560) Rendering buffer; (570) Control unit; (AA) D-layer packet;

Description

MMT 시스템을 위한 미디어 데이터 전송 장치 및 방법, 그리고 미디어 데이터 수신 장치 및 방법{MEDIA DATA TRANSMISSION APPARATUS AND METHOD, AND MEDIA DATA RECEPTION APPARATUS AND METHOD IN MMT SYSTEM}MEDIA DATA TRANSMISSION APPARATUS AND METHOD, AND MEDIA DATA RECEPTION APPARATUS AND METHOD IN MMT SYSTEM}

본 발명은 미디어 데이터의 전송 및 수신을 위한 장치 및 방법에 관한 것으로서, 더욱 상세하게는 MMT(MPEG Media Transport : MPEG 미디어 전송) 시스템을 위한 미디어 데이터의 송수신에 있어서 요구되는 캡슐화 계층(Encapsulation Layer, E-layer)의 타이밍 정보에 관한 것이다.
The present invention relates to an apparatus and method for transmitting and receiving media data, and more particularly, to an encapsulation layer (E) required for transmission and reception of media data for an MMT (MPEG Media Transport) system. -layer) timing information.

MMT(MPEG Media Transport)는 MPEG 시스템 분과(systems sub-working group) 에서 개발을 시작한 새로운 표준 기술이다. 기존의 MPEG-2 시스템은 방송망에서 A/V 콘텐츠를 전송하기 위해 필요한 패킷화, 동기화, 멀티플렉싱 등의 기능에 대한 표준으로 MPEG-2 TS(transport stream) 기술이 표준화되어 현재 널리 쓰여지고 있다. 그러나, 네트워크가 IP (Internet Protocol) 기반인 패킷 전송 환경에서 MPEG-2 TS는 비효율적이다. 따라서, ISO MPEG에서는 새로운 미디어 전송 환경과 앞으로 예상되는 미디어 전송 환경을 고려하여 새로운 미디어 전송 표준의 필요성을 인식하게 되었고, MMT 표준화를 시작하게 되었다.MPEG Media Transport (MMT) is a new standard technology that has begun development in the MPEG systems sub-working group. The existing MPEG-2 system has been widely used since MPEG-2 transport stream (TS) technology has been standardized as a standard for packetization, synchronization, and multiplexing for transmitting A / V content in a broadcasting network. However, MPEG-2 TS is inefficient in a packet transmission environment in which a network is based on IP (Internet Protocol). Therefore, ISO MPEG recognized the necessity of a new media transmission standard in consideration of the new media transmission environment and the expected media transmission environment, and started to standardize MMT.

MMT의 E-layer 타이밍 모델과 유사한 종래의 기술로는 MPEG-2 시스템 기술에서 채택하고 있는 DTS(Decoding Time Stamp), PTS(Presentation Time Stamp) 기반의 타이밍 모델과 RTP(real-time transport protocol) 프로토콜에서 제공하는 RTP 타임스탬프 및 NTP(network time protocol) 타임스탬프 정보 기반의 타이밍 모델이 있다. Conventional techniques similar to MMT's E-layer timing model include the decoding time stamp (DTS), the presentation time stamp (PTS) -based timing model, and the real-time transport protocol (RTP) protocol adopted by MPEG-2 system technology. There is a timing model based on RTP timestamp and network time protocol (NTP) timestamp information.

보다 구체적으로 설명하면, 종래에 개발된 미디어 전송을 위한 타이밍 모델은 크게 2 가지가 존재하며, 첫째는 MPEG-2 시스템 기술이고, 둘째는 RTP 및 RTCP(RTP control protocol)를 결합적으로 활용하는 방법이다. MPEG-2 시스템에서는 미디어 재생시점 결정을 위한 타이밍 모델을 구성하기 위한 타이밍 정보로 PTS, DTS 타이밍 정보를 활용한다. RTP 및 RTCP를 복합적으로 활용하는 방법의 경우에는 RTP에 기록되는 RTP 타임스탬프 정보와 RTCP SR (sender report)에 기록되는 NTP 타임 스탬프를 동시에 활용하게 된다. More specifically, there are two conventionally developed timing models for media transmission, firstly, MPEG-2 system technology, and secondly, a method of combining RTP and RTCP (RTP control protocol). to be. In the MPEG-2 system, PTS and DTS timing information are used as timing information for constructing a timing model for determining a media playback time. In the case of using a combination of RTP and RTCP, the RTP timestamp information recorded in the RTP and the NTP time stamp recorded in the RTCP sender report are simultaneously used.

MPEG-2 시스템 기술은 압축된 미디어를 방송망과 같은 안정적인 전송망을 통해 전달하기 위한 타이밍 모델을 제시하고 있다. MPEG-2 시스템은 통상적으로 디지털방송 서비스를 목적으로 개발된 규격이기 때문에 전송되는 MPEG-2 TS (transport stream) 패킷들은 채널 품질이 비교적 안정적인 서킷 스위치 망 (circuit switched network)인 방송망을 통해 수신기에 전달된다. 따라서, MPEG-2 TS 패킷들은 전송 채널에서 경험하게 되는 패킷 지연 시간이 비교적 짧고 일정하며 수신기에 도착된 TS 패킷들을 순차적으로 처리하기 위한 타이밍 모델도 비교적 안정적으로 작동하게 된다. 그러나, 방송망이 아닌 IP 망의 경우 전송되는 TS 패킷들이 겪게 되는 도착 지연 시간의 간격이 매우 불규칙하기 때문에, MPEG-2 시스템 기술이 채택하는 타이밍 모델이 안정적으로 유지되기가 힘들다. MPEG-2 system technology proposes a timing model for delivering compressed media through a stable transmission network such as a broadcasting network. Since MPEG-2 system is a standard developed for digital broadcasting service, MPEG-2 TS (transport stream) packets transmitted to the receiver are transmitted to the receiver through a broadcasting network which is a circuit switched network with relatively stable channel quality. do. Accordingly, MPEG-2 TS packets have a relatively short and constant packet delay time experienced in a transport channel, and a timing model for sequentially processing TS packets arriving at a receiver also operates relatively stably. However, in the case of an IP network other than a broadcasting network, the arrival delay time intervals experienced by the TS packets transmitted are very irregular, and therefore, the timing model adopted by the MPEG-2 system technology is difficult to maintain stably.

RTP/RTCP 기반의 타이밍 모델의 경우 RTP 패킷의 헤더에 기록되는 RTP 타임스탬프가 특정 미디어 스트림의 내부적인 시간적 순서 관계를 나타낸다. 따라서, 서로 다른 미디어 스트림 사이의 동기화를 제공하기 위해서는 절대 시간 (wall-clock)에 해당하는 타이밍 정보가 전달이 되어야 하는데 이러한 목적으로 단말로 전송되는 타이밍 정보가 NTP 타임스탬프이다. NTP 타임스탬프는 RTCP SR (sender report) 패킷에 실려서 전송이 되는데, 일정한 주기를 갖고서 반복적으로 전송된다. RTCP SR 패킷은 미디어를 전송하기 위한 RTP 스트림과는 별도로 전송되는 스트림이므로 네트워크에 대해 트래픽 부담을 가중시키고 서버/단말에서 관리해야 할 UDP 포트 (port) 및 스트림 개수의 증가로 송수신 시스템의 동작이 복잡해 진다.In the RTP / RTCP-based timing model, the RTP timestamp recorded in the header of the RTP packet indicates the internal temporal ordering relationship of a specific media stream. Accordingly, in order to provide synchronization between different media streams, timing information corresponding to an absolute time (wall-clock) must be delivered. The timing information transmitted to the terminal for this purpose is an NTP timestamp. The NTP timestamp is transmitted in an RTCP sender report (SRTCP) packet. The NTP timestamp is repeatedly transmitted at regular intervals. Since RTCP SR packets are transmitted separately from the RTP stream for transmitting media, the operation of the transmitting and receiving system is complicated by increasing the traffic burden on the network and increasing the number of UDP ports and streams to be managed by the server / terminal. Lose.

따라서, 상기 방법들의 문제점을 해결하기 위해 새롭게 표준화가 진행되는 MMT 기술의 E-layer 에서는 간단하면서 효율적인 동작이 가능한 새로운 타이밍 모델을 고려할 필요가 있다.
Therefore, in order to solve the problems of the above methods, it is necessary to consider a new timing model that enables simple and efficient operation in an E-layer of a newly standardized MMT technology.

한국 공개 특허 제 10-2011-0022664 호("미디어 스트림 구성요소들의 동기화", 코닌클리케 필립스 일렉트로닉스 엔.브이., 2011년 3월 7일 공개)Korean Unexamined Patent Publication No. 10-2011-0022664 ("Synchronization of Media Stream Components", published by Koninkli Philips Electronics V., March 7, 2011)

따라서, 전술한 문제점을 해결하기 위한 본 발명의 목적은 MMT 시스템 기반의 미디어 전송 서비스에서 전송되는 미디어의 재생 시점과 미디어들 간의 시간적 동기화에 필요한 기본적인 타이밍 정보를 제공하되, 종래의 타이밍 모델인 MPEG-2 시스템의 타이밍 모델과 RTP/RTCP 기반의 타이밍 모델과도 호환 가능한 타이밍 정보를 제공할 수 있는 미디어 데이터의 전송 장치 및 방법을 제공하는 것이다. Accordingly, an object of the present invention for solving the above problems is to provide the basic timing information necessary for the timing of the playback of the media and the time synchronization between the media transmitted in the media transmission service based on the MMT system, MPEG- which is a conventional timing model The present invention provides an apparatus and method for transmitting media data that can provide timing information compatible with the timing system of the 2 system and the RTP / RTCP-based timing model.

또한, 본 발명의 다른 목적은 MMT 시스템 기반의 미디어 전송 서비스에서 전송되는 미디어의 재생 시점과 미디어들 간의 시간적 동기화에 필요한 기본적인 타이밍 정보를 제공하되, 종래의 타이밍 모델인 MPEG-2 시스템의 타이밍 모델과 RTP/RTCP 기반의 타이밍 모델과도 호환 가능한 타이밍 정보를 제공할 수 있는 미디어 데이터의 수신 장치 및 방법을 제공하는 것이다.
In addition, another object of the present invention is to provide the basic timing information necessary for the timing of the playback of the media and the time synchronization between the media transmitted in the MMT system-based media transmission service, and the timing model of the conventional MPEG-2 system The present invention provides an apparatus and method for receiving media data that can provide timing information compatible with an RTP / RTCP-based timing model.

전술한 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 미디어 데이터 전송 장치는 부호화된 미디어 스트림을 캡슐화하여 타이밍 정보를 포함하는 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하는 캡슐화부(Encapsulator)를 포함하되, 상기 타이밍 정보는 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 미디어 데이터 전송 장치는 미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 인코더; 상기 부호화된 미디어 스트림을 저장하고 있는 버퍼; 상기 E-layer 데이터를 패킷화하여 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 패킷화부(Packetizer); 및 상기 패킷화된 D-layer 패킷을 전송하는 전송부를 더 포함하는 것을 특징으로 할 수 있다. 또한, 상기 제 1 샘플링 타임 정보는 1 비트이고, 상기 제 2 샘플링 타임 정보는 32 비트인 것을 특징으로 할 수 있다. 여기서, 상기 제 1 샘플링 타임 정보는 샘플링 클럭 주파수를 기반으로 하는 샘플링 타임(Sampling Time)의 33번째 비트의 값이고, 상기 제 2 샘플링 타임 정보는 상기 샘플링 타임(Sampling Time)의 하위 32 비트의 값인 것을 특징으로 할 수 있다. An apparatus for transmitting media data according to an embodiment of the present invention for encapsulating an encoded media stream generates an encapsulation layer data (E-layer data) including timing information. (Encapsulator), wherein the timing information may include first sampling time information, second sampling time information, and rendering time information. Here, the media data transmission device includes an encoder for generating media streams by encoding media data; A buffer that stores the encoded media stream; A packetizer for packetizing the E-layer data to generate a delivery layer packet (D-layer packet); And a transmitter configured to transmit the packetized D-layer packet. The first sampling time information may be 1 bit, and the second sampling time information may be 32 bits. Here, the first sampling time information is a value of the 33rd bit of the sampling time based on a sampling clock frequency, and the second sampling time information is a lower 32 bit value of the sampling time. It may be characterized by.

본 발명의 다른 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치는 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 디캡슐화화여 부호화된 미디어 스트림을 생성하고 타이밍 정보를 추출하는 디캡슐화부(Decapsulator)를 포함하되, 상기 타이밍 정보는 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 미디어 데이터 수신 장치는 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신하는 수신부; 상기 D-layer 패킷을 디패킷화하여 상기 E-layer 데이터를 생성하는 디패킷화부(Depacketizer); 상기 부호화된 미디어 스트림을 저장하는 버퍼; 상기 부호화된 미디어 스트림을 디코딩하는 디코더; 및 디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬하는 렌더링 버퍼(Rendering Buffer)를 더 포함하는 것을 특징으로 할 수 있다. 또한, 상기 렌더링 타임 정보는 상기 미디어 스트림이 디코딩된 이후 재생 시점까지 소요되는 시간을 나타내는 것을 특징으로 할 수 있다. 여기서, 상기 제 1 샘플링 타임 정보 및 제 2 샘플링 타임 정보를 기반으로 샘플링 타임(Sampling Time)을 결정하고 상기 샘플링 타임을 기반으로 미디어의 정확한 재생 시점을 나타내는 렌더링 타임을 결정하는 제어부를 더 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 제어부는 상기 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 기반으로 MPEG-2 시스템의 DTS(Decoding Time Stamp) 및 PTS(Presentation Time Stamp)를 생성하는 것을 특징으로 할 수 있으며, 상기 제어부는 상기 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 기반으로 RTP(Real Time Protocol)의 RTP 타임 스탬프를 생성하는 것을 특징으로 할 수 있다.In accordance with another aspect of the present invention, an apparatus for receiving media data generates an encoded media stream by decapsulating encapsulation layer data (E-layer data), and extracts timing information. A decapsulator may be included. The timing information may include first sampling time information, second sampling time information, and rendering time information. Here, the media data receiving apparatus includes a receiving unit for receiving a delivery layer packet (D-layer packet); A depacketizer configured to depacketize the D-layer packet to generate the E-layer data; A buffer for storing the encoded media stream; A decoder for decoding the encoded media stream; And a rendering buffer for rearranging the decoded media data for display. In addition, the rendering time information may represent a time required until the playback time after the media stream is decoded. The method may further include a controller configured to determine a sampling time based on the first sampling time information and the second sampling time information, and to determine a rendering time indicating an accurate playback time of media based on the sampling time. It can be characterized. The controller may generate a decoding time stamp (DTS) and a presentation time stamp (PTS) of the MPEG-2 system based on the first sampling time information, the second sampling time information, and the rendering time information. The controller may generate an RTP time stamp of a real time protocol (RTP) based on the second sampling time information and the rendering time information.

본 발명의 다른 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 미디어 데이터 전송 방법은 부호화된 미디어 스트림을 캡슐화하여 타이밍 정보를 포함하는 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하는 단계를 포함하되, 상기 타이밍 정보는 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 미디어 데이터 전송 방법은 미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 단계; 상기 부호화된 미디어 스트림을 저장하는 단계; 상기 E-layer 데이터를 패킷화하여 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 단계; 및 상기 패킷화된 D-layer 패킷을 전송하는 단계를 더 포함하는 것을 특징으로 할 수 있다. 또한, 상기 제 1 샘플링 타임 정보는 1 비트이고, 상기 제 2 샘플링 타임 정보는 32 비트인 것을 특징으로 할 수 있다. 여기서, 상기 제 1 샘플링 타임 정보는 샘플링 클럭 주파수를 기반으로 하는 샘플링 타임(Sampling Time)의 33번째 비트의 값이고, 상기 제 2 샘플링 타임 정보는 상기 샘플링 타임(Sampling Time)의 하위 32 비트의 값인 것을 특징으로 할 수 있다. In accordance with another aspect of the present invention, there is provided a media data transmission method for generating encapsulation layer data (E-layer data) including timing information by encapsulating an encoded media stream. In addition, the timing information may include first sampling time information, second sampling time information, and rendering time information. The media data transmission method may include generating a media stream by encoding media data; Storing the encoded media stream; Packetizing the E-layer data to generate a delivery layer packet (D-layer packet); And transmitting the packetized D-layer packet. The first sampling time information may be 1 bit, and the second sampling time information may be 32 bits. Here, the first sampling time information is a value of the 33rd bit of the sampling time based on a sampling clock frequency, and the second sampling time information is a lower 32 bit value of the sampling time. It may be characterized by.

본 발명의 다른 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 미디어 데이터 수신 방법은 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 디캡슐화화여 부호화된 미디어 스트림을 생성하고 타이밍 정보를 추출하는 단계를 포함하되, 상기 타이밍 정보는 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 미디어 데이터 수신 방법은 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신하는 단계; 상기 D-layer 패킷을 디패킷화하여 상기 E-layer 데이터를 생성하는 단계; 상기 부호화된 미디어 스트림을 저장하는 단계; 상기 부호화된 미디어 스트림을 디코딩하는 단계; 및 디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬하는 단계를 더 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 렌더링 타임 정보는 상기 미디어 스트림이 디코딩된 이후 재생 시점까지 소요되는 시간을 나타내는 것을 특징으로 할 수 있다. 여기서, 상기 제 1 샘플링 타임 정보 및 제 2 샘플링 타임 정보를 기반으로 샘플링 타임(Sampling Time)을 결정하고 상기 샘플링 타임을 기반으로 미디어의 정확한 재생 시점을 나타내는 렌더링 타임을 결정하는 단계를 더 포함하는 것을 특징으로 할 수 있다. 또한, 상기 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 기반으로 MPEG-2 시스템의 DTS(Decoding Time Stamp) 및 PTS(Presentation Time Stamp)를 생성하는 단계를 더 포함하는 것을 특징으로 할 수 있으며, 상기 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 기반으로 RTP(Real Time Protocol)의 RTP 타임 스탬프를 생성하는 단계를 더 포함하는 것을 특징으로 할 수 있다. In accordance with another aspect of the present invention, a method for receiving media data includes decapsulating encapsulation layer data (E-layer data) to generate an encoded media stream and extract timing information. The timing information may include first sampling time information, second sampling time information, and rendering time information. The method for receiving media data may include receiving a delivery layer packet (D-layer packet); Depacketizing the D-layer packet to generate the E-layer data; Storing the encoded media stream; Decoding the encoded media stream; And rearranging the decoded media data for display. Here, the rendering time information may represent a time required until a playback time after the media stream is decoded. The method may further include determining a sampling time based on the first sampling time information and the second sampling time information, and determining a rendering time indicating a correct playback time of the media based on the sampling time. It can be characterized. The method may further include generating a decoding time stamp (DTS) and a presentation time stamp (PTS) of the MPEG-2 system based on the first sampling time information, the second sampling time information, and the rendering time information. The method may further include generating an RTP time stamp of a real time protocol (RTP) based on the second sampling time information and the rendering time information.

전술한 본 발명의 일 실시 예에 따른 미디어 데이터의 전송 및 수신 장치에 따르면, MMT 전송 시스템이 Sampling_Time_Ext, Sampling_Time_Base, Rendering_Time_Offset 등의 타이밍 정보를 수신 단말기 측에게 제공하여 미디어에 대한 재생 시점을 도출하고 비디오 및 오디오와 같은 서로 다른 미디어 간에 동기화(lip-synchronization)를 유지하기 위해서 필요한 기본적인 타이밍 정보가 제공된다. 특히, Sampling Time 정보를 1비트의 Sampling_Time_Ext 필드와 32 비트의 Sampling_Time_Base 필드로 분리하여 표현함으로써 기존의 MPEG-2 시스템에서 사용되는 33비트 크기의 DTS/PTS 타이밍 정보와 RTP에서 사용되는 32 비트 크기의 RTP 타임스탬프 정보와 호환성을 유지할 수 있다.
According to the above-described apparatus for transmitting and receiving media data according to an embodiment of the present invention, the MMT transmission system provides timing information such as Sampling_Time_Ext, Sampling_Time_Base, Rendering_Time_Offset, etc. to the receiving terminal to derive a playback time for media, Basic timing information is provided to maintain lip-synchronization between different media such as audio. In particular, the Sampling Time information is divided into a 1-bit Sampling_Time_Ext field and a 32-bit Sampling_Time_Base field to express the 33-bit DTS / PTS timing information used in the existing MPEG-2 system and the 32-bit RTP used in the RTP. Maintain compatibility with time stamp information.

도 1은 MMT 계층 구조를 나타낸 개념도이다.
도 2는 MMT의 E-layer 헤더에 기록될 기본적인 타이밍 정보를 나타낸다.
도 3은 E-layer 헤더에 기록되는 타이밍 정보들 간의 시간적 상관 관계를 나타낸다.
도 4는 본 발명의 일 실시 예에 따른 미디어 데이터 전송 장치의 구성을 나타내는 블록도이다.
도 5는 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치의 구성을 나타내는 블록도이다.
도 6은 도 5의 미디어 데이터 수신 장치가 도 3에 표시된 타이밍 정보를 활용하여 시간적 동기화를 맞추기 위한 MMT 시스템의 수신 단말기에서 이루어지는 동작절차를 나타낸다.
도 7은 MMT E-layer 데이터의 헤더에 기록되어 있는 타이밍 정보를 MPEG-2 시스템의 DTS 및 PTS 정보로 매핑시키는 경우를 나타낸다.
도 8은 MMT E-layer 데이터의 헤더에 기록되어 있는 타이밍 정보를 RTP 패킷의 RTP 타임스탬프 정보로 매핑시키는 경우를 나타낸다.
도 9는 본 발명의 일 실시 예에 따른 미디어 데이터 전송 방법의 흐름도이다.
도 10은 본 발명의 일 실시 예에 따른 미디어 데이터 수신 방법의 흐름도이다.
도 11은 도 10의 샘플링 타임 및 렌더링 타임을 결정하는 단계의 상세 흐름도이다.
1 is a conceptual diagram illustrating an MMT hierarchical structure.
2 shows basic timing information to be recorded in an E-layer header of an MMT.
3 shows a temporal correlation between timing information recorded in an E-layer header.
4 is a block diagram illustrating a configuration of an apparatus for transmitting media data according to an embodiment of the present invention.
5 is a block diagram illustrating a configuration of an apparatus for receiving media data according to an embodiment of the present invention.
FIG. 6 illustrates an operation procedure performed by the media data receiving apparatus of FIG. 5 at a receiving terminal of an MMT system for timing synchronization using the timing information shown in FIG. 3.
FIG. 7 illustrates a case where timing information recorded in a header of MMT E-layer data is mapped to DTS and PTS information of an MPEG-2 system.
8 shows a case where the timing information recorded in the header of the MMT E-layer data is mapped to the RTP time stamp information of the RTP packet.
9 is a flowchart illustrating a method of transmitting media data according to an embodiment of the present invention.
10 is a flowchart illustrating a method of receiving media data according to an embodiment of the present invention.
11 is a detailed flowchart of a step of determining the sampling time and rendering time of FIG. 10.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 상세하게 설명하고자 한다.As the inventive concept allows for various changes and numerous embodiments, particular embodiments will be illustrated in the drawings and described in detail in the written description.

그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.It should be understood, however, that the invention is not intended to be limited to the particular embodiments, but includes all modifications, equivalents, and alternatives falling within the spirit and scope of the invention.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.The terms first, second, etc. may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component. And / or < / RTI > includes any combination of a plurality of related listed items or any of a plurality of related listed items.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. When a component is referred to as being "connected" or "connected" to another component, it may be directly connected to or connected to that other component, but it may be understood that other components may be present in between. Should be. On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it should be understood that there are no other elements in between.

본 출원에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used in this application is used only to describe a specific embodiment and is not intended to limit the invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, the terms "comprise" or "have" are intended to indicate that there is a feature, number, step, operation, component, part, or combination thereof described in the specification, and one or more other features. It is to be understood that the present invention does not exclude the possibility of the presence or the addition of numbers, steps, operations, components, components, or a combination thereof.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art. Terms such as those defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning in the context of the relevant art and are to be interpreted in an ideal or overly formal sense unless explicitly defined in the present application Do not.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시 예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
Hereinafter, with reference to the accompanying drawings, it will be described in detail a preferred embodiment of the present invention. In order to facilitate the understanding of the present invention, the same reference numerals are used for the same constituent elements in the drawings and redundant explanations for the same constituent elements are omitted.

MMTMMT 계층 구조 Hierarchy

도 1은 MMT 계층 구조를 나타낸 개념도이다. 1 is a conceptual diagram illustrating an MMT hierarchical structure.

도 1을 참조하면, MMT 계층은 캡슐화 계층(Encapsulation layer), 전달 계층(Delivery layer) 및 시그널링 계층(Signaling layer)의 기능 영역(functional area)을 포함한다. MMT 계층은 전송 계층(Transport layer) 위에서 동작한다. Referring to FIG. 1, the MMT layer includes an encapsulation layer, a delivery layer, and a functional area of a signaling layer. The MMT layer operates on a transport layer.

캡슐화 계층(Encapsulation layer; E-layer)은 예를 들어 전송되는 미디어의 패킷화(packetization), 프래그먼테이션(Fragmentation), 동기화(Synchronization), 멀티플렉싱(Multiplexing)등의 기능을 담당할 수 있다. The encapsulation layer (E-layer) can perform functions such as packetization, fragmentation, synchronization, and multiplexing of the transmitted media, for example.

캡슐화 계층(E-layer)은, 도 1에 도시된 바와 같이, MMT E.1 계층(MMT E.1 Layer), MMT E.2 계층(MMT E.2 Layer) 및 MMT E.3 계층(MMT E.3 Layer)으로 구성될 수 있다. The encapsulation layer (E-layer) includes an MMT E.1 layer (MMT E.1 Layer), an MMT E.2 layer (MMT E.2 Layer), and an MMT E.3 layer E.3 Layer).

E.3 계층은 미디어 코덱(A) 계층으로부터 제공된 미디어 프래그먼트 유닛(Media Fragment Unit; MFU)를 캡슐화하여 M-유닛(M-Unit)을 생성한다.The E.3 layer encapsulates a Media Fragment Unit (MFU) provided from the Media Codec (A) layer to create an M-Unit.

MFU는 미디어 디코더에서 독립적으로 소비될 수 있는 데이터 유닛을 싣을 수 있는, 임의의 특정 코덱(codec)에 독립적인, 포맷을 가질 수 있다. MFU는 예를 들어 비디오의 픽춰(picture) 또는 슬라이스(slice)가 될 수 있다. The MFU may have a format, independent of any particular codec, that can carry data units that can be consumed independently in the media decoder. The MFU can be, for example, a picture or slice of the video.

M-유닛은 하나 또는 복수의 MFU 로 구성될 수 있으며, 하나 또는 복수의 액세스 유닛(Access Unit)을 싣을 수 있는, 특정 코덱(codec)에 독립적인, 포맷을 가질 수 있다. The M-unit may consist of one or a plurality of MFUs and may have a format, independent of a particular codec, that may carry one or a plurality of access units.

E.2 계층은 E.3 계층에서 생성된 M-유닛을 캡슐화하여 MMT 애셋(MMT Asset)을 생성한다. The E.2 layer encapsulates the M-units created in the E.3 layer to create an MMT asset.

MMT 애셋은 단일의 데이터 소스로부터의 하나 또는 복수의 M-유닛으로 이루어진 데이터 엔티티(data entity)로서, 컴포지션 정보(composition information) 및 전송 특성(transport characteristics)이 정의된 데이터 유닛이다. MMT 애셋은 PES(packetized elementary streams)에 대응될 수 있으며, 예를 들어 비디오, 오디오, 프로그램 정보(program information), MPEG-U 위젯(widget), JPEG 이미지, MPEG 4 파일 포맷(File Format), M2TS(MPEG transport stream) 등에 대응될 수 있다. An MMT asset is a data entity composed of one or a plurality of M-units from a single data source and is a data unit in which composition information and transport characteristics are defined. MMT assets can correspond to packetized elementary streams (PES), for example video, audio, program information, MPEG-U widgets, JPEG images, MPEG 4 file format, M2TS (MPEG transport stream) and the like.

E.1 계층(E.1 Layer)은 E.2 계층에서 생성된 MMT 애셋을 캡슐화하여 MMT 패키지(MMT Package)를 생성한다. E.1 Layer (E.1 Layer) encapsulates MMT asset created in E.2 layer to create MMT Package (MMT Package).

MMT 패키지는 콤포지션 정보(composition information) 및 전송 특성(transport characteristics)과 같은 부가 정보와 함께 하나 또는 복수의 MMT 애셋으로 구성될 수 있다. 콤포지션 정보(composition information)는 MMT 애셋들 사이의 관계(relationship)에 대한 정보를 포함하며, 하나의 컨텐츠(content)가 복수개의 MMT 패키지로 이루어질 경우 복수의 MMT 패키지간의 관계(relationship)를 나타내기 위한 정보를 더 포함할 수 있다. 전송 특성(transport characteristics)은 MMT 애셋 또는 MMT 패킷의 전송 조건(delivery condition)을 결정하기 위해 필요한 전송 특성 정보를 포함할 수 있으며, 예를 들어 트래픽 기술 파라미터(traffic description parameter) 및 QoS 기술자(QoS descriptor)를 포함할 수 있다. MMT 패키지는 MPEG-2 TS의 프로그램(Program)에 대응될 수 있다.
The MMT package may be composed of one or more MMT assets together with additional information such as composition information and transport characteristics. Composition information includes information about a relationship between MMT assets, and when one content consists of a plurality of MMT packages, it indicates a relationship between a plurality of MMT packages. It may further include information. The transport characteristics may include transmission characteristic information necessary for determining a delivery condition of an MMT asset or an MMT packet, and may include, for example, a traffic description parameter and a QoS descriptor. ) May be included. The MMT package may correspond to a program of MPEG-2 TS.

전달 계층(delivery layer)은 예를 들어 네트워크를 통해 전송되는 미디어의 네트워크 플로우 멀티플렉싱(network flow multiplexing), 네트워크 패킷화(network packetization), QoS 제어 등을 수행할 수 있다. The delivery layer may perform, for example, network flow multiplexing, network packetization, and QoS control of media transmitted through a network.

전달 계층 (D-layer)은, 도 1에 도시된 바와 같이, MMT D.1 계층(MMT D.1 Layer), MMT D.2 계층(MMT D.2 Layer) 및 MMT D.3 계층(MMT D.3 Layer)으로 구성될 수 있다. 1, the D-layer includes an MMT D.1 layer (MMT D.1 Layer), an MMT D.2 layer (MMT D.2 Layer), and an MMT D.3 layer (MMT D.3 Layer).

D.1 계층(D.1-layer)은 E.1 계층에서 생성된 MMT 패키지를 받아서 MMT 페이로드 포맷(MMT Payload format)을 생성한다. MMT 페이로드 포맷은 MMT 애셋을 전송하고, 그리고 MMT 애플리케이션 프로토콜 또는 RTP와 같은 다른 기존의 애플리케이션 전송 프로토콜에 의한 소비를 위한 정보를 전송하기 위한 페이로드 포맷이다. MMT 페이로드는 AL-FEC와 같은 정보와 함께 MFU의 프래그먼트를 포함할 수 있다.The D.1 layer receives the MMT package generated in the E.1 layer and generates an MMT payload format. The MMT payload format is a payload format for carrying MMT assets and for transmitting information for consumption by the MMT application protocol or other existing application transport protocol such as RTP. The MMT payload may contain fragments of MFUs with information such as AL-FEC.

D.2 계층(D.2-layer)은 D.1 계층에서 생성된 MMT 페이로드 포맷을 받아서 MMT 전송 패킷(MMT Transport Packet) 또는 MMT 패킷(MMT Packet)를 생성한다. MMT 전송 패킷 또는 MMT 패킷은 MMT를 위한 애플리케이션 전송 프로토콜에 사용되는 데이터 포맷이다. The D.2 layer receives the MMT payload format generated in the D.1 layer and generates an MMT transport packet or an MMT packet. The MMT transport packet or MMT packet is a data format used in an application transport protocol for MMT.

D.3 계층(D.3-layer)은 교차 계층 설계(cross-layer design)에 의해 계층간에 정보를 교환할 수 있는 기능을 제공하여 QoS를 지원한다. 예를 들어, D.3 계층은 MAC/PHY 계층의 QoS 파라미터를 이용하여 QoS 제어를 수행할 수 있다.
D.3 layer (D.3-layer) supports QoS by providing the function of exchanging information between layers by cross-layer design. For example, the D.3 layer may perform QoS control using QoS parameters of the MAC / PHY layer.

시그널링 계층(Signaling layer)은 시그널링 기능(signaling function)을 수행한다. 예를 들어 전송되는 미디어의 세션 초기화/제어/관리(session initialization/control/management), 서버 기반 및/또는 클라이언트 기반의 트릭 모드, 서비스 디스커버리(Service discovery), 동기화(Synchronization) 등을 위한 시그널링 기능을 수행할 수 있다. The signaling layer performs a signaling function. For example, signaling functions for session initialization / control / management of transmitted media, server-based and / or client-based trick modes, service discovery, synchronization, etc. Can be done.

시그널링 계층(Signaling layer)은, 도 1에 도시된 바와 같이, MMT S.1 계층(MMT S.1 Layer) 및 MMT S.2 계층(MMT S.2 Layer)으로 구성될 수 있다. Signaling layer (Signaling layer), as shown in Figure 1, may be composed of MMT S.1 layer (MMT S.1 Layer) and MMT S.2 layer (MMT S.2 Layer).

S.1 계층은 서비스 디스커버리(Service discovery), 미디어의 세션 초기화/종료(media session initialization/termination), 미디어의 세션 표현/제어(media session presentation/control), 전달(D) 계층 및 캡슐화(E) 계층과의 인터페이스 기능 등을 수행할 수 있다. S.1 계층은 미디어 표현 세션 관리(presentation session management)를 위한 애플리케이션들간의 제어 메시지들의 포맷을 정의할 수 있다. The S.1 layer consists of service discovery, media session initialization / termination, media session presentation / control, transport layer (D) and encapsulation (E) And an interface function with the layer. The S.1 layer may define the format of control messages between applications for media presentation session management.

S.2 계층은 흐름 제어(flow control), 전달 세션 관리(delivery session management), 전달 세션 모니터링(delivery session monitoring), 에러 제어(error control), 하이브리드망 동기화 제어(Hybrid network synchronization control)에 관한 전달 계층(D-layer)의 전달 엔드-포인트들(delivery end-points)간에 교환되는 제어 메시지의 포맷을 정의할 수 있다. The S.2 layer is responsible for flow control, delivery session management, delivery session monitoring, error control, and hybrid network synchronization control. It is possible to define the format of the control message exchanged between delivery end-points of the D-layer.

S.2 계층은 전달 계층의 동작을 지원하기 위하여 전달 세션 설정 및 해제(delivery session establishment and release), 전달 세션 모니터링, 흐름 제어, 에러 제어, 설정된 전달 세션에 대한 리소스 예약, 복합 전달 환경하에서의 동기화를 위한 시그널링, 적응적 전달(adaptive delivery)를 위한 시그널링을 포함할 수 있다. 송신측(sender)와 수신측(receiver)간에 필요한 시그널링을 제공할 수 있다. 즉, S.2 계층은 전술한 바와 같은 전달 계층의 동작을 지원하기 위하여 송신측(sender)와 수신측(receiver)간에 필요한 시그널링을 제공할 수 있다. 또한, S.2 계층은 전달 계층 및 캡슐화 계층과의 인터페이스 기능을 담당할 수 있다.
The S.2 layer supports delivery session establishment and release, delivery session monitoring, flow control, error control, resource scheduling for established delivery sessions, and synchronization in a complex delivery environment to support the behavior of the delivery layer. Signaling for adaptive delivery, and signaling for adaptive delivery. Required signaling may be provided between a sender and a receiver. That is, the S.2 layer may provide signaling required between the sender and the receiver in order to support the operation of the transport layer as described above. In addition, the S.2 layer may be responsible for interfacing with the transport layer and the encapsulation layer.

본 발명은 MMT 시스템에서 미디어에 대한 재생 시점 정보를 얻고 미디어들 간에 시간적 동기화를 유지하면서 미디어를 재생하기 위한 기본적인 E-layer 타이밍 정보를 포함하는 미디어 데이터의 전송 장치 및 방법, 그리고 수신 장치 및 방법에 관한 것이다. 제안하는 타이밍 정보는 기존의 MPEG-2 시스템 및 RTP의 타이밍 모델과 연동하여 호환성을 유지하면서 활용될 수 있도록 하여 MMT E-layer에 생성된 데이터가 MMT의 D-layer(Delivery layer, 전달 계층) 뿐만 아니라 기존의 RTP에 의해서도 원활하게 전송되도록 할 수 있다. 그리고, MMT E-layer에서 생성된 데이터를 MPEG-2 시스템 포맷으로 변환할 경우에 타이밍 정보가 MPEG-2 시스템에서 채택하는 타이밍 정보의 표현 방식과 호환성을 유지하면서 간단하게 변환되도록 할 수 있다. The present invention relates to an apparatus and method for transmitting media data, including basic E-layer timing information for acquiring playback time information on media and playing media while maintaining time synchronization between media in an MMT system. It is about. The proposed timing information can be utilized while maintaining compatibility with the existing MPEG-2 system and RTP timing model, so that the data generated in the MMT E-layer is not only D-layer (Delivery layer) of MMT. In addition, it can be smoothly transmitted by the existing RTP. When the data generated by the MMT E-layer is converted into the MPEG-2 system format, the timing information can be easily converted while maintaining compatibility with the representation method of the timing information adopted by the MPEG-2 system.

즉, 본 발명에서는 E-layer에 포함되어야 할 효율적인 타이밍 정보를 고안함으로써 IP 망을 통한 효율적인 미디어 전송을 목표로 하는 MMT 시스템 기반의 미디어 전송 서비스에서 전송되는 미디어의 재생 시점과 미디어들 간에 시간적 동기화에 필요한 기본적인 타이밍 정보를 제공한다. 여기서, 기존에 개발된 타이밍 모델인 MPEG-2 시스템의 타이밍 모델과 RTP/RTCP 기반의 타이밍 모델의 단점을 보완하여 MMT 시스템의 E-layer에 적용이 가능한 간단하면서도 효율적인 타이밍 모델을 고안하고 이 모델의 작동에 필요한 타이밍 정보를 제안한다. 이 타이밍 정보를 활용하여 미디어 스트림 내의 프레임에 대한 정확한 재생시점 정보를 제공하여 정해진 시간에 미디어 재생이 가능하도록 하고, 더 나아가서 서로 다른 미디어들 간의 동기화에 필요한 기본적인 시간 정보를 제공하게 한다.
That is, in the present invention, by devising efficient timing information to be included in the E-layer, the timing of the media transmission and the time synchronization between the media in the MMT system-based media transmission service aiming at efficient media transmission over the IP network are determined. Provide the basic timing information you need. Here, we devise a simple and efficient timing model that can be applied to the E-layer of the MMT system by complementing the shortcomings of the existing timing model of the MPEG-2 system and the RTP / RTCP based timing model. Suggest timing information for operation. The timing information is used to provide accurate playback time information of frames in the media stream to enable media playback at a predetermined time, and further, to provide basic time information required for synchronization between different media.

도 4는 본 발명의 일 실시 예에 따른 미디어 데이터 전송 장치의 구성을 나타내는 블록도이다. 도 4에 도시된 바와 같이, 본 발명의 일 실시 예에 따른 미디어 데이터 전송 장치(400)는 미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 인코더(410), 상기 부호화된 미디어 스트림을 저장하고 있는 버퍼(420), 상기 부호화된 미디어 스트림을 캡슐화하여 타이밍 정보를 포함하는 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하는 캡슐화부(Encapsulator, 430), 상기 E-layer 데이터를 패킷화하여 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 패킷화부(Packetizer, 440) 및 상기 패킷화된 D-layer 패킷을 전송하는 전송부(450)를 포함할 수 있다. 여기서, 상기 E-layer 데이터에 포함된 타이밍 정보는 MPEG-2 시스템 및 RTP(Real Time Protocol)와 호환되는 것을 특징으로 할 수 있다. 보다 구체적으로, 상기 타이밍 정보는 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함하는 것을 특징으로 할 수 있다. 4 is a block diagram illustrating a configuration of an apparatus for transmitting media data according to an embodiment of the present invention. As shown in FIG. 4, the media data transmission apparatus 400 according to an embodiment of the present invention includes an encoder 410 for generating a media stream by encoding media data, and a buffer that stores the encoded media stream. 420, an encapsulator 430 that encapsulates the encoded media stream to generate encapsulation layer data (E-layer data) including timing information, and transmits the packetized E-layer data. It may include a packetizer 440 for generating a delivery layer packet (D-layer packet) and a transmission unit 450 for transmitting the packetized D-layer packet. Here, the timing information included in the E-layer data may be compatible with the MPEG-2 system and the Real Time Protocol (RTP). More specifically, the timing information may include first sampling time information, second sampling time information, and rendering time information.

도 2는 MMT의 E-layer 데이터의 헤더에 기록되는 타이밍 정보를 나타낸다. 도 2를 참조하여, 상기 타이밍 정보에 포함된 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 상세히 설명한다. 2 shows timing information recorded in a header of E-layer data of an MMT. Referring to FIG. 2, first sampling time information, second sampling time information, and rendering time information included in the timing information will be described in detail.

상기 타이밍 정보는 비디오의 픽처(picture)나 오디오의 프레임(frame)과 같은 미디어 데이터의 샘플 혹은 이러한 미디어 데이터의 샘플을 하나 이상으로 묶은 단위의 E-layer 데이터에 할당될 수 있다. 도 2에 도시된 바와 같이, 상기 E-layer 타이밍 정보는 제 1 샘플링 타임 정보(이하 'Sampling_Time_Ext', 210), 제 2 샘플링 타임 정보(이하 'Sampling_Time_Base', 220) 및 렌더링 타임 정보(이하 'Rendering_Time_Offset', 230) 등의 세 가지 필드를 포함할 수 있다. 여기서, 상기 Sampling_Time_Ext(210)는 1 비트, 상기 Sampling_Time_Base(220)는 32 비트, 상기 Rendering_Time_Offset(230)는 20 비트인 것을 특징으로 할 수 있다. The timing information may be allocated to a sample of media data, such as a picture of a video or a frame of audio, or to E-layer data in units of one or more of the samples of the media data. As shown in FIG. 2, the E-layer timing information includes first sampling time information (hereinafter, 'Sampling_Time_Ext', 210), second sampling time information (hereinafter, 'Sampling_Time_Base', 220), and rendering time information (hereinafter, 'Rendering_Time_Offset' ', 230) may be included. Here, the Sampling_Time_Ext 210 may be 1 bit, the Sampling_Time_Base 220 is 32 bits, and the Rendering_Time_Offset 230 may be 20 bits.

샘플링 타임(Sampling Time)은 MPEG-2 시스템 및 RTP전송 시스템에서 통상적으로 사용되는 90 KHz 정밀도로 작동하는 샘플링 클럭 주파수 (sampling clock frequency) 로부터 얻어질 수 있다. 만약, 90 KHz 정밀도 이외의 샘플링 클럭 주파수를 채택할 경우에도 마찬가지의 원리로 적용이 가능하다. MMT 전송 시스템의 미디어 인코더(Encoder)에 압축되는 순서대로 입력되는 픽처들에 대한 샘플링 시간을 90 KHz 샘플링 클럭 주파수로부터 얻어낸 결과가 샘플링 타임(Sampling Time) 이다. 샘플링 타임(Sampling Time)은 총 33 비트의 크기로 이루어 질 수 있다. 여기서 상기 Sampling_Time_Ext(210)은 Sampling Time의 33번째 비트의 값을 의미할 수 있으며, Sampling_Time_Base(220)는 Sampling Time의 하위 32 비트의 값을 나타낼 수 있다. Sampling Time can be obtained from a sampling clock frequency operating at 90 KHz precision commonly used in MPEG-2 systems and RTP transmission systems. If a sampling clock frequency other than 90 KHz precision is adopted, the same principle can be applied. Sampling time is the result of obtaining the sampling time for the pictures inputted in the order of compression to the media encoder of the MMT transmission system from the 90 KHz sampling clock frequency. Sampling time can be a total of 33 bits. Here, the Sampling_Time_Ext 210 may mean the value of the 33rd bit of the Sampling Time, and the Sampling_Time_Base 220 may represent the lower 32 bits of the Sampling Time.

Rendering_Time_Offset(230)은 디코딩(Decoding) 이후에 재생 시점인 렌더링(Rendering Time)에 이르기까지 소요되는 시간을 나타낸다. 디코딩 후에 얻어진 압축이 해제된 미디어 데이터를 렌더링 버퍼(Rendering buffer)에 저장한 후에 렌더링 타임(ndering Time) 순간에 출력 장치로 재생시킬 수 있다. Rendering buffer는 비디오 화면 구조 (video sequence structure)에 B-픽처가 존재하는 경우에 발생하는 I-픽처, P-픽처, 및 B-픽처들의 화면간 순서 재배치 (picture reordering)를 위한 용도로도 활용된다. 통상적으로 B-픽처는 디코딩 즉시 재생되므로 Rendering buffer 과정을 거치지 않고 곧바로 출력이 되지만, I-픽처나 P-픽처는 디코딩된 후 재생되기까지 Rendering_Time_Offset 만큼 기다려야 한다. The Rendering_Time_Offset 230 represents a time required until decoding, which is a playback time, after decoding. After the decompressed media data obtained after decoding is stored in a rendering buffer, the decompressed media data may be reproduced by an output device at a rendering time. The rendering buffer is also used for picture reordering of I-pictures, P-pictures, and B-pictures that occur when a B-picture is present in the video sequence structure. . Normally, B-pictures are reproduced immediately after decoding, so they are immediately output without undergoing a rendering buffer process. However, I-pictures or P-pictures must wait for Rendering_Time_Offset until they are decoded and played.

이러한 시간 정보들 간의 상관 관계를 그림으로 표현하면 도 3과 같다. If the correlation between such time information is represented graphically as shown in FIG.

도 3은 E-layer 헤더에 기록되는 타이밍 정보들 간의 시간적 상관 관계를 나타낸다. 도 3에서 도시된 바와 같이, Delivery Time과 Decoding Time은 전송 포맷의 MMT 패킷을 생성하는 역할을 담당하는 D-layer의 헤더에서 전달하게 되는 타이밍 정보를 통해서 얻어진다.
3 shows a temporal correlation between timing information recorded in an E-layer header. As shown in FIG. 3, delivery time and decoding time are obtained through timing information delivered in a header of a D-layer, which is responsible for generating an MMT packet of a transport format.

도 5는 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치의 구성을 나타내는 블록도이다. 5 is a block diagram illustrating a configuration of an apparatus for receiving media data according to an embodiment of the present invention.

도 5에 도시된 바와 같이, 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치(500)는 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신하는 수신부(510), 상기 D-layer 패킷을 디패킷화하여 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하는 디패킷화부(Depacketizer, 520), 상기 E-layer 데이터를 디캡슐화화여 부호화된 미디어 스트림을 생성하고 타이밍 정보를 추출하는 디캡슐화부(Decapsulator, 530), 상기 부호화된 미디어 스트림을 저장하는 버퍼(540), 상기 부호화된 미디어 스트림을 디코딩하는 디코더(550) 및 디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬하는 렌더링 버퍼(Rendering Buffer, 560)를 포함할 수 있다. 여기서, 상기 타이밍 정보는 MPEG-2 시스템 및 RTP(Real Time Protocol)와 호환되는 것을 특징으로 할 수 있다. 구체적으로, 상기 타이밍 정보는 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함할 수 있다. 상기 타이밍 정보는 전술한 미디어 데이터 전송 장치의 타이밍 정보와 동일하다. 즉, 상기 E-layer 타이밍 정보는 제 1 샘플링 타임 정보(이하 'Sampling_Time_Ext'), 제 2 샘플링 타임 정보(이하 'Sampling_Time_Base') 및 렌더링 타임 정보(이하 'Rendering_Time_Offset') 등의 세 가지 필드를 포함할 수 있다. As shown in FIG. 5, the apparatus 500 for receiving media data according to an embodiment of the present invention includes a receiver 510 for receiving a delivery layer packet (D-layer packet) and the D-layer packet. A depacketizer 520 for generating encapsulation layer data (E-layer data) by depacking the data, and generating an encoded media stream by decapsulating the E-layer data and extracting timing information. A decapsulator 530, a buffer 540 for storing the encoded media stream, a decoder 550 for decoding the encoded media stream, and a rendering buffer for reordering the decoded media data for display. Rendering buffer 560). Here, the timing information may be compatible with the MPEG-2 system and the Real Time Protocol (RTP). In detail, the timing information may include first sampling time information, second sampling time information, and rendering time information. The timing information is the same as the timing information of the aforementioned media data transmission device. That is, the E-layer timing information may include three fields such as first sampling time information (hereinafter referred to as 'Sampling_Time_Ext'), second sampling time information (hereinafter referred to as 'Sampling_Time_Base'), and rendering time information (hereinafter referred to as 'Rendering_Time_Offset'). Can be.

여기서, 상기 미디어 데이터 수신 장치(500)는 상기 제 1 샘플링 타임 정보 및 제 2 샘플링 타임 정보를 기반으로 샘플링 타임(Sampling Time)을 결정하고 상기 샘플링 타임을 기반으로 미디어의 정확한 재생 시점을 나타내는 렌더링 타임을 결정하는 제어부(570)를 더 포함할 수 있다. 상기 제어부(570)가 도 3의 시간 관계에 의해 Sampling Time과 Rendering Time 값을 얻어내기 위한 수학식은 하기와 같다. 먼저, Sampling Time을 하기의 수학식 1에 의해 계산할 수 있다. Here, the media data receiving apparatus 500 determines a sampling time based on the first sampling time information and the second sampling time information, and renders time indicating an accurate playback time point of the media based on the sampling time. It may further include a control unit 570 for determining. Equation for the control unit 570 to obtain the Sampling Time and Rendering Time values by the time relationship of FIG. 3 is as follows. First, the sampling time may be calculated by Equation 1 below.

Figure pat00001
Figure pat00001

Decoding Time은 E-layer의 Sampling Time정보와 D-layer에서 제공되는 Sender_Processing_Delay와 Receiver_Processing_Delay를 활용하여 하기의 수학식 2에 의해 계산할 수 있다. Decoding Time can be calculated by Equation 2 below using Sampling Time information of the E-layer and Sender_Processing_Delay and Receiver_Processing_Delay provided from the D-layer.

Figure pat00002
Figure pat00002

미디어의 정확한 재생시점을 나타내는 Rendering Time은 하기의 수학식 3에 의해 계산할 수 있다.  The rendering time representing the exact playback time of the media can be calculated by Equation 3 below.

Figure pat00003
Figure pat00003

한편, MMT 시스템의 작동이 IP 네트워크를 통한 전송이 목적이 아니라, 로컬 장치로의 직접적인 저장만을 목적으로 할 경우에는 Sender_Processing_Delay, Transmission_Delay, 및 Receiver_Processing_Delay가 존재하지 않는다. 따라서, 로컬 저장 장치(local storage device)에 저장된 MMT 데이터를 단말기에서 로컬로 재생하기 위해 필요한 Decoding Time 과 Rendering Time은 각각 하기의 수학식 4와 수학식 5에 의해 계산할 수 있다. On the other hand, when the operation of the MMT system is not intended for transmission over the IP network, but only for direct storage to the local device, Sender_Processing_Delay, Transmission_Delay, and Receiver_Processing_Delay do not exist. Therefore, Decoding Time and Rendering Time required for locally reproducing MMT data stored in a local storage device in the terminal may be calculated by Equations 4 and 5, respectively.

Figure pat00004
Figure pat00004

Figure pat00005
Figure pat00005

이 경우에는 수학식 2와 달리 Sampling_Time 값 자체가 Decoding_Time 값으로 활용된다.
In this case, unlike Equation 2, the Sampling_Time value itself is used as the Decoding_Time value.

도 6은 도 5의 미디어 데이터 수신 장치가 도 3에 표시된 타이밍 정보를 활용하여 시간적 동기화를 맞추기 위한 MMT 시스템의 수신 단말기에서 이루어지는 동작절차를 나타낸다. 도 3에 표시된 MMT E-layer 의 타이밍 정보를 활용하여 MMT 시스템의 미디어 데이터 수신 장치 측에서 이루어지는 동작 절차는 도 6과 같다.
FIG. 6 illustrates an operation procedure performed by the media data receiving apparatus of FIG. 5 at a receiving terminal of an MMT system for timing synchronization using the timing information shown in FIG. 3. An operation procedure performed at the media data receiving apparatus side of the MMT system using the timing information of the MMT E-layer shown in FIG. 3 is shown in FIG. 6.

도 2에 도시된 바와 같이, Sampling Time을 Sampling_Time_Ext와 Sampling_Time_Base필드로 나뉘어 표시하는 이유는 MMT E-layer의 타이밍 정보를 기존의 MPEG-2 시스템의 타이밍 정보와 RTP 타임스탬프 값으로 직접적인 변환이 이루어질 수 있도록 하기 위함이다. MMT에 의해 생성된 데이터는 기존의 MPEG-2 시스템과 같은 저장 포맷과 RTP 패킷과 같은 전송 포맷으로 손쉽게 변환이 가능해야 한다. As shown in FIG. 2, the reason why the Sampling Time is divided into Sampling_Time_Ext and Sampling_Time_Base fields is displayed so that timing information of the MMT E-layer can be directly converted into timing information and RTP timestamp value of the existing MPEG-2 system. To do this. Data generated by MMT should be easily convertible to a storage format such as the MPEG-2 system and a transport format such as an RTP packet.

따라서, MMT 시스템의 E-layer에서 생성된 데이터를 MPEG-2 시스템 포맷으로 변환할 경우에는 MPEG-2 PES(packetized elementary system) 패킷 헤더에 포함되는 DTS 및 PTS 타이밍 정보를 MMT의 E-layer 타이밍 정보로부터 효율적으로 유도해 내야 한다. 또한, MMT 시스템의 E-layer에서 생성된 데이터를 RTP 프로토콜을 활용하여 전송할 경우에도 RTP 프로토콜 헤더에 포함되는 RTP 타임스탬프 값을 MMT E-layer 타이밍 정보로부터 효율적으로 유도해 내야 한다. 이 두 가지 경우를 모두 만족시키기 위해서 본 발명에서는 총 33 비트 크기를 갖는 Sampling Time 값의 33번째 비트에 해당하는 값을 1비트 크기의 Sampling_Time_Ext필드로 표시하고, 나머지 32비트에 해당하는 값을 Sampling_Time_Base 필드로 표시할 수 있다. 상기와 같이 Sampling Time 정보를 1비트의 Sampling_Time_Ext필드와 32 비트의 Sampling_Time_Base 필드로 분리하여 표현할 경우 MPEG-2 시스템의 33비트 DTS/PTS 값과 32 비트의 RTP 타임스탬프 값 모두를 직접적으로 얻어낼 수 있다.
Therefore, when the data generated by the E-layer of the MMT system is converted into the MPEG-2 system format, the DTS and PTS timing information included in the MPEG-2 packetized elementary system (PES) packet header is converted to the E-layer timing information of the MMT. Efficiently derived from In addition, even when transmitting data generated in the E-layer of the MMT system using the RTP protocol, the RTP timestamp value included in the RTP protocol header should be efficiently derived from the MMT E-layer timing information. In order to satisfy both cases, in the present invention, a value corresponding to the 33rd bit of the Sampling Time value having a total size of 33 bits is represented by a Sampling_Time_Ext field having a size of 1 bit, and the value corresponding to the remaining 32 bits is represented by a Sampling_Time_Base field. Can be displayed as As described above, when the Sampling Time information is divided into a 1-bit Sampling_Time_Ext field and a 32-bit Sampling_Time_Base field, both 33-bit DTS / PTS values and 32-bit RTP timestamp values of the MPEG-2 system can be directly obtained. .

도 7은 MMT E-layer 데이터의 헤더에 기록되어 있는 타이밍 정보를 MPEG-2 시스템의 DTS 및 PTS 정보로 매핑시키는 경우를 나타낸다. 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치의 제어부(570)는 상기 제 1 샘플링 타임 정보(Sampling_Time_Ext), 제 2 샘플링 타임 정보(Sampling_Time_Base) 및 렌더링 타임 정보를 기반으로 MPEG-2 시스템의 DTS(Decoding Time Stamp) 및 PTS(Presentation Time Stamp)를 생성할 수 있다. FIG. 7 illustrates a case where timing information recorded in a header of MMT E-layer data is mapped to DTS and PTS information of an MPEG-2 system. The control unit 570 of the apparatus for receiving media data according to an embodiment of the present invention uses the DTS (MPS) of the MPEG-2 system based on the first sampling time information (Sampling_Time_Ext), the second sampling time information (Sampling_Time_Base), and the rendering time information. Decoding Time Stamp) and PTS (Presentation Time Stamp) can be generated.

보다 구체적으로, MMT E-layer 데이터의 헤더에 기록되어 있는 타이밍 정보를 하기의 수학식 6을 기반으로 MPEG-2 시스템의 DTS 값으로 매핑할 수 있다. More specifically, the timing information recorded in the header of the MMT E-layer data may be mapped to the DTS value of the MPEG-2 system based on Equation 6 below.

Figure pat00006
Figure pat00006

상기 수학식 6에서 Sender_Processing_to_Decoding_Delay는 도 3에 표시된 Sender Processing Delay, Transmission Delay, Receiver Processing Delay를 모두 합한 시간에 대한 예상된 값을 나타낸다.In Equation 6, Sender_Processing_to_Decoding_Delay represents an expected value for the sum of all of the Sender Processing Delay, Transmission Delay, and Receiver Processing Delay shown in FIG. 3.

또한, MMT E-layer 데이터의 헤더에 기록되어 있는 타이밍 정보를 상기 수학식 6의 결과를 활용한 하기의 수학식 7을 기반으로 MPEG-2 시스템의 PTS 값으로 매핑할 수 있다. In addition, the timing information recorded in the header of the MMT E-layer data may be mapped to the PTS value of the MPEG-2 system based on Equation 7 below using the result of Equation 6.

Figure pat00007
Figure pat00007

한편, 상기 수학식 6과 수학식 7에 의해 계산되는 DTS와 PTS 정보를 활용하면 MMT 시스템에 의해 전송되는 미디어 데이터의 시간 정보를 MPEG-2 시스템에서 사용하는 시간 정보의 포맷으로 해석이 가능하므로 MPEG-2 시스템을 통해 전송된 미디어 데이터와도 시간적 동기화를 맞출 수 있다. 즉, 하나의 스트림은 MMT 시스템을 통해서 전송이 되고 또 다른 스트림은 MPEG 시스템을 통해서 전송이 될 경우, 이 두 가지 스트림들 간에 시간적 동기화를 맞출 수 있다.
On the other hand, if the DTS and PTS information calculated by Equations 6 and 7 are used, the time information of the media data transmitted by the MMT system can be interpreted as a format of the time information used by the MPEG-2 system. Time synchronization can also be achieved with media data transmitted via the -2 system. That is, when one stream is transmitted through the MMT system and another stream is transmitted through the MPEG system, temporal synchronization between the two streams can be achieved.

도 8은 MMT E-layer 데이터의 헤더에 기록되어 있는 타이밍 정보를 RTP 패킷의 RTP 타임스탬프 정보로 매핑시키는 경우를 나타낸다. 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치의 제어부(570)는 상기 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 기반으로 RTP(Real Time Protocol)의 RTP 타임 스탬프를 생성하는 것을 특징으로 할 수 있다. RTP 타임스탬프는 총 32 비트의 길이를 갖기 때문에 하기 수학식 8을 기반으로 RTP 타임스탬프 값으로의 직접적인 매핑이 가능하다. 8 shows a case where the timing information recorded in the header of the MMT E-layer data is mapped to the RTP time stamp information of the RTP packet. The controller 570 of the apparatus for receiving media data according to an embodiment of the present invention may generate an RTP time stamp of a real time protocol (RTP) based on the second sampling time information and the rendering time information. . Since the RTP timestamp has a total length of 32 bits, direct mapping to the RTP timestamp value is possible based on Equation 8 below.

Figure pat00008
Figure pat00008

따라서, MMT E-layer의 타이밍 정보를 기존의 MPEG-2 시스템의 타이밍 정보와 RTP 타임스탬프 값으로 직접 변환할 수 있다. 즉, MMT에 의해 생성된 데이터가 기존의 MPEG-2 시스템과 같은 저장 포맷과 RTP 패킷과 같은 전송 포맷으로 손쉽게 변환될 수 있다.
Therefore, the timing information of the MMT E-layer can be directly converted into the timing information and the RTP timestamp value of the conventional MPEG-2 system. That is, the data generated by the MMT can be easily converted into a storage format such as the MPEG-2 system and a transmission format such as an RTP packet.

도 9는 본 발명의 일 실시 예에 따른 미디어 데이터 전송 방법의 흐름도이다. 9 is a flowchart illustrating a method of transmitting media data according to an embodiment of the present invention.

도 9에 도시된 바와 같이, 본 발명의 일 실시 예에 따른 미디어 데이터 전송 방법은 미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 단계(S910), 상기 부호화된 미디어 스트림을 저장하는 단계(S920), 상기 부호화된 미디어 스트림을 캡슐화하여 타이밍 정보를 포함하는 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하는 단계(S930), 상기 E-layer 데이터를 패킷화하여 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 단계(S940) 및 상기 패킷화된 D-layer 패킷을 전송하는 단계(S950)를 포함할 수 있다. 여기서, 상기 타이밍 정보는 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함하는 것을 특징으로 할 수 있다. As shown in FIG. 9, the media data transmission method according to an embodiment of the present invention includes generating a media stream by encoding media data (S910), storing the encoded media stream (S920), and Generating encapsulation layer data (E-layer data) including the timing information by encapsulating the encoded media stream (S930); packetizing the E-layer data to deliver a delivery layer packet; Generating a D-layer packet (S940) and transmitting the packetized D-layer packet (S950). Here, the timing information may include first sampling time information, second sampling time information, and rendering time information.

여기서, 상기 제 1 샘플링 타임 정보는 1 비트이고, 상기 제 2 샘플링 타임 정보는 32 비트인 것을 특징으로 할 수 있으며, 상기 제 1 샘플링 타임 정보는 샘플링 클럭 주파수를 기반으로 하는 샘플링 타임(Sampling Time)의 33번째 비트의 값이고, 상기 제 2 샘플링 타임 정보는 상기 샘플링 타임(Sampling Time)의 하위 32 비트의 값인 것을 특징으로 할 수 있다.
Here, the first sampling time information may be 1 bit, and the second sampling time information may be 32 bits. The first sampling time information may be a sampling time based on a sampling clock frequency. It is the value of the 33rd bit of the second sampling time information may be characterized in that the value of the lower 32 bits of the sampling time (Sampling Time).

도 10은 본 발명의 일 실시 예에 따른 미디어 데이터 수신 방법의 흐름도이고, 도 11은 도 10의 샘플링 타임 및 렌더링 타임을 결정하는 단계의 상세 흐름도이다. 10 is a flowchart of a method of receiving media data according to an embodiment of the present invention, and FIG. 11 is a detailed flowchart of steps of determining a sampling time and a rendering time of FIG. 10.

도 10에 도시된 바와 같이, 본 발명의 일 실시 예에 따른 미디어 데이터 수신 방법은 먼저 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신한다(S1010). 그리고 상기 D-layer 패킷을 디패킷화하여 상기 E-layer 데이터를 생성한다(S1020). 이후, 상기 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 디캡슐화화여 부호화된 미디어 스트림을 생성하고 타이밍 정보를 추출할 수 있다(S1030). 여기서, 상기 타이밍 정보는 MPEG-2 시스템 및 RTP(Real Time Protocol)와 호환되는 것을 특징으로 할 수 있다. 구체적으로, 상기 타이밍 정보는 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함할 수 있다. 또한, 상기 렌더링 타임 정보는 상기 미디어 스트림이 디코딩된 이후 재생 시점까지 소요되는 시간을 나타내는 것을 특징으로 할 수 있다. As shown in FIG. 10, the method for receiving media data according to an embodiment of the present invention first receives a delivery layer packet (D-layer packet) (S1010). The E-layer data is generated by depacketizing the D-layer packet (S1020). Thereafter, the encapsulation layer data (Encapsulation layer data, E-layer data) may be decapsulated to generate an encoded media stream and to extract timing information (S1030). Here, the timing information may be compatible with the MPEG-2 system and the Real Time Protocol (RTP). In detail, the timing information may include first sampling time information, second sampling time information, and rendering time information. In addition, the rendering time information may represent a time required until the playback time after the media stream is decoded.

이후, 상기 제 1 샘플링 타임 정보 및 제 2 샘플링 타임 정보를 기반으로 샘플링 타임(Sampling Time)을 결정하고 상기 샘플링 타임을 기반으로 미디어의 정확한 재생 시점을 나타내는 렌더링 타임을 결정할 수 있다(S1040). Thereafter, a sampling time may be determined based on the first sampling time information and the second sampling time information, and a rendering time indicating an accurate playback time of the media may be determined based on the sampling time (S1040).

도 11을 참조하여 상기 샘플링 타임 및 렌더링 타임 결정 단계(S1040)를 보다 상세히 설명하면, MMT E-layer의 데이터 헤더를 수신(S1041)하여, 제 1 샘플링 타임 정보(Sampling_Time_Ext)를 추출하고(S1042), 제 2 샘플링 타임 정보(Sampling_Time_Base)를 추출할 수 있다(S1043). 상기 제 1 샘플링 타임 정보 및 제 2 샘플링 타임 정보를 기반으로 Sampling Time을 계산하여(S1044), 디코딩 타임(Decoding Time)의 계산에 활용할 수 있다(S1046). 또한, 상기 MMT E-layer의 데이터 헤더에서 렌더링 타임 정보(Rendering_Time_Offset)를 추출하여(S1047), 상기 계산된 디코딩 타임과 상기 렌더링 타임 정보를 기반으로 렌더링 타임(Rendering Time)을 계산할 수 있다(S1047). Referring to FIG. 11, the sampling time and rendering time determination step (S1040) will be described in more detail. After receiving the data header of the MMT E-layer (S1041), the first sampling time information (Sampling_Time_Ext) is extracted (S1042). In operation S1043, the second sampling time information Sampling_Time_Base may be extracted. The sampling time may be calculated based on the first sampling time information and the second sampling time information (S1044), and may be used to calculate a decoding time (S1046). In addition, rendering time information (Rendering_Time_Offset) is extracted from the data header of the MMT E-layer (S1047), and a rendering time (Rendering Time) may be calculated based on the calculated decoding time and the rendering time information (S1047). .

다시 도 10을 참조하면, 이후 상기 부호화된 미디어 스트림을 저장하고(S1050), 상기 부호화된 미디어 스트림을 디코딩(S1060)하며, 디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬(S1070)할 수 있다.
Referring back to FIG. 10, the encoded media stream may be stored (S1050), the encoded media stream is decoded (S1060), and the decoded media data may be rearranged (S1070) for display.


Claims (22)

미디어 데이터를 전송하는 장치에 있어서,
부호화된 미디어 스트림을 캡슐화하여 타이밍 정보를 포함하는 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하는 캡슐화부(Encapsulator)를 포함하되,
상기 타이밍 정보는 MPEG-2 시스템 및 RTP(Real Time Protocol)와 호환되는 것을 특징으로 하는 미디어 데이터 전송 장치.
An apparatus for transmitting media data,
An encapsulator for encapsulating the encoded media stream to generate encapsulation layer data (E-layer data) including timing information.
And the timing information is compatible with an MPEG-2 system and a Real Time Protocol (RTP).
제 1항에 있어서, 상기 타이밍 정보는
제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함하는 것을 특징으로 하는 미디어 데이터 전송 장치.
The method of claim 1, wherein the timing information is
And first sampling time information, second sampling time information, and rendering time information.
제 1 항에 있어서,
미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 인코더;
상기 부호화된 미디어 스트림을 저장하고 있는 버퍼;
상기 E-layer 데이터를 패킷화하여 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 패킷화부(Packetizer); 및
상기 패킷화된 D-layer 패킷을 전송하는 전송부를 더 포함하는 것을 특징으로 하는 미디어 데이터 전송 장치.
The method of claim 1,
An encoder for encoding the media data to produce a media stream;
A buffer that stores the encoded media stream;
A packetizer for packetizing the E-layer data to generate a delivery layer packet (D-layer packet); And
And a transmitter for transmitting the packetized D-layer packet.
제 2 항에 있어서,
상기 제 1 샘플링 타임 정보는 1 비트이고,
상기 제 2 샘플링 타임 정보는 32 비트인 것을 특징으로 하는 미디어 데이터 전송 장치.
The method of claim 2,
The first sampling time information is 1 bit,
And the second sampling time information is 32 bits.
제 4 항에 있어서,
상기 제 1 샘플링 타임 정보는 샘플링 클럭 주파수를 기반으로 하는 샘플링 타임(Sampling Time)의 33번째 비트의 값이고,
상기 제 2 샘플링 타임 정보는 상기 샘플링 타임(Sampling Time)의 하위 32 비트의 값인 것을 특징으로 하는 미디어 데이터 전송 장치.
The method of claim 4, wherein
The first sampling time information is a value of the 33rd bit of the sampling time based on the sampling clock frequency.
And the second sampling time information is a lower 32-bit value of the sampling time.
미디어 데이터를 수신하는 장치에 있어서,
캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 디캡슐화화여 부호화된 미디어 스트림을 생성하고 타이밍 정보를 추출하는 디캡슐화부(Decapsulator)를 포함하되,
상기 타이밍 정보는 MPEG-2 시스템 및 RTP(Real Time Protocol)와 호환되는 것을 특징으로 하는 미디어 데이터 수신 장치.
An apparatus for receiving media data, the apparatus comprising:
A decapsulator for decapsulating encapsulation layer data (E-layer data) to generate an encoded media stream and extracting timing information;
And the timing information is compatible with an MPEG-2 system and a Real Time Protocol (RTP).
제 6항에 있어서, 상기 타이밍 정보는
제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함하는 것을 특징으로 하는 미디어 데이터 수신 장치.
The method of claim 6, wherein the timing information is
And first sampling time information, second sampling time information, and rendering time information.
제 6 항에 있어서,
전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신하는 수신부;
상기 D-layer 패킷을 디패킷화하여 상기 E-layer 데이터를 생성하는 디패킷화부(Depacketizer);
상기 부호화된 미디어 스트림을 저장하는 버퍼;
상기 부호화된 미디어 스트림을 디코딩하는 디코더; 및
디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬하는 렌더링 버퍼(Rendering Buffer)를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 장치.
The method according to claim 6,
A receiver for receiving a delivery layer packet (D-layer packet);
A depacketizer configured to depacketize the D-layer packet to generate the E-layer data;
A buffer for storing the encoded media stream;
A decoder for decoding the encoded media stream; And
And a rendering buffer for reordering the decoded media data for display.
제 7항에 있어서,
상기 제 1 샘플링 타임 정보 및 제 2 샘플링 타임 정보를 기반으로 샘플링 타임(Sampling Time)을 결정하고 상기 샘플링 타임을 기반으로 미디어의 정확한 재생 시점을 나타내는 렌더링 타임을 결정하는 제어부를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 장치.
8. The method of claim 7,
And a controller configured to determine a sampling time based on the first sampling time information and the second sampling time information, and to determine a rendering time indicating an accurate playback time of media based on the sampling time. Media data receiving device.
제 7항에 있어서, 상기 제어부는
상기 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 기반으로 MPEG-2 시스템의 DTS(Decoding Time Stamp) 및 PTS(Presentation Time Stamp)를 생성하는 것을 특징으로 하는 미디어 데이터 수신 장치.
8. The apparatus of claim 7, wherein the control unit
And generating a decoding time stamp (DTS) and a presentation time stamp (PTS) of the MPEG-2 system based on the first sampling time information, the second sampling time information, and the rendering time information.
제 7항에 있어서, 상기 제어부는
상기 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 기반으로 RTP(Real Time Protocol)의 RTP 타임 스탬프를 생성하는 것을 특징으로 하는 미디어 데이터 수신 장치.
8. The apparatus of claim 7, wherein the control unit
And generating an RTP time stamp of a real time protocol (RTP) based on the second sampling time information and the rendering time information.
미디어 데이터를 전송하는 방법에 있어서,
부호화된 미디어 스트림을 캡슐화하여 타이밍 정보를 포함하는 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하는 단계를 포함하되,
상기 타이밍 정보는 MPEG-2 시스템 및 RTP(Real Time Protocol)와 호환되는 것을 특징으로 하는 미디어 데이터 전송 방법.
In the method for transmitting media data,
Encapsulating the encoded media stream to generate encapsulation layer data (E-layer data) including timing information;
And the timing information is compatible with an MPEG-2 system and a Real Time Protocol (RTP).
제 12항에 있어서, 상기 타이밍 정보는
제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함하는 것을 특징으로 하는 미디어 데이터 전송 방법.
The method of claim 12, wherein the timing information is
And first sampling time information, second sampling time information, and rendering time information.
제 12 항에 있어서,
미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 단계;
상기 부호화된 미디어 스트림을 저장하는 단계;
상기 E-layer 데이터를 패킷화하여 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 단계; 및
상기 패킷화된 D-layer 패킷을 전송하는 단계를 더 포함하는 것을 특징으로 하는 미디어 데이터 전송 방법.
13. The method of claim 12,
Encoding the media data to generate a media stream;
Storing the encoded media stream;
Packetizing the E-layer data to generate a delivery layer packet (D-layer packet); And
And transmitting the packetized D-layer packet.
제 13 항에 있어서,
상기 제 1 샘플링 타임 정보는 1 비트이고,
상기 제 2 샘플링 타임 정보는 32 비트인 것을 특징으로 하는 미디어 데이터 전송 방법.
The method of claim 13,
The first sampling time information is 1 bit,
And the second sampling time information is 32 bits.
제 15 항에 있어서,
상기 제 1 샘플링 타임 정보는 샘플링 클럭 주파수를 기반으로 하는 샘플링 타임(Sampling Time)의 33번째 비트의 값이고,
상기 제 2 샘플링 타임 정보는 상기 샘플링 타임(Sampling Time)의 하위 32 비트의 값인 것을 특징으로 하는 미디어 데이터 전송 방법.
The method of claim 15,
The first sampling time information is a value of the 33rd bit of the sampling time based on the sampling clock frequency.
And the second sampling time information is a lower 32-bit value of the sampling time.
미디어 데이터를 수신하는 방법에 있어서,
캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 디캡슐화화여 부호화된 미디어 스트림을 생성하고 타이밍 정보를 추출하는 단계를 포함하되,
상기 타이밍 정보는 MPEG-2 시스템 및 RTP(Real Time Protocol)와 호환되는 것을 특징으로 하는 미디어 데이터 수신 방법.
In the method for receiving media data,
Decapsulating encapsulation layer data (E-layer data) to generate an encoded media stream and extracting timing information.
And the timing information is compatible with an MPEG-2 system and a Real Time Protocol (RTP).
제 17항에 있어서, 상기 타이밍 정보는
제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 포함하는 것을 특징으로 하는 미디어 데이터 수신 방법.
18. The method of claim 17, wherein the timing information is
And first sampling time information, second sampling time information, and rendering time information.
제 17 항에 있어서,
전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신하는 단계;
상기 D-layer 패킷을 디패킷화하여 상기 E-layer 데이터를 생성하는 단계;
상기 부호화된 미디어 스트림을 저장하는 단계;
상기 부호화된 미디어 스트림을 디코딩하는 단계; 및
디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬하는 단계를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 방법.
The method of claim 17,
Receiving a delivery layer packet (D-layer packet);
Depacketizing the D-layer packet to generate the E-layer data;
Storing the encoded media stream;
Decoding the encoded media stream; And
Reordering the decoded media data for display.
제 18항에 있어서,
상기 제 1 샘플링 타임 정보 및 제 2 샘플링 타임 정보를 기반으로 샘플링 타임(Sampling Time)을 결정하고 상기 샘플링 타임을 기반으로 미디어의 정확한 재생 시점을 나타내는 렌더링 타임을 결정하는 단계를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 방법.
19. The method of claim 18,
Determining a sampling time based on the first sampling time information and the second sampling time information, and determining a rendering time indicating an accurate playback time of media based on the sampling time. The method of receiving media data.
제 18항에 있어서,
상기 제 1 샘플링 타임 정보, 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 기반으로 MPEG-2 시스템의 DTS(Decoding Time Stamp) 및 PTS(Presentation Time Stamp)를 생성하는 단계를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 방법.
19. The method of claim 18,
Generating a decoding time stamp (DTS) and a presentation time stamp (PTS) of the MPEG-2 system based on the first sampling time information, the second sampling time information, and the rendering time information. How to receive data.
제 18항에 있어서,
상기 제 2 샘플링 타임 정보 및 렌더링 타임 정보를 기반으로 RTP(Real Time Protocol)의 RTP 타임 스탬프를 생성하는 단계를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 방법.
19. The method of claim 18,
And generating an RTP time stamp of a real time protocol (RTP) based on the second sampling time information and the rendering time information.
KR1020120105350A 2011-09-23 2012-09-21 Media data transmission apparatus and method, and media data reception apparatus and method in mmt system KR20130032843A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2012/007617 WO2013042998A1 (en) 2011-09-23 2012-09-21 Apparatus and method for transmitting media data for mmt system, and apparatus and method for receiving media data

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020110096492 2011-09-23
KR20110096492 2011-09-23

Publications (1)

Publication Number Publication Date
KR20130032843A true KR20130032843A (en) 2013-04-02

Family

ID=48435518

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120105350A KR20130032843A (en) 2011-09-23 2012-09-21 Media data transmission apparatus and method, and media data reception apparatus and method in mmt system

Country Status (1)

Country Link
KR (1) KR20130032843A (en)

Similar Documents

Publication Publication Date Title
KR102049907B1 (en) Media data transmission apparatus and method, and media data reception apparatus and method in mmt system
JP6887466B2 (en) A device that transmits packets in a multimedia transmission system
TWI668982B (en) Method and server device for transport interface for multimedia and file transport, and computer-readable storage medium for recording related instructions thereon
US20150181003A1 (en) Method and apparatus for transmitting and receiving packets in hybrid transmission service of mmt
CN108777676B (en) Apparatus and method for receiving media data in multimedia transmission system
CN113287323B (en) Method, client device and computer readable medium for retrieving media data
JP6302274B2 (en) Transmitting apparatus and receiving apparatus
US20130173826A1 (en) Method of providing timing information using mmt signaling layer signaling for synchronizing mmt packet streams in mmt hybrid delivery service and method of synchronizing mmt packet streams in mmt hybrid delivery service
KR102026266B1 (en) Estimation method of network jitter for apparatuses transporting coded media data
KR20130009670A (en) Packet transmission apparatus and method, and packet reception apparatus and method in mmt system
KR102098723B1 (en) Method configuring and transmitting mmt transport packet
WO2004086765A1 (en) Data transmission device
KR20130009671A (en) Packet transmission apparatus and method, and packet reception apparatus and method in mmt system
KR20130032843A (en) Media data transmission apparatus and method, and media data reception apparatus and method in mmt system
KR102093408B1 (en) Method and apparatus of selective classification of packet error of multiple packet streams multiplexed in same port
KR101920051B1 (en) Methods of Providing Timing Information for Synchronizing MMT Packet Streams in MMT Hybrid Delivery Service and Methods of Synchronizing MMT Packet Streams in MMT Hybrid Delivery Service
WO2013042998A1 (en) Apparatus and method for transmitting media data for mmt system, and apparatus and method for receiving media data
WO2013009131A2 (en) Apparatus and method for transmitting packet and apparatus and method for receiving packet in mmt system
KR20130138694A (en) Method for describing timing information in media processing unit which contains one or more access units

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid