WO2013042999A1 - Mmt 시스템을 위한 미디어 데이터 전송 장치 및 방법, 그리고 미디어 데이터 수신 장치 및 방법 - Google Patents

Mmt 시스템을 위한 미디어 데이터 전송 장치 및 방법, 그리고 미디어 데이터 수신 장치 및 방법 Download PDF

Info

Publication number
WO2013042999A1
WO2013042999A1 PCT/KR2012/007618 KR2012007618W WO2013042999A1 WO 2013042999 A1 WO2013042999 A1 WO 2013042999A1 KR 2012007618 W KR2012007618 W KR 2012007618W WO 2013042999 A1 WO2013042999 A1 WO 2013042999A1
Authority
WO
WIPO (PCT)
Prior art keywords
time
information
layer
media data
transmission
Prior art date
Application number
PCT/KR2012/007618
Other languages
English (en)
French (fr)
Inventor
유정주
김창기
김태정
정영호
홍진우
서광덕
이홍래
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to CN201280057672.5A priority Critical patent/CN103947215B/zh
Priority to US14/345,074 priority patent/US20140351874A1/en
Priority claimed from KR1020120105347A external-priority patent/KR101959260B1/ko
Publication of WO2013042999A1 publication Critical patent/WO2013042999A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2362Generation or processing of Service Information [SI]

Definitions

  • the present invention relates to an apparatus and method for transmitting and receiving media data, and more particularly, to a delivery layer (D) required for transmitting and receiving media data for an MMT (MPEG Media Transport) system. -layer) timing information.
  • D delivery layer
  • MMT MPEG Media Transport
  • MPEG Media Transport is a new standard technology that has begun development in the MPEG systems sub-working group.
  • the existing MPEG-2 system has been widely used since MPEG-2 transport stream (TS) technology has been standardized as a standard for packetization, synchronization, and multiplexing for transmitting A / V content in a broadcasting network.
  • MPEG-2 TS is inefficient in a packet transmission environment in which a network is based on IP (Internet Protocol). Therefore, ISO MPEG recognized the necessity of a new media transmission standard in consideration of the new media transmission environment and the expected media transmission environment, and started to standardize MMT.
  • DTS decoding time stamp
  • PTS presentation time stamp
  • RTP real-time transport protocol
  • NTP network time protocol
  • timing models for media transmission there are two conventionally developed timing models for media transmission, firstly, MPEG-2 system technology, and secondly, a method of combining RTP and RTCP (RTP Control Protocol).
  • RTP and RTCP RTP Control Protocol
  • PTS and DTS timing information are used as timing information for constructing a timing model for determining a media playback time.
  • RTP time stamp information recorded in the RTP and the NTP time stamp recorded in the RTCP Sender Report (SR) are simultaneously used.
  • MPEG-2 system technology proposes a timing model for delivering compressed media through a stable transmission network such as a broadcasting network. Since MPEG-2 system is a standard developed for digital broadcasting service, MPEG-2 Transport Stream (TS) packets transmitted to the receiver are transmitted to the receiver through a broadcasting network, which is a circuit switched network with stable channel quality. do. Accordingly, MPEG-2 TS packets have a relatively short and constant packet delay time experienced in a transport channel, and a timing model for sequentially processing TS packets arriving at a receiver also operates relatively stably. However, in the case of IP networks other than broadcasting networks, the arrival delay time intervals experienced by TS packets transmitted are very irregular, and therefore, the timing model adopted by MPEG-2 system technology is difficult to maintain stably.
  • TS Transport Stream
  • the RTP timestamp recorded in the header of the RTP packet indicates the internal temporal ordering relationship of a specific media stream. Accordingly, in order to provide synchronization between different media streams, timing information corresponding to an absolute time (wall-clock) must be delivered.
  • the timing information transmitted to the terminal for this purpose is an NTP timestamp.
  • the NTP timestamp is transmitted in an RTCP SR (Sender Report) packet, which is repeatedly transmitted at regular intervals. Since RTCP SR packets are transmitted separately from the RTP stream for transmitting media, the operation of the transmitting and receiving system is complicated by increasing the traffic burden on the network and increasing the number of UDP ports and streams to be managed by the server / terminal. Lose.
  • the D-layer of the MMT technology which is newly standardized, can effectively transmit important time information generated in the D-layer packetization process to prepare for transmission of the MMT packet to the receiving terminal. It is necessary to consider the timing model.
  • an object of the present invention for solving the above problems is the transmission of media data capable of providing D-layer timing information necessary for the timing of playback of media and temporal synchronization between media in an MMT system-based media transmission service. It is to provide an apparatus and method.
  • Another object of the present invention is to provide an apparatus and method for receiving media data capable of providing D-layer timing information required for time synchronization of media and time of playback of media transmitted in a MMT system-based media transmission service.
  • a media data transmission apparatus including a delivery layer packet including packetization of encapsulation layer data (E-layer data) and including timing information. And a packetizer for generating a D-layer packet, wherein the timing information includes sampling time information and transmission procedure delay information.
  • the media data transmission device may further include an encoder for encoding media data to generate a media stream; A buffer that stores the encoded media stream; An encapsulator for encapsulating the encoded media stream to generate the E-layer data; And a transmitter configured to transmit the packetized D-layer packet.
  • the sampling time information may be in a network time protocol (NTP) time stamp format, and may include an integer part and a decimal part, and the integer part may have any one size of 32 bits or 16 bits.
  • the delay information may include delay time information from a sampling time according to the sampling time information to a time point of generating the D-layer packet and starting transmission.
  • an apparatus for receiving media data depacketizes a delivery layer packet (D-layer packet) to encapsulation layer data (E-S). layer data) and a depacketizer for extracting timing information.
  • the timing information may include sampling time information and transmission procedure delay information.
  • the media data receiving apparatus includes a receiving unit for receiving the delivery layer packet (D-layer packet); A decapsulator for generating an encoded media stream by decapsulating the E-layer data; A buffer for storing the encoded media stream; A decoder for decoding the encoded media stream; And a rendering buffer for rearranging the decoded media data for display.
  • the media data receiving apparatus may include a controller configured to determine a delivery time indicating a time at which the media data transmitting apparatus starts to generate a D-layer packet based on the sampling time information and the transmission procedure delay information. It may be characterized in that it further comprises. In addition, the controller measures an arrival time (Arrival Time), which means a time when the D-layer packet arrives at the media data receiving apparatus, and further transmits a transmission delay time based on the arrival time and the transmission time. It may be characterized by determining. The controller may determine the reception procedure delay time such that the total delay time is kept constant based on the transmission procedure delay time included in the transmission procedure delay information and the transmission delay time. The control unit may use the sampling time information and the transmission procedure delay information to synchronize media data received from different media data transmission devices.
  • Arriv Time arrival time
  • the control unit may use the sampling time information and the transmission procedure delay information to synchronize media data received from different media data transmission devices.
  • a media data transmission method includes a delivery layer packet including timing information by packetizing encapsulation layer data (E-layer data). packet, D-layer packet), wherein the timing information includes sampling time information and transmission procedure delay information.
  • the media data transmission method may include generating a media stream by encoding media data; Storing the encoded media stream; Encapsulating the encoded media stream to generate the E-layer data; And transmitting the packetized D-layer packet.
  • the sampling time information may be in a network time protocol (NTP) time stamp format, and may include an integer part and a decimal part, and the integer part may have any one size of 32 bits or 16 bits.
  • the delay information may include delay time information from a sampling time according to the sampling time information to a time point of generating the D-layer packet and starting transmission.
  • a method for receiving media data includes encapsulation layer data (E-) by depacketizing a delivery layer packet (D-layer packet). layer data), and extracting timing information, wherein the timing information includes sampling time information and transmission procedure delay information.
  • the media data receiving method may include receiving the delivery layer packet (D-layer packet); Decapsulating the E-layer data to generate an encoded media stream; Storing the encoded media stream; Decoding the encoded media stream; And rearranging the decoded media data for display.
  • the method for receiving media data includes determining a delivery time indicating a time point at which a media data transmission device starts transmitting by generating a D-layer packet based on the sampling time information and transmission procedure delay information.
  • the method may further include measuring an arrival time (Arrival Time) indicating a time at which the D-layer packet arrives at the media data receiving device and determining a transmission delay time based on the arrival time and the transmission time. It may be characterized in that it further comprises. The method may further include determining a reception procedure delay time such that the total delay time is kept constant based on the transmission procedure delay time included in the transmission procedure delay information and the transmission delay time. The sampling time information and the transmission procedure delay information may be used for synchronization of media data received from different media data transmission devices.
  • timing information for timing of media playback and time synchronization between media in a media transmission service based on an MMT system is provided.
  • the D-layer timing information of the MMT proposed by the present invention may be combined with a sampling time indicating an encoder input time of a media frame provided by an E-layer and a rendering time indicating a playback time of a media frame. It can be used to ensure that the service is performed while maintaining accurate temporal synchronization between media on the receiving terminal side.
  • FIG. 1 is a conceptual diagram illustrating an MMT hierarchical structure.
  • FIG. 3 is a block diagram illustrating a configuration of an apparatus for transmitting media data according to an embodiment of the present invention.
  • FIG. 5 illustrates a method for selecting a length of an integer part of the sampling time information of FIG. 2.
  • FIG. 6 is a block diagram illustrating a configuration of an apparatus for receiving media data according to an embodiment of the present invention.
  • FIG. 7 illustrates key time information to be considered for maintaining accurate synchronization between media in a media data receiving apparatus.
  • FIG. 9 is a flowchart illustrating a method of transmitting media data according to an embodiment of the present invention.
  • FIG. 10 is a flowchart illustrating a method of receiving media data according to an embodiment of the present invention.
  • first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another.
  • the first component may be referred to as the second component, and similarly, the second component may also be referred to as the first component.
  • FIG. 1 is a conceptual diagram illustrating an MMT hierarchical structure.
  • the MMT layer includes an encapsulation layer, a delivery layer, and a functional area of a signaling layer.
  • the MMT layer operates on a transport layer.
  • the encapsulation layer may be responsible for, for example, packetization, fragmentation, synchronization, multiplexing, and the like of transmitted media.
  • Encapsulation layer (E-layer), as shown in Figure 1, MMT E.1 Layer (MMT E.1 Layer), MMT E.2 Layer (MMT E.2 Layer) and MMT E.3 Layer (MMT) E.3 Layer).
  • MMT E.1 Layer MMT E.1 Layer
  • MMT E.2 Layer MMT E.2 Layer
  • MMT E.3 Layer MMT E.3 Layer
  • the E.3 layer encapsulates a Media Fragment Unit (MFU) provided from the Media Codec (A) layer to create an M-Unit.
  • MFU Media Fragment Unit
  • the MFU may have a format, independent of any particular codec, that can carry data units that can be consumed independently in the media decoder.
  • the MFU can be, for example, a picture or slice of the video.
  • the M-unit may consist of one or a plurality of MFUs and may have a format, independent of a particular codec, that may carry one or a plurality of access units.
  • the E.2 layer encapsulates the M-units created in the E.3 layer to create an MMT asset.
  • An MMT asset is a data entity composed of one or a plurality of M-units from a single data source and is a data unit in which composition information and transport characteristics are defined.
  • the MMT asset may correspond to PES (Packetized Elementary Streams), for example video, audio, program information, MPEG-U widgets, JPEG images, MPEG 4 file format, MPEG2 -TS (MPEG Transport Stream) or the like.
  • PES Packetized Elementary Streams
  • MPEG-U widgets JPEG images
  • MPEG 4 file format MPEG2 -TS (MPEG Transport Stream) or the like.
  • the E.1 layer creates an MMT package by encapsulating the MMT asset generated in the E.2 layer.
  • the MMT package may be composed of one or more MMT assets together with additional information such as composition information and transport characteristics.
  • Composition information includes information about a relationship between MMT assets, and when one content consists of a plurality of MMT packages, it indicates a relationship between a plurality of MMT packages. It may further include information.
  • the transport characteristics may include transmission characteristic information necessary for determining a delivery condition of an MMT asset or an MMT packet, and may include, for example, a traffic description parameter and a QoS descriptor. ) May be included.
  • the MMT package may correspond to a program of MPEG-2 TS.
  • the delivery layer may perform, for example, network flow multiplexing, network packetization, and QoS control of media transmitted through a network.
  • a transport layer includes an MMT D.1 layer, an MMT D.2 layer, and an MMT D.3 layer. D.3 Layer).
  • the D.1 layer receives the MMT package generated in the E.1 layer and generates an MMT payload format.
  • the MMT payload format is a payload format for carrying MMT assets and for transmitting information for consumption by the MMT application protocol or other existing application transport protocol such as RTP.
  • the MMT payload may include a fragment of the MFU along with information such as AL-FEC.
  • the D.2 layer receives the MMT payload format generated in the D.1 layer and generates an MMT transport packet or an MMT packet.
  • the MMT transport packet or MMT packet is a data format used in an application transport protocol for MMT.
  • D.3 layer supports QoS by providing the ability to exchange information between layers by cross-layer design.
  • the D.3 layer may perform QoS control using QoS parameters of the MAC / PHY layer.
  • the signaling layer performs a signaling function. For example, signaling functions for session initialization / control / management of transmitted media, server-based and / or client-based trick modes, service discovery, synchronization, etc. Can be done.
  • Signaling layer may be composed of MMT S.1 layer (MMT S.1 Layer) and MMT S.2 layer (MMT S.2 Layer).
  • S.1 layer includes service discovery, media session initialization / termination of media, media session presentation / control of media, delivery (D) layer and encapsulation (E).
  • the interface function with the layer can be performed.
  • the S.1 layer may define the format of control messages between applications for media presentation session management.
  • the S.2 layer is responsible for flow control, delivery session management, delivery session monitoring, error control, and hybrid network synchronization control. It is possible to define the format of the control message exchanged between delivery end-points of the D-layer.
  • the S.2 layer supports delivery session establishment and release, delivery session monitoring, flow control, error control, resource scheduling for established delivery sessions, and synchronization in a complex delivery environment to support the behavior of the delivery layer.
  • Signaling for adaptive delivery, and signaling for adaptive delivery. Required signaling may be provided between a sender and a receiver. That is, the S.2 layer may provide signaling required between the sender and the receiver in order to support the operation of the transport layer as described above.
  • the S.2 layer may be responsible for interfacing with the transport layer and the encapsulation layer.
  • the present invention provides an apparatus and method for transmitting media data including delivery layer (D-layer) timing information for reproducing media while obtaining playback time information on media and maintaining temporal synchronization between media, And a receiving apparatus and method.
  • important time information generated in the process of generating an MMT packet for transmission in an MMT transmission system can be recorded in a D-layer of an MMT and transmitted to a receiving terminal.
  • the media data receiving apparatus can play the media while maintaining accurate temporal synchronization between the media based on the D-layer time information.
  • the media data transmission apparatus may record important time information that can be secured at the time of generating the D-layer header when generating the MMT packet, in the D-layer header.
  • the present invention provides a simple timing model and operation of the model that can effectively transmit important time information generated in the D-layer packetization process to prepare the transmission of the MMT packet in the D-layer of the MMT technology to the receiving terminal. It may include timing information required for. Therefore, by devising the timing information to be provided in the D-layer of the MMT system, it is possible to ensure accurate time synchronization between the media transmitted in the MMT system-based media transmission service.
  • an apparatus 300 for transmitting media data includes an encoder 310 for encoding media data to generate a media stream, and a buffer for storing the encoded media stream. 320), an encapsulator 330 that encapsulates the encoded media stream to generate encapsulation layer data (E-layer data), and delivers the timing information by packetizing the E-layer data.
  • a packetizer 340 for generating a layer packet (D-layer packet) and a transmitter 350 for transmitting the packetized D-layer packet may be included.
  • the timing information included in the D-layer data may include sampling time information and transmission procedure delay information.
  • FIGS. 2 and 4 show basic timing information to be recorded in the D-layer header of the MMT. 4 also shows key time information to be considered in order to maintain accurate synchronization between media in a media data transmission device.
  • a timing model for maintaining synchronization in a media data transmission apparatus using sampling time information and transmission procedure delay information included in the timing information will be described in detail with reference to FIGS. 2 and 4.
  • the timing information recorded in the header of the D-layer data of the MMT includes sampling time information (hereinafter, 'NTP (T Sam )', 210) and transmission procedure delay information (hereinafter, 'Sender_Processing_Delay', 220. ) May be included.
  • the timing information may be allocated to an MMT package generated in an E-layer of an MMT and carried in a payload of an MMT packet.
  • the sampling time information may be a network time protocol (NTP) time stamp format, and may include an integer part and a decimal part, and the integer part may have any one size of 32 bits or 16 bits.
  • the transmission procedure delay information may include delay time information from a sampling time according to the sampling time information to a time when the D-layer packet is generated to start transmission.
  • the sampling time information T Sam 210 may include sampling times for pictures input in the order of being compressed to the media encoder 310.
  • NTP (T Sam ) 210 is a NTP timestamp with a Universal Uime Coordinated (UTC) time corresponding to NTP (T Sam ) 210, which is a sampling time of a media frame input to encoder 310 of MMT.
  • UTC Universal Uime Coordinated
  • the format is shown.
  • the method of representing NTP (T Sam ) 210 in the NTP timestamp format may be implemented in two forms.
  • the NTP timestamp format can consist of a total of 64 bits.
  • the 64-bit length may include an integer part representing a second time in integer precision units having a length of 32 bits and a second fraction part representing a second time in decimal precision units having a length of 32 bits.
  • UTC time corresponding to 136 years after January 1, 1900 can be expressed.
  • a time interval used for media synchronization for an MMT system-based media service is sufficient within several days. Therefore, if the service is terminated within 18 hours after the service starts, it is sufficient to use only the lower 16 bits without using the entire 32-bit interval.
  • the fractional-second unit of time may use all 32 bits according to the original format.
  • FIG. 5 illustrates a method for selecting a length of an integer part of the sampling time information of FIG. 2.
  • a method of expressing an NTP timestamp for an NTP (T Sam ) 210 may be obtained through the method as illustrated in FIG. 5.
  • the transmission procedure delay information (Sender_Processing_Delay (D S ), 220) is used to generate media data from the time of delivery (D Delvery Time (T Del )), which is the time at which the transmission starts by generating a D-layer packet after the sampling time.
  • the transmission device 300 may indicate a delay time for processing.
  • FIG. 6 is a block diagram illustrating a configuration of an apparatus for receiving media data according to an embodiment of the present invention.
  • the media data receiving apparatus 600 includes a receiver 610 for receiving a delivery layer packet (D-layer packet) and the D-layer packet.
  • a depacketizer (620) for generating encapsulation layer data (E-layer data) by depacketizing and extracting timing information, and generating an encoded media stream by decapsulating the E-layer data.
  • Rendering Buffer 660).
  • the timing information may include sampling time information and transmission procedure delay information.
  • the timing information is the same as the timing information of the aforementioned media data transmission device. That is, the D-layer timing information may include two fields such as sampling time information NTP (T Sam ) 210 and transmission procedure delay information Sender_Processing_Delay 220.
  • FIG. 7 illustrates key time information to be considered for maintaining accurate synchronization between media in a media data receiving apparatus. 6 to 7, the media data receiving apparatus 600 according to an embodiment of the present invention will be described in more detail.
  • the MMT D-layer packet transmitted from the media data transmission apparatus 300 at a delivery time (T Del ) is transmitted through a transmission unit 350, a transmission channel (not shown), and a reception unit 610.
  • Delay, D T may be input to the D-layer depacketizer 620 of the media data receiving apparatus 600 at an arrival time (Arrival Time, T Arr ).
  • the MMT D-layer packet is received through a depacketizer (620), an E-layer decapsulator (630), and a buffer (Buffer, 640).
  • Delay (D S ) is input to the decoder (Decoder, 650), decoding can be started at the decoding time (Decoding Time, T Dec ).
  • the rendering buffer 660 stays at the rendering buffer 660 by the rendering time offset D 0 and is reproduced by the output device 605 at the rendering time T Ren .
  • Sampling time (T Sam ) of timing information such as a delivery time (T Del ), an arrival time (Arrival Time, T Arr ), and a decoding time (T Dec ) shown in FIGS. 4 and 7.
  • T Sam delivery time
  • T Arr Arriv Time
  • T Dec decoding time
  • FIG. 8 shows a temporal correlation between timing information used in the present invention. Referring to FIG. 8, the temporal correlation between main timing information to be considered in the E-layer and the D-layer of the MMT system will be described.
  • the timing information shown in FIG. 8 can be represented by a sampling clock frequency operating at 90 KHz precision commonly used in MPEG-2 systems and RTP transmission systems.
  • sampling time and rendering time are information that can be provided by E-layer of MMT, and delivery time and decoding time are provided by D-layer. It can be derived based on the timing information.
  • Arrival time is actually measured by using the UTC time at the media data receiving device. The arrival time is measured based on the measured arrival time and the delivery time provided by the D-layer. This allows accurate calculation of the transmission delay value.
  • Equation 2 In order to provide a seamless media service while synchronizing between end-to-end terminals (that is, between a media data transmission device and a media data reception device) based on an MMT system, it is transmitted as shown in Equation 2 below.
  • the sum of the procedure delay time (D S ), the transmission delay time (D T ), and the receiver procedure delay time (Receiver Processing Delay, D R ) must be maintained at a constant value of D Tot .
  • D S is a delay time that has already occurred during the processing of the media data transmission apparatus 300 and D T is a delay time that has already occurred during the transmission over the network
  • the media data receiving apparatus 600 adjusts the value of D R appropriately. You can keep Tot constant.
  • the size of the D Tot parameter may be determined to an appropriate value considering the service delay time experienced by the consumer.
  • the D Tot parameter is transmitted from the server to the media data receiving apparatus 600 through a signaling procedure by the S-layer of the MMT in the initial stage of media service, so the media data receiving apparatus 600 already knows before the full media transmission service is performed. Will be.
  • the media data transmission apparatus 300 may transmit the MMT D-layer packet by recording NTP (T Sam ) 210 and D S 220 values as shown in FIG. 2 in the D-layer header of the MMT packet.
  • the cost, the media data reception apparatus 600 includes the NTP (T Sam) is 210 and the D S media data transmission, based on 220 apparatus (300) D-layer packet, as shown in Figure 6
  • the controller 670 may further include a control unit 670 that determines a delivery time indicating a time point at which the transmission is started. That is, in the media data receiving apparatus 600 that receives the MMT D-layer packet, the controller 670 sets a time value expressed in NTP format of UTC time corresponding to a transmission time (Delivery Time, T Del ). It can be calculated through the equation (3).
  • Equation 3 it is assumed that a sampling clock frequency operating at a 90 KHz precision that is commonly used in an MPEG-2 system and an RTP transmission system is used. If a sampling clock frequency other than 90 KHz precision is adopted, the same principle can be applied.
  • the transmission delay time (D T ) means a time elapsed between the delivery time T Del of FIG. 4 and the arrival time T Arr of FIG. 7.
  • Arrival Time (T Arr ) may be measured after the MMT D-layer packet arrives at the receiver 610, and may express UTC time corresponding to this time in NTP format (T Arr ).
  • the controller 670 measures an arrival time, which means a time when the D-layer packet arrives at the media data receiving apparatus 600, and transmits a transmission delay time based on the arrival time and the transmission time.
  • (Transmission Delay) can be further determined. That is, the control unit 670 of the media data receiving apparatus 600 utilizes the measured NTP (T Arr ) and the NTP (T Del ) value calculated in Equation 3 to transmit delay time according to Equation 4 below.
  • T Arr the measured NTP
  • T Del NTP
  • control unit 670 is a reception procedure so that the total delay time (D Tot ) is kept constant based on the transmission procedure delay time (D S ) and the transmission delay time (D T ) included in the transmission procedure delay information.
  • the delay time D R can be determined. That is, a D R value satisfying Equation 2 may be determined based on Equation 5 below from the D S value recorded and transmitted in the MMT D-layer packet and the D T value obtained by Equation 4.
  • the control unit 670 of the media data receiving apparatus 600 may derive an accurate time to stay in the buffer 640 before the decoded frame data is decoded by using the D R value, and through this, the decoding time ( MMT data can be processed while satisfying Decoding Time (T Dec ) accurately.
  • the decompressed frame data obtained after decoding at T Dec is output to the rendering device (Rendering Time, T Ren ) after staying in the rendering buffer (660) by the rendering time offset (Rendering_Time_Offset, D O ). 605).
  • the above-described method can easily synchronize not only synchronization between multiple media streams transmitted from the same server, but also synchronization between multiple media data transmitted from different servers (ie, media data transmission devices). That is, the controller 670 may use the sampling time information and the transmission procedure delay information for synchronizing media data received from different media data transmission devices. For example, when a left view and a right view of a multi-view video are transmitted to a specific terminal through different servers, the receiving terminal receives the left image received through different paths. You should process the video with the right and the right. When processing according to the proposed technique, smooth synchronization can be provided.
  • the proposed inventive technique can be effectively used to provide synchronization in a hybrid delivery environment in which multiple media are transmitted live through various channel paths.
  • FIG. 9 is a flowchart illustrating a method of transmitting media data according to an embodiment of the present invention.
  • the media data transmission method includes generating a media stream by encoding media data (S910), storing the encoded media stream (S920), and Generating an encapsulation layer data (E-layer data) by encapsulating the encoded media stream (S930), delivering a delivery layer packet including timing information by packetizing the E-layer data; Generating a D-layer packet (S940) and transmitting the packetized D-layer packet (S950).
  • the timing information may include sampling time information and transmission procedure delay information.
  • the sampling time information may be a NTP (Network Time Protocol) time stamp format, and may include an integer part and a decimal part, and the integer part may have any one size of 32 bits or 16 bits.
  • the transmission procedure delay information may include delay time information from a sampling time according to the sampling time information to a time point when the D-layer packet is generated to start transmission.
  • FIG. 10 is a flowchart illustrating a method of receiving media data according to an embodiment of the present invention.
  • the method for receiving media data first receives a delivery layer packet (D-layer packet) (S1010).
  • the D-layer packet may be depacketized to generate encapsulation layer data (E-layer data) and to extract timing information (S1020).
  • the timing information may include sampling time information and transmission procedure delay information.
  • the E-layer data may be decapsulated to generate an encoded media stream (S1030).
  • a delivery time indicating a time point at which a media data transmission device starts to generate a D-layer packet based on the sampling time information and transmission procedure delay information included in the timing information May be determined (S1040).
  • an Arrival Time which means a time when the D-layer packet arrives at the media data receiving apparatus, may be measured, and a transmission delay time may be determined based on the arrival time and the transmission time ( S1050).
  • the reception procedure delay time may be determined such that the total delay time is kept constant based on the transmission procedure delay time included in the transmission procedure delay information and the transmission delay time (S1060).
  • the encoded media stream may be stored (S1070), the encoded media stream is decoded (S1080), and the decoded media data may be rearranged (S1090) for display.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

MMT 시스템 기반의 미디어 전송 서비스에서 전송되는 미디어의 재생 시점과 미디어들 간의 시간적 동기화에 필요한 D-layer 타이밍 정보를 제공할 수 있는 미디어 데이터의 전송 장치 및 방법, 그리고 수신 장치 및 방법이 제공된다. 미디어 데이터를 전송하는 장치는 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 패킷화하여 타이밍 정보를 포함하는 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 패킷화부(Packetizer)를 포함하되, 상기 타이밍 정보는 샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 할 수 있다.

Description

MMT 시스템을 위한 미디어 데이터 전송 장치 및 방법, 그리고 미디어 데이터 수신 장치 및 방법
본 발명은 미디어 데이터의 전송 및 수신을 위한 장치 및 방법에 관한 것으로서, 더욱 상세하게는 MMT(MPEG Media Transport : MPEG 미디어 전송) 시스템을 위한 미디어 데이터의 송수신에 있어서 요구되는 전달 계층(Delivery Layer, D-layer)의 타이밍 정보에 관한 것이다.
MMT(MPEG Media Transport)는 MPEG 시스템 분과(systems sub-working group) 에서 개발을 시작한 새로운 표준 기술이다. 기존의 MPEG-2 시스템은 방송망에서 A/V 콘텐츠를 전송하기 위해 필요한 패킷화, 동기화, 멀티플렉싱 등의 기능에 대한 표준으로 MPEG-2 TS(transport stream) 기술이 표준화되어 현재 널리 쓰여지고 있다. 그러나, 네트워크가 IP (Internet Protocol) 기반인 패킷 전송 환경에서 MPEG-2 TS는 비효율적이다. 따라서, ISO MPEG에서는 새로운 미디어 전송 환경과 앞으로 예상되는 미디어 전송 환경을 고려하여 새로운 미디어 전송 표준의 필요성을 인식하게 되었고, MMT 표준화를 시작하게 되었다.
MMT의 타이밍 모델과 유사한 미디어 전송 과정에서 발생하는 중요한 시간 정보를 전달하기 위한 종래의 기술로는 MPEG-2 시스템 기술에서 채택하고 있는 DTS(Decoding Time Stamp), PTS(Presentation Time Stamp) 기반의 타이밍 모델과 RTP 프로토콜에서 제공하는 RTP(real-time transport protocol) 타임스탬프 및 NTP(network time protocol) 타임스탬프 정보 기반의 타이밍 모델이 있다.
보다 구체적으로 설명하면, 종래에 개발된 미디어 전송을 위한 타이밍 모델은 크게 2 가지가 존재하며, 첫째는 MPEG-2 시스템 기술이고, 둘째는 RTP 및 RTCP(RTP Control Protocol)를 결합적으로 활용하는 방법이다. MPEG-2 시스템에서는 미디어 재생시점 결정을 위한 타이밍 모델을 구성하기 위한 타이밍 정보로 PTS, DTS 타이밍 정보를 활용한다. RTP 및 RTCP를 복합적으로 활용하는 방법의 경우에는 RTP에 기록되는 RTP 타임스탬프 정보와 RTCP SR(Sender Report)에 기록되는 NTP 타임 스탬프를 동시에 활용하게 된다.
MPEG-2 시스템 기술은 압축된 미디어를 방송망과 같은 안정적인 전송망을 통해 전달하기 위한 타이밍 모델을 제시하고 있다. MPEG-2 시스템은 통상적으로 디지털방송 서비스를 목적으로 개발된 규격이기 때문에 전송되는 MPEG-2 TS(Transport Stream) 패킷들은 채널 품질이 비교적 안정적인 서킷 스위치 망(circuit switched network)인 방송망을 통해 수신기에 전달된다. 따라서, MPEG-2 TS 패킷들은 전송 채널에서 경험하게 되는 패킷 지연 시간이 비교적 짧고 일정하며 수신기에 도착된 TS 패킷들을 순차적으로 처리하기 위한 타이밍 모델도 비교적 안정적으로 작동하게 된다. 그러나, 방송망이 아닌 IP 망의 경우 전송되는 TS 패킷들이 겪게 되는 도착 지연 시간의 간격이 매우 불규칙하기 때문에, MPEG-2 시스템 기술이 채택하는 타이밍 모델이 안정적으로 유지되기가 힘들다.
RTP/RTCP 기반의 타이밍 모델의 경우 RTP 패킷의 헤더에 기록되는 RTP 타임스탬프가 특정 미디어 스트림의 내부적인 시간적 순서 관계를 나타낸다. 따라서, 서로 다른 미디어 스트림 사이의 동기화를 제공하기 위해서는 절대 시간 (wall-clock)에 해당하는 타이밍 정보가 전달이 되어야 하는데 이러한 목적으로 단말로 전송되는 타이밍 정보가 NTP 타임스탬프이다. NTP 타임스탬프는 RTCP SR (Sender Report) 패킷에 실려서 전송이 되는데, 일정한 주기를 갖고서 반복적으로 전송된다. RTCP SR 패킷은 미디어를 전송하기 위한 RTP 스트림과는 별도로 전송되는 스트림이므로 네트워크에 대해 트래픽 부담을 가중시키고 서버/단말에서 관리해야 할 UDP 포트 (port) 및 스트림 개수의 증가로 송수신 시스템의 동작이 복잡해 진다.
따라서, 상기 방법들의 문제점을 해결하기 위해 새롭게 표준화가 진행되는 MMT 기술의 D-layer 에서는 MMT 패킷의 전송을 준비하는 D-layer 패킷화 과정에서 발생하게 되는 중요한 시간 정보를 효과적으로 수신 단말기로 전달할 수 있는 타이밍 모델을 고려할 필요가 있다.
따라서, 전술한 문제점을 해결하기 위한 본 발명의 목적은 MMT 시스템 기반의 미디어 전송 서비스에서 전송되는 미디어의 재생 시점과 미디어들 간의 시간적 동기화에 필요한 D-layer 타이밍 정보를 제공할 수 있는 미디어 데이터의 전송 장치 및 방법을 제공하는 것이다.
또한, 본 발명의 다른 목적은 MMT 시스템 기반의 미디어 전송 서비스에서 전송되는 미디어의 재생 시점과 미디어들 간의 시간적 동기화에 필요한 D-layer 타이밍 정보를 제공할 수 있는 미디어 데이터의 수신 장치 및 방법을 제공하는 것이다.
전술한 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 미디어 데이터 전송 장치는 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 패킷화하여 타이밍 정보를 포함하는 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 패킷화부(Packetizer)를 포함하되, 상기 타이밍 정보는 샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 할 수 있다. 또한, 상기 미디어 데이터 전송 장치는 미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 인코더; 상기 부호화된 미디어 스트림을 저장하고 있는 버퍼; 상기 부호화된 미디어 스트림을 캡슐화하여 상기 E-layer 데이터를 생성하는 캡슐화부(Encapsulator); 및 상기 패킷화된 D-layer 패킷을 전송하는 전송부를 더 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 샘플링 타임 정보는 NTP(Network Time Protocol) 타임 스탬프 포맷이며, 정수부 및 소수부를 포함하고, 상기 정수부는 32 비트 또는 16 비트 중 어느 하나의 크기를 가지는 것을 특징으로 할 수 있으며, 상기 전송 절차 지연 정보는 상기 샘플링 타임 정보에 따른 샘플링 타임 이후 상기 D-layer 패킷을 생성하여 전송을 시작하는 시점까지의 지연 시간 정보를 포함하는 것을 특징으로 할 수 있다.
본 발명의 다른 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치는 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 디패킷화하여 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하고 타이밍 정보를 추출하는 디패킷화부(Depacketizer)를 포함하되, 상기 타이밍 정보는 샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 미디어 데이터 수신 장치는 상기 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신하는 수신부; 상기 E-layer 데이터를 디캡슐화하여 부호화된 미디어 스트림을 생성하는 디캡슐화부(Decapsulator); 상기 부호화된 미디어 스트림을 저장하는 버퍼; 상기 부호화된 미디어 스트림을 디코딩하는 디코더; 및 디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬하는 렌더링 버퍼(Rendering Buffer)를 더 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 미디어 데이터 수신 장치는 상기 샘플링 타임 정보 및 전송 절차 지연 정보를 기반으로 미디어 데이터 전송 장치가 D-layer 패킷을 생성하여 전송을 시작하는 시점을 나타내는 전송 시각(Delivery Time)을 결정하는 제어부를 더 포함하는 것을 특징으로 할 수 있다. 또한, 상기 제어부는 상기 D-layer 패킷이 상기 미디어 데이터 수신 장치로 도착한 시각을 의미하는 도착 시각(Arrival Time)을 측정하고 상기 도착 시각 및 상기 전송 시각을 기반으로 전송 지연 시간(Transmission Delay)을 더 결정하는 것을 특징으로 할 수 있다. 또한, 상기 제어부는 상기 전송 절차 지연 정보에 포함된 전송 절차 지연 시간 및 상기 전송 지연 시간을 기반으로 총 지연 시간이 일정하게 유지되도록 수신 절차 지연 시간을 결정하는 것을 특징으로 할 수 있다. 한편, 상기 제어부는 서로 다른 미디어 데이터 전송 장치로부터 수신한 미디어 데이터의 동기화를 위해 상기 샘플링 타임 정보 및 전송 절차 지연 정보를 이용하는 것을 특징으로 할 수 있다.
본 발명의 다른 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 미디어 데이터 전송 방법은 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 패킷화하여 타이밍 정보를 포함하는 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 단계를 포함하되, 상기 타이밍 정보는 샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 미디어 데이터 전송 방법은 미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 단계; 상기 부호화된 미디어 스트림을 저장하는 단계; 상기 부호화된 미디어 스트림을 캡슐화하여 상기 E-layer 데이터를 생성하는 단계; 및 상기 패킷화된 D-layer 패킷을 전송하는 단계를 더 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 샘플링 타임 정보는 NTP(Network Time Protocol) 타임 스탬프 포맷이며, 정수부 및 소수부를 포함하고, 상기 정수부는 32 비트 또는 16 비트 중 어느 하나의 크기를 가지는 것을 특징으로 할 수 있으며, 상기 전송 절차 지연 정보는 상기 샘플링 타임 정보에 따른 샘플링 타임 이후 상기 D-layer 패킷을 생성하여 전송을 시작하는 시점까지의 지연 시간 정보를 포함하는 것을 특징으로 할 수 있다.
본 발명의 다른 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 미디어 데이터 수신 방법은 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 디패킷화하여 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하고 타이밍 정보를 추출하는 단계를 포함하되, 상기 타이밍 정보는 샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 미디어 데이터 수신 방법은 상기 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신하는 단계; 상기 E-layer 데이터를 디캡슐화하여 부호화된 미디어 스트림을 생성하는 단계; 상기 부호화된 미디어 스트림을 저장하는 단계; 상기 부호화된 미디어 스트림을 디코딩하는 단계; 및 디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬하는 단계를 더 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 미디어 데이터 수신 방법은 상기 샘플링 타임 정보 및 전송 절차 지연 정보를 기반으로 미디어 데이터 전송 장치가 D-layer 패킷을 생성하여 전송을 시작하는 시점을 나타내는 전송 시각(Delivery Time)을 결정하는 단계를 더 포함하는 것을 특징으로 할 수 있다. 또한, 상기 D-layer 패킷이 상기 미디어 데이터 수신 장치로 도착한 시각을 의미하는 도착 시각(Arrival Time)을 측정하고 상기 도착 시각 및 상기 전송 시각을 기반으로 전송 지연 시간(Transmission Delay)을 결정하는 단계를 더 포함하는 것을 특징으로 할 수 있다. 여기서, 상기 전송 절차 지연 정보에 포함된 전송 절차 지연 시간 및 상기 전송 지연 시간을 기반으로 총 지연 시간이 일정하게 유지되도록 수신 절차 지연 시간을 결정하는 단계를 더 포함하는 것을 특징으로 할 수 있다. 한편, 상기 샘플링 타임 정보 및 전송 절차 지연 정보는 서로 다른 미디어 데이터 전송 장치로부터 수신한 미디어 데이터의 동기화를 위해 이용되는 것을 특징으로 할 수 있다.
전술한 본 발명의 일 실시 예에 따른 미디어 데이터 전송 장치 및 방법, 그리고 미디어 데이터 수신 장치 및 방법에 따르면, MMT 시스템 기반의 미디어 전송 서비스에서 미디어의 재생 시점과 미디어들 간의 시간적 동기화를 위한 타이밍 정보가 제공된다. 본 발명에서 제안하는 MMT의 D-layer 타이밍 정보는 E-layer에서 제공하는 미디어 프레임의 인코더 입력 시점을 나타내는 샘플링 타임(Sampling Time) 및 미디어 프레임의 재생 시점을 나타내는 렌더링 타임(Rendering Time)과 결합적으로 사용되어 수신 단말기 측에서 미디어들 간에 정확한 시간적 동기화를 유지하면서 서비스가 이루어지게 할 수 있다.
도 1은 MMT 계층 구조를 나타낸 개념도이다.
도 2는 MMT의 D-layer 헤더에 기록될 기본적인 타이밍 정보를 나타낸다.
도 3은 본 발명의 일 실시 예에 따른 미디어 데이터 전송 장치의 구성을 나타내는 블록도이다.
도 4는 미디어 데이터 전송 장치에서 미디어 간의 정확한 동기화를 유지하기 위해 고려해야 할 주요 시간 정보들을 나타낸다.
도 5는 도 2의 샘플링 타임 정보의 정수부의 길이를 선택하기 위한 방법을 나타낸다.
도 6은 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치의 구성을 나타내는 블록도이다.
도 7은 미디어 데이터 수신 장치에서 미디어 간의 정확한 동기화를 유지를 위해 고려해야 할 주요 시간 정보들을 나타낸다.
도 8은 본 발명에서 사용되는 타이밍 정보들 간의 시간적 상관 관계를 나타낸다.
도 9는 본 발명의 일 실시 예에 따른 미디어 데이터 전송 방법의 흐름도이다.
도 10은 본 발명의 일 실시 예에 따른 미디어 데이터 수신 방법의 흐름도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 상세하게 설명하고자 한다.
그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시 예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
MMT 계층 구조
도 1은 MMT 계층 구조를 나타낸 개념도이다.
도 1을 참조하면, MMT 계층은 캡슐화 계층(Encapsulation layer), 전달 계층(Delivery layer) 및 시그널링 계층(Signaling layer)의 기능 영역(functional area)을 포함한다. MMT 계층은 전송 계층(Transport layer) 위에서 동작한다.
캡슐화 계층(Encapsulation layer; E-layer)은 예를 들어 전송되는 미디어의 패킷화(packetization), 프래그먼테이션(Fragmentation), 동기화(Synchronization), 멀티플렉싱(Multiplexing)등의 기능을 담당할 수 있다.
캡슐화 계층(E-layer)은, 도 1에 도시된 바와 같이, MMT E.1 계층(MMT E.1 Layer), MMT E.2 계층(MMT E.2 Layer) 및 MMT E.3 계층(MMT E.3 Layer)으로 구성될 수 있다.
E.3 계층은 미디어 코덱(A) 계층으로부터 제공된 미디어 프래그먼트 유닛(Media Fragment Unit; MFU)를 캡슐화하여 M-유닛(M-Unit)을 생성한다.
MFU는 미디어 디코더에서 독립적으로 소비될 수 있는 데이터 유닛을 싣을 수 있는, 임의의 특정 코덱(codec)에 독립적인, 포맷을 가질 수 있다. MFU는 예를 들어 비디오의 픽춰(picture) 또는 슬라이스(slice)가 될 수 있다.
M-유닛은 하나 또는 복수의 MFU 로 구성될 수 있으며, 하나 또는 복수의 액세스 유닛(Access Unit)을 싣을 수 있는, 특정 코덱(codec)에 독립적인, 포맷을 가질 수 있다.
E.2 계층은 E.3 계층에서 생성된 M-유닛을 캡슐화하여 MMT 애셋(MMT Asset)을 생성한다.
MMT 애셋은 단일의 데이터 소스로부터의 하나 또는 복수의 M-유닛으로 이루어진 데이터 엔티티(data entity)로서, 컴포지션 정보(composition information) 및 전송 특성(transport characteristics)이 정의된 데이터 유닛이다. MMT 애셋은 PES(Packetized Elementary Streams)에 대응될 수 있으며, 예를 들어 비디오, 오디오, 프로그램 정보(program information), MPEG-U 위젯(widget), JPEG 이미지, MPEG 4 파일 포맷(File Format), MPEG2-TS(MPEG Transport Stream)등에 대응될 수 있다.
E.1 계층(E.1 Layer)은 E.2 계층에서 생성된 MMT 애셋을 캡슐화하여 MMT 패키지(MMT Package)를 생성한다.
MMT 패키지는 콤포지션 정보(composition information) 및 전송 특성(transport characteristics)과 같은 부가 정보와 함께 하나 또는 복수의 MMT 애셋으로 구성될 수 있다. 콤포지션 정보(composition information)는 MMT 애셋들 사이의 관계(relationship)에 대한 정보를 포함하며, 하나의 컨텐츠(content)가 복수개의 MMT 패키지로 이루어질 경우 복수의 MMT 패키지간의 관계(relationship)를 나타내기 위한 정보를 더 포함할 수 있다. 전송 특성(transport characteristics)은 MMT 애셋 또는 MMT 패킷의 전송 조건(delivery condition)을 결정하기 위해 필요한 전송 특성 정보를 포함할 수 있으며, 예를 들어 트래픽 기술 파라미터(traffic description parameter) 및 QoS 기술자(QoS descriptor)를 포함할 수 있다. MMT 패키지는 MPEG-2 TS의 프로그램(Program)에 대응될 수 있다.
전달 계층(delivery layer)은 예를 들어 네트워크를 통해 전송되는 미디어의 네트워크 플로우 멀티플렉싱(network flow multiplexing), 네트워크 패킷화(network packetization), QoS 제어 등을 수행할 수 있다.
전달 계층(D-layer)은, 도 1에 도시된 바와 같이, MMT D.1 계층(MMT D.1 Layer), MMT D.2 계층(MMT D.2 Layer) 및 MMT D.3 계층(MMT D.3 Layer)으로 구성될 수 있다.
D.1 계층(D.1-layer)은 E.1 계층에서 생성된 MMT 패키지를 받아서 MMT 페이로드 포맷(MMT payload format)을 생성한다. MMT 페이로드 포맷은 MMT 애셋을 전송하고, 그리고 MMT 애플리케이션 프로토콜 또는 RTP와 같은 다른 기존의 애플리케이션 전송 프로토콜에 의한 소비를 위한 정보를 전송하기 위한 페이로드 포맷이다. MMT 페이로드는 AL-FEC와 같은 정보와 함께 MFU의 프래그먼트를 포함할 수 있다.
D.2 계층(D.2-layer)은 D.1 계층에서 생성된 MMT 페이로드 포맷을 받아서 MMT 전송 패킷(MMT Transport Packet) 또는 MMT 패킷(MMT Packet)를 생성한다. MMT 전송 패킷 또는 MMT 패킷은 MMT를 위한 애플리케이션 전송 프로토콜에 사용되는 데이터 포맷이다.
D.3 계층(D.3-layer)은 교차 계층 설계(cross-layer design)에 의해 계층간에 정보를 교환할 수 있는 기능을 제공하여 QoS를 지원한다. 예를 들어, D.3 계층은 MAC/PHY 계층의 QoS 파라미터를 이용하여 QoS 제어를 수행할 수 있다.
시그널링 계층(Signaling layer)은 시그널링 기능(signaling function)을 수행한다. 예를 들어 전송되는 미디어의 세션 초기화/제어/관리(session initialization/control/management), 서버 기반 및/또는 클라이언트 기반의 트릭 모드, 서비스 디스커버리(service discovery), 동기화(synchronization) 등을 위한 시그널링 기능을 수행할 수 있다.
시그널링 계층(Signaling layer)은, 도 1에 도시된 바와 같이, MMT S.1 계층(MMT S.1 Layer) 및 MMT S.2 계층(MMT S.2 Layer)으로 구성될 수 있다.
S.1 계층은 서비스 디스커버리(service discovery), 미디어의 세션 초기화/종료(media session initialization/termination), 미디어의 세션 표현/제어(media session presentation/control), 전달(D) 계층 및 캡슐화(E) 계층과의 인터페이스 기능 등을 수행할 수 있다. S.1 계층은 미디어 표현 세션 관리(presentation session management)를 위한 애플리케이션들간의 제어 메시지들의 포맷을 정의할 수 있다.
S.2 계층은 흐름 제어(flow control), 전달 세션 관리(delivery session management), 전달 세션 모니터링(delivery session monitoring), 에러 제어(error control), 하이브리드 망 동기화 제어(hybrid network synchronization control)에 관한 전달 계층(D-layer)의 전달 엔드-포인트들(delivery end-points)간에 교환되는 제어 메시지의 포맷을 정의할 수 있다.
S.2 계층은 전달 계층의 동작을 지원하기 위하여 전달 세션 설정 및 해제(delivery session establishment and release), 전달 세션 모니터링, 흐름 제어, 에러 제어, 설정된 전달 세션에 대한 리소스 예약, 복합 전달 환경하에서의 동기화를 위한 시그널링, 적응적 전달(adaptive delivery)를 위한 시그널링을 포함할 수 있다. 송신측(sender)와 수신측(receiver)간에 필요한 시그널링을 제공할 수 있다. 즉, S.2 계층은 전술한 바와 같은 전달 계층의 동작을 지원하기 위하여 송신측(sender)와 수신측(receiver)간에 필요한 시그널링을 제공할 수 있다. 또한, S.2 계층은 전달 계층 및 캡슐화 계층과의 인터페이스 기능을 담당할 수 있다.
본 발명은 MMT 시스템에서 미디어에 대한 재생 시점 정보를 얻고 미디어들 간에 시간적 동기화를 유지하면서 미디어를 재생하기 위한 전달 계층(Delivery Layer, D-layer) 타이밍 정보를 포함하는 미디어 데이터의 전송 장치 및 방법, 그리고 수신 장치 및 방법에 관한 것이다. 본 발명은 MMT의 전송 시스템에서 전송을 위한 MMT 패킷을 생성하는 과정에서 발생하게 되는 중요한 시간정보를 MMT의 D-layer에 기록하여 수신 단말기로 전송할 수 있다. 미디어 데이터 수신 장치는 이러한 D-layer 시간정보를 바탕으로 미디어들 간에 정확한 시간적 동기화를 유지하면서 미디어를 재생할 수 있게 된다. 이를 위해서 미디어 데이터 전송 장치에서는 MMT 패킷 생성 시에 D-layer 헤더를 생성하는 시점에서 확보 가능한 중요한 시간정보를 D-layer 헤더에 기록할 수 있다.
즉, 본 발명은 MMT 기술의 D-layer에서 MMT 패킷의 전송을 준비하는 D-layer 패킷화 과정에서 발생하게 되는 중요한 시간 정보를 효과적으로 수신 단말기로 전달할 수 있는 구현이 간단한 타이밍 모델 및 상기 모델의 작동에 필요한 타이밍 정보를 포함할 수 있다. 따라서, MMT 시스템의 D-layer에서 제공해야 할 타이밍 정보를 고안함으로써 MMT 시스템 기반의 미디어 전송 서비스에서 전송되는 미디어들 간에 정확한 시간적 동기화가 이루어지도록 할 수 있다.
도 3은 본 발명의 일 실시 예에 따른 미디어 데이터 전송 장치의 구성을 나타내는 블록도이다. 도 3에 도시된 바와 같이, 본 발명의 일 실시 예에 따른 미디어 데이터 전송 장치(300)는 미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 인코더(310), 상기 부호화된 미디어 스트림을 저장하고 있는 버퍼(320), 상기 부호화된 미디어 스트림을 캡슐화하여 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하는 캡슐화부(Encapsulator, 330), 상기 E-layer 데이터를 패킷화하여 타이밍 정보를 포함하는 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 패킷화부(Packetizer, 340) 및 상기 패킷화된 D-layer 패킷을 전송하는 전송부(350)를 포함할 수 있다. 여기서, 상기 D-layer 데이터에 포함된 타이밍 정보는 샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 할 수 있다.
도 2는 MMT의 D-layer 헤더에 기록될 기본적인 타이밍 정보를 나타낸다. 또한, 도 4는 미디어 데이터 전송 장치에서 미디어 간의 정확한 동기화를 유지하기 위해 고려해야 할 주요 시간 정보들을 나타낸다. 이하, 도 2 및 도 4를 참조하여, 상기 타이밍 정보에 포함된 샘플링 타임 정보 및 전송 절차 지연 정보를 이용한 미디어 데이터 전송 장치에서의 동기화 유지를 위한 타이밍 모델을 상세히 설명한다.
도 2에 도시된 바와 같이, MMT의 D-layer 데이터의 헤더에 기록되는 상기 타이밍 정보는 샘플링 타임 정보(이하 'NTP(TSam)', 210) 및 전송 절차 지연 정보(이하 'Sender_Processing_Delay', 220)를 포함할 수 있다. 상기 타이밍 정보는 MMT의 E-layer에서 생성되어 MMT 패킷의 페이로드(payload)에 실리게 되는 MMT 패키지 (package)에 대해 할당될 수 있다. 여기서, 상기 샘플링 타임 정보는 NTP(Network Time Protocol) 타임 스탬프 포맷이며, 정수부 및 소수부를 포함하고, 상기 정수부는 32 비트 또는 16 비트 중 어느 하나의 크기를 가지는 것을 특징으로 할 수 있다. 또한, 상기 전송 절차 지연 정보는 상기 샘플링 타임 정보에 따른 샘플링 타임 이후 상기 D-layer 패킷을 생성하여 전송을 시작하는 시점까지의 지연 시간 정보를 포함하는 것을 특징으로 할 수 있다.
도 4를 참조하여 보다 상세히 설명하면, 샘플링 타임 정보(TSam, 210)는 미디어 인코더(Media Encoder, 310)에 압축되는 순서대로 입력되는 픽처들에 대한 샘플링 시간을 포함할 수 있다. NTP(TSam)(210)은 MMT의 인코더(310)에 입력되는 미디어 프레임의 샘플링 타임(Sampling Time)인 NTP(TSam)(210)에 해당하는 UTC(Universal Uime Coordinated) 시간을 NTP 타임스탬프 포맷으로 나타낸 것이다. NTP(TSam)(210)을 NTP 타임스탬프 포맷으로 나타내는 방법은 2가지 형태로 구현할 수 있다.
기본적으로 NTP 타임스탬프 포맷은 총 64비트로 구성될 수 있다. 이 64비트 길이는 32 비트의 길이로 정수 정밀도 단위의 초 시간을 표현하는 정수부(seconds part)와 32 비트의 길이로 소수 정밀도 단위의 초 시간을 표현하는 소수부 (seconds fraction part)를 포함할 수 있다. 정수 정밀도를 표현하는 정수부의 경우 32비트 길이를 모두 사용할 경우 1900년 1월 1일 이후의 136년 동안에 해당하는 UTC 시간을 표현할 수 있다. 그런데, MMT 시스템 기반의 미디어 서비스를 위한 미디어 동기화에 사용되는 시간 구간은 수일 (several days) 이내이면 충분하다. 따라서, 서비스가 시작된 후에 18시간 이내에 서비스가 종료되는 상황이라면 굳이 32비트 전체 구간을 사용할 필요없이 하위 16비트만 사용해도 충분하다. 한편, 시간 동기화의 정밀도를 최대화하기 위해서 소수 정밀도 단위의 초 시간은 원래의 포맷을 따라서 32비트 전체를 사용할 수 있다.
도 5는 도 2의 샘플링 타임 정보의 정수부의 길이를 선택하기 위한 방법을 나타낸다. 도 5에 도시된 바와 같이, 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치(300)에서는 NTP(TSam)(210)에 대한 NTP 타임스탬프 표현 방법을 도 5에 도시된 바와 같은 방법을 통해서 버전 별로 (16비트 (정수부)+32비트 (소수부)=48비트) 혹은 (32비트 (정수부)+32비트 (소수부)=64비트) 가운데 한 가지를 선택하도록 할 수 있다. 즉, 상기 정수부는 32 비트 또는 16 비트 중 어느 하나의 크기를 가지는 것을 특징으로 할 수 있다.
전송 절차 지연 정보(Sender_Processing_Delay(DS), 220)는 샘플링 타임(Sampling Time) 이후에 D-layer 패킷을 생성하여 전송을 시작하는 시점인 전송 시각(Delivery Time(TDel))에 이르기까지 미디어 데이터 전송 장치(300)에서 처리에 소요된 지연 시간을 나타낼 수 있다.
도 6은 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치의 구성을 나타내는 블록도이다.
도 6에 도시된 바와 같이, 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치(600)는 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신하는 수신부(610), 상기 D-layer 패킷을 디패킷화하여 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하고 타이밍 정보를 추출하는 디패킷화부(Depacketizer, 620), 상기 E-layer 데이터를 디캡슐화화여 부호화된 미디어 스트림을 생성하는 디캡슐화부(Decapsulator, 630), 상기 부호화된 미디어 스트림을 저장하는 버퍼(640), 상기 부호화된 미디어 스트림을 디코딩하는 디코더(650) 및 디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬하는 렌더링 버퍼(Rendering Buffer, 660)를 포함할 수 있다.
여기서, 상기 타이밍 정보는 샘플링 타임 정보 및 전송 절차 지연 정보를 포함할 수 있다. 상기 타이밍 정보는 전술한 미디어 데이터 전송 장치의 타이밍 정보와 동일하다. 즉, 상기 D-layer 타이밍 정보는 샘플링 타임 정보(NTP(TSam), 210) 및 전송 절차 지연 정보(Sender_Processing_Delay, 220) 등의 두 가지 필드를 포함할 수 있다.
도 7은 미디어 데이터 수신 장치에서 미디어 간의 정확한 동기화를 유지를 위해 고려해야 할 주요 시간 정보들을 나타낸다. 도 6 내지 도 7을 참조하여, 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치(600)를 보다 상세히 설명한다.
미디어 데이터 전송 장치(300)에서 전송 시각(Delivery Time,TDel)에 전송된 MMT D-layer 패킷은 전송부(350), 전송채널(미도시) 및 수신부(610)를 거쳐서 전송 지연 시간(Transmission Delay, DT) 이후인 도착 시각(Arrival Time, TArr)에 미디어 데이터 수신 장치(600)의 D-layer 디패킷화부(Depacketizer, 620)에 입력될 수 있다. 계속해서 MMT D-layer 패킷은 디패킷화부(Depacketizer, 620), E-layer 디캡슐화부(Decapsulator, 630) 및 버퍼(Buffer, 640)를 거치면서 소요되는 지연 시간인 수신 절차 지연 시간(Receiver Processing Delay, DS) 이후에 디코더(Decoder, 650)에 입력되며, 디코딩 시각(Decoding Time, TDec)에 디코딩이 시작될 수 있다.
디코딩 후에 렌더링 타임 오프셋(Rendering Time Offset, DO) 만큼 렌더링 버퍼(Rendering Buffer, 660)에 머무른 후에 렌더링 시각(Rendering Time, TRen)에 출력 장치(605)로 재생된다. 도 4 및 도 7에 표시된 전송 시각(Delivery Time, TDel), 도착 시각(Arrival Time, TArr), 디코딩 시각(Decoding Time, TDec) 등의 타이밍 정보를 샘플링 시각(Sampling Time, TSam)을 기준으로 표시하면 하기의 수학식 1과 같다.
수학식 1
Figure PCTKR2012007618-appb-M000001
도 8은 본 발명에서 사용되는 타이밍 정보들 간의 시간적 상관 관계를 나타낸다. 도 8을 참조하여 MMT 시스템의 E-layer 및 D-layer에서 고려되어야 할 주요 타이밍 정보들 간의 시간적 상관 관계를 설명한다.
도 8에 표시된 타이밍 정보들은 MPEG-2 시스템 및 RTP전송 시스템에서 통상적으로 사용되는 90 KHz 정밀도로 작동하는 샘플링 클럭 주파수 (sampling clock frequency) 에 의해 표현될 수 있다. 이러한 타이밍 정보들 가운데, 샘플링 시각(sampling time)과 렌더링 시각(rendering time)은 MMT의 E-layer에서 제공 가능한 정보들이며, 전송 시각(delivery time)과 디코딩 시각(decoding time)은 D-layer에서 제공되는 타이밍 정보를 바탕으로 유도가 가능하다. 도착 시각(arrival time)은 미디어 데이터 수신 장치에서 UTC 시간을 활용하여 실제 측정이 가능한데, 측정된 도착 시각(arrival time)과 D-layer에서 제공되는 전송 시각(delivery time)에 해당하는 UTC 시간 정보를 활용하면 전송 지연 시간(transmission delay) 값에 대한 정확한 계산이 가능하다.
하기에서, 도 4, 도 7 및 도 8에 도시된 타이밍 정보들을 활용하여 본 발명의 일 실시 예에 따른 미디어 데이터 수신 장치(600)가 정확한 미디어 동기화를 달성하는 방법을 상세히 설명한다.
MMT 시스템 기반의 단대단 (End-to-end) 단말기 간(즉, 미디어 데이터 전송 장치와 미디어 데이터 수신 장치 간)에 동기화가 이루어지면서 끊김 없는 미디어 서비스를 제공하기 위해서는 하기의 수학식 2와 같이 전송 절차 지연 시간( Sender Processing Delay, DS), 전송 지연 시간(Transmission Delay, DT), 및 수신 절차 지연 시간(Receiver Processing Delay, DR)의 총합을 DTot의 일정한 값으로 유지해야 한다.
수학식 2
Figure PCTKR2012007618-appb-M000002
DS 는 미디어 데이터 전송 장치(300)의 처리 과정에서 이미 발생한 지연 시간이고, DT는 네트워크를 통한 전송 과정에서 이미 발생한 지연 시간이므로 미디어 데이터 수신 장치(600) 측에서는 DR값을 적절히 조절하여 DTot를 일정하게 유지할 수 있다.
DTot 파라메터의 크기는 소비자가 겪게 되는 서비스 지연 시간을 고려하여 적절한 값으로 결정할 수 있다. DTot 파라메터는 미디어 서비스 초기 단계에서 MMT의 S-layer에 의한 시그널링 절차를 통해 서버에서 미디어 데이터 수신 장치(600)로 전송되므로 본격적인 미디어 전송 서비스가 이루어지기 전에 미디어 데이터 수신 장치(600)가 이미 알고 있게 된다.
미디어 데이터 전송 장치(300)에서는 도 2에 도시된 바와 같은 NTP(TSam)(210)과 DS(220) 값을 MMT 패킷의 D-layer 헤더에 기록하여 MMT D-layer 패킷을 전송할 수 있다. 여기서, 도 6에 도시된 바와 같이, 상기 미디어 데이터 수신 장치(600)는 상기 NTP(TSam)(210) 및 DS(220)를 기반으로 미디어 데이터 전송 장치(300)가 D-layer 패킷을 생성하여 전송을 시작하는 시점을 나타내는 전송 시각(Delivery Time)을 결정하는 제어부(670)를 더 포함할 수 있다. 즉, 상기 MMT D-layer 패킷을 수신한 미디어 데이터 수신 장치(600)에서는 상기 제어부(670)가 전송 시각(Delivery Time, TDel)에 해당하는 UTC 시간의 NTP 포맷으로 표현된 시간 값을 하기의 수학식 3을 통해 계산할 수 있다.
수학식 3
Figure PCTKR2012007618-appb-M000003
상기 수학식 3에서는 MPEG-2 시스템 및 RTP 전송 시스템에서 통상적으로 사용되는 90 KHz 정밀도로 작동하는 샘플링 클럭 주파수를 사용함을 가정하였다. 만약, 90 KHz 정밀도 이외의 샘플링 클럭 주파수를 채택할 경우에도 마찬가지의 원리로 적용이 가능하다.
전송 지연 시간(Transmission Delay, DT)은 도 4의 전송 시각(Delivery Time, TDel)과 도 7의 도착 시각(Arrival Time, TArr) 사이에 경과된 시간을 의미한다. 도착 시각(Arrival Time, TArr)은 MMT D-layer 패킷이 수신부(610)에 도착한 후에 측정할 수 있고 이 시간에 해당하는 UTC 시간을 NTP 포맷인 NTP(TArr)로 표현할 수 있다.
여기서, 상기 제어부(670)는 상기 D-layer 패킷이 상기 미디어 데이터 수신 장치(600)로 도착한 시각을 의미하는 도착 시각(Arrival Time)을 측정하고 상기 도착 시각 및 상기 전송 시각을 기반으로 전송 지연 시간(Transmission Delay)을 더 결정할 수 있다. 즉, 미디어 데이터 수신 장치(600)의 상기 제어부(670)는 측정된 NTP(TArr)과 상기 수학식 3에서 계산된 NTP(TDel) 값을 활용하여 하기의 수학식 4에 의해 전송 지연 시간(Transmission Delay, DT)을 산출할 수 있다.
수학식 4
Figure PCTKR2012007618-appb-M000004
여기서, 상기 제어부(670)는 상기 전송 절차 지연 정보에 포함된 전송 절차 지연 시간(DS) 및 상기 전송 지연 시간(DT)을 기반으로 총 지연 시간(DTot)이 일정하게 유지되도록 수신 절차 지연 시간(DR)을 결정할 수 있다. 즉, MMT D-layer 패킷에 기록되어 전달된 DS 값과 상기 수학식 4에 의해 얻어진 DT 값으로부터 상기 수학식 2를 만족시키는 DR 값을 하기의 수학식 5를 기반으로 결정할 수 있다.
수학식 5
Figure PCTKR2012007618-appb-M000005
미디어 데이터 수신 장치(600)의 제어부(670)에서는 DR 값을 활용하여 압축된 프레임 데이터가 디코딩되기 이전에 버퍼(Buffer, 640)에 머물러야 하는 정확한 시간을 도출할 수 있고, 이를 통해서 디코딩 시각(Decoding Time, TDec)을 정확하게 만족시키면서 MMT 데이터를 처리할 수 있다. TDec에 디코딩이 이루어진 후에 얻게 되는 압축이 해제된 프레임 데이터는 렌더링 타임 오프셋(Rendering_Time_Offset, DO) 만큼 렌더링 버퍼(Rendering Buffer, 660)에 머무른 후인 렌더링 시각(Rendering Time, TRen)에 출력 장치(605)로 재생될 수 있다.
한편, 상기에 제시된 방법은 동일한 서버에서 전송된 다중의 미디어 스트림 간의 동기화 뿐만 아니라, 서로 다른 서버(즉, 미디어 데이터 전송 장치)에서 전송된 다중의 미디어 데이터 간의 동기화도 간단하게 맞출 수 있다. 즉, 상기 제어부(670)는 서로 다른 미디어 데이터 전송 장치로부터 수신한 미디어 데이터의 동기화를 위해 상기 샘플링 타임 정보 및 전송 절차 지연 정보를 이용할 수 있다. 예를 들면, 다시점(multi-view) 비디오의 좌영상(left view)과 우영상(right view)이 서로 다른 서버를 통해 특정 단말기로 전송될 경우 수신 단말기는 서로 다른 경로를 통해 수신된 좌영상과 우영상을 동기화를 맞추면서 처리해야 한다. 제안된 발명의 기법을 따라서 처리할 경우 원활한 동기화 제공이 가능하다.
또 다른 예시로, 비디오 스트림과 오디오 스트림이 서로 다른 서버로부터 특정 단말기로 전송될 경우에도, 이 비디오 스트림과 오디오 스트림 간의 입술 동기화 (lip-synchronization)를 제안된 발명 기법을 통해서 간단하게 맞출 수 있다. 따라서, 제안된 발명 기법은 다양한 채널 경로를 통해서 다중의 미디어를 라이브(live)로 전송하는 하이브리드 전송(hybrid delivery) 환경에서의 동기화 제공에도 매우 효과적으로 활용할 수 있다.
도 9는 본 발명의 일 실시 예에 따른 미디어 데이터 전송 방법의 흐름도이다.
도 9에 도시된 바와 같이, 본 발명의 일 실시 예에 따른 미디어 데이터 전송 방법은 미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 단계(S910), 상기 부호화된 미디어 스트림을 저장하는 단계(S920), 상기 부호화된 미디어 스트림을 캡슐화하여 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하는 단계(S930), 상기 E-layer 데이터를 패킷화하여 타이밍 정보를 포함하는 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 단계(S940) 및 상기 패킷화된 D-layer 패킷을 전송하는 단계(S950)를 포함할 수 있다. 여기서, 상기 타이밍 정보는 샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 할 수 있다.
여기서, 상기 샘플링 타임 정보는 NTP(Network Time Protocol) 타임 스탬프 포맷이며, 정수부 및 소수부를 포함하고, 상기 정수부는 32 비트 또는 16 비트 중 어느 하나의 크기를 가지는 것을 특징으로 할 수 있다. 또한, 상기 전송 절차 지연 정보는 상기 샘플링 타임 정보에 따른 샘플링 타임 이후 상기 D-layer 패킷을 생성하여 전송을 시작하는 시점까지의 지연 시간 정보를 포함하는 것을 특징으로 할 수 있다.
도 10은 본 발명의 일 실시 예에 따른 미디어 데이터 수신 방법의 흐름도이다.
도 10에 도시된 바와 같이, 본 발명의 일 실시 예에 따른 미디어 데이터 수신 방법은 먼저 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신한다(S1010). 그리고 상기 D-layer 패킷을 디패킷화하여 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하고 타이밍 정보를 추출할 수 있다(S1020). 여기서, 상기 타이밍 정보는 샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 할 수 있다. 이후, 상기 E-layer 데이터를 디캡슐화화여 부호화된 미디어 스트림을 생성할 수 있다(S1030).
타이밍 정보의 추출이 완료되면, 상기 타이밍 정보에 포함된 상기 샘플링 타임 정보 및 전송 절차 지연 정보를 기반으로 미디어 데이터 전송 장치가 D-layer 패킷을 생성하여 전송을 시작하는 시점을 나타내는 전송 시각(Delivery Time)을 결정할 수 있다(S1040). 또한, 상기 D-layer 패킷이 상기 미디어 데이터 수신 장치로 도착한 시각을 의미하는 도착 시각(Arrival Time)을 측정하고 상기 도착 시각 및 상기 전송 시각을 기반으로 전송 지연 시간(Transmission Delay)을 결정할 수 있다(S1050). 이후, 상기 전송 절차 지연 정보에 포함된 전송 절차 지연 시간 및 상기 전송 지연 시간을 기반으로 총 지연 시간이 일정하게 유지되도록 수신 절차 지연 시간을 결정할 수 있다(S1060).
이후 상기 부호화된 미디어 스트림을 저장하고(S1070), 상기 부호화된 미디어 스트림을 디코딩(S1080)하며, 디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬(S1090)할 수 있다.

Claims (22)

  1. 미디어 데이터를 전송하는 장치에 있어서,
    캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 패킷화하여 타이밍 정보를 포함하는 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 패킷화부(Packetizer)를 포함하되,
    상기 타이밍 정보는 미디어 데이터들 간의 시간적 동기화를 위해 사용되는 것을 특징으로 하는 미디어 데이터 전송 장치.
  2. 제 1 항에 있어서, 상기 타이밍 정보는
    샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 하는 미디어 데이터 전송 장치.
  3. 제 1 항에 있어서,
    미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 인코더;
    상기 부호화된 미디어 스트림을 저장하고 있는 버퍼;
    상기 부호화된 미디어 스트림을 캡슐화하여 상기 E-layer 데이터를 생성하는 캡슐화부(Encapsulator); 및
    상기 패킷화된 D-layer 패킷을 전송하는 전송부를 더 포함하는 것을 특징으로 하는 미디어 데이터 전송 장치.
  4. 제 2 항에 있어서,
    상기 샘플링 타임 정보는 NTP(Network Time Protocol) 타임 스탬프 포맷이며, 정수부 및 소수부를 포함하고,
    상기 정수부는 32 비트 또는 16 비트 중 어느 하나의 크기를 가지는 것을 특징으로 하는 미디어 데이터 전송 장치.
  5. 제 2 항에 있어서,
    상기 전송 절차 지연 정보는 상기 샘플링 타임 정보에 따른 샘플링 타임 이후 상기 D-layer 패킷을 생성하여 전송을 시작하는 시점까지의 지연 시간 정보를 포함하는 것을 특징으로 하는 미디어 데이터 전송 장치.
  6. 미디어 데이터를 수신하는 장치에 있어서,
    전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 디패킷화하여 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하고 타이밍 정보를 추출하는 디패킷화부(Depacketizer)를 포함하되,
    상기 타이밍 정보는 미디어 데이터들 간의 시간적 동기화를 위해 사용되는 것을 특징으로 하는 미디어 데이터 수신 장치.
  7. 제 6항에 있어서, 상기 타이밍 정보는
    샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 하는 미디어 데이터 수신 장치.
  8. 제 6 항에 있어서,
    상기 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신하는 수신부;
    상기 E-layer 데이터를 디캡슐화하여 부호화된 미디어 스트림을 생성하는 디캡슐화부(Decapsulator);
    상기 부호화된 미디어 스트림을 저장하는 버퍼;
    상기 부호화된 미디어 스트림을 디코딩하는 디코더; 및
    디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬하는 렌더링 버퍼(Rendering Buffer)를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 장치.
  9. 제 7 항에 있어서,
    상기 샘플링 타임 정보 및 전송 절차 지연 정보를 기반으로 미디어 데이터 전송 장치가 D-layer 패킷을 생성하여 전송을 시작하는 시점을 나타내는 전송 시각(Delivery Time)을 결정하는 제어부를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 장치.
  10. 제 9항에 있어서, 상기 제어부는
    상기 D-layer 패킷이 상기 미디어 데이터 수신 장치로 도착한 시각을 의미하는 도착 시각(Arrival Time)을 측정하고 상기 도착 시각 및 상기 전송 시각을 기반으로 전송 지연 시간(Transmission Delay)을 더 결정하는 것을 특징으로 하는 미디어 데이터 수신 장치.
  11. 제 10항에 있어서, 상기 제어부는
    상기 전송 절차 지연 정보에 포함된 전송 절차 지연 시간 및 상기 전송 지연 시간을 기반으로 총 지연 시간이 일정하게 유지되도록 수신 절차 지연 시간을 결정하는 것을 특징으로 하는 미디어 데이터 수신 장치.
  12. 미디어 데이터를 전송하는 방법에 있어서,
    캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 패킷화하여 타이밍 정보를 포함하는 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 생성하는 단계를 포함하되,
    상기 타이밍 정보는 미디어 데이터들 간의 시간적 동기화를 위해 사용되는 것을 특징으로 하는 미디어 데이터 전송 방법.
  13. 제 12항에 있어서, 상기 타이밍 정보는
    샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 하는 미디어 데이터 전송 방법.
  14. 제 12 항에 있어서,
    미디어 데이터를 인코딩하여 미디어 스트림을 생성하는 단계;
    상기 부호화된 미디어 스트림을 저장하는 단계;
    상기 부호화된 미디어 스트림을 캡슐화하여 상기 E-layer 데이터를 생성하는 단계; 및
    상기 패킷화된 D-layer 패킷을 전송하는 단계를 더 포함하는 것을 특징으로 하는 미디어 데이터 전송 방법.
  15. 제 13 항에 있어서,
    상기 샘플링 타임 정보는 NTP(Network Time Protocol) 타임 스탬프 포맷이며, 정수부 및 소수부를 포함하고,
    상기 정수부는 32 비트 또는 16 비트 중 어느 하나의 크기를 가지는 것을 특징으로 하는 미디어 데이터 전송 방법.
  16. 제 13 항에 있어서,
    상기 전송 절차 지연 정보는 상기 샘플링 타임 정보에 따른 샘플링 타임 이후 상기 D-layer 패킷을 생성하여 전송을 시작하는 시점까지의 지연 시간 정보를 포함하는 것을 특징으로 하는 미디어 데이터 전송 방법.
  17. 미디어 데이터를 수신하는 방법에 있어서,
    전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 디패킷화하여 캡슐화 계층 데이터(Encapsulation layer data, E-layer 데이터)를 생성하고 타이밍 정보를 추출하는 단계를 포함하되,
    상기 타이밍 정보는 미디어 데이터들 간의 시간적 동기화를 위해 사용되는 것을 특징으로 하는 미디어 데이터 수신 방법.
  18. 제 17항에 있어서, 상기 타이밍 정보는
    샘플링 타임 정보 및 전송 절차 지연 정보를 포함하는 것을 특징으로 하는 미디어 데이터 수신 방법.
  19. 제 17 항에 있어서,
    상기 전달 계층 패킷(Delivery layer packet, D-layer 패킷)을 수신하는 단계;
    상기 E-layer 데이터를 디캡슐화하여 부호화된 미디어 스트림을 생성하는 단계;
    상기 부호화된 미디어 스트림을 저장하는 단계;
    상기 부호화된 미디어 스트림을 디코딩하는 단계; 및
    디스플레이를 위해 상기 디코딩된 미디어 데이터를 재정렬하는 단계를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 방법.
  20. 제 18 항에 있어서,
    상기 샘플링 타임 정보 및 전송 절차 지연 정보를 기반으로 미디어 데이터 전송 장치가 D-layer 패킷을 생성하여 전송을 시작하는 시점을 나타내는 전송 시각(Delivery Time)을 결정하는 단계를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 방법.
  21. 제 20항에 있어서,
    상기 D-layer 패킷이 상기 미디어 데이터 수신 장치로 도착한 시각을 의미하는 도착 시각(Arrival Time)을 측정하고 상기 도착 시각 및 상기 전송 시각을 기반으로 전송 지연 시간(Transmission Delay)을 결정하는 단계를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 방법.
  22. 제 21항에 있어서,
    상기 전송 절차 지연 정보에 포함된 전송 절차 지연 시간 및 상기 전송 지연 시간을 기반으로 총 지연 시간이 일정하게 유지되도록 수신 절차 지연 시간을 결정하는 단계를 더 포함하는 것을 특징으로 하는 미디어 데이터 수신 방법.
PCT/KR2012/007618 2011-09-23 2012-09-21 Mmt 시스템을 위한 미디어 데이터 전송 장치 및 방법, 그리고 미디어 데이터 수신 장치 및 방법 WO2013042999A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201280057672.5A CN103947215B (zh) 2011-09-23 2012-09-21 传送媒体数据的方法和设备、接收媒体数据的设备和方法
US14/345,074 US20140351874A1 (en) 2011-09-23 2012-09-21 Method and apparatus for transmitting media data for mmt system, and apparatus and method for receiving media data

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20110096491 2011-09-23
KR10-2011-0096491 2011-09-23
KR10-2012-0105347 2012-09-21
KR1020120105347A KR101959260B1 (ko) 2011-09-23 2012-09-21 Mmt 시스템을 위한 미디어 데이터 전송 장치 및 방법, 그리고 미디어 데이터 수신 장치 및 방법

Publications (1)

Publication Number Publication Date
WO2013042999A1 true WO2013042999A1 (ko) 2013-03-28

Family

ID=47914638

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2012/007618 WO2013042999A1 (ko) 2011-09-23 2012-09-21 Mmt 시스템을 위한 미디어 데이터 전송 장치 및 방법, 그리고 미디어 데이터 수신 장치 및 방법

Country Status (1)

Country Link
WO (1) WO2013042999A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015152587A3 (en) * 2014-03-31 2017-05-04 Samsung Electronics Co., Ltd. Method and apparatus for signaling and operation of low delay consumption of media data in mmt

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100358119B1 (ko) * 2001-02-09 2002-10-25 한국전자통신연구원 디지털 데이터 방송 서비스를 위한 데이터 스트리밍 장치및 그 방법
KR100646851B1 (ko) * 2004-11-03 2006-11-23 한국전자통신연구원 오디오/비디오 서비스와 데이터 서비스의 동기화를 위한지상파 디지털멀티미디어방송 송/수신 시스템
JP2010171697A (ja) * 2009-01-22 2010-08-05 Hitachi Ltd 映像配信システム,映像配信装置,及び同期補正処理装置
KR20110098830A (ko) * 2008-12-19 2011-09-01 톰슨 라이센싱 외부 코프로세서를 포함하는 멀티플렉서에서의 전송 스트림 동기화를 위한 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100358119B1 (ko) * 2001-02-09 2002-10-25 한국전자통신연구원 디지털 데이터 방송 서비스를 위한 데이터 스트리밍 장치및 그 방법
KR100646851B1 (ko) * 2004-11-03 2006-11-23 한국전자통신연구원 오디오/비디오 서비스와 데이터 서비스의 동기화를 위한지상파 디지털멀티미디어방송 송/수신 시스템
KR20110098830A (ko) * 2008-12-19 2011-09-01 톰슨 라이센싱 외부 코프로세서를 포함하는 멀티플렉서에서의 전송 스트림 동기화를 위한 방법
JP2010171697A (ja) * 2009-01-22 2010-08-05 Hitachi Ltd 映像配信システム,映像配信装置,及び同期補正処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015152587A3 (en) * 2014-03-31 2017-05-04 Samsung Electronics Co., Ltd. Method and apparatus for signaling and operation of low delay consumption of media data in mmt
US10530828B2 (en) 2014-03-31 2020-01-07 Samsung Electronics Co., Ltd. Method and apparatus for signaling and operation of low delay consumption of media data in MMT

Similar Documents

Publication Publication Date Title
KR102049907B1 (ko) Mmt 시스템을 위한 미디어 데이터 전송 장치 및 방법, 그리고 미디어 데이터 수신 장치 및 방법
WO2012128563A2 (ko) 이종망 기반 연동형 방송콘텐츠 송수신 장치 및 방법
JP5086285B2 (ja) 映像配信システム,映像配信装置,及び同期補正処理装置
WO2012173389A2 (en) Method and apparatus for transmitting/receiving media contents in multimedia system
WO2012125001A2 (en) Method and apparatus for configuring content in a broadcast system
WO2013055176A1 (en) Apparatus and method for transmitting multimedia data in hybrid network
EP2987330A1 (en) Method and apparatus for transmitting media data in multimedia transport system
JP2007097185A (ja) マルチメディアストリームにおける同期化ウォーターマーキング
KR20140008237A (ko) 엠엠티의 하이브리드 전송 서비스에서 패킷 전송 및 수신 장치 및 방법
KR20130078643A (ko) Mmt 복합 전달 서비스에서 mmt 패킷 스트림 동기화를 위한 mmt 제어 계층 시그널링을 이용한 타이밍 정보 제공 방법 및 mmt 패킷 스트림 동기화 방법
WO2013112027A1 (ko) 부호화된 미디어 데이터를 전송하는 장치에서의 네트워크 지터 추정 방법
WO2013098810A1 (en) Adaptive forward error correction (fec) system and method
KR20130009670A (ko) 엠엠티 시스템에서의 패킷 전송 장치 및 방법, 및 패킷 수신 장치 및 방법
JP2012513139A (ja) 外部のコプロセッサを有するマルチプレクサにおいてトランスポートストリームを同期させる方法
US20100172374A1 (en) System and method for transport of a constant bit rate stream
WO2015105375A1 (en) Method and apparatus for transmitting and receiving media data in multimedia system
WO2013042999A1 (ko) Mmt 시스템을 위한 미디어 데이터 전송 장치 및 방법, 그리고 미디어 데이터 수신 장치 및 방법
WO2014010830A1 (ko) 엠엠티의 하이브리드 전송 서비스에서 패킷 전송 및 수신 장치 및 방법
WO2013042998A1 (ko) Mmt 시스템을 위한 미디어 데이터 전송 장치 및 방법, 그리고 미디어 데이터 수신 장치 및 방법
US8050252B2 (en) Packet-based video network indicating video signal synchronization and methodology thereof
WO2013009131A2 (ko) 엠엠티 시스템에서의 패킷 전송 장치 및 방법, 및 패킷 수신 장치 및 방법
WO2013055168A1 (ko) 콤포지션 정보 및 전송 특성 정보가 연동된 미디어 데이터를 이종 ip 네트워크를 통하여 전송하는 방법
WO2014014305A1 (ko) 동일 포트에 멀티플렉싱 된 다중 패킷 스트림의 패킷오류 구분을 선택적으로 수행하는 방법 및 그 장치
WO2013109094A1 (ko) 이종망 네트워크에서 미디어 프래그먼트 유닛으로 나누어진 액세스 유닛을 가지는 미디어 데이터를 전송하는 방법
WO2011132973A2 (en) Method and apparatus for transmitting and receiving service discovery information in multimedia transmission system and file structure for the same

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12833041

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 14345074

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12833041

Country of ref document: EP

Kind code of ref document: A1