WO2015151781A1 - 送信装置、送信方法、受信装置および受信方法 - Google Patents

送信装置、送信方法、受信装置および受信方法 Download PDF

Info

Publication number
WO2015151781A1
WO2015151781A1 PCT/JP2015/057777 JP2015057777W WO2015151781A1 WO 2015151781 A1 WO2015151781 A1 WO 2015151781A1 JP 2015057777 W JP2015057777 W JP 2015057777W WO 2015151781 A1 WO2015151781 A1 WO 2015151781A1
Authority
WO
WIPO (PCT)
Prior art keywords
time information
time
information
unit
clock
Prior art date
Application number
PCT/JP2015/057777
Other languages
English (en)
French (fr)
Inventor
北里 直久
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Publication of WO2015151781A1 publication Critical patent/WO2015151781A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4305Synchronising client clock from received content stream, e.g. locking decoder clock with encoder clock, extraction of the PCR packets

Definitions

  • the present technology relates to a transmission device, a transmission method, a reception device, and a reception method. More specifically, the present technology relates to a transmission device that transmits transmission media packets obtained by fragmenting transmission media such as video and audio on broadcast signals.
  • IPTV Internet Protocol Television
  • IPTV Internet Protocol Television
  • VoD Video on Demand
  • HTTP Hypertext Transfer Protocol
  • DASH Dynamic Adaptive Streaming Over HTTP
  • MPD Media Presentation Description
  • url address of chunked media data described therein.
  • the media data in this case is media data such as audio (Audio) / video (Video) / subtitle (Subtitle).
  • the purpose of the present technology is to satisfactorily realize clock synchronization and presentation synchronization when transmission media packets obtained by fragmenting transmission media such as video and audio are transmitted on broadcast signals.
  • a clock generation unit that generates a clock of a first frequency synchronized with the time information acquired from the time information server;
  • a time information generator for generating time information synchronized with the time information acquired from the time information server, including frequency information of the clock of the first frequency generated by the clock generator;
  • An encoding unit for encoding the transmission medium;
  • a packetizing unit for fragmenting the transmission medium encoded by the encoding unit in a predetermined unit, and generating a transmission media packet including each fragment;
  • a transmission unit for transmitting a transmission media packet generated by the packetization unit and a stream including time information packets having time information generated by the time information generation unit in a time-sharing manner on a broadcast wave;
  • the packetizer above Based on the time information generated by the time information generation unit to obtain the information of the decoding time and display time for each presentation unit of the transmission media, In the transmission media packet, the information of the obtained decoding time and display time is arranged in association with the data of each presentation unit.
  • a clock having a first frequency synchronized with the time information acquired from the time information server by the clock generation unit is generated.
  • a 27-MHz clock synchronized with the time information is generated from a time information server, for example, an NTP (Network Time Protocol) server.
  • the time information generation unit generates time information synchronized with the time information acquired from the time information server, including the frequency information of the clock of the first frequency generated by the clock generation unit.
  • the transmission unit such as video and audio is encoded by the encoding unit.
  • the packetizing unit fragments the transmission media encoded by the encoding unit in a predetermined unit, and generates a transmission media packet including each fragment. Then, the transmission unit transmits a broadcast wave carrying a transmission media packet generated by the packetizing unit and a stream including time information packets having time information generated by the time information generating unit in a time division manner.
  • the packetizing unit information on the decoding time and the display time for each presentation unit of the transmission media is acquired based on the time information generated by the time information generating unit, and the transmission media packet is associated with the data of each presentation unit.
  • the information of the obtained decoding time and display time is arranged.
  • the time information generated by the time information generation unit has a second part and a subsecond part indicated by the count value of the clock of the second frequency. May be obtained separately in a second portion and a subsecond portion indicated by a count value of the clock of the second frequency.
  • the second frequency may be 90 KHz.
  • the packetizing unit may acquire the second part and the subsecond part of the decoding time and display time information so that the total number of bits is a multiple of eight.
  • the time information generation unit counts the 27 MHz clock synchronized with the time information acquired from the time information server and divides the frequency by 300, and the divided output of the 9-bit counter.
  • a 17-bit counter that counts and divides the frequency by 90000 and a 32-bit counter that counts the frequency-divided output of the 17-bit counter may be provided.
  • the transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments, and the packetizing unit arranges a time stamp box before the first movie fragment, and this time stamp box.
  • information of decoding time and display time for a presentation unit included in a whole predetermined number of movie fragments may be described.
  • the transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments, and the packetizing unit arranges a time stamp box in front of each movie fragment, and this time stamp The box may describe information on the decoding time and display time for the presentation unit included in the subsequent movie fragment.
  • a transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments, and the packetizing unit arranges a meta box before the first movie fragment, and this meta box.
  • information of decoding time and display time for a presentation unit included in a whole predetermined number of movie fragments may be described.
  • a transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments, and the packetizing unit arranges a meta box in front of each movie fragment.
  • the information of the decoding time and the display time for the presentation unit included in the subsequent movie fragment may be described.
  • a transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments, and the packetizing unit provides hint information before each presentation unit data for each movie fragment.
  • the decoding time and display time information may be arranged.
  • the transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments, and the packetizing unit provides hint information before the first presentation unit data for each movie fragment.
  • information on the decoding time and display time for all presentation units may be arranged.
  • a transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments, and the packetizing unit is provided as auxiliary information before each presentation unit data for each movie fragment.
  • the decoding time and display time information may be arranged.
  • the transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments
  • the packetizing unit includes auxiliary information before the first presentation unit data for each movie fragment.
  • information on the decoding time and display time for all presentation units may be arranged.
  • the time information acquired from the time information server includes the frequency information of the clock of the first frequency synchronized with the time information acquired from the time information server in the stream carried on the broadcast wave. Includes packets with synchronized time information. Therefore, the receiving side can generate a clock (system clock) having the same first frequency as that of the transmitting side based on the time information, and clock synchronization can be realized.
  • the transmission medium is based on the time information synchronized with the time information acquired from the time information server, including the frequency information of the clock of the first frequency synchronized with the time information acquired from the time information server.
  • the decoding time and display time information for each presentation unit is acquired, and the acquired decoding time and display time information is arranged in the transmission media packet in association with the data of each presentation unit. Therefore, on the receiving side, based on the time information including the frequency information of the clock of the first frequency generated based on the time information included in the stream, and the decoding time and display time information for each transmission media presentation unit.
  • the presentation synchronization can be realized.
  • Time having time information synchronized with the time information acquired from the time information server including the transmission media packet having fragments obtained by fragmenting the encoded transmission medium and the frequency information of the clock of the first frequency
  • a receiving unit for receiving a broadcast wave on which a stream including information packets in a time-division manner is mounted;
  • a clock generation unit that generates a clock of the first frequency based on time information of the time information packet;
  • a time information generating unit that generates time information synchronized with the time information acquired from the time information server, including frequency information of the clock of the first frequency generated by the clock generating unit;
  • information of decoding time and display time is arranged in association with data of each presentation unit,
  • the encoded transmission media included in the transmission media packet received by the receiving unit is generated for each presentation unit by the decoding time and display time information extracted from the transmission media packet and the time information generating unit.
  • a processing unit for processing based on the time information to be received.
  • a broadcast wave on which a stream is placed is received by the receiving unit.
  • This stream includes transmission media packets and time information packets in a time division manner.
  • the transmission media packet has a fragment obtained by fragmenting the encoded transmission medium.
  • information on decoding time and display time is arranged in association with data of each presentation unit.
  • the time information packet has time information synchronized with time information acquired from a time information server, for example, an NTP server, including frequency information of a first frequency, for example, 27 MHz clock.
  • the clock generation unit generates a clock having a first frequency based on the time information included in the time information packet.
  • the time information generation unit generates time information synchronized with the time information acquired from the time information server, including the frequency information of the clock having the first frequency. Then, the encoded transmission media included in the transmission media packet received by the receiving unit is processed by the processing unit for each presentation unit, and information on the decoding time and the display time extracted from the transmission media packet, and time information Processing is performed based on time information generated by the generation unit.
  • the time information generated by the time information generation unit includes a second part and a subsecond part indicated by the count value of the clock of the second frequency, and information on the decoding time and the display time extracted from the transmission media packet Each may have a sub-second portion indicated by a second and a clock count value of the second frequency.
  • the second frequency may be 90 KHz.
  • the time information generation unit counts the 27 MHz clock generated by the clock generation unit and divides it by 300, and counts the divided output of this 9-bit counter and divides it by 90000.
  • a 17-bit counter and a 32-bit counter that counts the divided output of the 17-bit counter may be provided.
  • the first frequency clock (system clock) similar to that on the transmission side based on the time information synchronized with the time information acquired from the time information server included in the broadcast signal, and the first The time information including the frequency information of the clock of the frequency is generated. Based on this time information and information on the decoding time and display time arranged in the transmission media packet in association with the data of each presentation unit of the transmission media, the decoding and display processing for each presentation unit of the transmission media Is done. Therefore, clock synchronization and presentation synchronization can be realized.
  • FIG. 3 is a diagram illustrating a structure of a media segment (MS) included in an f-MP4 stream. It is a figure which shows the example of a description of the MPD file contained as a service channel signal (SCS) in the stream of f-MP4 system.
  • MS media segment
  • SCS service channel signal
  • NTP time
  • format the format (NTP
  • NTP time
  • format the format (NTP
  • NTP time
  • format the format (NTP
  • NTP time
  • format the format (NTP
  • FIG. 1 shows a configuration example of a broadcast system 10 as an embodiment.
  • the broadcast system 10 includes a broadcast transmission system 100 and a receiver 200.
  • the broadcast transmission system 100 is a time information server, for example, a 27 MHz clock (system clock) synchronized with time information acquired from an NTP (Network Time Protocol) server, and a time including frequency information of the 27 MHz clock. Generate information.
  • the broadcast transmission system 100 fragments transmission media such as video and audio in predetermined units, and generates transmission media packets (media segments) including the fragments.
  • the broadcast transmission system 100 arranges decoding time information (DTS: Decode TimeStamp) and display time information (PTS: Presentation TimeStamp) in a transmission media packet in association with data of each presentation unit of the transmission media.
  • DTS Decode TimeStamp
  • PTS Presentation TimeStamp
  • the broadcast transmission system 100 acquires the information on the decoding time and the display time based on the time information generated as described above.
  • the broadcast transmission system 100 transmits a Fragmented MP4 (f-MP4) stream on a broadcast wave, which includes transmission media packets, time information packets having time information, and control signal packets having control signals in a time division manner. .
  • f-MP4 Fragmented MP4
  • the receiver 200 receives the above-described broadcast wave transmitted from the broadcast transmission system 100. Based on the time information included in the f-MP4 stream transmitted on the broadcast wave, the receiver 200 synchronizes with this time information (the 27 MHz clock (system clock)) and the 27 MHz clock. Time information synchronized with the time information acquired from the time information server including the frequency information is generated.
  • the receiver 200 extracts information on the decoding time and the display time arranged in the transmission media packet in association with the data of each presentation unit of the transmission media. Then, the receiver 200 processes the transmission media included in the f-MP4 stream based on the extracted decoding time and display time information and the generated time information for each presentation unit.
  • the broadcast transmission system 100 and the receiver 200 are configured as described above, so that clock synchronization and presentation synchronization are realized as in the conventional MPEG2-TS system.
  • the transmission system and the reception system correspond to, for example, the broadcast transmission system 100 and the receiver 200 described above.
  • the transmission system includes a clock generation unit 11 that generates a 27 MHz system clock and a clock unit (time information generation unit) 12 that generates time information.
  • the transmission system also includes an encoding processing unit 13, a packetization / time stamp adding unit 14, and an encoding buffer 15.
  • the encoding processing unit 13 encodes transmission media such as video and audio.
  • the packetization / time stamp addition unit 14 packetizes the transmission media after encoding, and displays the display time (PTS: Presentation Time) for each transmission media presentation unit based on the time information generated by the clock unit 12. Stamp) is added.
  • the packet of the transmission medium is temporarily stored in the encode buffer 15 and transmitted at an appropriate timing.
  • the receiving system includes a clock generation unit 21 that generates a 27 MHz system clock and a clock unit (time information generation unit) 22 that generates time information.
  • the receiving system also includes a decode buffer 23, a depacketization / timing adjustment unit 24, and a decode processing unit 25.
  • the decode buffer 23 temporarily stores received transmission media packets.
  • the packet of the transmission medium stored in the decode buffer 23 is taken out with reference to the time information generated by the clock unit 22, and extracted at the timing of the added display time information. It becomes.
  • the decoding processing unit 25 the transmission medium obtained by depacketization is decoded to obtain a baseband transmission medium.
  • the clock synchronization means that the frequency of the system clock generated by the clock generation unit 11 of the transmission system and the frequency of the system clock generated by the clock generation unit 21 of the reception system become the same frequency. . If clock synchronization is not realized, corruption such as frame skipping occurs while reception is continued on the receiving side.
  • the presentation synchronization means that the time information of the clock unit 12 of the transmission system is combined with the time information of the clock unit 22 of the reception system, and display time information for each presentation unit of the transmission medium is added to the packet of the transmission medium. means.
  • the time information of the clock unit 22 of the reception system is matched with the time information of the clock unit 12 of the transmission system, a transmission delay from the transmission system to the reception system is considered. If the presentation synchronization is not realized, it is impossible to synchronize the video and audio on the receiving side and appropriately present without destroying the buffer.
  • FIG. 3 shows an f-MP4 stream structure included in a broadcast signal transmitted from the broadcast transmission system 100 to the receiver 200.
  • the media segment (MS: Media Segment) as the transmission media packet
  • the initialization segment (IS: Initialization Segment) related to the video and audio components.
  • the initialization segment (IS) includes initialization information for decoding processing.
  • the media segment (MS) is acquired after acquiring the initialization segment (IS).
  • service channel signal SCS: Service Channel Signal
  • control signal packet a packet including a control signal (control signal packet).
  • MPD Media Presentation Description
  • MPD file information such as a moving image compression method, encoding speed, image size, and language is hierarchically described in the XML format.
  • this f-MP4 stream there is a packet (time information packet) having time information including frequency information of a 27 MHz clock synchronized with time information acquired from an NTP (Network Time Protocol) server. .
  • NTP Network Time Protocol
  • FIG. 4 shows the structure of the initialization segment (IS).
  • This initialization segment (IS) has a box structure based on ISOBMFF (ISO Base Media File Format).
  • a “ftyp” box indicating a file type (File type) is arranged at the top, followed by a “moov” box for control.
  • the “moov” box includes various boxes including the illustrated “mvex” box. This “moov” box contains initialization information for the decoding process.
  • FIG. 5 shows the structure of the media segment (MS).
  • This media segment (MS) has a box structure based on ISOBMFF (ISO Base Media File Format).
  • a “styp” box indicating the segment type (Segment type) is placed at the head, followed by a “sidx” box indicating the segment index (Segment index), followed by one or more movie fragments (Movie Fragment). ) Is arranged.
  • the segment type information contained in the “styp” box is a fixed value “msdh”. This “styp” box may not be present.
  • the segment index information contained in the “sidx” box is information indicating the first byte value of each movie fragment. In the case of a single movie fragment, this “type” box may not be present. Since the size of the movie fragment is variable, when there are a plurality of movie fragments, a “sidx” box is required to know the first byte value of each movie fragment.
  • a movie fragment (Movie) Fragment) is composed of a “moof” box in which control information is entered and an “mdat” box in which the actual signal (transmission medium) such as video and audio is entered. Since the “mdat” box of one movie fragment contains a fragment obtained by fragmenting the transmission medium, the control information contained in the “moof” box is control information related to the fragment. As the size of the fragment, for example, MPEG Video GOP (Group Picture) is assumed.
  • FIG. 6 shows an example of the MPD file.
  • This example is not an actual XML description, but describes the elements and attributes described according to the structure.
  • information such as a moving image compression method, encoding speed, image size, and language is hierarchically described in the XML format.
  • the MPD file hierarchically includes structures such as a period, an adaptation set, an representation, a segment template, and the like.
  • the description specification of the MPD file is defined in the international standard “ISO / IEC 23099-1” that defines the MPEG-DASH specification.
  • the structure of the period has information on the program (a set of synchronized video and audio data). Further, the adaptation set structure included in the period structure groups the stream selection range (representation group). In addition, the representation structure included in the adaptation set structure has information such as the encoding speed of the moving image and audio, and the audio size of the moving image.
  • the structure of the segment template included in the structure of the adaptation set has information related to video and audio segments.
  • the segment template structure includes an initialization element indicating location information for acquiring an initialization segment (IS), and a medium indicating a location information template for acquiring a media segment (MS) supplied in different files from time to time. Attributes etc. are included.
  • the MPD file includes time unit information at the time specification such as presentation timing as “SegmentBase @ timescale”.
  • “SegmentBase @ timescale @ 90000”, which is a unit of 1/90000 seconds (corresponding to a 90 KHz clock cycle).
  • the MPD file includes time information indicating the start time of a segment timeline (SegmentTimeline) that is a continuation of media segments (MS) included in a period as “SegmentTimeline S @ t”.
  • the time information at this time indicates a relative time length from the start time of the period to the start time of the segment timeline, and is indicated by a count value of a clock having a frequency indicated by “SegmentBase @ timescale”.
  • “SegmentTimeline S @ t 0”, indicating that the start time of the segment timeline is the same as the start time of the period.
  • the MPD file includes time information indicating the time length of the media segment (MS) included in the period as “SegmentTimeline S @ d”.
  • the time information at this time is indicated by a count value of a clock having a frequency indicated by “SegmentBase @ timescale”.
  • “SegmentTimeline S @ t 180000”
  • “SegmentBase @ timescale 90000”, 2 seconds are indicated.
  • NTP Network Time Protocol
  • stratum 1 stratum 1
  • UTC Coordinated Universal Time
  • FIG. 7B shows a time information format (NTP time stamp format) provided by the NTP server.
  • This time information is in a 64-bit format, with the upper 32 bits indicating UTC accumulated seconds and the lower 32 bits indicating less than seconds.
  • FIG. 8 shows a configuration example of the broadcast transmission system 100.
  • the audio transmission system is omitted.
  • the broadcast transmission system 100 includes an NTP / IP interface 131 and 32-bit registers 132a and 132b.
  • the broadcast transmission system 100 also includes a voltage-controlled oscillator 133 that generates a 27 MHz clock (system clock), a 9-bit counter 134a, a 17-bit counter 134b, and a 32-bit counter 134c that form a clock unit, and a bit conversion unit 135. And a comparator 136.
  • the broadcast transmission system 100 also includes an NTP-CR packetizing unit 137, a video encoding processing unit 138, an f-MP4 packetizing unit 139, an encoding buffer 140, an MPD generator 141, and a multiplexer 142. ing.
  • the NTP / IP interface 131 accesses an NTP server (not shown) via the Internet at a predetermined time interval, and obtains time information in 64-bit format (see FIG. 7B).
  • the 32-bit registers 132a and 132b hold 64-bit format time information acquired by the NTP / IP interface 131.
  • the 32-bit register 132a holds upper 32 bits of bit data
  • the 32-bit register 132b holds lower 32 bits of bit data.
  • the contents held in the 32-bit registers 132a and 132b are updated each time the 64-bit format time information is acquired by the NTP / IP interface 131.
  • the configuration may be as it is.
  • the registers 132a and 132b are continuously operated as counters that automatically indicate the time so as to reproduce the clock of the NTP server. It is also possible to do.
  • the output of the register 132b indicating the lower 32 bits of the acquired time information becomes all 0s
  • the output of the register 132a indicating the upper 32 bits of the time information is set as an initial value of the 32-bit counter 134c.
  • the 17-bit counter 134b and the 9-bit counter 134a are all set to 0. This setting operation is limited to one time when the broadcast transmission system 100 starts operation.
  • the voltage controlled oscillator 133 generates a 27 MHz clock (system clock).
  • the 9-bit counter 134a the 27 MHz clock output from the voltage controlled oscillator 133 is counted, divided by 300, and a 90 KHz clock is output.
  • the 17-bit counter 134b counts the 90 KHz clock output from the 9-bit counter 134a, divides the frequency by 90000, and outputs a 1 Hz clock.
  • the 32-bit counter 134c the 1 Hz clock output from the 17-bit counter 134b is counted, and a 32-bit bit output that is time information (Regenerated UTC) with second accuracy is obtained.
  • the 58-bit bit output of the 9-bit counter 134a, the 17-bit counter 134b, and the 32-bit counter 134c becomes a system time clock (STC: System Time) Clock) as time information by the counter operation from the initial value.
  • STC System Time
  • This system time clock is input to the bit conversion unit 135.
  • bit conversion unit 135 for example, a conversion table is used, and the bit output of the 9-bit counter 134a and the 17-bit counter 134b is converted into a 32-bit output that is continuous with the lower bits of the bit output of the 32-bit counter 134c.
  • the This conversion is performed to correspond to the lower 32 bits of the time information in the 64-bit format obtained from the NTP server.
  • the bit conversion unit 135 obtains a 64-bit output that combines the 32-bit output converted in this way and the bit output of the 32-bit counter 134c.
  • the 64-bit bit output from the bit conversion unit 135 is latched at the timing when the held contents of the 32-bit registers 132a and 132b are updated, and the register holding contents, that is, the 64-bit format obtained from the NTP server are latched. Compared with time information. Then, a comparison error signal is supplied from the comparator 136 to the voltage controlled oscillator 133 as a control signal.
  • the voltage controlled oscillator 133, the counters 134a, 134b, and 134c, the bit converter 134, and the comparator 136 constitute a PLL (Phase Locked Loop) circuit. Therefore, the voltage controlled oscillator 133 generates a 27 MHz clock (system clock) synchronized with the time information in the 64-bit format acquired from the NTP server.
  • the counters 134a, 134b, and 134c generate 58-bit time information that includes the 27-MHz clock frequency information and that is synchronized with the 64-bit format time information acquired from the NTP server.
  • the 58-bit time information is supplied to the NTP-CR packetization unit 137. Based on the 58-bit time information, the NTP-CR packetizing unit 137 generates a packet including an NTP clock reference (NTP_CR: NTP Clock Reference) having 27 MHz clock frequency information.
  • NTP_CR NTP Clock Reference
  • FIG. 9 shows the configuration of this NTP clock reference.
  • the packet including the NTP_CR generated by the packetizing unit 137 is supplied to the multiplexer 142.
  • video data to be transmitted is encoded in synchronization with the 27 MHz clock obtained by the voltage controlled oscillator 133, and a video elementary stream is obtained.
  • the video elementary stream thus obtained is fragmented every predetermined time, for example, every 10 seconds, and a media segment (MS) including each fragment is generated.
  • the f-MP4 packetization unit 139 also generates an initialization segment (IS).
  • the media segment (MS) and initialization segment (IS) generated by the f-MP4 packetization unit 139 in this way are supplied to the multiplexer 142 through the encode buffer 140.
  • the f-MP4 packetizing unit 139 also generates time information generated by the clock unit as information on the decoding time (DTS) and information on the display time (PTS) for each presentation unit (picture) of the video signal as the transmission medium. Get based on.
  • a second part output from the 32-bit counter 134c and a sub-second part indicated by a count value of a clock having a frequency of 90 KHz output from the 17-bit counter 134b are used.
  • the decoding time and display time information are obtained separately for the second part and the subsecond part.
  • TSBase ⁇ ⁇ ⁇ ⁇ int that is a second part
  • TSBase fr that is a subsecond part
  • FIG. 10 shows a configuration example of the time information acquisition unit 150 in the f-MP4 packetization unit 139.
  • the time information acquisition unit 150 includes latch circuits 151 and 152 and a DTS / PTS calculation circuit 153.
  • the 32-bit data (second part) output from the 32-bit counter 134c is input to the latch circuit 151.
  • the 17-bit data (subsecond part) output from the 17-bit counter 134 b is input to the latch circuit 152.
  • the latch circuits 151 and 152 are supplied with a picture start pulse (Picture Start pulse) generated at the encoding start timing of each picture as a latch pulse. Therefore, the time information (second part) “TSBase int” is obtained from the latch circuit 151 for each presentation unit (picture). The latch circuit 152 obtains time information (sub-second part) “TSBase ⁇ fr” for each presentation unit (picture).
  • Picture Start pulse Picture Start pulse
  • FIG. 11B shows changes in count outputs of the 32-bit data counter 134c and the 17-bit counter 134b.
  • the count output changes in synchronization with the 90 KHz clock shown in FIG.
  • FIG. 11C shows a picture start pulse supplied to the latch circuits 151 and 152 as a latch pulse.
  • FIG. 11D shows time information “TSBase int / fr” acquired by the latch circuits 151 and 152 corresponding to each presentation unit (picture).
  • the display time information (PTS) for each presentation unit (picture). ) Is calculated. This display time information is obtained separately for display time information (second part) “PTSPint” and display time information (subsecond part) “PTS fr”. In this case, the display time information “PTS int / fr” is obtained by adding the fixed delay amount “DelayOffset” set with 90 KHz accuracy to the time information “TSBase int / fr”.
  • the display time information “PTS int / fr” is calculated by the following mathematical formulas (1), (2), and (3).
  • PTS TSBase_int x 90000 + TSBase_fr + DelayOffset (1)
  • PTS_int PTS / 90000 (2)
  • PTS_fr Mod (PTS, 90000) (3)
  • the DTS / PTS calculation circuit 153 calculates decoding time information (DTS) for each presentation unit (picture) based on the display time information “PTS int / fr” calculated as described above.
  • This decode time information is obtained by dividing into decode time information (second part) “DTS int” and decode time information (subsecond part) “DTS fr”.
  • several fixed offset values “DPOffset” that estimate the deviation of the decoding timing due to re-ordering of I picture, P picture, and B picture are subtracted from the display time information “PTS int / fr”.
  • the decoding time information “DTS / int / fr” is obtained.
  • the decoding time information “DTS int / fr” is calculated by the following mathematical formulas (4), (5), and (6).
  • DTS PTS-DPOffset (4)
  • DTS_int DTS / 90000 (5)
  • DTS_fr Mod (DTS, 90000) (6)
  • the f-MP4 packetization unit 139 associates the media segment (MS) with the data of each presentation unit (picture) and displays the display time information “PTS int / fr” and the decode time information “ DTS int / fr ”is placed. Details of the arrangement position and the arrangement method will be described later.
  • the MPD generator 141 generates an MPD file and generates a packet including this MPD file. This packet is supplied to the multiplexer 142.
  • the multiplexer 142 generates an f-MP4 stream including each packet. This f-MP4 stream is transmitted on a broadcast wave.
  • the broadcast transmission system is configured as a collection of independent devices in the form of 131 to 137 as synchronization signal generators, 138 to 141 as encoders, and 142 as multiplexers.
  • a 27 MHz clock is not directly connected, but only a 90 KHz clock or a so-called TV synchronization signal (horizontal / vertical synchronization signal) is generated by the synchronization signal generator, and this is sent to the encoder. It is conceivable to use a method in which the 27 MHz VCO is also locked to the TV sync signal by an encoder.
  • FIG. 12 shows a first example of the arrangement position and arrangement method of the decoding time and the display time.
  • a time stamp (TimeStamp) box is newly defined, and this time stamp box is arranged before the first movie fragment (Movie Fragment).
  • the decoding time information “DTS int / fr” and the display time information “PTS int / fr” for each presentation unit included in all movie fragments in the media segment are displayed in binary format in the order of transmission. It is described by.
  • the decoding time and display time information for the presentation unit included in all the movie fragments in the media segment are described. Then, it becomes possible to prepare the timing of decoding and display for each presentation unit transmitted thereafter with a sufficient margin. However, in this case, the description contents of the time stamp box are not confirmed until after the encoding of all the pictures is confirmed, so that a delay corresponding to the media segment occurs.
  • FIG. 13 shows a second example of the arrangement position and the arrangement method of the decoding time and the display time.
  • a time stamp (TimeStamp) box is newly defined, and this time stamp box is arranged in front of each movie fragment (Movie Fragment).
  • decoding time information “DTS int / fr” and display time information “PTS int / fr” for the presentation unit included in the subsequent movie fragment are described in binary format in the order of transmission.
  • the time stamp box arranged in front of each movie fragment describes the decoding time and display time information for the presentation unit included in the following movie fragment, so that the delay for the movie segment is sufficient. Compared with the first example, the delay can be reduced. However, since the number of time stamp boxes increases, the amount of information for configuring the time stamp box increases compared to the first example described above.
  • FIG. 14 shows a third example of the decoding time, the arrangement position of the display time, and the arrangement method.
  • a known Meta box is placed before the first movie fragment (Movie ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ Fragment).
  • the decoding time information “DTSDint / fr” and the display time information “PTS int / fr” for the presentation unit included in all movie fragments in the media segment are structured in the order of transmission, It is described in XML.
  • timestamp is defined as “hdlr_type” of “hdlr box” in the meta box.
  • decoding time information “DTS int / fr” and display time information “PTS int / fr” of each presentation unit in the media segment are described in XML.
  • FIG. 15 shows an XML description example. In this case, there are as many sample elements as there are sample presentations in the media segment, and the ptsint attribute, ptsfr attribute, dtsint attribute, and dtsfr attribute are described side by side as attributes of each sample element.
  • the meta box arranged before the first movie fragment the information on the decoding time and the display time for the presentation unit included in all the movie fragments in the media segment is described. It becomes possible to prepare the timing of decoding and display for each presentation unit transmitted thereafter with a sufficient margin. However, in this case, as in the first example described above, the description content of the metabox is not confirmed until after the encoding of all the pictures is confirmed, so that a delay corresponding to the media segment occurs.
  • FIG. 16 shows a fourth example of the arrangement position and arrangement method of the decoding time and the display time.
  • a meta box is arranged in front of each movie fragment (Movie Fragment). Then, in this meta box, decoding time information “DTS int / fr” and display time information “PTS int / fr” for the presentation unit included in the subsequent movie fragment are described in binary format in the order of transmission.
  • “timestamp” is defined as “hdlr_type” of “hdlr box” in each meta box.
  • the decoding time information “DTS int / fr” and the display time information “PTS int / fr” of each presentation unit in the movie fragment are described in XML.
  • the delay for the movie segment is sufficient. Compared with the third example, the delay can be reduced. However, since the number of metaboxes increases, the amount of information for configuring the metabox increases as compared with the third example described above.
  • FIG. 17 shows a fifth example of the arrangement position and the arrangement method of the decoding time and the display time.
  • a “traf” box as a hint track (hint track) together with a “traf” box of a transmission medium (Video / Audio etc.) in a “moof” box of each movie fragment (Movie Fragment)
  • the hint information data is defined as a sample time stamp (DTS / PTS).
  • decoding time information “DTS int / fr” and display time information “PTS int / fr” as hint samples (hint sample) and media samples (Media sample) are alternately arranged.
  • the decoding time information “DTS int / fr” and the display time information “PTS int / fr” and the media sample (Media sample) are alternately arranged in the “mdat” block, so that each media sample is received on the receiving side. Correspondence of decoding time and display time information to (Media sample) is facilitated. However, in such an arrangement, it is necessary to describe the first byte position and size information of each media sample in the “traf” box of the transmission medium (Video / Audio, etc.), and the amount of restriction information increases.
  • FIG. 18 shows a sixth example of the arrangement position and arrangement method of the decoding time and the display time.
  • a “traf” box as a hint track (hint track) together with a “traf” box of a transmission medium (Video / Audio etc.) in a “moof” box of each movie fragment (Movie Fragment)
  • the hint information data is defined as a sample time stamp (DTS / PTS).
  • DTS / PTS sample time stamp
  • the decoding time information “DTS int / fr” and the display time information “PTS int” corresponding to each media sample are used as hint samples (hint sample). / fr "are arranged together.
  • the “mdat” block information on the decoding time and display time corresponding to each media sample is collectively arranged as a hint sample (hinthsample) before the first media sample (Media sample).
  • a hint sample hint sample
  • the “traf” box of transmission media Video / Audio, etc.
  • only the first byte position of the first media sample and all size information need only be described, and the amount of restriction information can be reduced compared to the fifth example. it can.
  • a delay corresponding to the movie fragment occurs.
  • FIG. 19 shows a seventh example of the arrangement position and arrangement method of the decoding time and the display time.
  • a “saiz / saio” box is arranged in a “traf” box of a transmission medium (Video / Audio, etc.) in a “moof” box of each movie fragment (Movie Fragment).
  • the decoding time information “DTS int / fr” and the display time information “PTS int / fr” as sample auxiliary information (Sample Auxiliary information) are arranged in front of each media sample (Media sample) of the “mdat” block.
  • offset values indicating the position of the sample auxiliary information corresponding to each media sample are listed and arranged.
  • size information of the sample auxiliary information corresponding to each media sample is arranged in a list.
  • the decoding time information “DTS int / fr” and the display time information “PTS int / fr” as sample auxiliary information and the media sample (Media sample) are alternately arranged in the “mdat” block, On the receiving side, it becomes easy to associate the decoding time and display time information with each media sample (Media sample). However, in the case of such an arrangement, the information amount of offset values and size information described in the “saiz / saio” box becomes relatively large.
  • FIG. 20 shows an eighth example of the arrangement position and arrangement method of the decoding time and the display time.
  • a “saiz / saio” box is arranged in a “traf” box in a “moof” box of each movie fragment (Movie Fragment).
  • the decoding time information “DTS int / fr” and display time information “PTS int / fr” as sample auxiliary information (Sample Auxiliary information) are collected before the first media sample (Media sample) of the “mdat” block. Arranged.
  • an offset value indicating the position of the sample auxiliary information arranged together is arranged.
  • the size information of the sample auxiliary information arranged together is arranged.
  • sample Auxiliary information sample auxiliary information
  • FIG. 21 shows a configuration example of the receiver 200.
  • the receiver 200 includes a demultiplexer 231, a voltage controlled oscillator 232 that generates a 27 MHz clock (system clock), a 9-bit counter 233a, a 17-bit counter 233b, and a 32-bit counter 233c that constitute a clock unit, and a comparator. 234.
  • the receiver 200 includes a decode buffer 235, a DTS / PTS extractor 238, a timing controller 239, and a video decode processing unit 240.
  • the demultiplexer 231 is supplied with an f-MP4 stream that is sent over a broadcast wave.
  • the demultiplexer 231 extracts NTP_CR from the packet including the NTP clock reference (NTP_CR).
  • NTP_CR NTP clock reference
  • the 58-bit NTP_CR that is received first is set as an initial value in a 58-bit counter including the counter 233a, the counter 233b, and the counter 233c.
  • the NTP_CR received thereafter is supplied to the comparator 234.
  • the 27 MHz clock generated by the voltage controlled oscillator 232 is counted by the 9-bit counter 233a and divided by 300.
  • the 90 KHz clock obtained by the 9-bit counter 233a is counted by the 17-bit counter 233b and divided by 90000.
  • the 1 Hz clock obtained by the 17-bit counter 233b is counted by the 32-bit counter 233c.
  • the 32-bit counter 233c obtains a 32-bit bit output that is time information (Regenerated UTC) with second accuracy.
  • the 58-bit bit output of the 9-bit counter 233a, the 17-bit counter 233b, and the 32-bit counter 233c is a system time clock (STC: System Time) Clock) as time information.
  • STC System Time
  • This system time clock is supplied to the comparator 234.
  • the comparator 234 for example, at the timing when NTP_CR is supplied from the demultiplexer 231, the system time clock is latched and compared with NTP_CR.
  • the comparison error signal output from the comparator 234 is supplied to the voltage controlled oscillator 232 as a control signal.
  • the voltage controlled oscillator 232, the counters 233a, 233b, 233c and the comparator 234 constitute a PLL (Phase Locked Loop) circuit. Therefore, the voltage controlled oscillator 232 generates a 27 MHz clock synchronized with NTP_CR. The frequency of the 27 MHz clock becomes equal to the frequency of the clock generated by the voltage controlled oscillator 133 of the broadcast transmission system 100 described above, and clock synchronization is realized.
  • the counters 233a, 233b, and 233c generate a system time clock synchronized with NTP_CR.
  • This system time clock matches the system time clock generated by the counters 134a, 134b, 134c of the broadcast transmission system 100 described above. Therefore, as described above, coupled with the fact that the decoding time “DTS int / fr” and the display time information “PTS int / fr” for each presentation unit (picture) of the video signal are inserted into the f-MP4 stream, Presentation synchronization is realized.
  • the demultiplexer 231 extracts the initialization segment (IS) and the media segment (MS). In this case, after the initialization segment (IS) is extracted, the media segment (MS) sent thereafter is extracted.
  • the initialization information of the decoding process is extracted from the initialization segment (IS) and supplied to the video decoding processing unit 240 through the decoding buffer 235.
  • initialization is performed based on initialization information of decoding processing.
  • the demultiplexer 231 depackets each extracted media segment (MS), and takes out the encoded video data of each picture included in the “mdat” box of each movie fragment (Movie Fragment). .
  • the encoded video data of each picture taken in this way is temporarily stored in the decode buffer 235.
  • Information “PTS int / fr” is extracted.
  • the system time clock (time information) generated by the counters 233a, 233b, 233c is the system time clock (time information) generated by the counters 134a, 134b, 134c of the broadcast transmission system 100. It will be synchronized.
  • the count value (second portion) of the 32-bit counter 233c and the count value of the 17-bit counter 233b (sub-second portion, 90 KHz clock count value) are supplied to the timing controller 239.
  • the timing controller 239 also receives the decoding time information “DTS int / fr” and the display time corresponding to the encoded video data of each picture stored in the decoding buffer 235 and extracted by the DTS / PTS extraction unit 238. Information “PTS int / fr” is supplied.
  • the video decoding processing unit 240 is instructed to decode and display the encoded video data of each picture stored in the decoding buffer 235.
  • the timing controller 239 refers to the count value (second part) of the counter 233c and the count value (sub-second part) of the counter 233b for the instructions, and decode time information supplied from the DTS / PTS extraction unit 238. Based on “DTS int / fr” and display time information “PTS int / fr”, an instruction is given at each timing. In this case, the timing controller 239 determines that the decoding time (DTS) or the display time (PTS) has been reached by matching the second part with the subsecond part.
  • the video decoding processing unit 240 performs decoding processing on the encoded video data of each picture stored in the decoding buffer 235 based on an instruction from the timing controller 239 and outputs the decoded data.
  • the video decoding processing unit 238 fetches and decodes the encoded video data of the processing target picture from the decoding buffer 235 according to the decoding instruction, and then outputs the decoded video data according to the display instruction.
  • the flowchart in FIG. 22 shows an example of the processing procedure of the synchronization control processing in the receiver 200 described above.
  • the receiver 200 starts processing in step ST1. Thereafter, in step ST2, the receiver 200 determines whether or not a media segment (MS) has been received.
  • MS media segment
  • step ST3 the receiver 200 extracts the decoding time information “DTS int / fr” and the display time information “PTS int / fr” of each presentation unit (picture) included in the media segment (MS). . Then, the receiver 200 moves to the process of step ST4. When not received in step ST2, the receiver 200 immediately moves to the process in step ST4.
  • step ST4 the receiver 200 determines whether or not the decoding time (DTS) has come.
  • the receiver 200 instructs the video decoding processing unit 240 to decode the encoded video data of the target picture from the timing controller 239 in step ST5. Thereafter, the receiver 200 proceeds to the process of step ST6. Further, when the decoding time (DTS) is not reached in step ST4, the receiver 200 immediately returns to the process of step ST4.
  • step ST6 the receiver 200 determines whether or not the display time (PTS) has come.
  • the receiver 200 instructs the video decoding processing unit 240 from the timing controller 239 to display the target picture, that is, output the decoded video data. .
  • the receiver 200 returns to the process of step ST2 after the process of step ST7. Further, when the display time (PTS) is not reached in step ST6, the receiver 200 immediately returns to the process of step ST6.
  • the stream put on the broadcast wave transmitted from the broadcast transmission system 100 has the frequency information of the 27 MHz clock synchronized with the time information acquired from the time information server.
  • a packet having time information is included. Therefore, the receiving side can generate a 27 MHz clock (system clock) similar to that on the transmitting side based on this time information, and clock synchronization can be realized.
  • the decoding time and display for each presentation unit of transmission media arranged in a media segment (transmission media packet) included in a stream carried on a broadcast wave transmitted from the broadcast transmission system 100 is acquired based on the time information synchronized with the time information acquired from the time information server, including the frequency information of the 27 MHz clock synchronized with the time information acquired from the time information server. Therefore, on the receiving side, the time information including the frequency information of the 27 MHz clock generated based on the time information included in the stream, and the decoding time and display time arranged in the media segment for each transmission media presentation unit are displayed. Based on the information, presentation synchronization can be realized.
  • the decoding time information “DTS int / fr” and the display time information “PTS int / fr” arranged in the media segment have 32 bits for the second part and 17 bits for the subsecond part.
  • An example is shown.
  • the number of bits is not limited to this.
  • the total number of bits of the second part and the subsecond part may be a multiple of 8. For example, if the second part is 16 bits and the subsecond part is 16 bits, or the second part is 15 bits and the subsecond part is 17 bits, the total number of bits can be reduced to 32 bits.
  • the timing controller 239 of the receiver 200 has bits in the corresponding range among the outputs of the counters 233c and 233b. Matching is performed using values.
  • the subsecond portion is 17 bits, the accuracy is 90 KHz.
  • the subsecond portion is 16 bits, the accuracy is 45 KHz.
  • the stream carried on the broadcast wave is an f-MP4 stream.
  • the present technology is not limited to the f-MP4 stream, but can be similarly applied to other equivalent streams.
  • this technique can also take the following structures.
  • a clock generation unit that generates a clock having a first frequency synchronized with the time information acquired from the time information server;
  • a time information generator for generating time information synchronized with the time information acquired from the time information server, including frequency information of the clock of the first frequency generated by the clock generator;
  • An encoding unit for encoding the transmission medium;
  • a packetizing unit for fragmenting the transmission medium encoded by the encoding unit in a predetermined unit, and generating a transmission media packet including each fragment;
  • a transmission unit for transmitting a transmission media packet generated by the packetization unit and a stream including time information packets having time information generated by the time information generation unit in a time-sharing manner on a broadcast wave;
  • the packetizer above Based on the time information generated by the time information generator, obtain the information of the decoding time and display time for each presentation unit of the transmission media, A transmission apparatus that arranges the acquired decoding time and display time information in association with the data of each presentation unit in the transmission media packet
  • the time information generated by the time information generation unit includes a second part and a subsecond part indicated by the count value of the clock of the second frequency
  • the packetizer above The transmission apparatus according to (1), wherein each of the decoding time information and the display time information is obtained by being divided into a second part and a sub-second part indicated by a count value of the clock of the second frequency.
  • the packetizing unit The transmission apparatus according to (2), wherein the second part and the subsecond part of the decoding time and display time information are acquired so that the total number of bits is a multiple of eight.
  • the time information generation unit A 9-bit counter that counts the 27 MHz clock generated by the clock generator and divides it by 300; a 17-bit counter that counts the divided output of the 9-bit counter and divides it by 90000; and the 17-bit counter
  • the transmission device further including a 32-bit counter that counts the divided output of (6)
  • the transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments
  • the packetizer above A time stamp box is arranged in front of the first movie fragment, and information on the decoding time and display time for the presentation unit included in the whole predetermined number of movie fragments is described in the time stamp box.
  • the transmission device according to any one of (5).
  • the transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments
  • the packetizer above A time stamp box is arranged in front of each movie fragment, and information on the decoding time and display time for the presentation unit included in the subsequent movie fragment is described in the time stamp box. Any one of (1) to (5) A transmitting device according to claim 1.
  • the transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments, The packetizer above A meta box is placed in front of the first movie fragment, and the decoding time and display time information for the presentation unit included in the entire predetermined number of movie fragments are described in the meta box. ).
  • the transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments, The packetizer above A meta box is arranged in front of each movie fragment, and the information on the decoding time and display time for the presentation unit included in the following movie fragment is described in the meta box in any one of (1) to (5) The transmitting device described.
  • the transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments, The packetizer above The transmission device according to any one of (1) to (5), wherein information of a decoding time and a display time is arranged as hint information before each presentation unit data for each movie fragment.
  • the transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments, The packetizer above The transmission according to any one of (1) to (5), wherein information of decoding time and display time for all presentation units is arranged as hint information before the data of the first presentation unit for each movie fragment. apparatus.
  • the transmission media packet generated by the packetization unit is a media segment including a predetermined number of movie fragments, The packetizer above The transmission device according to any one of (1) to (5), wherein information of a decoding time and a display time is arranged as auxiliary information before each presentation unit data for each movie fragment.
  • the transmission media packet generated by the packetizing unit is a media segment including a predetermined number of movie fragments,
  • the packetizer above The transmission according to any one of (1) to (5), wherein information of decoding time and display time for all presentation units is arranged as auxiliary information before the data of the first presentation unit for each movie fragment. apparatus.
  • Time information synchronized with time information acquired from a time information server including transmission media packets having fragments obtained by fragmenting encoded transmission media and frequency information of the clock of the first frequency
  • a clock generation unit that generates a clock of the first frequency based on time information of the time information packet;
  • information of decoding time and display time is arranged in association with data of each presentation unit,
  • the encoded transmission media included in the transmission media packet received by the receiving unit is generated for each presentation unit by the decoding time and display time information extracted from the transmission media packet and the time information generating unit.
  • the time information generated by the time information generation unit includes a second part and a subsecond part indicated by the count value of the clock of the second frequency, Each of the decoding time and display time information extracted from the transmission media packet has a subsecond portion indicated by a second and a clock count value of the second frequency.
  • the receiving apparatus according to (15).
  • the time information generation unit A 9-bit counter that counts the 27 MHz clock generated by the clock generator and divides it by 300; a 17-bit counter that counts the divided output of the 9-bit counter and divides it by 90000; and the 17-bit counter
  • the time information acquired from the time information server including the transmission media packet having a fragment obtained by fragmenting the encoded transmission medium and the frequency information of the clock of the first frequency by the reception unit.
  • information of decoding time and display time is arranged in association with data of each presentation unit,
  • the encoded transmission media included in the transmission media packet received in the reception step is generated for each presentation unit in the decoding time and display time information extracted from the transmission media packet and in the time information generation step.
  • the receiving method which further has a processing step processed based on time information to be performed.
  • Voltage controlled oscillator 233a ... 9 Ttokaunta 233b ... 17-bit counter 233 c ... 32-bit counter 234 ... comparator 235 ... decode buffer 238 ... DTS / PTS extractor 239 ... timing controller 240 ... video decoding unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

 ビデオ、オーディオなどの伝送メディアを断片化して得られた伝送メディアパケットを放送信号に載せて送信する場合におけるクロック同期、提示同期を良好に実現可能とする。 時刻情報サーバから取得された時刻情報に同期した第1の周波数のクロックを生成する。この第1の周波数のクロックの周波数情報を含む、時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する。符号化された伝送メディアを所定の単位で断片化し、各断片を含む伝送メディアパケットを生成する。この伝送メディアパケットと時刻情報を持つ時刻情報パケットを時分割的に含むストリームを放送波に載せて送信する。伝送ディアパケットに、伝送メディアの各提示単位のデータに対応付けて、上記時刻情報に基づいて取得されたデコード時刻および表示時刻の情報を配置する。

Description

送信装置、送信方法、受信装置および受信方法
 本技術は、送信装置、送信方法、受信装置および受信方法に関し、詳しくは、ビデオ、オーディオなどの伝送メディアを断片化して得られた伝送メディアパケットを放送信号に載せて送信する送信装置等に関する。
 従来、デジタル放送は世界的にMPEG2-TS方式のシステム仕様に基づいて規定され運用されてきた。運用を開始した後、10-15年経過するうちに、映像符号化の技術が進化すると共により高解像度高画質化の要求も高まってきた。また、一方で、インターネットの普及と高速化が進み、放送と同等の画質の映像信号を、通信路を経由して受信することも可能となってきた。
 従来、インターネット等のネットワークを利用したIPTV(Internet Protocol Television)配信システムが提案されている(例えば、特許文献1参照)。近時、IPTV等のインターネットストリーミングにおける標準化が行われている。例えば、HTTP(Hypertext Transfer Protocol)ストリーミングによるVoD((Video on Demand)ストリーミングや、ライブストリーミングに適用される方式の標準化が行われている。
 特に、ISO/IEC/MPEGで標準化が行われているDASH(Dynamic Adaptive Streaming over HTTP)が注目されている。DASHでは、クライアント端末は、MPD(Media Presentation Description)と呼ばれるメタファイルと、そこに記述されるチャンク化されたメディアデータのアドレス(url)をもとに、ストリーミングデータを取得して再生する。この場合のメディアデータは、オーディオ(Audio)/ビデオ(Video)/サブタイトル(Subtitle)等のメディアデータである。
特開2011-193058号公報
 そのような状況にあって、放送と通信を統合的に利用したサービスへの期待もふくらんできており、技術的にも放送と通信の配信仕様の共通化、統合化が求められている。
 本技術の目的は、ビデオ、オーディオなどの伝送メディアを断片化して得られた伝送メディアパケットを放送信号に載せて送信する場合におけるクロック同期、提示同期を良好に実現することにある。
 本技術の概念は、
 時刻情報サーバから取得された時刻情報に同期した第1の周波数のクロックを生成するクロック生成部と、
 上記クロック生成部で生成される上記第1の周波数のクロックの周波数情報を含む、上記時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する時刻情報生成部と、
 伝送メディアを符号化する符号化部と、
 上記符号化部で符号化された伝送メディアを所定の単位で断片化し、各断片を含む伝送メディアパケットを生成するパケット化部と、
 上記パケット化部で生成された伝送メディアパケットおよび上記時刻情報生成部で生成される時刻情報を持つ時刻情報パケットを時分割的に含むストリームを放送波に載せて送信する送信部を備え、
 上記パケット化部は、
 上記時刻情報生成部で生成された時刻情報に基づいて上記伝送メディアの提示単位毎のデコード時刻および表示時刻の情報を取得し、
 上記伝送メディアパケットに、各提示単位のデータに対応付けて、該取得されたデコード時刻および表示時刻の情報を配置する
 送信装置にある。
 本技術において、クロック生成部により時刻情報サーバから取得された時刻情報に同期した第1の周波数のクロックが生成される。例えば、時刻情報サーバ、例えば、NTP(Network Time Protocol)サーバから時刻情報に同期した27MHzのクロックが生成される。時刻情報生成部により、このクロック生成部で生成される第1の周波数のクロックの周波数情報を含む、時刻情報サーバから取得された時刻情報に同期した時刻情報が生成される。
 符号化部により、ビデオ、オーディオ等の伝送メディアが符号化される。パケット化部により、符号化部で符号化された伝送メディアが所定の単位で断片化され、各断片を含む伝送メディアパケットが生成される。そして、送信部により、パケット化部で生成された伝送メディアパケットおよび時刻情報生成部で生成される時刻情報を持つ時刻情報パケットを時分割的に含むストリームを載せた放送波が送信される。
 パケット化部では、時刻情報生成部で生成される時刻情報に基づいて伝送メディアの提示単位毎のデコード時刻および表示時刻の情報が取得され、伝送メディアパケットに、各提示単位のデータに対応付けて、この取得されたデコード時刻および表示時刻の情報が配置される。
 例えば、時刻情報生成部で生成される時刻情報は、秒部分と第2の周波数のクロックのカウント値で示されるサブ秒部分を有し、パケット化部は、デコード時刻および表示時刻の情報のそれぞれを、秒部分と第2の周波数のクロックのカウント値で示されるサブ秒部分に分けて取得する、ようにされてもよい。この場合、例えば、第2の周波数は、90KHzである、ようにされてもよい。また、この場合、パケット化部は、デコード時刻および表示時刻の情報のそれぞれの秒部分とサブ秒部分を、合計ビット数が8の倍数となるように取得する、ようにされてもよい。
 そして、この場合、例えば、時刻情報生成部は、時刻情報サーバから取得された時刻情報に同期した27MHzのクロックをカウントして300分周する9ビットカウンタと、この9ビットカウンタの分周出力をカウントして90000分周する17ビットカウンタと、この17ビットカウンタの分周出力をカウントする32ビットカウンタを有する、ようにされてもよい。
 例えば、パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、パケット化部は、最初のムービーフラグメントの前に、タイムスタンプボックスを配置し、このタイムスタンプボックスに、所定数のムービーフラグメント全体に含まれる提示単位分のデコード時刻および表示時刻の情報を記述する、ようにされてもよい。
 また、例えば、パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、パケット化部は、各ムービーフラグメントの前にタイムスタンプボックスをそれぞれ配置し、このタイムスタンプボックスに、続くムービーフラグメントに含まれる提示単位分のデコード時刻および表示時刻の情報を記述する、ようにされてもよい。
 また、例えば、パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、パケット化部は、最初のムービーフラグメントの前に、メタボックスを配置し、このメタボックスに、所定数のムービーフラグメント全体に含まれる提示単位分のデコード時刻および表示時刻の情報を記述する、ようにされてもよい。
 また、例えば、パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、パケット化部は、各ムービーフラグメントの前にメタボックスをそれぞれ配置し、このメタボックスに、続くムービーフラグメントに含まれる提示単位分のデコード時刻および表示時刻の情報を記述する、ようにされてもよい。
 また、例えば、パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、パケット化部は、ムービーフラグメント毎に、各提示単位のデータの前に、ヒント情報として、デコード時刻および表示時刻の情報を配置する、ようにされてもよい。
 また、例えば、パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、パケット化部は、ムービーフラグメント毎に、最初の提示単位のデータの前に、ヒント情報として、全提示単位分のデコード時刻および表示時刻の情報を配置する、ようにされてもよい。
 また、例えば、パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、パケット化部は、ムービーフラグメント毎に、各提示単位のデータの前に、補助情報として、デコード時刻および表示時刻の情報を配置する、ようにされてもよい。
 また、例えば、パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、パケット化部は、ムービーフラグメント毎に、最初の提示単位のデータの前に、補助情報として、全提示単位分のデコード時刻および表示時刻の情報を配置する、ようにされてもよい。
 このように本技術においては、放送波に載せるストリームに、時刻情報サーバから取得された時刻情報に同期した第1の周波数のクロックの周波数情報を含む、この時刻情報サーバから取得された時刻情報に同期した時刻情報を持つパケットが含まれる。そのため、受信側では、この時刻情報に基づいて送信側と同様の第1の周波数のクロック(システムクロック)を生成でき、クロック同期の実現が可能となる。
 また、本技術においては、時刻情報サーバから取得された時刻情報に同期した第1の周波数のクロックの周波数情報を含む、時刻情報サーバから取得された時刻情報に同期した時刻情報に基づいて伝送メディアの提示単位毎のデコード時刻および表示時刻の情報が取得され、伝送メディアパケットに、各提示単位のデータに対応付けて、この取得されたデコード時刻および表示時刻の情報が配置される。そのため、受信側では、ストリームに含まれる時刻情報に基づいて生成される第1の周波数のクロックの周波数情報を含む時刻情報と、伝送メディアの提示単位毎のデコード時刻および表示時刻の情報とに基づき、提示同期の実現が可能となる。
 また、本技術の他の概念は、
 符号化された伝送メディアが断片化されて得られた断片を持つ伝送メディアパケットおよび第1の周波数のクロックの周波数情報を含む、時刻情報サーバから取得された時刻情報に同期した時刻情報を持つ時刻情報パケットを時分割的に含むストリームが載せられた放送波を受信する受信部と、
 上記時刻情報パケットが持つ時刻情報に基づいて、上記第1の周波数のクロックを生成するクロック生成部と、
 上記クロック生成部で生成される上記第1の周波数のクロックの周波数情報を含む、上記時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する時刻情報生成部を備え、
 上記伝送メディアパケットには、各提示単位のデータに対応付けてデコード時刻および表示時刻の情報が配置されており、
 上記受信部で受信された伝送メディアパケットに含まれる符号化された伝送メディアを、提示単位毎に、該伝送メディアパケットから抽出されるデコード時刻および表示時刻の情報と、上記時刻情報生成部で生成される時刻情報とに基づいて処理する処理部をさらに備える
 受信装置にある。
 本技術において、受信部により、ストリームが載せられた放送波が受信される。このストリームには、伝送メディアパケットおよび時刻情報パケットが時分割的に含まれている。ここで、伝送メディアパケットは、符号化された伝送メディアが断片化されて得られた断片を持っている。そして、この伝送メディアパケットには、各提示単位のデータに対応付けてデコード時刻および表示時刻の情報が配置されている。時刻情報パケットは、第1の周波数、例えば27MHzのクロックの周波数情報を含む、時刻情報サーバ、例えばNTPサーバから取得された時刻情報に同期した時刻情報を持っている。
 クロック生成部により、時刻情報パケットが持つ時刻情報に基づいて、第1の周波数のクロックが生成される。時刻情報生成部により、この第1の周波数のクロックの周波数情報を含む、時刻情報サーバから取得された時刻情報に同期した時刻情報が生成される。そして、処理部により、受信部で受信された伝送メディアパケットに含まれる符号化された伝送メディアが、提示単位毎に、この伝送メディアパケットから抽出されるデコード時刻および表示時刻の情報と、時刻情報生成部で生成される時刻情報とに基づいて処理される。
 例えば、時刻情報生成部で生成される時刻情報は、秒部分と第2の周波数のクロックのカウント値で示されるサブ秒部分を有し、伝送メディアパケットから抽出されるデコード時刻および表示時刻の情報のそれぞれは、秒分と第2の周波数のクロックのカウント値で示されるサブ秒部分を有する、ようにされてもよい。この場合、例えば、第2の周波数は、90KHzである、ようにされてもよい。
 この場合、例えば、時刻情報生成部は、クロック生成部で生成される27MHzのクロックをカウントして300分周する9ビットカウンタと、この9ビットカウンタの分周出力をカウントして90000分周する17ビットカウンタと、この17ビットカウンタの分周出力をカウントする32ビットカウンタを有する、ようにされてもよい。
 このように本技術においては、放送信号に含まれる時刻情報サーバから取得された時刻情報に同期した時刻情報に基づいて送信側と同様の第1の周波数のクロック(システムクロック)と、この第1の周波数のクロックの周波数情報を含む時刻情報が生成される。そして、この時刻情報と、伝送メディアパケットに伝送メディアの各提示単位のデータに対応付けて配置されているデコード時刻および表示時刻の情報に基づいて、伝送メディアの提示単位毎のデコードや表示の処理が行われる。そのため、クロック同期および提示同期の実現が可能となる。
 本技術によれば、ビデオ、オーディオなどの伝送メディアを断片化して得られた伝送メディアパケットを放送信号に載せて送信する場合におけるクロック同期、提示同期を良好に実現できる。なお、ここに記載された効果に必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
実施の形態としての送受信システムの構成例を示すブロック図である。 送信・受信システムにおけるクロック同期と提示同期について説明するための図である。 放送送出システムから受信機に送信される放送信号に含まれるf-MP4方式のストリーム構造を示す図である。 f-MP4方式のストリームに含まれる初期化セグメント(IS)の構造を示す図である。 f-MP4方式のストリームに含まれるメディアセグメント(MS)の構造を示す図である。 f-MP4方式のストリームにサービス・チャネル・シグナル(SCS)として含まれるMPDファイルの記述例を示す図である。 NTPサーバおよびこのNTPサーバが提供する時刻情報のフォーマット(NTP time stamp format)を説明するための図である。 放送送出システムの構成例を示すブロック図である。 NTP・クロック・リファレンスの構成を示す図である。 時間情報取得部の構成例を示すブロック図である。 時間情報取得部の各部の信号の状態を示す図である。 デコード時刻、表示時刻の配置位置および配置方法の第1の例を示す図である。 デコード時刻、表示時刻の配置位置および配置方法の第2の例を示す図である。 デコード時刻、表示時刻の配置位置および配置方法の第3の例を示す図である。 XML記述例を示す図である。 デコード時刻、表示時刻の配置位置および配置方法の第4の例を示す図である。 デコード時刻、表示時刻の配置位置および配置方法の第5の例を示す図である。 デコード時刻、表示時刻の配置位置および配置方法の第6の例を示す図である。 デコード時刻、表示時刻の配置位置および配置方法の第7の例を示す図である。 デコード時刻、表示時刻の配置位置および配置方法の第8の例を示す図である。 受信機の構成例を示すブロック図である。 受信機における同期制御処理の処理手順の一例を示すフローチャートである。
 以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明を以下の順序で行う。
 1.実施の形態
 2.変形例
 <1.実施の形態>
 [放送システムの構成例]
 図1は、実施の形態としての放送システム10の構成例を示している。この放送システム10は、放送送出システム100と、受信機200により構成されている。
 放送送出システム100は、時刻情報サーバとしての、例えば、NTP(Network Time Protocol)サーバから取得された時刻情報に同期した、27MHzのクロック(システムクロック)と、この27MHzのクロックの周波数情報を含む時刻情報を生成する。放送送出システム100は、ビデオ、オーディオなどの伝送メディアを所定の単位で断片化し、各断片を含む伝送メディアパケット(メディアセグメント)を生成する。
 放送送出システム100は、伝送メディアパケットに、伝送メディアの各提示単位のデータに対応付けて、デコード時刻の情報(DTS:Decode TimeStamp)および表示時刻の情報(PTS:Presentation TimeStamp)を配置する。放送送出システム100は、これらデコード時刻および表示時刻の情報を、上述したように生成される時刻情報に基づいて取得する。放送送出システム100は、伝送メディアパケット、時刻情報を持つ時刻情報パケットおよび制御信号を持つ制御信号パケットを時分割的に含む、Fragmented MP4(f-MP4)方式のストリームを放送波に載せて送信する。
 受信機200は、放送送出システム100から送られてくる上述の放送波を受信する。受信機200は、放送波に載せて送られてくるf-MP4方式のストリームに含まれる時刻情報に基づいて、この時刻情報に同期した、27MHzのクロック(システムクロック)と、この27MHzのクロックの周波数情報を含む、時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する。
 また、受信機200は、伝送メディアパケットに伝送メディアの各提示単位のデータに対応付けて配置されているデコード時刻および表示時刻の情報を抽出する。そして、受信機200は、f-MP4方式のストリームに含まれる伝送メディアを、提示単位毎に、抽出されたデコード時刻および表示時刻の情報と、生成された時刻情報とに基づいて処理する。
 放送システム10においては、放送送出システム100および受信機200を上述した構成とすることで、従来のMPEG2-TS方式と同様に、クロック同期と提示同期が実現される。
 図2を用いて、送信・受信システムにおけるクロック同期と提示同期について説明する。送信システム、受信システムは、例えば、上述の放送送出システム100、受信機200に対応する。送信システムは、27MHzのシステムクロックを生成するクロック生成部11と、時刻情報を生成する時計部(時刻情報生成部)12を有している。また、送信システムは、エンコード処理部13と、パケット化/タイムスタンプ付加部14と、エンコードバッファ15を有している。
 エンコード処理部13では、ビデオ、オーディオなどの伝送メディアが符号化される。パケット化/タイムスタンプ付加部14では、符号化後の伝送メディアのパケット化が行われると共に、時計部12で生成される時刻情報に基づいて伝送メディアの提示単位毎に表示時刻(PTS:Presentation Time Stamp)が付加される。そして、伝送メディアのパケットは、エンコードバッファ15に一時的に蓄積され、適宜なタイミングで送信される。
 受信システムは、27MHzのシステムクロックを生成するクロック生成部21と、時刻情報を発生する時計部(時刻情報生成部)22を有している。また、受信システムは、デコードバッファ23と、デパケット化/タイミング調整部24と、デコード処理部25を有している。
 デコードバッファ23では、受信された伝送メディアのパケットを一時的に蓄積する。デパケット化/タイミング調整部24では、デコードバッファ23に蓄積されている伝送メディアのパケットが、時計部22で生成される時刻情報が参照され、付加されている表示時刻情報のタイミングで取り出されてデパケット化される。デコード処理部25では、デパケット化により得られた伝送メディアが復号化され、ベースバンドの伝送メディアが得られる。
 ここで、クロック同期とは、送信システムのクロック生成部11で生成されるシステムクロックの周波数と、受信システムのクロック生成部21で生成されるシステムクロックの周波数が、同一周波数となることを意味する。クロック同期が実現されていない場合、受信側で受信を継続しているうちにフレーム飛び等が発生するなどの破たんが起きる。
 また、提示同期とは、送信システムの時計部12の時刻情報と受信システムの時計部22の時刻情報を合わせ、かつ伝送メディアの提示単位毎の表示時刻情報を伝送メディアのパケットに付加することを意味する。なお、ここで、送信システムの時計部12の時刻情報に受信システムの時計部22の時刻情報を合わせる場合には、送信システムから受信システムへの伝送遅延が考慮される。提示同期が実現されていない場合、受信側でビデオ、オーディオの同期をとってバッファを破たんさせずに適切に提示するということができなくなる。
 図3は、放送送出システム100から受信機200に送信される放送信号に含まれるf-MP4方式のストリーム構造を示している。このf-MP4方式のストリームには、ビデオ、オーディオの各コンポーネントに関連して、上述した伝送メディアパケットとしてのメディアセグメント(MS:Media Segment)と、初期化セグメント(IS:Initialization Segment)が存在する。初期化セグメント(IS)には、復号処理の初期化情報などが含まれている。受信時には、初期化セグメント(IS)を取得した上で、メディアセグメント(MS)を取得することになる。
 また、このf-MP4方式のストリームには、サービス・チャネル・シグナル(SCS:Service Channel Signal)、つまり制御信号を含むパケット(制御信号パケット)が存在する。図には、MPD(Media Presentation Description)ファイルというメタファイルを含むパケットのみが示されている。MPDファイルには、動画の圧縮方式や符号化速度、画像サイズ、言語などの情報がXML形式で階層的に記述されている。
 また、このf-MP4方式のストリームには、NTP(Network Time Protocol)サーバから取得された時刻情報に同期した、27MHzのクロックの周波数情報を含む時刻情報を持つパケット(時刻情報パケット)が存在する。
 図4は、初期化セグメント(IS)の構造を示している。この初期化セグメント(IS)は、ISOBMFF(ISO Base Media File Format)に基づくボックス(Box)構造を持つ。先頭に、ファイルタイプ(File type)を示す“ftyp”ボックスが配置され、それに続いて制御用の“moov”ボックスが配置されている。詳細説明は省略するが、“moov”ボックス内には、図示の“mvex”ボックスを含む種々のボックスが含まれている。この“moov”ボックスに、復号処理の初期化情報などが入っている。
 図5は、メディアセグメント(MS)の構造を示している。このメディアセグメント(MS)は、ISOBMFF(ISO Base Media File Format)に基づくボックス(Box)構造を持つ。先頭にセグメントタイプ(Segment type)を示す“styp”ボックスが配置され、それに続いてセグメントインデックス(Segment index)を示す“sidx”ボックスは配置され、それに続いて一つまたは複数のムービーフラグメント(Movie Fragment)が配置されている。
 “styp”ボックスに入っているセグメントタイプの情報は固定値の‘msdh’である。この“styp”ボックスはなくてもよい。また、“sidx”ボックスに入っているセグメントインデックスの情報は、各ムービーフラグメントの先頭のバイト(byte)値を示す情報である。ムービーフラグメントが一つの場合は、この“styp”ボックスがなくてもよい。ムービーフラグメントのサイズは可変長であることから、ムービーフラグメントが複数の場合は、各ムービーフラグメントの先頭のバイト値を知るために、“sidx”ボックスが必要となる。
 ムービーフラグメント(Movie Fragment)は、制御情報が入る“moof”ボックスと、ビデオ、オーディオなどの信号(伝送メディア)の実体そのものが入る“mdat”ボックスから構成される。一つのムービーフラグメントの“mdat”ボックスには、伝送メディアが断片化されて得られた断片が入るので、“moof”ボックスに入る制御情報はその断片に関する制御情報となる。断片の大きさとしては、例えば、MPEG VideoのGOP(Group Of Picture)などが想定される。
 図6は、MPDファイルの一例を示している。なお、この例示は実際のXML記述ではなく、記述される各要素と属性を構造に従って並べたものである。MPDファイルには、上述したように、動画の圧縮方式や符号化速度、画像サイズ、言語などの情報がXML形式で階層的に記述されている。MPDファイルには、ピリオド(Period)、アダプテーションセット(AdaptationSet)、リプレゼンテーション(Representation)、セグメントテンプレート(SegmentTemplate)、などの構造体が、階層的に含まれている。このMPDファイルの記述仕様は、MPEG-DASHの仕様を規定する国際標準規格「ISO/IEC 23009-1」に定められている。
 ピリオドの構造体は、プログラム(同期を取った1組の動画や音声等のデータ)の情報を持つ。また、ピリオドの構造体に含まれるアダプテーションセットの構造体は、ストリームの選択範囲(リプレゼンテーション群)をグルーピングする。また、アダプテーションセットの構造体に含まれるリプレゼンテーションの構造体は、動画や音声の符号化速度、動画の音声サイズなどの情報を持つ。
 また、アダプテーションセットの構造体に含まれるセグメントテンプレートの構造体は、動画や音声のセグメント関連の情報を持つ。セグメントテンプレートの構造体には、初期化セグメント(IS)を取得するロケーション情報を示すイニシャライゼ―ション要素と、時々刻々異なるファイルで供給されるメディアセグメント(MS)を取得するロケーション情報のテンプレートを示すメディア属性等が含まれる。
 MPDファイルには、ピリオド(Period)毎の制御情報が記述される。このピリオドは、例えば一つの番組に相当する期間を示している。MPDファイルには、ピリオドの開始時刻情報が、「Period@start」として含まれている。この情報は、年月日時分秒で示される。図示の例では、「Period@start = “2013-12-01T10:30:30”」となっており、2013年12月1日10時30分30秒が示されている。
 また、MPDファイルには、提示タイミングなどの時刻指定のときの時間単位情報が、「SegmentBase@timescale」として含まれている。図示の例では、「SegmentBase@timescale = 90000」となっており、1/90000秒(90KHzのクロックの周期に相当)の単位であることが示されている。
 また、MPDファイルには、ピリオドに含まれるメディアセグメント(MS)の連続であるセグメントタイムライン(SegmentTimeline)の開始時刻を示す時間情報が、「SegmentTimeline S@t」として含まれている。この時時間情報は、ピリオドの開始時刻からセグメントタイムラインの開始時刻までの相対的な時間長を示し、「SegmentBase@timescale」で示される周波数のクロックのカウント値で示される。図示の例では、「SegmentTimeline S@t = 0」となっており、セグメントタイムラインの開始時間がピリオドの開始時間と同じであることが示されている。
 また、MPDファイルには、ピリオドに含まれるメディアセグメント(MS)の時間長を示す時間情報が、「SegmentTimeline S@d」として含まれている。この時時間情報は、「SegmentBase@timescale」で示される周波数のクロックのカウント値で示される。図示の例では、「SegmentTimeline S@t = 180000」となっており、「SegmentBase@timescale = 90000」であるとき、2秒であることが示されている。
 [NTP(Network Time Protocol)の説明]
 ここで、NTPについて説明する。図7(a)に示すように、NTPサーバには、階層(Stratum)が存在し、番号が若いほど高精度となっている。例えば、階層1(Stratum 1)のNTPサーバは原子時計と直結していて、時刻情報の誤差は1μs未満である。NTPサーバが提供する時刻情報は、1900年1月1日からの積算秒数(UTC:Coordinated Universal Time)で表現されている。
 図7(b)は、NTPサーバが提供する時刻情報のフォーマット(NTP time stamp format)を示している。この時刻情報は、64ビットフォーマットであり、上位32ビットはUTCの積算秒数を示し、下位32ビットは秒未満を示している。
 パーソナルコンピュータ、スマートフォンなどのクライアントからNTPプロトコルでNTPサーバにアクセスして時刻情報を取得するときには、どの階層のNTPサーバにサクセスするか不明である。そのため、複数のNTPサーバに同期アクセスして平均値を取ることで、ばらつきを抑え、より正確な時刻情報を得るようになされる。
 [放送送出システムの構成]
 図8は、放送送出システム100の構成例を示している。なお、図示の例においては、オーディオの送信系については、省略されている。この放送送出システム100は、NTP/IPインタフェース131と、32ビットレジスタ132a,132bを有している。
 また、この放送送出システム100は、27MHzのクロック(システムクロック)を生成する電圧制御発振器133と、時計部を構成する9ビットカウンタ134a、17ビットカウンタ134bおよび32ビットカウンタ134cと、ビット変換部135と、比較器136を有している。
 また、この放送送出システム100は、NTP-CRパケット化部137と、ビデオエンコード処理部138と、f-MP4パケット化部139と、エンコードバッファ140と、MPD発生器141と、マルチプレクサ142を有している。
 NTP/IPインタフェース131により、インターネット経由で図示しないNTPサーバに所定の時間間隔でアクセスされ、64ビットフォーマットの時刻情報(図7(b)参照)が取得される。32ビットレジスタ132a,132bでは、NTP/IPインタフェース131で取得される64ビットフォーマットの時刻情報が保持される。32ビットレジスタ132aには上位32ビットのビットデータが保持され、32ビットレジスタ132bには下位32ビットのビットデータが保持される。32ビットレジスタ132a,132bの保持内容は、NTP/IPインタフェース131で64ビットフォーマットの時刻情報を取得する毎に更新される。
 ここで、時刻情報を取得する頻度が十分高い場合にはこのままの構成でよいが、低い場合にはレジスタ132a,132bはNTPサーバの時計を再現するように自動的に時刻を示すカウンタとして継続動作することも考えられる。ここで、取得した時刻情報の下位32ビットを示すレジスタ132bの出力がオール0となった時点で、時刻情報の上位32ビットを示すレジスタ132aの出力を32ビットカウンタ134cの初期値としてセットし、かつ17ビットカウンタ134bと9ビットカウンタ134aをそれぞれオール0にセットする。この設定動作は放送送出システム100が動作開始する1回のみに限定される。
 電圧制御発振器133では、27MHzのクロック(システムクロック)が発生される。9ビットカウンタ134aでは、電圧制御発振器133から出力される27MHzのクロックがカウントされて、300分周され、90KHzのクロックが出力される。17ビットカウンタ134bでは、9ビットカウンタ134aから出力される90KHzのクロックがカウントされて、90000分周されて、1Hzのクロックが出力される。32ビットカウンタ134cでは、17ビットカウンタ134bから出力される1Hzのクロックがカウントされて、秒精度の時刻情報(Regenerated UTC)である32ビットのビット出力が得られる。
 9ビットカウンタ134a、17ビットカウンタ134bおよび32ビットカウンタ134cの58ビットのビット出力は、初期値からのカウンタ動作により、時刻情報としてのシステム・タイム・クロック(STC:System Time Clock)となる。このシステム・タイム・クロックはビット変換部135に入力される。
 このビット変換部135では、例えば変換テーブルが使用されるなどして、9ビットカウンタ134aおよび17ビットカウンタ134bのビット出力が、32ビットカウンタ134cのビット出力の下位に連続する32ビット出力に変換される。この変換は、NTPサーバから取得される64ビットフォーマットの時刻情報の下位32ビットのビット出力に対応させるために行われる。ビット変換部135では、このように変換された32ビット出力と32ビットカウンタ134cのビット出力とを合わせた64ビット出力が得られる。
 比較器136では、32ビットレジスタ132a,132bの保持内容が更新されるタイミングでビット変換部135からの64ビットのビット出力がラッチされ、レジスタ保持内容、つまりNTPサーバから取得された64ビットフォーマットの時刻情報と比較される。そして、比較器136から電圧制御発振器133に、比較誤差信号が制御信号として供給される。
 ここで、電圧制御発振器133、カウンタ134a,134b,134c、ビット変換部134および比較器136により、PLL(Phase Locked Loop)回路が構成される。そのため、電圧制御発振器133では、NTPサーバから取得された64ビットフォーマットの時刻情報に同期した27MHzのクロック(システムクロック)が生成される。また、カウンタ134a,134b,134cでは、この27MHzのクロックの周波数情報を含む、NTPサーバから取得された64ビットフォーマットの時刻情報に同期した、58ビットの時刻情報が生成される。
 この58ビットの時刻情報は、NTP-CRパケット化部137に供給される。NTP-CRパケット化部137では、この58ビットの時刻情報に基づき、27MHzのクロックの周波数情報を持つNTP・クロック・リファレンス(NTP_CR:NTP Clock Reference)を含むパケットが生成される。図9は、このNTP・クロック・リファレンスの構成を示している。このようにパケット化部137で生成されるNTP_CRを含むパケットはマルチプレクサ142に供給される。
 ビデオエンコード処理部138では、電圧制御発振器133で得られる27MHzのクロックに同期して、送信すべきビデオデータの符号化が行われて、ビデオエレメンタリストリームが得られる。f-MP4パケット化部139では、このように得られるビデオエレメンタリストリームが、所定時間分、例えば、10秒分毎に断片化され、各断片を含むメディアセグメント(MS)が生成される。
 なお、このf-MP4パケット化部139では、初期化セグメント(IS)も生成される。このようにf-MP4パケット化部139で生成されるメディアセグメント(MS)および初期化セグメント(IS)は、エンコードバッファ140を通じてマルチプレクサ142に供給される。
 また、f-MP4パケット化部139では、伝送メディアとしてのビデオ信号の提示単位(ピクチャ)毎のデコード時刻の情報(DTS)および表示時刻の情報(PTS)が、時計部で生成される時刻情報に基づいて取得される。この場合、32ビットカウンタ134cから出力される秒部分と、17ビットカウンタ134bから出力される90KHzの周波数のクロックのカウント値で示されるサブ秒部分が用いられる。そして、この場合、デコード時刻および表示時刻の情報のそれぞれは秒部分とサブ秒部分に分けて取得される。
 f-MP4パケット化部139におけるデコード時刻および表示時刻の情報の取得に関してさらに説明する。f-MP4パケット化部139では、まず、各提示単位(ピクチャ)の先頭のエンコード開始時のタイミングにおける時刻情報として、秒部分である「TSBase int」と、サブ秒部分である「TSBase fr」が取得される。
 図10は、f-MP4パケット化部139内の時間情報取得部150の構成例を示している。この時間情報取得部150は、ラッチ回路151,152と、DTS/PTS算出回路153を有している。32ビットカウンタ134cから出力される32ビットデータ(秒部分)は、ラッチ回路151に入力される。また、17ビットカウンタ134bから出力される17ビットデータ(サブ秒部分)は、ラッチ回路152に入力される。
 ラッチ回路151,152には、各ピクチャのエンコード開始タイミングで発生されるピクチャ・スタートパルス(Picture Start pulse)がラッチパルスとして供給される。そのため、ラッチ回路151からは、提示単位(ピクチャ)毎に、時刻情報(秒部分)「TSBase int」が得られる。また、ラッチ回路152からは、提示単位(ピクチャ)毎に、時刻情報(サブ秒部分)「TSBase fr」が得られる。
 図11(b)は、32ビットデータカウンタ134cと17ビットカウンタ134bのカウント出力の変化を示している。このカウント出力は、図11(a)に示す90KHzのクロックに同期して変化していく。図11(c)は、ラッチ回路151,152にラッチパルスとして供給されるピクチャ・スタートパルスを示している。そして、図11(d)は、ラッチ回路151,152で各提示単位(ピクチャ)に対応して取得される時刻情報「TSBase int/fr」を示している。
 DTS/PTS算出回路153では、ラッチ回路151,152で提示単位(ピクチャ)毎に取得される時刻情報「TSBase int/fr」に基づいて、提示単位(ピクチャ)毎に、表示時刻の情報(PTS)が算出される。この表示時刻情報は、表示時刻情報(秒部分)「PTS int」と、表示時刻情報(サブ秒部分)「PTS fr」とに分けて求められる。この場合、時刻情報「TSBase int/fr」に対して、90KHz精度で設定した固定の遅延量「DelayOffset」を足し合わせることで、表示時刻情報「PTS int/fr」が求められる。
 表示時刻情報「PTS int/fr」は、以下の数式(1)、(2)、(3)で算出される。
 PTS = TSBase_int×90000 + TSBase_fr + DelayOffset  ・・・(1)
 PTS_int = PTS/90000  ・・・(2)
 PTS_fr = Mod(PTS,90000)  ・・・(3)
 また、DTS/PTS算出回路153では、上述したように算出される表示時刻情報「PTS int/fr」に基づいて、提示単位(ピクチャ)毎に、デコード時刻の情報(DTS)が算出される。このデコード時刻情報は、デコード時刻情報(秒部分)「DTS int」と、デコード時刻情報(サブ秒部分)「DTS fr」とに分けて求められる。この場合、表示時刻情報「PTS int/fr」から、Iピクチャ,Pピクチャ,Bピクチャのリオーダリング(re-ordering)によるデコードタイミングのずれを見積もったいくつかの固定オフセット値「DPOffset」を差し引くことで、デコード時刻情報「DTS int/fr」が求められる。
 デコード時刻情報「DTS int/fr」は、以下の数式(4)、(5)、(6)で算出される。
 DTS = PTS-DPOffset  ・・・(4)
 DTS_int = DTS/90000  ・・・(5)
 DTS_fr = Mod(DTS,90000)  ・・・(6)
 f-MP4パケット化部139では、メディアセグメント(MS)に、各提示単位(ピクチャ)のデータに対応付けて、上述したように求められた表示時刻情報「PTS int/fr」とデコード時刻情報「DTS int/fr」が配置される。なお、配置位置および配置方法の詳細については、後述する。
 図8に戻って、MPD発生器141では、MPDファイルが生成され、このMPDファイルを含むパケットが生成される。このパケットは、マルチプレクサ142に供給される。マルチプレクサ142では、各パケットを含むf-MP4方式のストリームが生成される。このf-MP4方式のストリームが放送波に載せられて送信される。
 なお、放送送出システムが、131~137を同期信号生成器、138~141をエンコーダ、142をマルチプレクサという形態の独立した装置の集合体として構成されることも想定される、その場合には、上記同期信号生成器からエンコーダのインタフェースとしては、27MHzクロックを直接接続するのではなく、90KHzクロックのみ、あるいはいわゆるTV同期信号(水平・垂直同期信号)を同期信号生成器で生成してこれをエンコーダへ入力し、エンコーダでも27MHzVCOを上記TV同期信号にロックさせる方法をとることが考えられる。
 [デコード時刻、表示時刻の配置位置および配置方法]
 ここで、メディアセグメント(MS)におけるデコード時刻、表示時刻の配置位置および配置方法の詳細を説明する。図12は、デコード時刻、表示時刻の配置位置および配置方法の第1の例を示している。この第1の例の場合、タイムスタンプ(TimeStamp)ボックスが新規定義され、このタイムスタンプボックスが、最初のムービーフラグメント(Movie Fragment)の前に、配置される。そして、このタイムスタンプボックスに、メディアセグメント内の全てのムービーフラグメントに含まれる提示単位分のデコード時刻の情報「DTS int/fr」および表示時刻情報「PTS int/fr」が、伝送順に、バイナリ形式で記述される。
 このように最初のムービーフラグメントの前に配置されるタイムスタンプボックスに、メディアセグメント内の全てのムービーフラグメントに含まれる提示単位分のデコード時刻および表示時刻の情報が記述されることで、受信側では、その後に伝送されてくる各提示単位に関してデコードや表示のタイミングを予め余裕をもって準備することが可能となる。ただし、この場合、全てのピクチャのエンコードが確定した後でないとタイムスタンプボックスの記述内容が確定しないので、メディアセグメント分の遅延が発生することとなる。
 図13は、デコード時刻、表示時刻の配置位置および配置方法の第2の例を示している。この第2の例の場合、タイムスタンプ(TimeStamp)ボックスが新規定義され、このタイムスタンプボックスが、各ムービーフラグメント(Movie Fragment)の前に、配置される。そして、このタイムスタンプボックスに、続くムービーフラグメントに含まれる提示単位分のデコード時刻の情報「DTS int/fr」および表示時刻情報「PTS int/fr」が、伝送順に、バイナリ形式で記述される。
 このように各ムービーフラグメントの前に配置されるタイムスタンプボックスに、続くムービーフラグメントに含まれる提示単位分のデコード時刻および表示時刻の情報が記述されることで、ムービーセグメント分の遅延で済み、上述の第1の例に比べて、遅延を小さくできる。ただし、タイムスタンプボックスの個数が多くなることから、このタイムスタンプボックスを構成するための情報量が、上述の第1の例に比べて、増加する。
 図14は、デコード時刻、表示時刻の配置位置および配置方法の第3の例を示している。この第3の例の場合、既知のメタ(Meta)ボックスが、最初のムービーフラグメント(Movie Fragment)の前に、配置される。そして、このメタボックスに、メディアセグメント内の全てのムービーフラグメントに含まれる提示単位分のデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」が、伝送順に構造化されて、XMLで記述される。
 この場合、メタボックス内の“hdlr box”の「hdlr_type」として“timestamp”が規定される。そして、“xml box”に、メディアセグメント内の各提示単位のデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」がXMLで記述される。図15は、XML記述例を示している。この場合、メディアセグメント内のサンプル提示分だけのサンプル要素が存在し、各サンブル要素の属性として、ptsint属性、ptsfr属性、dtsint属性、dtsfr属性が並べて記述される。
 このように最初のムービーフラグメントの前に配置されるメタボックスに、メディアセグメント内の全てのムービーフラグメントに含まれる提示単位分のデコード時刻および表示時刻の情報が記述されることで、受信側では、その後に伝送されてくる各提示単位に関してデコードや表示のタイミングを予め余裕をもって準備することが可能となる。ただし、この場合、上述の第1の例と同様に、全てのピクチャのエンコードが確定した後でないとメタボックスの記述内容が確定しないので、メディアセグメント分の遅延が発生することとなる。
 図16は、デコード時刻、表示時刻の配置位置および配置方法の第4の例を示している。この第4の例の場合、メタ(Meta)ボックスが、各ムービーフラグメント(Movie Fragment)の前に、配置される。そして、このメタボックスに、続くムービーフラグメントに含まれる提示単位分のデコード時刻の情報「DTS int/fr」および表示時刻情報「PTS int/fr」が、伝送順に、バイナリ形式で記述される。この場合、各メタボックス内の“hdlr box”の「hdlr_type」として“timestamp”が規定される。そして、“xml box”に、ムービーフラグメント内の各提示単位のデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」がXMLで記述される。
 このように各ムービーフラグメントの前に配置されるメタボックスに、続くムービーフラグメントに含まれる提示単位分のデコード時刻および表示時刻の情報が記述されることで、ムービーセグメント分の遅延で済み、上述の第3の例に比べて、遅延を小さくできる。ただし、メタボックスの個数が多くなることから、このメタボックスを構成するための情報量が、上述の第3の例に比べて、増加する。
 図17は、デコード時刻、表示時刻の配置位置および配置方法の第5の例を示している。この第5の例の場合、各ムービーフラグメント(Movie Fragment)の“moof”ボックス内に、伝送メディア(Video/Audio等)の“traf”ボックスと共に、ヒントトラック(hint track)としての“traf”ボックスが配置され、ヒント情報のデータとしてはサンプル(sample)単位のタイムスタンプ(DTS/PTS)と規定される。そして、“mdat”ブロックには、ヒントサンプル(hint sample)としてのデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」と、メディアサンプル(Media sample)とが交互に配置される。
 このように“mdat”ブロックにデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」とメディアサンプル(Media sample)とが交互に配置されることで、受信側では各メディアサンプル(Media sample)に対するデコード時刻および表示時刻の情報の対応付けが容易となる。しかし、このような配置をする場合、伝送メディア(Video/Audio等)の“traf”ボックスに各メディアサンプルの先頭バイト位置およびサイズ情報の記述が必要となり、規制情報量が増加する。
 図18は、デコード時刻、表示時刻の配置位置および配置方法の第6の例を示している。この第6の例の場合、各ムービーフラグメント(Movie Fragment)の“moof”ボックス内に、伝送メディア(Video/Audio等)の“traf”ボックスと共に、ヒントトラック(hint track)としての“traf”ボックスが配置され、ヒント情報のデータとしてはサンプル(sample)単位のタイムスタンプ(DTS/PTS)と規定される。そして、“mdat”ブロックには、先頭のメディアサンプル(Media sample)の前に、ヒントサンプル(hint sample)として各メディアサンプルに対応したデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」がまとめて配置される。
 このように“mdat”ブロックに、先頭のメディアサンプル(Media sample)の前に、ヒントサンプル(hint sample)として各メディアサンプルに対応したデコード時刻および表示時刻の情報がまとめて配置されることで、伝送メディア(Video/Audio等)の“traf”ボックスには最初のメディアサンプルの先頭バイト位置および全サイズ情報のみを記述するだけで済み、第5の例に比べて、規制情報量を減らすことができる。しかし、このような配置をする場合、ムービーフラグメント分の遅延が発生する。
 図19は、デコード時刻、表示時刻の配置位置および配置方法の第7の例を示している。この第7の例の場合、各ムービーフラグメント(Movie Fragment)の“moof”ボックス内の伝送メディア(Video/Audio等)の“traf”ボックスに、“saiz/saio”ボックスが配置される。そして、サンプル補助情報(Sample Auxiliary information)としてのデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」が、“mdat”ブロックの各メディアサンプル(Media sample)の前に配置される。
 なお、“saiz”ボックスには、各メディアサンプルに対応したサンプル補助情報の位置を示すオフセット値が、リスト化されて配置される。また、“saio”ボックスには、各メディアサンプルに対応したサンプル補助情報のサイズ情報が、リスト化されて配置される。
 このように“mdat”ブロックにサンプル補助情報としてのデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」と、メディアサンプル(Media sample)とが交互に配置されることで、受信側では各メディアサンプル(Media sample)に対するデコード時刻および表示時刻の情報の対応付けが容易となる。しかし、このような配置をする場合、“saiz/saio”ボックスに記述されるオフセット値やサイズ情報の情報量が比較的大きくなる。
 図20は、デコード時刻、表示時刻の配置位置および配置方法の第8の例を示している。この第8の例の場合、各ムービーフラグメント(Movie Fragment)の“moof”ボックス内の“traf”ボックスに、“saiz/saio”ボックスが配置される。そして、サンプル補助情報(Sample Auxiliary information)としてのデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」が、“mdat”ブロックの先頭のメディアサンプル(Media sample)の前にまとめて配置される。
 なお、“saiz”ボックスには、まとめて配置されるサンプル補助情報の位置を示すオフセット値が配置される。また、“saio”ボックスには、まとめて配置されるサンプル補助情報のサイズ情報が配置される。
 このように“mdat”ブロックに、先頭のメディアサンプル(Media sample)の前に、サンプル補助情報(Sample Auxiliary information)としてのデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」がまとめて配置されることで、“saiz/saio”ボックスにはまとめて配置されるサンプル補助情報のオフセット値およびサイズ情報のみを記述するだけで済み、第7の例に比べて、規制情報量を減らすことができる。しかし、このような配置をする場合、ムービーフラグメント分の遅延が発生する。
 [受信機の構成]
 図21は、受信機200の構成例を示している。なお、図示の例においては、オーディオの受信系については、省略されている。この受信機200は、デマルチプレクサ231と、27MHzのクロック(システムクロック)を生成する電圧制御発振器232と、時計部を構成する9ビットカウンタ233a、17ビットカウンタ233bおよび32ビットカウンタ233cと、比較器234を有している。また、この受信機200は、デコードバッファ235と、DTS/PTS抽出器238と、タイミングコントローラ239と、ビデオデコード処理部240を有している。
 デマルチプレクサ231には、放送波に載せて送られてくるf-MP4方式のストリームが供給される。デマルチプレクサ231では、NTP・クロック・リファレンス(NTP_CR)を含むパケットからNTP_CRが抽出される。選局時や電源投入時において、最初に受信した58ビットのNTP_CR は、カウンタ233a、カウンタ233bおよびカウンタ233cからなる58ビットのカウンタに初期値としてセットされる。その後に受信したこのNTP_CRは、比較器234に供給される。
 また、電圧制御発振器232で生成される27MHzのクロックは9ビットカウンタ233aでカウントされ、300分周される。この9ビットカウンタ233aで得られる90KHzのクロックは17ビットカウンタ233bでカウントされ、90000分周される。そして、この17ビットカウンタ233bで得られる1Hzのクロックは32ビットカウンタ233cでカウントされる。32ビットカウンタ233cでは、秒精度の時刻情報(Regenerated UTC)である32ビットのビット出力が得られる。
 9ビットカウンタ233a、17ビットカウンタ233bおよび32ビットカウンタ233cの58ビットのビット出力は、時刻情報としてのシステム・タイム・クロック(STC:System Time Clock)となる。このシステム・タイム・クロックは、比較器234に供給される。比較器234では、例えば、デマルチプレクサ231からNTP_CRが供給されるタイミングで、システム・タイム・クロックがラッチされ、NTP_CRと比較される。
 この比較器234から出力される比較誤差信号は、電圧制御発振器232に制御信号として供給される。ここで、電圧制御発振器232、カウンタ233a,233b,233cおよび比較器234により、PLL(Phase Locked Loop)回路が構成される。そのため、電圧制御発振器232ではNTP_CRに同期した27MHzのクロックが生成される。この27MHzのクロックの周波数は、上述した放送送出システム100の電圧制御発振器133で生成されるクロックの周波数と等しくなり、クロック同期が実現される。
 また、カウンタ233a,233b,233cでは、NTP_CRに同期したシステム・タイム・クロックが生成される。このシステム・タイム・クロックは、上述した放送送出システム100のカウンタ134a,134b,134cで生成されるシステム・タイム・クロックと合ったものとなる。そのため、上述したように、f-MP4ストリームに、ビデオ信号の提示単位(ピクチャ)毎のデコード時刻「DTS int/fr」および表示時刻情報「PTS int/fr」が挿入されていることと相まって、提示同期が実現される。
 また、デマルチプレクサ231では、初期化セグメント(IS)およびメディアセグメント(MS)が抽出される。この場合、初期化セグメント(IS)が抽出された後に、その後に送られてくるメディアセグメント(MS)が抽出される。
 また、デマルチプレクサ231では、初期化セグメント(IS)から復号処理の初期化情報などが取り出されて、デコードバッファ235を通じてビデオデコード処理部240に供給される。ビデオデコード処理部240では、例えば、復号処理の初期化情報に基づいて、初期化が行われる。
 また、デマルチプレクサ231では、抽出された各メディアセグメント(MS)のデパケット化が行われ、各ムービーフラグメント(Movie Fragment)の“mdat”ボックスに含まれている各ピクチャの符号化ビデオデータが取り出される。このように取りされた各ピクチャの符号化ビデオデータは、デコードバッファ235に一時的に蓄積される。この際に、各メディアセグメント(MS)から、DTS/PTS抽出器238で、デコードバッファ235に蓄積される各ピクチャの符号化ビデオデータに対応した、デコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」が抽出される。
 上述したように、カウンタ233a,233b,233cで生成されるシステム・タイム・クロック(時刻情報)は、放送送出システム100のカウンタ134a,134b,134cで生成されるシステム・タイム・クロック(時刻情報)に、同期したものとなる。32ビットカウンタ233cのカウント値(秒部分)と、17ビットカウンタ233bのカウント値(サブ秒部分で、90KHzのクロックのカウント値)は、タイミングコントローラ239に供給される。また、タイミングコントローラ239には、DTS/PTS抽出部238で抽出される、デコードバッファ235に蓄積されている各ピクチャの符号化ビデオデータに対応した、デコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」が供給される。
 タイミングコントローラ239では、ビデオデコード処理部240に対して、デコードバッファ235に蓄積されている各ピクチャの符号化ビデオデータに対する、デコード指示および表示指示が行われる。この場合、タイミングコントローラ239は、それらの指示を、カウンタ233cのカウント値(秒部分)とカウンタ233bのカウント値(サブ秒部分)を参照し、DTS/PTS抽出部238から供給されるデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」に基づいて、それぞれのタイミングで指示を行う。なお、この場合、タイミングコントローラ239は、デコード時刻(DTS)や表示時刻(PTS)になったことの判断を、秒部分とサブ秒部分とのマッチングをそれぞれとることで行う。
 ビデオデコード処理部240では、タイミングコントローラ239からの指示に基づいて、デコードバッファ235に蓄積されている各ピクチャの符号化ビデオデータのデコード処理を行って出力する。この場合、ビデオデコード処理部238は、デコード指示に従ってデコードバッファ235から処理対象のピクチャの符号化ビデオデータを取り込んでデコードし、その後、表示指示に従ってデコード後のビデオデータを出力する。
 図22のフローチャートは、上述した受信機200における同期制御処理の処理手順の一例を示している。受信機200は、ステップST1において、処理を開始する。その後、受信機200は、ステップST2において、メディアセグメント(MS)を受信したか否かを判断する。
 受信したとき、受信機200は、ステップST3において、メディアセグメント(MS)に含まる各提示単位(ピクチャ)のデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」を抽出する。その後、受信機200は、ステップST4の処理に移る。また、ステップST2で受信していないとき、受信機200は、直ちに、ステップST4の処理に移る。
 ステップST4において、受信機200は、デコード時刻(DTS)になったか否かを判断する。デコード時刻(DTS)になったとき、受信機200は、ステップST5において、タイミングコントローラ239からビデオデコード処理部240に対して、対象のピクチャの符号化ビデオデータのデコード指示を行う。その後、受信機200は、ステップST6の処理に移る。また、ステップST4でデコード時刻(DTS)になっていないとき、受信機200は、直ちに、ステップST4の処理に戻る。
 このステップST6において、受信機200は、表示時刻(PTS)になったか否かを判断する。表示時刻(PTS)になったとき、受信機200は、ステップST7において、タイミングコントローラ239からビデオデコード処理部240に対して、対象のピクチャの表示指示、つまりデコード後のビデオデータの出力指示を行う。受信機200は、このステップST7の処理の後、ステップST2の処理に戻る。また、ステップST6で表示時刻(PTS)になっていないとき、受信機200は、直ちに、ステップST6の処理に戻る。
 上述したように、図1に示す送受信システム10においては、放送送出システム100から送信される放送波に載せるストリームに、時刻情報サーバから取得された時刻情報に同期した27MHzのクロックの周波数情報を持つ時刻情報を持つパケットが含まれるものである。そのため、受信側では、この時刻情報に基づいて送信側と同様の27MHzのクロック(システムクロック)を生成でき、クロック同期の実現が可能となる。
 また、図1に示す送受信システム10においては、放送送出システム100から送信される放送波に載せるストリームに含まれるメディアセグメント(伝送メディアパケット)に配置される伝送メディアの提示単位毎のデコード時刻および表示時刻の情報が、時刻情報サーバから取得された時刻情報に同期した27MHzのクロックの周波数情報を含む、時刻情報サーバから取得された時刻情報に同期した時刻情報に基づいて取得されるものである。そのため、受信側では、ストリームに含まれる時刻情報に基づいて生成される27MHzのクロックの周波数情報を含む時刻情報と、伝送メディアの提示単位毎にメディアセグメントに配置されているデコード時刻および表示時刻の情報に基づき、提示同期の実現が可能となる。
 <2.変形例>
 なお、上述実施の形態において、メディアセグメントに配置されるデコード時刻情報「DTS int/fr」および表示時刻情報「PTS int/fr」は、秒部分が32ビットで、サブ秒部分が17ビットである例を示した。しかし、それぞれのビット数は、これに限定されるものではない。例えば、秒部分とサブ秒部分の合計ビット数を8の倍数とすることも考えられる。例えば、秒部分が16ビットでサブ秒部分が16ビット、あるいは秒部分が15ビットでサブ秒部分が17ビットとすることで、合計ビット数を32ビットに収めることができる。
 このようにメディアセグメントに配置される時刻情報の秒部分とサブ秒部分のビット数が設定される場合、受信機200のタイミングコントローラ239では、カウンタ233c,233bの出力のうち、対応する範囲のビット値を用いてマッチングをとることになる。なお、サブ秒部分が17ビットである場合は90KHzの精度であるが、サブ秒部分が16ビットである場合は45KHzの精度となる。
 また、上述実施の形態において、放送波に載せられるストリームがf-MP4方式のストリームである例を示した。本技術は、放送波に載せられるストリームがf-MP4方式のストリームに限定されるものではなく、その他の同等のストリームである場合にも同様に適用可能である。
 また、上述実施の形態においては、放送送出システム100の電圧制御発振器133や受信機200の電圧制御発振器232で27MHzのクロックを生成する例を示した。また、上述実施の形態においては、サブ秒部分が90KHzの周波数のクロックのカウント値で示される例を示した。しかし、本技術は、上述の27MHzや90KHzに必ずしも限定されるものではなく、その他の周波数である場合にも同様に適用できるものである。
 また、本技術は、以下のような構成を取ることもできる。
 (1)時刻情報サーバから取得された時刻情報に同期した第1の周波数のクロックを生成するクロック生成部と、
 上記クロック生成部で生成される上記第1の周波数のクロックの周波数情報を含む、上記時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する時刻情報生成部と、
 伝送メディアを符号化する符号化部と、
 上記符号化部で符号化された伝送メディアを所定の単位で断片化し、各断片を含む伝送メディアパケットを生成するパケット化部と、
 上記パケット化部で生成された伝送メディアパケットおよび上記時刻情報生成部で生成される時刻情報を持つ時刻情報パケットを時分割的に含むストリームを放送波に載せて送信する送信部を備え、
 上記パケット化部は、
 上記時刻情報生成部で生成される時刻情報に基づいて上記伝送メディアの提示単位毎のデコード時刻および表示時刻の情報を取得し、
 上記伝送メディアパケットに、各提示単位のデータに対応付けて、該取得されたデコード時刻および表示時刻の情報を配置する
 送信装置。
 (2)上記時刻情報生成部で生成される時刻情報は、秒部分と第2の周波数のクロックのカウント値で示されるサブ秒部分を有し、
 上記パケット化部は、
 上記デコード時刻および表示時刻の情報のそれぞれを、秒部分と上記第2の周波数のクロックのカウント値で示されるサブ秒部分に分けて取得する
 前記(1)に記載の送信装置。
 (3)上記パケット化部は、
 上記デコード時刻および表示時刻の情報のそれぞれの秒部分とサブ秒部分を、合計ビット数が8の倍数となるように取得する
 前記(2)に記載の送信装置。
 (4)上記第1の周波数は27MHzであり、上記第2の周波数は90KHzである
 前記(2)または(3)に記載の送信装置。
 (5)上記時刻情報生成部は、
 上記クロック生成部で生成される上記27MHzのクロックをカウントして300分周する9ビットカウンタと、該9ビットカウンタの分周出力をカウントして90000分周する17ビットカウンタと、該17ビットカウンタの分周出力をカウントする32ビットカウンタを有する
 前記(4)に記載の送信装置。
 (6)上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
 上記パケット化部は、
 最初のムービーフラグメントの前に、タイムスタンプボックスを配置し、該タイムスタンプボックスに、上記所定数のムービーフラグメント全体に含まれる提示単位分のデコード時刻および表示時刻の情報を記述する
 前記(1)から(5)のいずれかに記載の送信装置。
 (7)上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
 上記パケット化部は、
 各ムービーフラグメントの前にタイムスタンプボックスをそれぞれ配置し、該タイムスタンプボックスに、続くムービーフラグメントに含まれる提示単位分のデコード時刻および表示時刻の情報を記述する
 前記(1)から(5)のいずれかに記載の送信装置。
 (8)上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
 上記パケット化部は、
 最初のムービーフラグメントの前に、メタボックスを配置し、該メタボックスに、上記所定数のムービーフラグメント全体に含まれる提示単位分のデコード時刻および表示時刻の情報を記述する
 前記(1)から(5)に記載の送信装置。
 (9)上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
 上記パケット化部は、
 各ムービーフラグメントの前にメタボックスをそれぞれ配置し、該メタボックスに、続くムービーフラグメントに含まれる提示単位分のデコード時刻および表示時刻の情報を記述する
 前記(1)から(5)のいずれかに記載の送信装置。
 (10)上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
 上記パケット化部は、
 上記ムービーフラグメント毎に、各提示単位のデータの前に、ヒント情報として、デコード時刻および表示時刻の情報を配置する
 前記(1)から(5)のいずれかに記載の送信装置。
 (11)上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
 上記パケット化部は、
 上記ムービーフラグメント毎に、最初の提示単位のデータの前に、ヒント情報として、全提示単位分のデコード時刻および表示時刻の情報を配置する
 前記(1)から(5)のいずれかに記載の送信装置。
 (12)上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
 上記パケット化部は、
 上記ムービーフラグメント毎に、各提示単位のデータの前に、補助情報として、デコード時刻および表示時刻の情報を配置する
 前記(1)から(5)のいずれかに記載の送信装置。
 (13)上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
 上記パケット化部は、
 上記ムービーフラグメント毎に、最初の提示単位のデータの前に、補助情報として、全提示単位分のデコード時刻および表示時刻の情報を配置する
 前記(1)から(5)のいずれかに記載の送信装置。
 (14)時刻情報サーバから取得された時刻情報に同期した第1の周波数のクロックを生成するクロック生成ステップと、
 上記クロック生成ステップで生成される上記第1の周波数のクロックの周波数情報を含む、上記時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する時刻情報生成ステップと、
 伝送メディアを符号化する符号化ステップと、
 上記符号化ステップで符号化された伝送メディアを所定の単位で断片化し、各断片を含む伝送メディアパケットを生成するパケット化ステップと、
 送信部により、上記パケット化ステップで生成された伝送メディアパケットおよび上記時刻情報生成ステップで生成される時刻情報を持つ時刻情報パケットを時分割的に含むストリームを放送波に載せて送信する送信ステップを有し、
 上記パケット化ステップでは、
 上記時刻情報生成ステップで生成される時刻情報に基づいて上記伝送メディアの提示単位毎のデコード時刻および表示時刻の情報を取得し、
 上記伝送メディアパケットに、各提示単位のデータに対応付けて、該取得されたデコード時刻および表示時刻の情報を配置する
 送信方法。
 (15)符号化された伝送メディアが断片化されて得られた断片を持つ伝送メディアパケットおよび第1の周波数のクロックの周波数情報を含む、時刻情報サーバから取得された時刻情報に同期した時刻情報を持つ時刻情報パケットを時分割的に含むストリームが載せられた放送波を受信する受信部と、
 上記時刻情報パケットが持つ時刻情報に基づいて、上記第1の周波数のクロックを生成するクロック生成部と、
 上記クロック生成部で生成される上記第1の周波数のクロックの周波数情報を含む、上記時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する時刻情報生成部を備え、
 上記伝送メディアパケットには、各提示単位のデータに対応付けてデコード時刻および表示時刻の情報が配置されており、
 上記受信部で受信された伝送メディアパケットに含まれる符号化された伝送メディアを、提示単位毎に、該伝送メディアパケットから抽出されるデコード時刻および表示時刻の情報と、上記時刻情報生成部で生成される時刻情報とに基づいて処理する処理部をさらに備える
 受信装置。
 (16)上記時刻情報生成部で生成される時刻情報は、秒部分と第2の周波数のクロックのカウント値で示されるサブ秒部分を有し、
 上記伝送メディアパケットから抽出されるデコード時刻および表示時刻の情報のそれぞれは、秒分と上記第2の周波数のクロックのカウント値で示されるサブ秒部分を有する
 前記(15)に記載の受信装置。
 (17)上記第1の周波数は27MHzであり、上記第2の周波数は90KHzである
 前記(16)に記載の受信装置。
 (18)上記時刻情報生成部は、
 上記クロック生成部で生成される上記27MHzのクロックをカウントして300分周する9ビットカウンタと、該9ビットカウンタの分周出力をカウントして90000分周する17ビットカウンタと、該17ビットカウンタの分周出力をカウントする32ビットカウンタを有する
 前記(17)に記載の受信装置。
 (19)受信部により、符号化された伝送メディアが断片化されて得られた断片を持つ伝送メディアパケットおよび第1の周波数のクロックの周波数情報を含む、時刻情報サーバから取得された時刻情報に同期した時刻情報を持つ時刻情報パケットを時分割的に含むストリームが載せられた放送波を受信する受信ステップと、
 上記時刻情報パケットが持つ時刻情報に基づいて、上記第1の周波数のクロックを生成するクロック生成ステップと、
 上記クロック生成ステップで生成される上記第1の周波数のクロックの周波数情報を含む、上記時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する時刻情報生成ステップを有し、
 上記伝送メディアパケットには、各提示単位のデータに対応付けてデコード時刻および表示時刻の情報が配置されており、
 上記受信ステップで受信された伝送メディアパケットに含まれる符号化された伝送メディアを、提示単位毎に、該伝送メディアパケットから抽出されるデコード時刻および表示時刻の情報と、上記時刻情報生成ステップで生成される時刻情報とに基づいて処理する処理ステップをさらに有する
 受信方法。
 10・・・放送システム
 100・・・放送送出システム
 131・・・NTP/IPインタフェース
 132a,132b・・・32ビットレジスタ
 133・・・電圧制御発振器
 134a・・・9ビットカウンタ
 134b・・・17ビットカウンタ
 134c・・・32ビットカウンタ
 135・・・ビット変換部
 136・・・比較器
 137・・・NTP-CRパケット化部
 138・・・ビデオエンコード処理部
 139・・・f-MP4パケット化部
 140・・・エンコードバッファ
 141・・・MPD発生器
 142・・・マルチプレクサ
 150・・・時間情報取得部
 151,1523・・・ラッチ回路
 153・・・DTS/PTS算出部
 200・・・受信機
 231・・・デマルチプレクサ
 232・・・電圧制御発振器
 233a・・・9ビットカウンタ
 233b・・・17ビットカウンタ
 233c・・・32ビットカウンタ
 234・・・比較器
 235・・・デコードバッファ
 238・・・DTS/PTS抽出器
 239・・・タイミングコントローラ
 240・・・ビデオデコード処理部

Claims (19)

  1.  時刻情報サーバから取得された時刻情報に同期した第1の周波数のクロックを生成するクロック生成部と、
     上記クロック生成部で生成される上記第1の周波数のクロックの周波数情報を含む、上記時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する時刻情報生成部と、
     伝送メディアを符号化する符号化部と、
     上記符号化部で符号化された伝送メディアを所定の単位で断片化し、各断片を含む伝送メディアパケットを生成するパケット化部と、
     上記パケット化部で生成された伝送メディアパケットおよび上記時刻情報生成部で生成される時刻情報を持つ時刻情報パケットを時分割的に含むストリームを放送波に載せて送信する送信部を備え、
     上記パケット化部は、
     上記時刻情報生成部で生成される時刻情報に基づいて上記伝送メディアの提示単位毎のデコード時刻および表示時刻の情報を取得し、
     上記伝送メディアパケットに、各提示単位のデータに対応付けて、該取得されたデコード時刻および表示時刻の情報を配置する
     送信装置。
  2.  上記時刻情報生成部で生成される時刻情報は、秒部分と第2の周波数のクロックのカウント値で示されるサブ秒部分を有し、
     上記パケット化部は、
     上記デコード時刻および表示時刻の情報のそれぞれを、秒部分と上記第2の周波数のクロックのカウント値で示されるサブ秒部分に分けて取得する
     請求項1に記載の送信装置。
  3.  上記パケット化部は、
     上記デコード時刻および表示時刻の情報のそれぞれの秒部分とサブ秒部分を、合計ビット数が8の倍数となるように取得する
     請求項2に記載の送信装置。
  4.  上記第1の周波数は27MHzであり、上記第2の周波数は90KHzである
     請求項2に記載の送信装置。
  5.  上記時刻情報生成部は、
     上記クロック生成部で生成される上記27MHzのクロックをカウントして300分周する9ビットカウンタと、該9ビットカウンタの分周出力をカウントして90000分周する17ビットカウンタと、該17ビットカウンタの分周出力をカウントする32ビットカウンタを有する
     請求項4に記載の送信装置。
  6.  上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
     上記パケット化部は、
     最初のムービーフラグメントの前に、タイムスタンプボックスを配置し、該タイムスタンプボックスに、上記所定数のムービーフラグメント全体に含まれる提示単位分のデコード時刻および表示時刻の情報を記述する
     請求項1に記載の送信装置。
  7.  上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
     上記パケット化部は、
     各ムービーフラグメントの前にタイムスタンプボックスをそれぞれ配置し、該タイムスタンプボックスに、続くムービーフラグメントに含まれる提示単位分のデコード時刻および表示時刻の情報を記述する
     請求項1に記載の送信装置。
  8.  上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
     上記パケット化部は、
     最初のムービーフラグメントの前に、メタボックスを配置し、該メタボックスに、上記所定数のムービーフラグメント全体に含まれる提示単位分のデコード時刻および表示時刻の情報を記述する
     請求項1に記載の送信装置。
  9.  上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
     上記パケット化部は、
     各ムービーフラグメントの前にメタボックスをそれぞれ配置し、該メタボックスに、続くムービーフラグメントに含まれる提示単位分のデコード時刻および表示時刻の情報を記述する
     請求項1に記載の送信装置。
  10.  上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
     上記パケット化部は、
     上記ムービーフラグメント毎に、各提示単位のデータの前に、ヒント情報として、デコード時刻および表示時刻の情報を配置する
     請求項1に記載の送信装置。
  11.  上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
     上記パケット化部は、
     上記ムービーフラグメント毎に、最初の提示単位のデータの前に、ヒント情報として、全提示単位分のデコード時刻および表示時刻の情報を配置する
     請求項1に記載の送信装置。
  12.  上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
     上記パケット化部は、
     上記ムービーフラグメント毎に、各提示単位のデータの前に、補助情報として、デコード時刻および表示時刻の情報を配置する
     請求項1に記載の送信装置。
  13.  上記パケット化部で生成される伝送メディアパケットは、所定数のムービーフラグメントを含むメディアセグメントであり、
     上記パケット化部は、
     上記ムービーフラグメント毎に、最初の提示単位のデータの前に、補助情報として、全提示単位分のデコード時刻および表示時刻の情報を配置する
     請求項1に記載の送信装置。
  14.  時刻情報サーバから取得された時刻情報に同期した第1の周波数のクロックを生成するクロック生成ステップと、
     上記クロック生成ステップで生成される上記第1の周波数のクロックの周波数情報を含む、上記時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する時刻情報生成ステップと、
     伝送メディアを符号化する符号化ステップと、
     上記符号化ステップで符号化された伝送メディアを所定の単位で断片化し、各断片を含む伝送メディアパケットを生成するパケット化ステップと、
     送信部により、上記パケット化ステップで生成された伝送メディアパケットおよび上記時刻情報生成ステップで生成される時刻情報を持つ時刻情報パケットを時分割的に含むストリームを放送波に載せて送信する送信ステップを有し、
     上記パケット化ステップでは、
     上記時刻情報生成ステップで生成される時刻情報に基づいて上記伝送メディアの提示単位毎のデコード時刻および表示時刻の情報を取得し、
     上記伝送メディアパケットに、各提示単位のデータに対応付けて、該取得されたデコード時刻および表示時刻の情報を配置する
     送信方法。
  15.  符号化された伝送メディアが断片化されて得られた断片を持つ伝送メディアパケットおよび第1の周波数のクロックの周波数情報を含む、時刻情報サーバから取得された時刻情報に同期した時刻情報を持つ時刻情報パケットを時分割的に含むストリームが載せられた放送波を受信する受信部と、
     上記時刻情報パケットが持つ時刻情報に基づいて、上記第1の周波数のクロックを生成するクロック生成部と、
     上記クロック生成部で生成される上記第1の周波数のクロックの周波数情報を含む、上記時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する時刻情報生成部を備え、
     上記伝送メディアパケットには、各提示単位のデータに対応付けてデコード時刻および表示時刻の情報が配置されており、
     上記受信部で受信された伝送メディアパケットに含まれる符号化された伝送メディアを、提示単位毎に、該伝送メディアパケットから抽出されるデコード時刻および表示時刻の情報と、上記時刻情報生成部で生成される時刻情報とに基づいて処理する処理部をさらに備える
     受信装置。
  16.  上記時刻情報生成部で生成される時刻情報は、秒部分と第2の周波数のクロックのカウント値で示されるサブ秒部分を有し、
     上記伝送メディアパケットから抽出されるデコード時刻および表示時刻の情報のそれぞれは、秒分と上記第2の周波数のクロックのカウント値で示されるサブ秒部分を有する
     請求項15に記載の受信装置。
  17.  上記第1の周波数は27MHzであり、上記第2の周波数は90KHzである
     請求項16に記載の受信装置。
  18.  上記時刻情報生成部は、
     上記クロック生成部で生成される上記27MHzのクロックをカウントして300分周する9ビットカウンタと、該9ビットカウンタの分周出力をカウントして90000分周する17ビットカウンタと、該17ビットカウンタの分周出力をカウントする32ビットカウンタを有する
     請求項17に記載の受信装置。
  19.  受信部により、符号化された伝送メディアが断片化されて得られた断片を持つ伝送メディアパケットおよび第1の周波数のクロックの周波数情報を含む、時刻情報サーバから取得された時刻情報に同期した時刻情報を持つ時刻情報パケットを時分割的に含むストリームが載せられた放送波を受信する受信ステップと、
     上記時刻情報パケットが持つ時刻情報に基づいて、上記第1の周波数のクロックを生成するクロック生成ステップと、
     上記クロック生成ステップで生成される上記第1の周波数のクロックの周波数情報を含む、上記時刻情報サーバから取得された時刻情報に同期した時刻情報を生成する時刻情報生成ステップを有し、
     上記伝送メディアパケットには、各提示単位のデータに対応付けてデコード時刻および表示時刻の情報が配置されており、
     上記受信ステップで受信された伝送メディアパケットに含まれる符号化された伝送メディアを、提示単位毎に、該伝送メディアパケットから抽出されるデコード時刻および表示時刻の情報と、上記時刻情報生成ステップで生成される時刻情報とに基づいて処理する処理ステップをさらに有する
     受信方法。
PCT/JP2015/057777 2014-04-04 2015-03-16 送信装置、送信方法、受信装置および受信方法 WO2015151781A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014077560 2014-04-04
JP2014-077560 2014-04-04

Publications (1)

Publication Number Publication Date
WO2015151781A1 true WO2015151781A1 (ja) 2015-10-08

Family

ID=54240113

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/057777 WO2015151781A1 (ja) 2014-04-04 2015-03-16 送信装置、送信方法、受信装置および受信方法

Country Status (1)

Country Link
WO (1) WO2015151781A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013192148A (ja) * 2012-03-15 2013-09-26 Nippon Hoso Kyokai <Nhk> 受信装置、クロック復元方法及びプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013192148A (ja) * 2012-03-15 2013-09-26 Nippon Hoso Kyokai <Nhk> 受信装置、クロック復元方法及びプログラム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ASSOCIATION OF RADIO INDUSTRIES AND BUSINESSES DIGITAL HOSO SYSTEM KAIHATSU BUKAI: "Shiryo UHD Saku 4-2-5 Cho Koseisaido Television Hoso System ni Kansuru Chukan Hokoku (Tajuka Hoshiki", 1 December 2013 (2013-12-01), pages 1 - 60, Retrieved from the Internet <URL:http://warp.ndl.go.jp/info:ndljp/pid/8380046/www.soumu.go.jp/main_content/000262096.pdf> [retrieved on 20141217] *
H.265/HEVC TEXTBOOK, 21 October 2013 (2013-10-21), pages 252 - 263 *
KYUNGMO PARK ET AL.: "Study of ISO/IEC CD 23008- 1 MPEG Media Transport", ISO/IEC JTC1/SC29/WG11 MPEG/N13089 SHANGHAI, October 2012 (2012-10-01), China, Retrieved from the Internet <URL:http://mpeg.chiariglione.org/standards/mpeg-h/mpeg-media-transport/study-isoiec-cd-23008-1-mpeg-media-transport> *
SHUICHI AOKI: "Media Transport Technologies for Next Generation Broadcasting Systems", NHK SCIENCE AND TECHNICAL RESEARCH LABORATORIES R&D REPORT, 15 July 2013 (2013-07-15), pages 22 - 31 *

Similar Documents

Publication Publication Date Title
JP6330681B2 (ja) 送信装置、送信方法、受信装置および受信方法
WO2014188960A1 (ja) 送信装置、送信方法、受信装置および受信方法
KR101689616B1 (ko) 미디어 세그먼트 송수신 방법 및 그를 이용한 송수신 장치
JP6302274B2 (ja) 送信装置及び受信装置
JP7279767B2 (ja) 送信方法および送信装置
KR102171652B1 (ko) 송신 장치, 송신 방법, 수신 장치 및 수신 방법
JP2013192148A (ja) 受信装置、クロック復元方法及びプログラム
JP2018182677A (ja) 情報処理装置、情報処理方法、プログラム、および記録媒体製造方法
JP6318953B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP2018182617A (ja) 情報処理装置、情報処理方法、プログラム、および記録媒体製造方法
WO2015151781A1 (ja) 送信装置、送信方法、受信装置および受信方法
JP6908170B2 (ja) 送信方法
JP6743931B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP7371734B2 (ja) 送信方法
JP6504294B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP2017046236A (ja) コンテンツ伝送システム、送信装置、受信装置、送信方法、受信方法、プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15772278

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15772278

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP