WO2018021107A1 - 送信装置、送信方法、受信装置および受信方法 - Google Patents

送信装置、送信方法、受信装置および受信方法 Download PDF

Info

Publication number
WO2018021107A1
WO2018021107A1 PCT/JP2017/026080 JP2017026080W WO2018021107A1 WO 2018021107 A1 WO2018021107 A1 WO 2018021107A1 JP 2017026080 W JP2017026080 W JP 2017026080W WO 2018021107 A1 WO2018021107 A1 WO 2018021107A1
Authority
WO
WIPO (PCT)
Prior art keywords
packet
region
subtitle
display
payload
Prior art date
Application number
PCT/JP2017/026080
Other languages
English (en)
French (fr)
Inventor
塚越 郁夫
高林 和彦
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to CN201780044904.6A priority Critical patent/CN109479154B/zh
Priority to EP21204372.3A priority patent/EP3979654A1/en
Priority to JP2018529802A priority patent/JPWO2018021107A1/ja
Priority to EP17834115.2A priority patent/EP3493548B1/en
Publication of WO2018021107A1 publication Critical patent/WO2018021107A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23614Multiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • H04N7/087Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only
    • H04N7/088Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital
    • H04N7/0884Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection
    • H04N7/0885Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection for the transmission of subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6125Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via Internet

Definitions

  • the present technology relates to a transmission device, a transmission method, a reception device, and a reception method, and more particularly to a transmission device that transmits a document of subtitle text information.
  • subtitle information is transmitted as bitmap data.
  • a text character code that is, on a text basis.
  • font development corresponding to the resolution is performed on the receiving side.
  • the text information has timing information.
  • TTML Timed Text Markup Language
  • W3C World Wide Web Consortium
  • an object of the present technology is to appropriately perform region display end processing on the reception side at the time of live distribution.
  • a packet generation unit that generates a packet in which a text information document of a subtitle having display timing information for each sample is arranged in a payload;
  • a transmission unit for transmitting the packet generated by the packet generation unit;
  • the period of the sample is in the transmitting device that changes in accordance with the change period of the subtitle display.
  • the packet generator generates a packet in which a document of subtitle text information having display timing information for each sample is arranged in the payload.
  • the header of the packet may include a time stamp indicating the start time of the corresponding sample.
  • the packet may be a PES packet.
  • the transmission unit transmits the packet generated by the packet generation unit. The sample period changes in accordance with the change period of the subtitle display.
  • the sample period is changed in accordance with the change period of the subtitle display. Therefore, it is possible to suppress the transmission frequency of the packet in which the text information document of the subtitle is arranged in the payload, and to improve the transmission efficiency.
  • the packet generation unit displays the region display end time information.
  • the document of the subtitle text information supplemented with may further generate a packet arranged in the payload.
  • the packet generation unit sets the region display end time.
  • a control command for providing may further generate a packet placed in the payload.
  • control command may indicate the display end of the region, and the display end time information of the region may be given by a time stamp included in the header of the packet.
  • control command indicates the display state of the region by a count at a predefined time interval, and the display end time information of the region indicates this count when it indicates that the count is the last.
  • the added time offset may be given by adding to the included in the packet header.
  • a subtitle text information document having display timing information for each sample includes a receiving unit that receives a packet arranged in a payload, The sample period changes to match the subtitle display change period.
  • the receiving apparatus further includes a control unit that controls region display based on the text information document of the subtitle arranged in the payload of the packet.
  • the receiving unit receives a packet in which a document of subtitle text information having display timing information for each sample is arranged in the payload.
  • the sample period changes in accordance with the subtitle display change period.
  • the control unit controls the region display based on the text information document of the subtitle arranged in the payload of the packet.
  • the sample period changes in accordance with the change period of the subtitle display. Therefore, the reception frequency of the packet in which the document of the text information of the subtitle is arranged in the payload is less than that in the case where the sample period is fixed, and the processing load on the reception unit and the control unit is reduced.
  • the control unit when there is no region display end time information in the text information document of the subtitle arranged in the payload of the received packet, the control unit is arranged in the payload of the packet received thereafter. Further, the display end of the region may be controlled based on the display end time information of the region supplemented in the text information document of the subtitle. Thereby, the display end process of the region at the time of live distribution can be appropriately performed.
  • the control unit when there is no display end time information of the region in the text information document of the subtitle arranged in the payload of the received packet, the control unit is arranged in the payload of the packet received thereafter.
  • the display end of the region may be controlled based on the control command for giving the display end time information of the region. Thereby, the display end process of the region at the time of live distribution can be appropriately performed.
  • a packet generation unit that generates a packet in which a text information document of a subtitle having display timing information for each sample is arranged in a payload;
  • a transmission unit for transmitting the packet generated by the packet generation unit;
  • the packet generator A control command for giving the display end time of the region is in the transmitting apparatus that further generates a packet arranged in the payload.
  • the packet generator generates a packet in which a document of subtitle text information having display timing information for each sample is arranged in the payload.
  • the header of the packet may include a time stamp indicating the start time of the corresponding sample.
  • the packet may be a PES packet.
  • the transmission unit transmits the packet generated by the packet generation unit.
  • the sample may be fixed. Further, for example, the sample may be changed in accordance with the change period of the subtitle display.
  • the document display end time information may not be included in the text information document of the subtitle placed in the payload of the packet generated by the packet generator.
  • the packet generation unit further generates a packet in which a control command for giving the display end time of the region is arranged in the payload.
  • a packet in which a control command for giving a display end time of a region is arranged in the payload is further generated. Therefore, the display end time information of the region can be given to the receiving side, and the display end processing of the region on the receiving side at the time of live distribution can be appropriately performed.
  • a receiving unit that receives a packet in which a document of text information of a subtitle having display timing information for each sample is arranged in a payload;
  • a control unit for controlling the region display based on the text information document of the subtitle arranged in the payload of the packet;
  • the control unit ends the display of the region placed in the payload of the subsequently received packet.
  • the receiving apparatus controls the end of display of the region based on a control command for giving time information.
  • the receiving unit receives a packet in which a document of subtitle text information having display timing information for each sample is arranged in the payload.
  • the control unit controls the region display based on the text information document of the subtitle arranged in the payload of the packet.
  • the control unit determines the region based on the control command placed in the payload of the subsequently received packet. The display end is controlled.
  • the display of the region arranged in the payload of the subsequently received packet is performed.
  • the display end of the region is controlled based on a control command for giving end time information. Therefore, the display end process of the region at the time of live distribution can be appropriately performed.
  • TTML document corresponding to each event It is a figure which shows an example of a TTML layer and a container layer in the case of a variable sample and live subtitle delivery. It is a figure which shows the structural example of transport stream TS. It is a block diagram which shows the structural example of a television receiver. It is a figure which shows another example of the TTML layer and container layer in the case of subtitle delivery in a fixed sample and live.
  • FIG. 1 shows a configuration example of a transmission / reception system 10 as an embodiment.
  • the transmission / reception system 10 includes a broadcast transmission system 100 and a television receiver 200.
  • the broadcast transmission system 100 transmits an MPEG-2 transport stream (hereinafter simply referred to as “transport stream”) TS as a multiplexed stream on a broadcast wave.
  • transport stream an MPEG-2 transport stream
  • the transport stream TS has a subtitle stream as well as a video stream and an audio stream.
  • the video stream is composed of video PES packets in which encoded image data is arranged in the payload.
  • the audio stream is composed of audio PES packets in which encoded audio data is arranged in the payload.
  • the subtitle stream includes subtitle text information having display timing information, and in this embodiment, a subtitle PES packet in which a segment packet having a TTML document (TTML document) is arranged in the payload. This subtitle PES packet is generated for each sample.
  • TTML document TTML document
  • each sample is a fixed sample (Fixed Sample) whose period is fixed as conventionally known, or, as newly proposed, the period is variable according to the change period of the subtitle display.
  • a variable sample (Variable Sample) is used.
  • each subtitle display corresponding to each sample is called an event.
  • variable samples the transmission frequency of the subtitle PES packet can be suppressed, and the transmission efficiency can be increased.
  • the display end time information of the region is given to the receiving side by the first method or the second method.
  • the reception side can appropriately perform the region display end processing on the reception side at the time of live distribution.
  • a PES packet in which a segment packet having a TTML document supplemented with region end time information is inserted into a payload is generated and transmitted.
  • This first method is limited to a sample unit in the case of a fixed sample.
  • a PES packet in which a segment packet having a control command for giving display end time information of a region is inserted into a payload is newly generated and transmitted.
  • the television receiver 200 receives the transport stream TS transmitted from the broadcast transmission system 100 by broadcast waves.
  • this transport stream TS has a subtitle stream together with a video stream and an audio stream.
  • the subtitle stream is composed of subtitle PES packets in which segment packets having a TTML document are arranged in the payload.
  • the television receiver 200 receives a subtitle PES packet for each sample before the start of the sample period corresponding to each sample.
  • the television receiver 200 controls the region display based on the TTML document included in the subtitle PES packet.
  • the television receiver 200 receives a PES packet less frequently than a fixed sample, and the processing load is reduced.
  • live subtitle delivery when the first method is adopted, the television receiver 200 displays the display end time information of the region included in the subtitle PES packet received after the start of the region display. The display end of the region is controlled based on the TTML document in which is filled.
  • the television receiver 200 gives the display end time information of the region included in the subtitle PES packet received after the start of the region display. Based on the control command, the display end time information of the region is acquired, and the display end of the region is controlled. Thereby, the television receiver 200 can appropriately perform the display end process of the region at the time of live distribution.
  • FIG. 2 shows a configuration example of the stream generation unit 110 of the broadcast transmission system 100.
  • the stream generation unit 110 includes a control unit 111, a video encoder 112, an audio encoder 113, a text format conversion unit 114, a subtitle encoder 115, and a TS formatter (multiplexer) 116.
  • the control unit 111 is configured to include, for example, a CPU (Central Processing Unit), and controls the operation of each unit of the stream generation unit 110.
  • the video encoder 112 receives the image data DV, encodes the image data DV, and generates a video stream (PES stream) composed of video PES packets having encoded image data in the payload.
  • the audio encoder 113 receives the audio data DA, encodes the audio data DA, and generates an audio stream (PES stream) composed of audio PES packets having encoded audio data.
  • the text format conversion unit 114 inputs text data (character code) DT as subtitle information, and obtains text information of a subtitle having a predetermined format having display timing information.
  • text information for example, TTML or a derived format of TTML can be considered. In this embodiment, TTML is assumed.
  • FIG. 3 shows an example of the structure of a TTML document (file).
  • TTML is described on an XML basis.
  • TTML has a head and a body. In the head, there are metadata, styling, layout, and the like.
  • the metadata includes title information and copyright information.
  • a region identifier and color information, font information, position information, and the like are arranged in association therewith.
  • background color information, alignment information, and the like are arranged in association with the region identifier.
  • the body includes subtitle text data to be displayed in association with the region identifier, region display start / end timing information, and the like.
  • the subtitle encoder 115 generates a segment packet (timed text subtitling segment: TT subtitling) segment) including a TTML document obtained by the text format conversion unit 114. Then, the subtitle encoder 115 generates a subtitle stream (PES stream) composed of subtitle PES packets in which the segment packets are arranged in the payload.
  • TT subtitling timed text subtitling segment
  • PES stream subtitle stream
  • the subtitle encoder 115 generates a subtitle PES packet for each sample. Further, in the case of live subtitle distribution (Live subtitle delivery), the subtitle encoder 115 cannot insert the region display end time in the TTML document included in the subtitle PES packet because the region display end time is unknown at first. Leave blank.
  • the subtitle encoder 115 generates a new subtitle PES packet in order to give the region display end time information to the receiving side.
  • the subtitle encoder 115 When the first method is adopted, the subtitle encoder 115 generates a segment packet including a TTML document in which region end time information is supplemented, and newly generates a subtitle PES packet in which the segment packet is arranged in the payload.
  • the subtitle encoder 115 When the second method is adopted, the subtitle encoder 115 generates a segment packet including a control command for giving region display end time information, and newly generates a subtitle PES packet in which the segment packet is arranged in the payload.
  • the subtitle encoder 115 generates a segment packet including download information for downloading a font file designated by the TTML font designation information, and arranges it in the payload of the PES packet.
  • FIG. 4A shows an example of the structure of a subtitle PES packet (PES_packet).
  • PES_startcode_prefix a fixed pattern “0x000001” is arranged.
  • An 8-bit field of “stream_id” indicates a stream identifier.
  • the 16-bit field of “PES_packet_length” indicates the number of subsequent bytes as the length (size) of the PES packet.
  • PES_packet_length there is a field of “Optional_PES_header ()”. In this field, time stamps of PTS, DTS, and the like are arranged. After this field, there is a field “PES_packet_data_byte”. This field corresponds to the PES payload. In this field, “PES_data_byte_field ()” for containerizing data is arranged.
  • FIG. 4B shows a structure example of “PES_data_byte_field ()”.
  • the 8-bit field of “data_identifier” indicates an identifier for identifying the type of data in the container portion. Since the conventional subtitle (in the case of a bitmap) is supposed to be indicated by “0x20”, the text can be identified by a new value, for example, “0x21”.
  • the 8-bit field of “subtitle_stream_id” indicates an identifier for identifying the type of the subtitle stream.
  • a new value for example, “0x01”, can be distinguished from the conventional subtitle stream “0x00” that transmits a bitmap.
  • FIG. 5 (a) shows an example of the definition of subtitle segment type (subtitle segment_type).
  • “0xA0” indicates a segment packet for transmitting a TTML document (TML document).
  • “0xA1” indicates a segment packet for transmitting a compressed TTML document.
  • “0xA2” indicates a segment packet for transmitting a control command (control command).
  • “0xA3” indicates a segment packet for transmitting font download information (font download information).
  • segments having different values of subtitle segment types can be arranged in one PES payload (PESPEpayload).
  • FIG. 6 shows an example of the structure of a subtitle stream (PES stream) composed of subtitle PES packets.
  • a subtitle PES packet a subtitle PES packet that includes only a segment packet that transmits a TTML document, a subtitle PES packet that includes only a segment packet that transmits a control command, and a subtitle PES that includes both of them. There are packets.
  • FIG. 7 shows an example of the structure of a TTML document segment (TTL_document_segment ()).
  • FIG. 8 shows the contents of main information in the structural example.
  • the 8-bit field of “sync_byte” is a unique word indicating the start of a segment.
  • An 8-bit field of “segment_type” is a segment type and indicates a segment type. In the case of this TTML document segment, “segment_type” is set to “0xA0” (see FIG. 5A).
  • the 8-bit field “number_of_regions” indicates the number of regions included in the TTML document. There are as many 8-bit fields of “region_id” as there are regions.
  • the field “region_id” indicates region identification information (id).
  • the region identification information (id) corresponds to the region identification information (id) in the TTML document.
  • the 16-bit field of “latency” indicates a delay amount of time until the subtitle display (subtitle display) transmitted with the byte data of “segment_data_field ()” from the PTS is started.
  • the value is, for example, 10 times the actual amount of time (in seconds).
  • a 16-bit field of “document_version_number” indicates update of information of the TTML document. If an update is made, the value is incremented by one.
  • the 16-bit field of “segment_length” indicates the number of subsequent bytes as the length (size) of the TTML document segment. After “segment_length”, there is a field “segment_data_field ()”. This field corresponds to the payload of the segment (segment packet), and the entire TTML document is arranged in this field.
  • FIG. 9 shows an example of the structure of the control command segment (control_command_segment ()).
  • FIG. 10 shows the contents of main information in the structural example.
  • the 8-bit field of “sync_byte” is a unique word indicating the start of a segment.
  • An 8-bit field of “segment_type” is a segment type and indicates a segment type. In the case of this control command segment, “segment_type” is set to “0xA2” (see FIG. 5A).
  • the 8-bit field of“ number_of_regions ” indicates the number of regions. As many as the number of regions, an 8-bit field of “region_id” and an 8-bit field of “command” exist repeatedly.
  • the field “region_id” indicates region identification information (id).
  • the “latency” field represents the command execution timing as a delay offset from the PTS. The value is indicated by a value 10 times, and “1” represents an execution delay of 0.1 seconds and “16” represents an execution delay of 1.6 seconds.
  • the “command” field indicates a command. For example, “0x01” indicates the end of region display. “0x02” indicates that information related to the region display is deleted from the buffer. “0x03” indicates the region display state by a count at a predetermined time interval (time ⁇ count).
  • time count indicates a time count (a count value at a fixed interval). It is an ascending value from “0x0001”, and the special value “0xFFFF” indicates the end of display.
  • time_offset indicates a time offset (time_offset) from the time stamp (timestamp) of the display end command.
  • FIG. 11 shows an example of the structure of font download information / segment (font_download_information_segment ()).
  • FIG. 12 shows the contents of main information in the structural example.
  • the 8-bit field of “sync_byte” is a unique word indicating the start of a segment.
  • An 8-bit field of “segment_type” is a segment type and indicates a segment type. In the case of this control command segment, “segment_type” is set to “0xA3” (see FIG. 5A).
  • a 16-bit field of “original_network_id” indicates identification information of a network through which download data is transmitted.
  • a 16-bit field of “transport_stream_id” indicates identification information of an individual transport stream.
  • a 16-bit field of “service_id” indicates identification information of a service to be downloaded. In the case of a download target common to distribution media, the font file may be sent by another transport stream instead of its own transport stream. "Original_network_id”, “transport_stream_id”, and “service_id” information can be specified.
  • the 8-bit field of “font_file_id” indicates the identification number assigned to the font file.
  • a 24-bit field of “ISO — 639_language_code” indicates a code consisting of three characters for identifying a language. For example, “jpn” indicates Japanese and “eng” indicates English.
  • the 8-bit field of “font_group_id” indicates the identification information of the font group and corresponds to the generic family of TTML.
  • An 8-bit field of “font_name_id” indicates an individual font name.
  • the 8-bit field “url_type” indicates the server type. For example, “0x01” indicates a font server (uncompressed URL), “0x02” indicates a general server (uncompressed URL), “0x11” indicates a font server (compressed URL), and “0x12” indicates a general server Indicates a server (compressed URL).
  • the 8-bit field of “url_string_length” indicates the length (size) of the character code portion indicating the character string of the subsequent URL in bytes. The character code is placed in the “char” field.
  • TTML layer TTML layer
  • container layer Container layer
  • the region A (Region A) information exists in the TTML layer.
  • This region A is displayed from the timing of T1 to the timing of T3. That is, for this region A, the start time “start time” corresponding to the time after the delay amount LTa from Tf1 reflecting the PTS is T1, and the end time “end time” is T3.
  • T3 since it is a subtitle distribution by the pre-author, T3 is known in advance, and the TTML document is associated with the region A from the beginning, in addition to “start time” being T1, the end time “ It is described that “end time” is T3.
  • region B information exists in the TTML layer.
  • This region B is displayed from the timing of T2 to the timing of T5 with some overlap with the above-mentioned region A in time. That is, for this region B, the start time “start time” corresponding to the time point after the delay amount LTb from Tf1 reflecting the PTS is T2, and the end time “end time” is T5.
  • T5 since it is subtitle distribution by the pre-author, T5 is known in advance, and the TTML document is associated with region B from the beginning, in addition to “start ⁇ time” being T2, the end time “ It is described that “end time” is T5.
  • region C (Region C) information exists in the TTML layer.
  • This region C is displayed from the timing of T4 to the timing of T6 with a slight overlap with the region B described above. That is, for this region C, the start time “start time” corresponding to the time point after the delay amount LTc from Tf3 reflecting the PTS is T4, and the end time “end time” is T6.
  • T6 since subtitle delivery is performed by the pre-author, T6 is known in advance, and the TTML document is associated with the region C from the beginning, in addition to “start time” being T4, the end time “ It is described that “end time” is T6.
  • PTS Presentation Time Stamp
  • the value of PTS (Presentation Time Stamp) inserted in the header of each PES packet is the start time (Sample start time) of the corresponding sample.
  • Each PES packet is transmitted so as to reach the receiving side at the latest before the start time of the corresponding sample.
  • a PES packet in which a segment packet of a TTML document including the region information of event 1 (event 1) is arranged in the payload is transmitted so as to reach the receiving side before time Tf1.
  • a PES packet in which a segment packet of a TTML document including region information of event 2 (event 2) is arranged in the payload is transmitted so as to reach the receiving side before time Tf2.
  • Event 1 a segment packet of a TTML document including the region information of event 1
  • event 2 region information of event 2
  • FIGS. 14A to 14E schematically show the contents of a TTML document corresponding to each event.
  • FIG. 14A shows a TTML document corresponding to event 1 (event 1).
  • This TTML document includes region B information as well as region A information.
  • FIG. 14B is a TTML document corresponding to event 2 (event 2).
  • This TTML document includes only region B information.
  • FIG. 14 (c) is a TTML document corresponding to event 3 (event 3).
  • This TTML document includes region C information as well as region B information.
  • FIG. 14D is a TTML document corresponding to event 4 (event 4).
  • This TTML document includes region C information as well as region B information.
  • FIG. 14E shows a TTML document corresponding to event 5 (event 5).
  • This TTML document includes only the information of region C.
  • FIG. 15 shows an example of the TTML layer and the container layer in that case.
  • the region A (Region A) information exists in the TTML layer. This region A is displayed from the timing of T1 to finally the timing of T3, but T3 cannot be known in advance. Therefore, in the TTML document, in relation to the region A, first, only “start time” is described as T1, and the end time “end time” is blanked. T1 corresponds to a time point after the delay amount LTa from Tf1 reflecting PTS.
  • region B information exists in the TTML layer. This region B overlaps with the above-described region A somewhat and is displayed from the timing of T2 to the timing of T5 in the end, but T5 cannot be known in advance. Therefore, in the TTML document, in relation to the region B, at first, only “start time” is described as T2, and the end time “end time” is blanked. T2 corresponds to a time point after the delay amount Ltb from Tf1 reflecting PTS.
  • region C (Region C) information exists in the TTML layer.
  • the region C overlaps with the above-described region B somewhat in time and is displayed from the timing of T4 to the timing of T6 finally, but T6 cannot be known in advance. Therefore, in the TTML document, in relation to the region C, at first, only “start ⁇ time” is described as T4, and the end time “end time” is blanked.
  • T4 corresponds to a time point after the delay amount LTc from Tf3 reflecting the PTS.
  • PTS Presentation Time Stamp
  • the value of PTS (Presentation Time Stamp) inserted in the header of each PES packet is the start time (Sample start time) of the corresponding sample.
  • Each PES packet is generated and transmitted so as to reach the receiving side at least at the start time of the corresponding sample.
  • a PES packet in which a segment packet of a TTML document including the region information of event 1 (event 1) is arranged in the payload is transmitted so as to reach the receiving side before time Tf1.
  • a PES packet in which a segment packet of a TTML document including region information of event 2 (event 2) is arranged in the payload is transmitted so as to reach the receiving side before time Tf2.
  • Event 1 a segment packet of a TTML document including the region information of event 1
  • event 2 region information of event 2
  • FIGS. 16A to 16E schematically show the contents of a TTML document corresponding to each event.
  • FIG. 16A shows a TTML document corresponding to event 1 (event 1).
  • This TTML document includes region B information as well as region A information.
  • FIG. 16B shows a TTML document corresponding to event 2 (event 2).
  • This TTML document includes only region B information.
  • FIG. 16C is a TTML document corresponding to event 3 (event 3).
  • This TTML document includes region C information as well as region B information.
  • FIG. 16D is a TTML document corresponding to event 4 (event 4).
  • This TTML document includes region C information as well as region B information.
  • FIG. 16E shows a TTML document corresponding to event 5 (event 5).
  • This TTML document includes only the information of region C.
  • a control command command for giving display end time information of the region so as to reach the receiving side before those times.
  • PTS Presentation Time Stamp
  • the display end time of the region is given by PTS.
  • FIG. 17 shows an example of a TTML layer and a container layer in that case.
  • the region A (Region A) information exists in the TTML layer.
  • This region A is displayed from the timing of T1 to the timing of T3. That is, for this region A, the start time “start time” is T1, and the end time “end time” is T3.
  • T3 since it is a subtitle distribution by the pre-author, T3 is known in advance, and the TTML document is associated with the region A from the beginning, in addition to “start time” being T1, the end time “ It is described that “end time” is T3.
  • region B information exists in the TTML layer.
  • This region B is displayed from the timing of T2 to the timing of T5 with some overlap with the above-mentioned region A in time. That is, for this region B, the start time “start time” is T2, and the end time “end time” is T5.
  • T5 since it is subtitle distribution by the pre-author, T5 is known in advance, and the TTML document is associated with region B from the beginning, in addition to “start ⁇ time” being T2, the end time “ It is described that “end time” is T5.
  • region C (Region C) information exists in the TTML layer.
  • This region C is displayed from the timing of T4 to the timing of T6 with a slight overlap with the region B described above. That is, for this region C, the start time “start time” is 42 and the end time “end time” is T6.
  • T6 since subtitle delivery is performed by the pre-author, T6 is known in advance, and the TTML document is associated with the region C from the beginning, in addition to “start time” being T4, the end time “ It is described that “endTtime” is T6.
  • T1 to T2, T2 to T3, T3 to T4, T4 to T5, and T5 to T6 are each defined as one sample.
  • Event 1 the sample from T1 to T2 constitutes event 1 (event 1)
  • the sample from T2 to T3 constitutes event 2 (event 2)
  • the sample from T3 to T4 constitutes event 3 (event 3)
  • Event 4 is composed of samples from T4 to T5
  • event 5 is composed of samples from T5 to T6.
  • the value of PTS (Presentation Time Stamp) inserted in the header of each PES packet is the start time (Sample start time) of the corresponding sample.
  • Each PES packet is transmitted so as to reach the receiving side at the latest before the start time of the corresponding sample.
  • the PES packet in which the segment packet of the TTML document including the region information of event 1 (event 1) is arranged in the payload is transmitted so as to reach the receiving side before time T1.
  • a PES packet in which a segment packet of a TTML document including the region information of event 2 (event 2) is arranged in the payload is transmitted so as to reach the receiving side before time T2.
  • FIG. 18A to 18E schematically show the contents of a TTML document corresponding to each event.
  • FIG. 18A shows a TTML document corresponding to event 1 (event 1).
  • This TTML document includes only the information of region A.
  • FIG. 18B is a TTML document corresponding to event 2 (event 2).
  • This TTML document includes region B information as well as region A information.
  • FIG. 18C shows a TTML document corresponding to event 3 (event 3).
  • This TTML document includes only region B information.
  • FIG. 18D shows a TTML document corresponding to event 4 (event 4).
  • This TTML document includes region C information as well as region B information.
  • FIG. 18 (e) is a TTML document corresponding to event 5 (event 5).
  • FIG. 19 shows an example of a TTML layer and a container layer in that case.
  • the region A (Region A) information exists in the TTML layer. This region A is displayed from the timing of T1 to finally the timing of T3, but T3 cannot be known in advance. Therefore, in the TTML document, in relation to the region A, first, only “start time” is described as T1, and the end time “end time” is blanked.
  • region B information exists in the TTML layer. This region B overlaps with the above-described region A somewhat and is displayed from the timing of T2 to the timing of T5 in the end, but T5 cannot be known in advance. Therefore, in the TTML document, in relation to the region B, at first, only “start time” is described as T2, and the end time “end time” is blanked.
  • region C (Region C) information exists in the TTML layer.
  • the region C overlaps with the above-described region B somewhat in time and is displayed from the timing of T4 to the timing of T6 finally, but T6 cannot be known in advance. Therefore, in the TTML document, in relation to the region C, at first, only “start ⁇ time” is described as T4, and the end time “end time” is blanked.
  • PTS Presentation Time Stamp
  • the value of PTS (Presentation Time Stamp) inserted in the header of each PES packet is the start time (Sample start time) of the corresponding sample.
  • Each PES packet is generated and transmitted so as to reach the receiving side at the latest before the start time of the corresponding sample.
  • a PES packet in which a segment packet of a TTML document including the region information of event 1 (event 1) is arranged in the payload is transmitted so as to reach the receiving side before time Tf1.
  • a PES packet in which a segment packet of a TTML document including region information of event 2 (event 2) is arranged in the payload is transmitted so as to reach the receiving side before time Tf2.
  • Event 1 a segment packet of a TTML document including the region information of event 1
  • event 2 region information of event 2
  • the segment packet of the TTML document in which the display end time information of the region is supplemented is arranged in the payload.
  • a PES packet is generated and transmitted. That is, when the display end times of the regions A, B, and C are known, the TTML document is updated.
  • T1 to T2, T2 to T3p, T3p to T3, T3 to T4, T4 to T5p, T5p to T5, T5 to T6p, and T6p to T6 are defined as one sample, respectively. Is done.
  • the samples from T3p to T3, the samples from T4 to T5p, and the samples from T6p to T6 are samples for updating to a TTML document supplemented with region display end time information.
  • the sample from T1 to T2 constitutes event 1 (event 1)
  • the sample from T2 to T3p constitutes event 2 (event 2)
  • the sample from T3p to T3 constitutes event 3 (event 3)
  • Samples from T3 to T4 constitute event 4 (event 4)
  • samples from T4 to T5p constitute event 5 (event 5)
  • samples from T5p to T5 constitute event 6 (event 6)
  • T5 Event 7 (event 7) is composed of the T6p sample
  • event 8 (event 8) is composed of the T6p to T6 samples.
  • the value of PTS (Presentation Time Stamp) inserted in the header of each PES packet is the start time (Sample start time) of the corresponding sample.
  • FIG. 20A to 20H schematically show the contents of the TTML document corresponding to each event.
  • FIG. 20A shows a TTML document corresponding to event 1 (event 1).
  • This TTML document includes only the information of region A.
  • FIG. 20B is a TTML document corresponding to event 2 (event 2).
  • This TTML document includes region B information as well as region A information.
  • FIG. 20C shows a TTML document corresponding to event 3 (event 3).
  • This TTML document includes region B information as well as region A information.
  • the TTML document is supplemented with the display end time information of the region A as shown by being surrounded by a broken-line rectangular frame.
  • FIG. 20D is a TTML document corresponding to event 4 (event 4).
  • This TTML document includes only region B information.
  • FIG. 20 (e) is a TTML document corresponding to event 5 (event 5).
  • This TTML document includes region C information as well as region B information.
  • FIG. 20 (f) is a TTML document corresponding to event 6 (event 6).
  • This TTML document includes region C information as well as region B information.
  • the TTML document is supplemented with the display end time information of the region B as shown by being surrounded by a broken-line rectangular frame.
  • FIG. 20 (g) is a TTML document corresponding to event 7 (event 7).
  • This TTML document includes only the information of region C.
  • FIG. 20 (h) is a TTML document corresponding to event 8 (event 8).
  • This TTML document includes only the information of region C.
  • the TTML document is supplemented with the display end time information of the region C as shown by being surrounded by a broken-line rectangular frame.
  • FIG. 21 shows an example of a TTML layer and a container layer in that case.
  • the region A (Region A) information exists in the TTML layer. This region A is displayed from the timing of T1 to finally the timing of T3, but T3 cannot be known in advance. Therefore, in the TTML document, in relation to the region A, first, only “start time” is described as T1, and the end time “end time” is blanked.
  • region B information exists in the TTML layer. This region B overlaps with the above-described region A somewhat and is displayed from the timing of T2 to the timing of T5 in the end, but T5 cannot be known in advance. Therefore, in the TTML document, in relation to the region B, at first, only “start time” is described as T2, and the end time “end time” is blanked.
  • region C (Region C) information exists in the TTML layer.
  • the region C overlaps with the above-described region B somewhat in time and is displayed from the timing of T4 to the timing of T6 finally, but T6 cannot be known in advance. Therefore, in the TTML document, in relation to the region C, at first, only “start ⁇ time” is described as T4, and the end time “end time” is blanked.
  • T1 to T2, T2 to T3, T3 to T4, T4 to T5, and T5 to T6 are each defined as one sample.
  • an event is configured for each sample. Therefore, the sample from T1 to T2 constitutes event 1 (event 1), the sample from T2 to T3 constitutes event 2 (event 2), the sample from T3 to T4 constitutes event 3 (event 3), Event 4 (event 4) is composed of samples from T4 to T5, and event 5 (event 5) is composed of samples from T5 to T6.
  • the value of PTS (Presentation Time Stamp) inserted in the header of each PES packet is the start time (Sample start time) of the corresponding sample.
  • Each PES packet is transmitted so as to reach the receiving side at least at the start time of the corresponding sample.
  • the PES packet in which the segment packet of the TTML document including the region information of event 1 (event 1) is arranged in the payload is transmitted so as to reach the receiving side before time T1.
  • a PES packet in which a segment packet of a TTML document including the region information of event 2 (event 2) is arranged in the payload is transmitted so as to reach the receiving side before time T2.
  • FIG. 22A shows a TTML document corresponding to event 1 (event 1).
  • FIG. 22B is a TTML document corresponding to event 2 (event 2).
  • This TTML document includes region B information as well as region A information.
  • FIG. 22 (c) is a TTML document corresponding to event 3 (event 3).
  • This TTML document includes only region B information.
  • FIG. 22D is a TTML document corresponding to event 4 (event 4).
  • This TTML document includes region C information as well as region B information.
  • FIG. 22 (e) is a TTML document corresponding to event 5 (event 5).
  • the value of PTS (Presentation Time Stamp) inserted in the header of the PES packet indicates the display end time of the region. Accordingly, in this case, the display end time of the region is given by PTS.
  • the generated PES packets are transmitted sequentially.
  • the value of PTS (Presentation Time Stamp) inserted in the header of the PES packet indicates, for example, the transmission time of the PES packet.
  • the display end time of the region is given by adding the time offset added to the count to the PTS when indicating that the count is the last.
  • FIG. 23 shows an example of a TTML layer and a container layer in that case.
  • the arranged PES packets are sequentially generated and transmitted.
  • control commands including “1”, “2”, “3”, “4”, “5”, and “FFFF” as count TC at intervals of 1 second after time T2 has elapsed.
  • the TS formatter 116 transport-packets and multiplexes the video stream generated by the video encoder 112, the audio stream generated by the audio encoder 113, and the subtitle stream generated by the subtitle encoder 115, A transport stream TS as a multiplexed stream is obtained.
  • the operation of the stream generation unit 110 shown in FIG. 2 will be briefly described.
  • the image data DV is supplied to the video encoder 112.
  • the image data DV is encoded, and a video stream (PES stream) including a video PES packet having encoded image data in a payload is generated.
  • This video stream is supplied to the TS formatter 116.
  • the audio data DA is supplied to the audio encoder 113.
  • the audio encoder 113 encodes the audio data DA, and generates an audio stream (PES stream) composed of audio PES packets having encoded audio data. This audio stream is supplied to the TS formatter 116.
  • text data (character code) DT as subtitle information is supplied to the text format conversion unit 114.
  • This text format conversion unit 114 obtains subtitle text information in a predetermined format having display timing information, here, TTML. This TTML is supplied to the subtitle encoder 115.
  • a segment packet (timed text subtitling segment: TT subtitling segment) including a TTML document obtained by the text format conversion unit 114 is generated. Then, in the subtitle encoder 115, the segment packet is arranged in the payload and a subtitle PES packet is generated.
  • the subtitle encoder 115 In the subtitle encoder 115, a subtitle PES packet is generated for each sample. In addition, in the case of live subtitle distribution (Live subtitle delivery), the subtitle encoder 115 cannot insert the region display end time in the TTML document included in the subtitle PES packet because the region display end time is unknown at first. It is set to a blank state.
  • the subtitle encoder 115 After that, when the region display end time is known, the subtitle encoder 115 generates a new subtitle PES packet in order to give or specify the region display end time information to the receiving side.
  • a segment packet including download information for downloading a font file specified by the TTML font specification information is generated and placed in the payload of the PES packet.
  • the subtitle encoder 115 generates a subtitle stream (PES stream) composed of the above-described subtitle PES packets. This subtitle stream is supplied to the TS formatter 116. In the TS formatter 116, the stream generated by each encoder is converted into a transport packet and multiplexed to generate a transport stream TS as a multiplexed stream.
  • PES stream subtitle stream
  • FIG. 24 shows a configuration example of the transport stream TS.
  • a video PES packet “Video PES” that is a PES packet of the video stream identified by PID1.
  • an audio PES packet “Audio PES” that is a PES packet of the audio stream identified by PID2.
  • a subtitle PES packet “Subtitle PES” that is a PES packet of the subtitle stream identified by PID3.
  • the PES packet is composed of a PES header (PES header) and a PES payload (PES payload).
  • PES header PES header
  • PES payload PES payload
  • a DTS / PTS time stamp is inserted in the PES header
  • a video encoded stream encoded image data
  • audio PES packet a PTS time stamp is inserted in the PES header
  • an audio encoded stream encoded audio data
  • a PTS time stamp is inserted in the PES header, and the PES payload includes a segment packet (timed text subtitling segment with TTML document, control command, font download information, etc. : TT subtitling segment) is inserted.
  • the transport stream TS includes a PMT (Program Map Table) as PSI (Program Specific Information).
  • PSI Program Specific Information
  • the PMT includes a program descriptor (Program Descriptor) that describes information related to the entire program.
  • the PMT includes an elementary stream loop having information related to each elementary stream.
  • Information such as a packet identifier (PID) is arranged in each loop.
  • FIG. 25 illustrates a configuration example of the television receiver 200.
  • the television receiver 200 includes a receiving unit 201, a TS analysis unit (demultiplexer) 202, a video decoder 203, a video superimposing unit 204, a panel drive circuit 205, and a display panel 206.
  • the television receiver 200 includes an audio decoder 207, an audio output circuit 208, a speaker 209, and a subtitle decoder 210.
  • the television receiver 200 also includes a CPU 221, a flash ROM 222, a DRAM 223, an internal bus 224, a remote control receiver 225, and a remote control transmitter 226.
  • the CPU 221 controls the operation of each part of the television receiver 200.
  • the flash ROM 222 stores control software and data.
  • the DRAM 223 constitutes a work area for the CPU 221.
  • the CPU 221 develops software and data read from the flash ROM 222 on the DRAM 223 to activate the software, and controls each unit of the television receiver 200.
  • the remote control receiving unit 225 receives the remote control signal (remote control code) transmitted from the remote control transmitter 226 and supplies it to the CPU 221.
  • the CPU 221 controls each part of the television receiver 200 based on this remote control code.
  • the CPU 221, flash ROM 222, and DRAM 223 are connected to the internal bus 224.
  • the receiving unit 201 receives the transport stream TS transmitted from the broadcast transmission system 100 on a broadcast wave.
  • the transport stream TS includes a video stream, an audio stream, and a subtitle stream.
  • the TS analysis unit 202 extracts video, audio, and subtitle streams from the transport stream TS.
  • the audio decoder 207 performs a decoding process on the audio stream extracted by the TS analysis unit 202 to obtain audio data.
  • the audio output circuit 208 performs necessary processing such as D / A conversion and amplification on the audio data, and supplies the audio data to the speaker 209.
  • the video decoder 203 performs a decoding process on the video stream extracted by the TS analysis unit 202 to obtain image data.
  • the subtitle decoder 210 performs a decoding process on the subtitle stream extracted by the TS analysis unit 202, and obtains bitmap data of each region to be superimposed on the image data.
  • the subtitle decoder 210 extracts the segment packet from the segment packet including the TTML document, and obtains bitmap data of each region based on the TTML document.
  • the subtitle decoder 210 extracts the segment packet from the segment packet including the control command for giving the display end time information of the region, and sends this control command to the CPU 221.
  • the CPU 221 acquires the display end time of the region based on this control command.
  • the CPU 221 acquires the PTS inserted in the header of the PES packet as the display end time of the region.
  • the CPU 221 adds the time offset added to this count to the PTS inserted in the header of the PES packet when indicating that the count is the last. Is obtained as the display end time.
  • the subtitle decoder 210 extracts the segment packet from the segment packet including the font download information, and sends the font download information to the CPU 221.
  • the CPU 221 acquires information for downloading at least a font file designated by the font designation information of the TTML document from the font download segment.
  • the video superimposing unit 204 superimposes the bitmap data of each region obtained from the subtitle decoder 210 on the image data obtained by the video decoder 203. In this case, the video superimposing unit 204 superimposes the bitmap data of each region for the period from the display start time to the display end time.
  • the display start time is obtained from the display start time information of the region included in the TTML document.
  • the display end time is obtained from the display end time information of the region included in the TTML document in the case of subtitle distribution (Pre-authored subtitle delivery) by the pre-author (see FIGS. 13 and 17).
  • the display end time in the case of live subtitle delivery (Live subtitle delivery), when the first method is adopted, it is obtained from the display end time information of the region included in the updated TTML document.
  • the second method when the second method is adopted, it is obtained from the control command (see FIGS. 15, 21, and 23).
  • the panel drive circuit 205 drives the display panel 206 based on the display image data obtained by the video superimposing unit 204.
  • the display panel 206 includes, for example, an LCD (Liquid Crystal Display), an organic EL display (organic electroluminescence display), and the like.
  • the receiving unit 201 receives the transport stream TS transmitted from the broadcast transmission system 100 on the broadcast wave.
  • the transport stream TS includes a video stream, an audio stream, and a subtitle stream.
  • the transport stream TS is supplied to the TS analysis unit 202.
  • the TS analysis unit 202 extracts video, audio, and subtitle streams from the transport stream TS.
  • the video stream (PES stream) extracted by the TS analysis unit 202 is supplied to the video decoder 203.
  • the video stream is decoded and image data is obtained. This image data is supplied to the video superimposing unit 204.
  • the subtitle stream (PES stream) extracted by the TS analysis unit 202 is supplied to the subtitle decoder 210.
  • decoding processing is performed on the subtitle stream, and bitmap data of each region to be superimposed on the image data is obtained.
  • the segment packet is extracted from the segment packet including the control command for giving the display end time information of the region, and the control command is sent to the CPU 221.
  • the display end time of the region is acquired based on this control command.
  • the subtitle decoder 210 extracts the segment packet from the segment packet including the font download information, and sends this font download information to the CPU 221.
  • the CPU 221 acquires information for downloading at least a font file designated by the font designation information of the TTML document from the font download segment. This information is used as necessary to obtain the font file.
  • the bitmap data of each region output from the subtitle decoder 210 is supplied to the video superimposing unit 204.
  • the bitmap data of each region output from the subtitle decoder 210 is superimposed on the image data obtained by the video decoder 203. In this case, the bitmap data of each region is superimposed for the period from the display start time to the display end time.
  • the display start time is obtained from the display start time information of the region included in the TTML document.
  • the display end time is obtained from the display end time information of the region included in the TTML document in the case of subtitle distribution by the pre-author (see FIGS. 13 and 17).
  • the display end time is obtained from the display end time information of the region included in the updated TTML document when the first method is adopted in the case of live subtitle distribution (see FIG. 19). ), Obtained from the control command when the second method is employed (see FIGS. 15, 21, and 23).
  • Display image data obtained by the video superimposing unit 204 is supplied to the panel drive circuit 205.
  • the panel drive circuit 205 drives the display panel 206 based on the display video data. As a result, an image in which each region is superimposed is displayed on the display panel 206.
  • the broadcast transmission system 100 generates a subtitle PES packet in which a segment packet having a TTML document is arranged in a payload for each sample. For example, it is changed according to the change period of the subtitle display. Therefore, the transmission frequency of the subtitle PES packet can be suppressed, and the transmission efficiency can be increased.
  • the broadcast transmission system 100 can detect the TTML layer (first method) or the container layer (second Method) to send region display end time information. Therefore, region display end time information can be given to the reception side, and the region display end processing can be appropriately performed on the reception side.
  • the broadcast transmission system 100 sends a control command for giving, for example, region display end time information when the display end time of the region is known.
  • a PES packet in which the segment packet is inserted in the payload is newly generated and transmitted (second method). Therefore, even when the sample period is fixed, the display end time information of the region can be favorably given to the receiving side, and the display end processing of the region can be appropriately performed on the receiving side.
  • TTML is used as text information of a subtitle having a predetermined format having display timing information.
  • present technology is not limited to this, and other timed text information having information equivalent to TTML may be used.
  • a TTML derivative format may be used.
  • the transmission / reception system 10 including the broadcast transmission system 100 and the television receiver 200 is shown, but the configuration of the transmission / reception system to which the present technology can be applied is not limited thereto.
  • a configuration of a set top box and a monitor in which the television receiver 200 is connected by a digital interface such as HDMI (High-Definition Multimedia Interface) may be used.
  • HDMI High-Definition Multimedia Interface
  • HDMI High-Definition Multimedia Interface
  • the container multiplexed stream
  • the container is an MPEG-2 transport stream.
  • the present technology can be similarly applied when the multiplexed stream is an MMT stream or a DASH / ISOBMFF stream.
  • this technique can also take the following structures.
  • a packet generation unit that generates a packet in which a document of subtitle text information having display timing information for each sample is arranged in a payload;
  • a transmission unit for transmitting the packet generated by the packet generation unit;
  • the period of the sample changes in accordance with the change period of the subtitle display.
  • the header of the packet includes a time stamp indicating a start time of the corresponding sample.
  • the packet is a PES packet.
  • the packet generator When there is no region display end time information in the text information document of the subtitle arranged in the payload of the packet generated by the packet generation unit, The packet generator The transmission device according to any one of (1) to (3), further generating a packet in which a document of the text information of the subtitle supplemented with display end time information of the region is arranged in a payload. (5) When there is no region display end time information in the text information document of the subtitle arranged in the payload of the packet generated by the packet generation unit, The packet generator The transmission device according to any one of (1) to (3), further generating a packet in which a control command for giving display end time information of the region is arranged in a payload.
  • the above control command indicates the end of displaying the region,
  • the transmission device according to (5) wherein the display end time information of the region is given by a time stamp included in a header of the packet.
  • the control command indicates the display state of the region by counting at a predefined time interval,
  • the display end time information of the region is given by adding the time offset added to the count to a time stamp included in the header of the packet when indicating that the count is last.
  • a packet generation step in which a packet generation unit generates a packet in which a document of text information of a subtitle having display timing information for each sample is arranged in a payload;
  • the transmission unit has a transmission step of transmitting the packet generated by the packet generation unit,
  • the above sample period changes in accordance with the subtitle display change period.
  • a reception unit that receives a packet in which a document of text information of a subtitle having display timing information for each sample is arranged in a payload; The sample period changes to match the subtitle display change period.
  • a receiving apparatus further comprising: a control unit that controls region display based on a text information document of the subtitle arranged in a payload of the packet.
  • the reception unit includes a reception step of receiving a packet in which a document of text information of a subtitle having display timing information for each sample is arranged in a payload, The sample period changes to match the subtitle display change period.
  • the receiving method further comprising a control step in which the control unit controls region display based on the text information document of the subtitle arranged in the subtitle.
  • a packet generation unit that generates a packet in which a document of subtitle text information having display timing information for each sample is arranged in a payload; A transmission unit for transmitting the packet generated by the packet generation unit; When there is no region display end time information in the text information document of the subtitle placed in the payload of the packet generated by the packet generator, The packet generator A transmission apparatus that further generates a packet in which a control command for giving display end time information of the region is arranged in a payload. (14) The transmission device according to (13), wherein the period of the sample is fixed. (15) The transmission apparatus according to (13), wherein the period of the sample changes in accordance with a change period of subtitle display.
  • a packet generation step in which a packet generation unit generates a packet in which a document of text information of a subtitle having display timing information for each sample is arranged in a payload;
  • the transmission unit has a transmission step of transmitting the packet generated by the packet generation unit,
  • a control command for giving the display end time information of the region is A transmission method that further generates packets placed in the.
  • a receiving unit that receives a packet in which a document of text information of a subtitle having display timing information for each sample is arranged in a payload;
  • a control unit for controlling the region display based on the text information document of the subtitle arranged in the payload of the packet;
  • the control unit ends the display of the region placed in the payload of the subsequently received packet.
  • a receiving device that controls the end of display of the region based on a control command for providing time information.
  • the control unit has a control step of controlling the region display based on the text information document of the subtitle arranged in the payload of the packet;
  • the display of the region arranged in the payload of the received packet is ended.
  • a receiving method for controlling the display end of the region based on a control command for giving time information.
  • the main feature of this technology is that it is possible to suppress the transmission frequency of the subtitle PES packet including the TTML document and increase the transmission efficiency by changing the sample period according to the change period of the subtitle display. (See FIG. 17). Also, the main feature of this technology is that in the case of live subtitle distribution, when the display end time of the region is known, the display end time information of the region is sent by the TTML layer or the container layer, so that the reception side The display end process can be appropriately performed (see FIGS. 15, 19, 21, and 23).

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

サブタイトルのテキスト情報のドキュメントの伝送効率を高める。 サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを生成して送信する。サンプルの期間を、サブタイトルの表示の変化期間に合わせて変化させる。サブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットの送信頻度を抑制でき、伝送効率を高めることが可能となる。

Description

送信装置、送信方法、受信装置および受信方法
 本技術は、送信装置、送信方法、受信装置および受信方法に関し、特に、サブタイトルのテキスト情報のドキュメントを送信する送信装置等に関する。
 従来、例えば、DVB(Digital Video Broadcasting)の放送などでは、サブタイトルの情報をビットマップデータで送信する運用が行われている。近時、サブタイトルの情報をテキストの文字コードで、つまりテキストベースで送信することが提案されている。この場合、受信側で解像度に応じたフォント展開がなされる。
 また、サブタイトルの情報をテキストベースで送信する場合、テキスト情報にタイミング情報を持たせることが提案されている。このテキスト情報として、例えば、W3C(World Wide Web Consortium)でTTML(Timed Text Markup Language)が提唱されている(特許文献1参照)。
特開2012-169885号公報
 本技術の目的は、サブタイトルのテキスト情報のドキュメントの伝送効率を高めることにある。あるいは、本技術の目的は、ライブ配信時における受信側でのリージョンの表示終了処理を適切に行い得るようにすることにある。
 本技術の概念は、
 サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを生成するパケット生成部と、
 上記パケット生成部で生成されたパケットを送信する送信部を備え、
 上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化する
 送信装置にある。
 本技術において、パケット生成部により、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットが生成される。例えば、パケットのヘッダには、対応するサンプルの開始時刻を示すタイムスタンプが含まれる、ようにされてもよい。また、例えば、パケットは、PESパケットである、ようにされてもよい。送信部により、パケット生成部で生成されたパケットが送信される。サンプルの期間がサブタイトルの表示の変化期間に合わせて変化するようにされる。
 このように本技術においては、サンプルの期間がサブタイトルの表示の変化期間に合わせて変化するようにされる。そのため、サブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットの送信頻度を抑制でき、伝送効率を高めることが可能となる。
 なお、本技術において、例えば、パケット生成部で生成されたパケットのペイロードに配置されたサブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、パケット生成部は、リージョンの表示終了時刻情報が補填されたサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットをさらに生成する、ようにされてもよい。これにより、受信側にリージョンの表示終了時刻情報を与えることができ、ライブ配信時における受信側でのリージョンの表示終了処理を適切に行い得る。
 また、本技術において、例えば、パケット生成部で生成されたパケットのペイロードに配置されたサブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、パケット生成部は、リージョンの表示終了時刻を与えるための制御コマンドがペイロードに配置されたパケットをさらに生成する、ようにされてもよい。これにより、受信側にリージョンの表示終了時刻情報を与えることができ、ライブ配信時における受信側でのリージョンの表示終了処理を適切に行い得る。
 この場合、例えば、制御コマンドは、リージョンの表示終了を示し、リージョンの表示終了時刻情報は、パケットのヘッダに含まれるタイムスタンプで与えられる、ようにされてもよい。また、例えば、この場合、制御コマンドは、リージョンの表示状態を予め定義された時間間隔でのカウントで示し、リージョンの表示終了時刻情報は、カウントが最後であることを示すときに、このカウントに付加されているタイムオフセットを、パケットのヘッダに含まれるに加算することで与えられる、ようにされてもよい。
 また、本技術の他の概念は、
 サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを受信する受信部を備え、
 上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化し、
 上記パケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントに基づいてリージョン表示を制御する制御部をさらに備える
 受信装置にある。
 本技術において、受信部により、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットが受信される。サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化している。制御部により、パケットのペイロードに配置されたサブタイトルのテキスト情報のドキュメントに基づいてリージョン表示が制御される。
 このように本技術においては、サンプルの期間がサブタイトルの表示の変化期間に合わせて変化するようにされている。そのため、サブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットの受信頻度はサンプルの期間が固定の場合と比べて少なく、受信部および制御部の処理負荷が軽減される。
 なお、本技術において、例えば、受信されたパケットのペイロードに配置されたサブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、制御部は、その後に受信されたパケットのペイロードに配置されたサブタイトルのテキスト情報のドキュメントに補填されているリージョンの表示終了時刻情報に基づいてリージョンの表示終了を制御する、ようにされてもよい。これにより、ライブ配信時におけるリージョンの表示終了処理を適切に行い得る。
 また、本技術において、例えば、受信されたパケットのペイロードに配置されたサブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、制御部は、その後に受信されたパケットのペイロードに配置されたリージョンの表示終了時刻情報を与えるための制御コマンドに基づいてリージョンの表示終了を制御する、ようにされてもよい。これにより、ライブ配信時におけるリージョンの表示終了処理を適切に行い得る。
 また、本技術の他の概念は、
 サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを生成するパケット生成部と、
 上記パケット生成部で生成されたパケットを送信する送信部を備え、
 上記パケット生成部で生成されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、
 上記パケット生成部は、
 上記リージョンの表示終了時刻を与えるための制御コマンドがペイロードに配置されたパケットをさらに生成する
 送信装置にある。
 本技術において、パケット生成部により、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットが生成される。例えば、パケットのヘッダには、対応するサンプルの開始時刻を示すタイムスタンプが含まれる、ようにされてもよい。また、例えば、パケットは、PESパケットである、ようにされてもよい。送信部により、パケット生成部で生成されたパケットが送信される。また、例えば、サンプルは、固定とされている、ようにされてもよい。また、例えば、サンプルは、サブタイトルの表示の変化期間に合わせて変化する、ようにされてもよい。
 パケット生成部で生成されたパケットのペイロードに配置されたサブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないことがある。例えば、ライブ配信の場合であって、リージョンの表示終了時刻が不明の場合などである。この場合、パケット生成部により、リージョンの表示終了時刻を与えるための制御コマンドがペイロードに配置されたパケットがさらに生成される。
 このように本技術においては、リージョンの表示終了時刻を与えるための制御コマンドがペイロードに配置されたパケットがさらに生成されるものである。そのため、受信側にリージョンの表示終了時刻情報を与えることができ、ライブ配信時における受信側でのリージョンの表示終了処理を適切に行い得る。
 また、本技術の他の概念は、
 サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを受信する受信部と、
 上記パケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントに基づいてリージョン表示を制御する制御部を備え、
 上記制御部は、上記受信されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、その後に受信されたパケットのペイロードに配置されたリージョンの表示終了時刻情報を与えるための制御コマンドに基づいて上記リージョンの表示終了を制御する
 受信装置にある。
 本技術において、受信部により、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットが受信される。制御部により、パケットのペイロードに配置されたサブタイトルのテキスト情報のドキュメントに基づいてリージョン表示が制御される。制御部では、受信されたパケットのペイロードに配置されたサブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、その後に受信されたパケットのペイロードに配置された制御コマンドに基づいてリージョンの表示終了が制御される。
 このように本技術においては、受信されたパケットのペイロードに配置されたサブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、その後に受信されたパケットのペイロードに配置されたリージョンの表示終了時刻情報を与えるための制御コマンドに基づいてリージョンの表示終了が制御されるものである。そのため、ライブ配信時におけるリージョンの表示終了処理を適切に行い得る。
 本技術によれば、サブタイトルのテキスト情報のドキュメントの伝送効率を高めることができる。あるいは、本発明によれば、ライブ配信時における受信側でのリージョンの表示終了処理を適切に行うことができる。なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。
実施の形態としての送受信システムの構成例を示すブロック図である。 放送送出システムのストリーム生成部の構成例を示すブロック図である。 TTML構造を説明するための図である。 サブタイトルPESパケットの構造例と、「PES_data_byte_field()」の構造例を示す図である。 サブタイトル・セグメント・タイプの定義の一例を示す図である。 サブタイトルPESパケットにより構成されるサブタイトルストリーム(PESストリーム)の構造例を示す図である。 TTMLドキュメント・セグメントの構造例を示す図である。 TTMLドキュメント・セグメントの構造例における主要な情報の内容を示す図である。 制御コマンド・セグメントの構造例を示す図である。 制御コマンド・セグメントの構造例における主要な情報の内容を示す図である。 フォントダウンロード情報・セグメントの構造例を示す図である。 フォントダウンロード情報・セグメントの構造例における主要な情報の内容を示す図である。 固定サンプルで、かつ、プリオーサーでのサブタイトル配信の場合におけるTTMLレイヤおよびコンテナレイヤの一例を示す図である。 各イベントに対応したTTMLドキュメントの内容を概略的に示す図である。 固定サンプルで、かつ、ライブでのサブタイトル配信の場合におけるTTMLレイヤおよびコンテナレイヤの一例を示す図である。 各イベントに対応したTTMLドキュメントの内容を概略的に示す図である。 可変サンプルで、かつ、プリオーサーでのサブタイトル配信の場合におけるTTMLレイヤおよびコンテナレイヤの一例を示す図である。 各イベントに対応したTTMLドキュメントの内容を概略的に示す図である。 可変サンプルで、かつ、ライブでのサブタイトル配信の場合におけるTTMLレイヤおよびコンテナレイヤの一例を示す図である。 各イベントに対応したTTMLドキュメントの内容を概略的に示す図である。 可変サンプルで、かつ、ライブでのサブタイトル配信の場合におけるTTMLレイヤおよびコンテナレイヤの一例を示す図である。 各イベントに対応したTTMLドキュメントの内容を概略的に示す図である。 可変サンプルで、かつ、ライブでのサブタイトル配信の場合におけるTTMLレイヤおよびコンテナレイヤの一例を示す図である。 トランスポートストリームTSの構成例を示す図である。 テレビ受信機の構成例を示すブロック図である。 固定サンプルで、かつ、ライブでのサブタイトル配信の場合におけるTTMLレイヤおよびコンテナレイヤの他の一例を示す図である。
 以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明を以下の順序で行う。
 1.実施の形態
 2.変形例
 <1.実施の形態>
 [送受信システムの構成例]
 図1は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、放送送出システム100とテレビ受信機200により構成されている。
 放送送出システム100は、多重化ストリームとしてのMPEG-2トランスポートストリーム(以下、単に、「トランスポートストリーム」という)TSを、放送波に載せて送信する。
 トランスポートストリームTSは、ビデオストリーム、オーディオストリームと共に、サブタイトルストリームを有している。ビデオストリームは、ペイロードに符号化画像データが配置されたビデオPESパケットにより構成される。オーディオストリームは、ペイロードに符号化音声データが配置されたオーディオPESパケットにより構成される。
 サブタイトルストリームは、表示タイミング情報を持つサブタイトルのテキスト情報、この実施の形態ではTTMLのドキュメント(TTMLドキュメント)を持つセグメントパケットがペイロードに配置されたサブタイトルPESパケットにより構成される。このサブタイトルPESパケットは、サンプル毎に生成される。
 ここで、各サンプルは、従来知られているように、その期間が固定である固定サンプル(Fixed Sample)、あるいは、新規提案するように、サブタイトルの表示の変化期間に合わせてその期間が可変である可変サンプル(Variable Sample)とされる。なお、この実施の形態において、各サンプルに対応したサブタイトル表示のそれぞれをイベントと呼ぶことにする。可変サンプルの場合、サブタイトルPESパケットの送信頻度を抑制でき、伝送効率を高めることが可能となる。
 プリオーサー(Pre-authored)でのサブタイトル配信(Pre-authored subtitle delivery)の場合、リージョン表示終了時刻がわかるので、TTMLドキュメントに、リージョンの表示終了時刻の挿入が可能である。しかし、ライブ(Live)でのサブタイトル配信(Live subtitle delivery)の場合、表示開始当初はリージョン表示終了時刻が不明なので、TTMLドキュメントに、リージョンの表示終了時刻の挿入が不可能である。
 この実施の形態において、リージョン表示終了時刻がわかったとき、第1の方法、あるいは第2の方法で、受信側にリージョンの表示終了時刻情報を与える。これにより、受信側では、ライブ配信時における受信側でのリージョンの表示終了処理を適切に行い得る。
 第1の方法では、リージョン終了時刻情報が補填されたTTMLドキュメントを持つセグメントパケットがペイロードに挿入されたPESパケットを新たに生成して送信する。この第1の方法は、固定サンプルの場合にはそのサンプル単位に限定される。第2の方法では、リージョンの表示終了時刻情報を与えるための制御コマンドを持つセグメントパケットがペイロードに挿入されたPESパケットを新たに生成して送信する。
 テレビ受信機200は、放送送出システム100から放送波で送られてくるトランスポートストリームTSを受信する。このトランスポートストリームTSは、上述したように、ビデオストリーム、オーディオストリームと共に、サブタイトルストリームを有している。サブタイトルストリームは、上述したように、TTMLドキュメントを持つセグメントパケットがペイロードに配置されたサブタイトルPESパケットにより構成されている。
 テレビ受信機200は、各サンプルに対応して、そのサンプルの期間の開始前に、そのサンプルのためのサブタイトルPESパケットを受信する。テレビ受信機200は、そのサブタイトルPESパケットに含まれるTTMLドキュメントに基づいてリージョン表示を制御する。テレビ受信機200は、各サンプルが可変サンプルの場合には、固定サンプルに比べてPESパケットの受信頻度が少なく、処理負荷が軽減される。
 ライブでのサブタイトル配信(Live subtitle delivery)の場合、第1の方法が採用されているとき、テレビ受信機200は、リージョン表示の開始後に受信されたサブタイトルPESパケットに含まれるリージョンの表示終了時刻情報が補填されたTTMLドキュメントに基づいて、リージョンの表示終了を制御する。また、同様の場合において、第2の方法が採用されているとき、テレビ受信機200は、リージョン表示の開始後に受信されたサブタイトルPESパケットに含まれている、リージョンの表示終了時刻情報を与えるための制御コマンドに基づいて、リージョンの表示終了時刻情報を取得し、リージョンの表示終了を制御する。これにより、テレビ受信機200は、ライブ配信時におけるリージョンの表示終了処理を適切に行い得る。
 [放送送出システムのストリーム生成部の構成例]
 図2は、放送送出システム100のストリーム生成部110の構成例を示している。このストリーム生成部110は、制御部111と、ビデオエンコーダ112と、オーディオエンコーダ113と、テキストフォーマット変換部114と、サブタイトルエンコーダ115と、TSフォーマッタ(マルチプレクサ)116を有している。
 制御部111は、例えば、CPU(Central Processing Unit)を備えた構成とされており、ストリーム生成部110の各部の動作を制御する。ビデオエンコーダ112は、画像データDVを入力し、この画像データDVに対して符号化を施し、ペイロードに符号化画像データを持つビデオPESパケットにより構成されるビデオストリーム(PESストリーム)を生成する。オーディオエンコーダ113は、音声データDAを入力し、この音声データDAに対して符号化を施し、符号化音声データを持つオーディオPESパケットにより構成されるオーディオストリーム(PESストリーム)を生成する。
 テキストフォーマット変換部114は、サブタイトル情報としてのテキストデータ(文字コード)DTを入力し、表示タイミング情報を持つ所定フォーマットのサブタイトルのテキスト情報を得る。このテキスト情報として、例えば、TTMLあるいはTTMLの派生フォーマットが考えられるが、この実施の形態においてはTTMLであるとする。
 図3は、TTMLのドキュメント(ファイル)の構造例を示している。TTMLは、XMLベースで記載される。TTMLには、ヘッド(head)と、ボディ(body)が存在する。そして、ヘッド(head)には、メタデータ(metadata)、スタイリング(styling)、レイアウト(layout)などが存在する。
 メタデータには、タイトルの情報、コピーライトの情報などが含まれている。スタイリングには、リージョンの識別子と、それに関連付けてカラー情報、フォント情報、位置情報などが配置されている。レイアウトには、リージョンの識別子に関連付けてバックグラウンドカラー情報、アラインメント情報などが配置されている。ボディには、リージョンの識別子に関連付けて表示すべきサブタイトルのテキストデータ、リージョンの表示開始、終了のタイミング情報などが配置されている。
 図2に戻って、サブタイトルエンコーダ115は、テキストフォーマット変換部114で得られるTTMLのドキュメントを含むセグメントパケット(タイムド・テキスト・サブタイトリング・セグメント:TT subtitling segment)を生成する。そして、サブタイトルエンコーダ115は、ペイロードにそのセグメントパケットを配置したサブタイトルPESパケットにより構成されるサブタイトルストリーム(PESストリーム)を生成する。
 サブタイトルエンコーダ115は、サブタイトルPESパケットを、サンプル毎に生成する。また、サブタイトルエンコーダ115は、ライブでのサブタイトル配信(Live subtitle delivery)の場合、最初は、リージョン表示終了時刻が不明なので、サブタイトルPESパケットに含まれるTTMLドキュメントにリージョンの表示終了時刻を挿入できないので、ブランク状態とする。
 その後、リージョン表示終了時刻がわかったとき、サブタイトルエンコーダ115は、リージョン表示終了時刻情報を受信側に与えるために、新たなサブタイトルPESパケットを生成する。第1の方法を採用するとき、サブタイトルエンコーダ115は、リージョン終了時刻情報が補填されたTTMLドキュメントを含むセグメントパケットを生成し、それをペイロードに配置したサブタイトルPESパケットを新たに生成する。第2の方法を採用するとき、サブタイトルエンコーダ115は、リージョンの表示終了時刻情報を与えるための制御コマンドを含むセグメントパケットを生成し、それをペイロードに配置したサブタイトルPESパケットを新たに生成する。
 また、サブタイトルエンコーダ115は、TTMLのフォント指定情報で指定されているフォントのファイルをダウンロードするためのダウンロード情報を含むセグメントパケットを生成し、それをPESパケットのペイロードに配置する。
 図4(a)は、サブタイトルPESパケット(PES_packet)の構造例を示している。「PES_startcode_prefix」の24ビットフィールドには、“0x000001”の固定パターンが配置される。「stream_id」の8ビットフィールドは、ストリーム識別子を示す。サブタイトルPESパケットの場合、「private stream1を示す値である“10111101”とされる。「PES_packet_length」の16ビットフィールドは、PESパケットの長さ(サイズ)として以降のバイト数を示す。
 「PES_packet_length」の後に、「Optional_PES_header()」のフィールドが存在する。このフィールドには、PTS,DTSのタイムスタンプなどが配置される。このフィールドの後に、「PES_packet_data_byte」のフィールドが存在する。このフィールドが、PESペイロードに相当する。このフィールドに、データをコンテナするための「PES_data_byte_field()」が配置される。
 図4(b)は、「PES_data_byte_field()」の構造例を示している。「data_identifier」の8ビットフィールドは、コンテナ部分でデータの種類を識別する識別子を示す。従来のサブタイトル(ビットマップの場合)は、“0x20”で示すこととされているので、テキストの場合は新たな値、例えば“0x21”で識別することも可能である。
 「subtitle_stream_id」の8ビットフィールドは、サブタイトルストリームの種類を識別する識別子を示す。テキスト情報を伝送するサブタイトルストリームの場合は新たな値、例えば“0x01”とし、従来のビットマップを伝送するサブタイトルストリーム“0x00”と区別することが可能である。
 この「subtitle_stream_id」のフィールドの後に、“00001111”のパターンに続いて、「Subtitling_segments()」のフィールドが存在する。このフィールドに、セグメントパケットが配置される。このフィールドの後に、「end_of_PES_data_field_marker」の8ビットフィールドが存在する。このフィールドは、PESパケットの最後を示すマーカである。
 図5(a)は、サブタイトル・セグメント・タイプ(subtitle segment_type)の定義の一例を示している。“0xA0”は、TTMLドキュメント(TML document)を伝送するセグメントパケットであることを示す。“0xA1”は、圧縮されたTTMLドキュメントを伝送するセグメントパケットであることを示す。“0xA2”は、制御コマンド(control command)を伝送するセグメントパケットであることを示す。“0xA3”は、フォントダウンロード情報(font download information)を伝送するセグメントパケットであることを示す。図5(b)に示すように、異なる値のサブタイトル・セグメント・タイプを持つセグメント(segment)は、1つのPESペイロード(PES payload)に配置可能である。
 図6は、サブタイトルPESパケットにより構成されるサブタイトルストリーム(PESストリーム)の構造例を示している。この例では、サブタイトルPESパケットとして、TTMLドキュメントを伝送するセグメントパケットのみが含まれるサブタイトルPESパケット、制御コマンドを伝送するセグメントパケットのみが含まれるサブタイトルPESパケット、さらには、それらの双方が含まれるサブタイトルPESパケットなどが存在する。
 セグメントパケットの構造例を説明する。図7は、TTMLドキュメント・セグメント(TTL_document_segment())の構造例を示している。図8は、その構造例における主要な情報の内容を示している。「sync_byte」の8ビットフィールドは、セグメント開始を示すユニークワードである。「segment_type」の8ビットフィールドは、セグメントタイプであり、セグメント種類を示す。このTTMLドキュメント・セグメントの場合、「segment_type」は“0xA0”とされる(図5(a)参照)。
 「number_of_regions」の8ビットフィールドは、TTMLドキュメントに含まれるリージョンの数を示す。このリージョンの数だけ、「region_id」の8ビットフィールドが繰り返し存在する。「region_id」のフィールドは、リージョンの識別情報(id)を示す。このリージョンの識別情報(id)は、TTMLドキュメント内のリージョンの識別情報(id)に対応したものとされる。
 「latency」の16ビットフィールドは、PTSから“segment_data_field()”のバイトデータで伝送される字幕表示(サブタイトル表示)が開始されるまでの時間の遅延量を示す。値は、例えば、実際の時間量(秒単位)の10倍の値とされる。「document_version_number」の16ビットフィールドは、TTMLドキュメントの情報の更新を示す。更新がなされる場合は値を一つ増加する。
 「segment_length」の16ビットフィールドは、TTMLドキュメント・セグメントの長さ(サイズ)として以降のバイト数を示す。「segment_length」の後に、「segment_data_field()」のフィールドが存在する。このフィールドがセグメント(セグメントパケット)のペイロードに相当し、このフィールドにTTMLドキュメントの全体が配置される。
 図9は、制御コマンド・セグメント(control_command_segment())の構造例を示している。図10は、その構造例における主要な情報の内容を示している。「sync_byte」の8ビットフィールドは、セグメント開始を示すユニークワードである。「segment_type」の8ビットフィールドは、セグメントタイプであり、セグメント種類を示す。この制御コマンド・セグメントの場合、「segment_type」は“0xA2”とされる(図5(a)参照)。
 「number_of_regions」の8ビットフィールドは、リージョンの数を示す。このリージョンの数だけ、「region_id」の8ビットフィールド、「command」の8ビットフィールドが繰り返し存在する。「region_id」のフィールドは、リージョンの識別情報(id)を示す。「latency」のフィールドは、コマンド実行のタイミングをPTSからの遅延オフセットとして表す。値は10倍の値で示すようにし、“1”は、0.1秒、”16”は、1.6秒の実行遅延を表す。「command」のフィールドは、コマンドを示す。例えば、“0x01”は、リージョンの表示終了を示す。“0x02”は、リージョン表示に関係する情報をバッファから消去することを示す。“0x03”は、リージョン表示状態を予め定義された時間間隔でのカウント(time count)で示す。
 「command」が“0x03”であるとき、「time count」の16ビットフィールドが存在する。この「time count」のフィールドは、タイムカウント(固定間隔でのカウント値)を示す。“0x0001”からの昇順値であり、特殊値“0xFFFF”は表示終了を示す。「time_offset」の8ビットフィールドは、表示終了コマンドのタイムスタンプ(timestamp)からのタイムオフセット(time_offset)を示す。
 図11は、フォントダウンロード情報・セグメント(font_download_information_segment())の構造例を示している。図12は、その構造例における主要な情報の内容を示している。「sync_byte」の8ビットフィールドは、セグメント開始を示すユニークワードである。「segment_type」の8ビットフィールドは、セグメントタイプであり、セグメント種類を示す。この制御コマンド・セグメントの場合、「segment_type」は“0xA3”とされる(図5(a)参照)。
 「original_network_id」の16ビットフィールドは、ダウンロードデータが伝送されるネットワークの識別情報を示す。「transport_stream_id」の16ビットフィールドは、個別のトランスポートストリームの識別情報を示す。「service_id」の16ビットフィールドは、ダウンロードが行われるサービスの識別情報を示す。配信メディア間共通のダウンロード対象の場合、自身のトランスポートストリームではなく、他のトランスポートストリームでフォントファイルが送られていることもあり、その場合の参照先のプライベートセクションを特定する情報として、これらの「original_network_id」、「transport_stream_id」、「service_id」の情報が指定できるようになっている。
 「font_file_id」の8ビットフィールドは、フォントファイルに割り当てられた識別番号を示す。「ISO_639_language_code」の24ビットフィールドは、言語を識別させる3文字からなるコードを示す。例えば、“jpn”は日本語を示し、“eng”は英語を示す。「font_group_id」の8ビットフィールドは、フォントグループの識別情報を示し、TTMLのジェネリックファミリーに相当する。「font_name_id」の8ビットフィールドは、個別フォント名を示す。
 「url_type」の8ビットフィールドは、サーバのタイプを示す。例えば、“0x01”はフォントサーバ(非圧縮URL)を示し、“0x02”は一般のサーバ(非圧縮URL)を示し、“0x11”はフォントサーバ(圧縮URL)を示し、“0x12”は一般のサーバ(圧縮URL)を示す。「url_string_length」の8ビットフィールドは、以降のURLの文字列を示す文字コード部分の長さ(サイズ)をバイト数で示す。文字コードは、「char」のフィールドに配置される。
 「TTMLレイヤ(TTML layer)とコンテナレイヤ(Container layer)」
 ここで、TTMLレイヤとコンテナレイヤについてさらに説明する。最初に、固定サンプル(Fixed Sample)で、かつ、時間をかけて制作された、いわゆるプリオーサーでのサブタイトル配信(Pre-authored subtitle delivery)の場合について説明する。図13は、その場合におけるTTMLレイヤおよびコンテナレイヤの一例を示している。
 TTMLレイヤにリージョンA(Region A)の情報が存在する。このリージョンAは、T1のタイミングからT3のタイミングまで表示されるものである。すなわち、このリージョンAに関して、PTSを反映したTf1から遅延量LTaだけ後の時点に相当する開始時刻“start time”はT1で、終了時刻“end time”はT3である。ここでは、プリオーサーでのサブタイトル配信であるため、T3が予めわかっており、TTMLドキュメントには、リージョンAに関連して、最初から、“start time”がT1であることの他に、終了時刻“end time”がT3であることが記述される。
 また、TTMLレイヤにリージョンB(Region B)の情報が存在する。このリージョンBは、上述のリージョンAと多少時間的にオーバーラップして、T2のタイミングからT5のタイミングまで表示されるものである。すなわち、このリージョンBに関して、PTSを反映したTf1から遅延量LTbだけ後の時点に相当する開始時刻“start time”はT2で、終了時刻“end time”はT5である。ここでは、プリオーサーでのサブタイトル配信であるため、T5が予めわかっており、TTMLドキュメントには、リージョンBに関連して、最初から、“start time”がT2であることの他に、終了時刻“end time”がT5であることが記述される。
 さらに、TTMLレイヤにリージョンC(Region C)の情報が存在する。このリージョンCは、上述のリージョンBと多少時間的にオーバーラップして、T4のタイミングからT6のタイミングまで表示されるものである。すなわち、このリージョンCに関して、PTSを反映したTf3から遅延量LTcだけ後の時点に相当する開始時刻“start time”はT4で、終了時刻“end time”はT6である。ここでは、プリオーサーでのサブタイトル配信であるため、T6が予めわかっており、TTMLドキュメントには、リージョンCに関連して、最初から、“start time”がT4であることの他に、終了時刻“end time”がT6であることが記述される。
 ここで、サンプル毎にイベントが構成されるものとする。各イベントに対応して、そのイベントのリージョン情報を含むTTMLドキュメントのセグメントパケット(subtitle segment_type = 0xA0)がペイロードに配置されたPESパケット(コンテナパケット)が生成され、送信される。この場合、各PESパケットのヘッダに挿入されるPTS(Presentation Time Stamp)の値は、対応するサンプルの開始時刻(Sample start time)とされる。
 そして、各PESパケットは、遅くとも対応するサンプルの開始時刻より前には受信側に到達するように、送信される。例えば、イベント1(event 1)のリージョン情報を含むTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットは、時刻Tf1より前に受信側に到達するように、送信される。また、例えば、イベント2(event 2)のリージョン情報を含むTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットは、時刻Tf2より前に受信側に到達するように、送信される。その他についても同様である。
 図14(a)~(e)は、各イベントに対応したTTMLドキュメントの内容を概略的に示している。図14(a)は、イベント1(event 1)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンAの情報と共に、リージョンBの情報が含まれている。この場合、リージョンAの開始、終了の時刻は「begin=“T1”end=“T3”」とされ、リージョンBの開始、終了の時刻は「begin=“T2”end=“T5”」とされる。
 図14(b)は、イベント2(event 2)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報のみが含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“T5”」とされる。
 図14(c)は、イベント3(event 3)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報と共に、リージョンCの情報が含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“T5”」とされ、リージョンCの開始、終了の時刻は「begin=“T4”end=“T6”」とされる。
 図14(d)は、イベント4(event 4)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報と共に、リージョンCの情報が含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“T5”」とされ、リージョンCの開始、終了の時刻は「begin=“T4”end=“T6”」とされる。
 図14(e)は、イベント5(event 5)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンCの情報のみが含まれている。この場合、リージョンCの開始、終了の時刻は「begin=“T4”end=“T6”」とされる。
 次に、固定サンプル(Fixed Sample)で、かつ、ライブでのサブタイトル配信(Live subtitle delivery)について説明する。図15は、その場合におけるTTMLレイヤおよびコンテナレイヤの一例を示している。
 TTMLレイヤにリージョンA(Region A)の情報が存在する。このリージョンAは、T1のタイミングから最終的にはT3のタイミングまで表示されものであるが、T3については予め知ることはできない。そのため、TTMLドキュメントには、リージョンAに関連して、最初は、“start time”がT1であることのみ記述され、終了時刻“end time”についてはブランク状態とされる。なお、T1はPTSを反映したTf1から遅延量LTaだけ後の時点に相当する。
 また、TTMLレイヤにリージョンB(Region B)の情報が存在する。このリージョンBは、上述のリージョンAと多少時間的にオーバーラップして、T2のタイミングから最終的にはT5のタイミングまで表示されるものであるが、T5については予め知ることはできない。そのため、TTMLドキュメントには、リージョンBに関連して、最初は、“start time”がT2であることのみ記述され、終了時刻“end time”についてはブランク状態とされる。なお、T2はPTSを反映したTf1から遅延量Ltbだけ後の時点に相当する。
 さらに、TTMLレイヤにリージョンC(Region C)の情報が存在する。このリージョンCは、上述のリージョンBと多少時間的にオーバーラップして、T4のタイミングから最終的にはT6のタイミングまで表示されるものであるが、T6については予め知ることはできない。そのため、TTMLドキュメントには、リージョンCに関連して、最初は、“start time”がT4であることのみ記述され、終了時刻“end time”についてはブランク状態とされる。なお、T4はPTSを反映したTf3から遅延量LTcだけ後の時点に相当する。
 ここで、サンプル毎にイベントが構成されるものとする。各イベントに対応して、そのイベントのリージョン情報を含むTTMLドキュメントのセグメントパケット(subtitle segment_type = 0xA0)がペイロードに配置されたPESパケット(コンテナパケット)が生成され、送信される。この場合、各PESパケットのヘッダに挿入されるPTS(Presentation Time Stamp)の値は、対応するサンプルの開始時刻(Sample start time)とされる。
 そして、各PESパケットは、少なくとも対応するサンプルの開始時刻には受信側に到達するように生成、送信される。例えば、イベント1(event 1)のリージョン情報を含むTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットは、時刻Tf1より前に受信側に到達するように、送信される。また、例えば、イベント2(event 2)のリージョン情報を含むTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットは、時刻Tf2より前に受信側に到達するように、送信される。その他についても同様である。
 図16(a)~(e)は、各イベントに対応したTTMLドキュメントの内容を概略的に示している。図16(a)は、イベント1(event 1)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンAの情報と共に、リージョンBの情報が含まれている。この場合、リージョンAの開始、終了の時刻は「begin=“T1”end=“ ”」とされ、リージョンBの開始、終了の時刻は「begin=“T2”end=“ ”」とされる。
 図16(b)は、イベント2(event 2)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報のみが含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“ ”」とされる。
 図16(c)は、イベント3(event 3)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報と共に、リージョンCの情報が含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“ ”」とされ、リージョンCの開始、終了の時刻は「begin=“T4”end=“ ”」とされる。
 図16(d)は、イベント4(event 4)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報と共に、リージョンCの情報が含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“ ”」とされ、リージョンCの開始、終了の時刻は「begin=“T4”end=“ ”」とされる。
 図16(e)は、イベント5(event 5)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンCの情報のみが含まれている。この場合、リージョンCの開始、終了の時刻は「begin=“T4”end=“ ”」とされる。
 ここで、リージョンA,B,Cの表示終了時刻がわかった場合、リージョンの表示終了時刻情報が補填されたTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットを生成して送信することで、受信側にリージョンの表示終了時刻情報を与える(明示する)ことが考えられる。しかし、サンプル期間が固定であることから、このようにリージョンの表示終了時刻情報が補填されたTTMLドキュメントを含むPESパケットを生成して送信するタイミングは制限され、例えば、固定サンプルを伝送するパケットのPTSから「latency」量に相当するTTMLの“end time”をアップデート(update)することで行われる。サンプル期間が比較的長い場合は“end time”の予測が困難な場合も有り得る。
 このように、リージョンの表示終了時刻情報が補填されたTTMLドキュメントを送信することで受信側にリージョンの表示終了時刻情報を与えることが、困難な場合も生じる。例えば、リージョンAに関して、Tf1のタイミング以降に終了時刻T3がわかったとしても、リージョンの表示終了時刻情報が補填されたTTMLドキュメントを時刻T3の前に送信することはできない。同様のことが、リージョンB,Cに関しても起こる。
 そこで、この例の場合、リージョンA,B,Cの終了時刻がわかった場合、それらの時刻の前に受信側に到達するように、リージョンの表示終了時刻情報を与えるための制御コマンド(command=0x01)のセグメントパケット(subtitle segment_type = 0xA2)をペイロードに配置したPESパケットを生成し、送信することが行われる。この場合、当該PESパケットのヘッダに挿入されるPTS(Presentation Time Stamp)の値は、リージョンの表示終了時刻を示すものとされる。従って、この場合、リージョンの表示終了時刻は、PTSで与えられることになる。
 次に、可変サンプル(Variable Sample)で、かつ、プリオーサーでのサブタイトル配信(Pre-authored subtitle delivery)の場合について説明する。図17は、その場合におけるTTMLレイヤおよびコンテナレイヤの一例を示している。
 TTMLレイヤにリージョンA(Region A)の情報が存在する。このリージョンAは、T1のタイミングからT3のタイミングまで表示されるものである。すなわち、このリージョンAに関して、開始時刻“start time”はT1で、終了時刻“end time”はT3である。ここでは、プリオーサーでのサブタイトル配信であるため、T3が予めわかっており、TTMLドキュメントには、リージョンAに関連して、最初から、“start time”がT1であることの他に、終了時刻“end time”がT3であることが記述される。
 また、TTMLレイヤにリージョンB(Region B)の情報が存在する。このリージョンBは、上述のリージョンAと多少時間的にオーバーラップして、T2のタイミングからT5のタイミングまで表示されるものである。すなわち、このリージョンBに関して、開始時刻“start time”はT2で、終了時刻“end time”はT5である。ここでは、プリオーサーでのサブタイトル配信であるため、T5が予めわかっており、TTMLドキュメントには、リージョンBに関連して、最初から、“start time”がT2であることの他に、終了時刻“end time”がT5であることが記述される。
 さらに、TTMLレイヤにリージョンC(Region C)の情報が存在する。このリージョンCは、上述のリージョンBと多少時間的にオーバーラップして、T4のタイミングからT6のタイミングまで表示されるものである。すなわち、このリージョンCに関して、開始時刻“start time”は42で、終了時刻“end time”はT6である。ここでは、プリオーサーでのサブタイトル配信であるため、T6が予めわかっており、TTMLドキュメントには、リージョンCに関連して、最初から、“start time”がT4であることの他に、終了時刻“end time”がT6であることを記述される。
 可変サンプルにおいては、上述したように、サブタイトルの表示(各リージョンの表示)の変化期間に合わせてその期間が可変する。そのため、図17に示すように、T1からT2、T2からT3、T3からT4、T4からT5、T5からT6が、それぞれ、1つのサンプルとして定義される。
 ここで、サンプル毎にイベントが構成されるものとする。従って、T1からT2のサンプルでイベント1(event 1)が構成され、T2からT3のサンプルでイベント2(event 2)が構成され、T3からT4のサンプルでイベント3(event 3)が構成され、T4からT5のサンプルでイベント4(event 4)が構成され、T5からT6のサンプルでイベント5(event 5)が構成されている。
 各イベントに対応して、そのイベントのリージョン情報を含むTTMLドキュメントのセグメントパケット(subtitle segment_type = 0xA0)がペイロードに配置されたPESパケット(コンテナパケット)が生成され、送信される。この場合、各PESパケットのヘッダに挿入されるPTS(Presentation Time Stamp)の値は、対応するサンプルの開始時刻(Sample start time)とされる。
 そして、各PESパケットは、遅くとも対応するサンプルの開始時刻より前には受信側に到達するように、送信される。例えば、イベント1(event 1)のリージョン情報を含むTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットは、時刻T1より前に受信側に到達するように、送信される。また、例えば、イベント2(event 2)のリージョン情報を含むTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットは、時刻T2より前に受信側に到達するように、送信される。その他についても同様である。
 図18(a)~(e)は、各イベントに対応したTTMLドキュメントの内容を概略的に示している。図18(a)は、イベント1(event 1)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンAの情報のみが含まれている。この場合、リージョンAの開始、終了の時刻は「begin=“T1”end=“T3”」とされる。
 図18(b)は、イベント2(event 2)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンAの情報と共に、リージョンBの情報が含まれている。この場合、リージョンAの開始、終了の時刻は「begin=“T1”end=“T3”」とされ、リージョンBの開始、終了の時刻は「begin=“T2”end=“T5”」とされる。
 図18(c)は、イベント3(event 3)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報のみが含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“T5”」とされる。
 図18(d)は、イベント4(event 4)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報と共に、リージョンCの情報が含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“T5”」とされ、リージョンCの開始、終了の時刻は「begin=“T4”end=“T6”」とされる。
 図18(e)は、イベント5(event 5)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンCの情報のみが含まれている。この場合、リージョンCの開始、終了の時刻は「begin=“T4”end=“T6”」とされる。
 次に、可変サンプル(variable Sample)で、かつ、ライブでのサブタイトル配信(Live subtitle delivery)について説明する。図19は、その場合におけるTTMLレイヤおよびコンテナレイヤの一例を示している。
 TTMLレイヤにリージョンA(Region A)の情報が存在する。このリージョンAは、T1のタイミングから最終的にはT3のタイミングまで表示されものであるが、T3については予め知ることはできない。そのため、TTMLドキュメントには、リージョンAに関連して、最初は、“start time”がT1であることのみ記述され、終了時刻“end time”についてはブランク状態とされる。
 また、TTMLレイヤにリージョンB(Region B)の情報が存在する。このリージョンBは、上述のリージョンAと多少時間的にオーバーラップして、T2のタイミングから最終的にはT5のタイミングまで表示されるものであるが、T5については予め知ることはできない。そのため、TTMLドキュメントには、リージョンBに関連して、最初は、“start time”がT2であることのみ記述され、終了時刻“end time”についてはブランク状態とされる。
 さらに、TTMLレイヤにリージョンC(Region C)の情報が存在する。このリージョンCは、上述のリージョンBと多少時間的にオーバーラップして、T4のタイミングから最終的にはT6のタイミングまで表示されるものであるが、T6については予め知ることはできない。そのため、TTMLドキュメントには、リージョンCに関連して、最初は、“start time”がT4であることのみ記述され、終了時刻“end time”についてはブランク状態とされる。
 ここで、サンプル毎にイベントが構成されるものとする。各イベントに対応して、そのイベントのリージョン情報を含むTTMLドキュメントのセグメントパケット(subtitle segment_type = 0xA0)がペイロードに配置されたPESパケット(コンテナパケット)が生成され、送信される。この場合、各PESパケットのヘッダに挿入されるPTS(Presentation Time Stamp)の値は、対応するサンプルの開始時刻(Sample start time)とされる。
 各PESパケットは、遅くとも対応するサンプルの開始時刻より前には受信側に到達するように生成、送信される。例えば、イベント1(event 1)のリージョン情報を含むTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットは、時刻Tf1より前に受信側に到達するように、送信される。また、例えば、イベント2(event 2)のリージョン情報を含むTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットは、時刻Tf2より前に受信側に到達するように、送信される。その他についても同様である。
 この例の場合、可変サンプルであることを利用し、リージョンA,B,Cの表示終了時刻がわかった場合、リージョンの表示終了時刻情報が補填されたTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットを生成して送信する。つまり、リージョンA,B,Cの表示終了時刻がわかった場合、TTMLドキュメントのアップデートが行われる。
 この場合、図19に示すように、T1からT2、T2からT3p、T3pからT3、T3からT4、T4からT5p、T5pからT5、T5からT6p、T6pからT6が、それぞれ、1つのサンプルとして定義される。ここで、T3pからT3のサンプル、T4からT5pのサンプル、T6pからT6のサンプルは、リージョンの表示終了時刻情報が補填されたTTMLドキュメントへのアップデートのためのサンプルである。
 ここで、サンプル毎にイベントが構成されるものとする。従って、T1からT2のサンプルでイベント1(event 1)が構成され、T2からT3pのサンプルでイベント2(event 2)が構成され、T3pからT3のサンプルでイベント3(event 3)が構成され、T3からT4のサンプルでイベント4(event 4)が構成され、T4からT5pのサンプルでイベント5(event 5)が構成され、T5pからT5のサンプルでイベント6(event 6)が構成され、T5からT6pのサンプルでイベント7(event 7)が構成され、T6pからT6のサンプルでイベント8(event 8)が構成されている。
 各イベントに対応して、そのイベントのリージョン情報を含むTTMLドキュメントのセグメントパケット(subtitle segment_type = 0xA0)がペイロードに配置されたPESパケット(コンテナパケット)が生成され、送信される。この場合、各PESパケットのヘッダに挿入されるPTS(Presentation Time Stamp)の値は、対応するサンプルの開始時刻(Sample start time)とされる。
 図20(a)~(h)は、各イベントに対応したTTMLドキュメントの内容を概略的に示している。図20(a)は、イベント1(event 1)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンAの情報のみが含まれている。この場合、リージョンAの開始、終了の時刻は「begin=“T1”end=“ ”」とされる。
 図20(b)は、イベント2(event 2)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンAの情報と共に、リージョンBの情報が含まれている。この場合、リージョンAの開始、終了の時刻は「begin=“T1”end=“ ”」とされ、リージョンB開始、終了の時刻は「begin=“T2”end=“ ”」とされる。
 図20(c)は、イベント3(event 3)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンAの情報と共に、リージョンBの情報が含まれている。この場合、リージョンAの開始、終了の時刻は「begin=“T1”end=“T3”」とされ、リージョンBの開始、終了の時刻は「begin=“T2”end=“ ”」とされる。この場合、TTMLドキュメントは、破線矩形枠で囲んで示すように、リージョンAの表示終了時刻情報が補填されたものとなる。
 図20(d)は、イベント4(event 4)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報のみが含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“ ”」とされる。
 図20(e)は、イベント5(event 5)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報と共に、リージョンCの情報が含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“ ”」とされ、リージョンCの開始、終了の時刻は「begin=“T4”end=“ ”」とされる。
 図20(f)は、イベント6(event 6)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報と共に、リージョンCの情報が含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“T5”」とされ、リージョンCの開始、終了の時刻は「begin=“T4”end=“ ”」とされる。この場合、TTMLドキュメントは、破線矩形枠で囲んで示すように、リージョンBの表示終了時刻情報が補填されたものとなる。
 図20(g)は、イベント7(event 7)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンCの情報のみが含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T4”end=“ ”」とされる。
 図20(h)は、イベント8(event 8)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンCの情報のみが含まれている。この場合、リージョンCの開始、終了の時刻は「begin=“T4”end=“T6”」とされる。この場合、TTMLドキュメントは、破線矩形枠で囲んで示すように、リージョンCの表示終了時刻情報が補填されたものとなる。
 次も、可変サンプル(variable Sample)で、かつ、ライブでのサブタイトル配信(Live subtitle delivery)について説明する。図21は、その場合におけるTTMLレイヤおよびコンテナレイヤの一例を示している。
 TTMLレイヤにリージョンA(Region A)の情報が存在する。このリージョンAは、T1のタイミングから最終的にはT3のタイミングまで表示されものであるが、T3については予め知ることはできない。そのため、TTMLドキュメントには、リージョンAに関連して、最初は、“start time”がT1であることのみ記述され、終了時刻“end time”についてはブランク状態とされる。
 また、TTMLレイヤにリージョンB(Region B)の情報が存在する。このリージョンBは、上述のリージョンAと多少時間的にオーバーラップして、T2のタイミングから最終的にはT5のタイミングまで表示されるものであるが、T5については予め知ることはできない。そのため、TTMLドキュメントには、リージョンBに関連して、最初は、“start time”がT2であることのみ記述され、終了時刻“end time”についてはブランク状態とされる。
 さらに、TTMLレイヤにリージョンC(Region C)の情報が存在する。このリージョンCは、上述のリージョンBと多少時間的にオーバーラップして、T4のタイミングから最終的にはT6のタイミングまで表示されるものであるが、T6については予め知ることはできない。そのため、TTMLドキュメントには、リージョンCに関連して、最初は、“start time”がT4であることのみ記述され、終了時刻“end time”についてはブランク状態とされる。
 この場合、図21に示すように、T1からT2、T2からT3、T3からT4、T4からT5、T5からT6が、それぞれ、1つのサンプルとして定義される。ここで、サンプル毎にイベントが構成されるものとする。従って、T1からT2のサンプルでイベント1(event 1)が構成され、T2からT3のサンプルでイベント2(event 2)が構成され、T3からT4のサンプルでイベント3(event 3)が構成され、T4からT5のサンプルでイベント4(event 4)が構成され、T5からT6のサンプルでイベント5(event 5)が構成されている。
 各イベントに対応して、そのイベントのリージョン情報を含むTTMLドキュメントのセグメントパケット(subtitle segment_type = 0xA0)がペイロードに配置されたPESパケット(コンテナパケット)が生成され、送信される。この場合、各PESパケットのヘッダに挿入されるPTS(Presentation Time Stamp)の値は、対応するサンプルの開始時刻(Sample start time)とされる。
 そして、各PESパケットは、少なくとも対応するサンプルの開始時刻には受信側に到達するように、送信される。例えば、イベント1(event 1)のリージョン情報を含むTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットは、時刻T1より前に受信側に到達するように、送信される。また、例えば、イベント2(event 2)のリージョン情報を含むTTMLドキュメントのセグメントパケットがペイロードに配置されたPESパケットは、時刻T2より前に受信側に到達するように、送信される。その他についても同様である。
 図22(a)~(e)は、各イベントに対応したTTMLドキュメントの内容を概略的に示している。図22(a)は、イベント1(event 1)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンAの情報のみが含まれている。この場合、リージョンAの開始、終了の時刻は「begin=“T1”end=“ ”」とされる。
 図22(b)は、イベント2(event 2)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンAの情報と共に、リージョンBの情報が含まれている。この場合、リージョンAの開始、終了の時刻は「begin=“T1”end=“ ”」とされ、リージョンBの開始、終了の時刻は「begin=“T2”end=“ ”」とされる。
 図22(c)は、イベント3(event 3)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報のみが含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“ ”」とされる。
 図22(d)は、イベント4(event 4)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンBの情報と共に、リージョンCの情報が含まれている。この場合、リージョンBの開始、終了の時刻は「begin=“T2”end=“ ”」とされ、リージョンCの開始、終了の時刻は「begin=“T4”end=“ ”」とされる。
 図22(e)は、イベント5(event 5)に対応したTTMLドキュメントである。このTTMLドキュメントには、リージョンCの情報のみが含まれている。この場合、リージョンCの開始、終了の時刻は「begin=“T4”end=“ ”」とされる。
 この例では、リージョンA,B,Cの表示終了時刻がわかった場合、それらの時刻の前に受信側に到達するように、リージョンの表示終了時刻情報を与えるための制御コマンド(command=0x01)のセグメントパケット(subtitle segment_type = 0xA2)をペイロードに配置したPESパケットを生成し、送信することが行われる。この場合、当該PESパケットのヘッダに挿入されるPTS(Presentation Time Stamp)の値は、リージョンの表示終了時刻を示すものとされる。従って、この場合、リージョンの表示終了時刻は、PTSで与えられる。
 なお、制御コマンド(command=0x01)の代わりに、制御コマンド(command=0x03)(図9、図10参照)を用いてリージョンの表示終了時刻情報を受信側に与えることも考えられる。この場合、リージョンの表示状態を予め定義された時間間隔、例え1秒間隔などでのカウントで示し、そのカウントを含む制御コマンド(command=0x03)のセグメントパケット(subtitle segment_type = 0xA2)をペイロードに配置したPESパケットを生成し、順次送信することが行われる。
 この場合、PESパケットのヘッダに挿入されるPTS(Presentation Time Stamp)の値は、たとえば、当該PESパケットの送信時刻を示すものとされる。そして、この場合、リージョンの表示終了時刻は、カウントが最後であることを示すときに、このカウントに付加されているタイムオフセットを、PTSに加算することで与えられる。
 図23は、その場合におけるTTMLレイヤおよびコンテナレイヤの一例を示している。例えば、リージョンAに関しては、時刻T1を経過した後に1秒間隔で、カウントTCとして「1」、「FFFF」をそれぞれ含む制御コマンド(command=0x03)のセグメントパケット(subtitle segment_type = 0xA2)をペイロードに配置したPESパケットが順次生成されて送信される。
 この場合、カウントTCとして「1」に係るPESパケットの送信後にリージョンAの表示終了時刻がT3と分かったので、その次のカウントTCとして表示終了を示す「FFFF」がタイムオフセット“offset”を付加して送られ、このときのPTSはPTS(2)である。ここで、T3=PTS(2)+offsetの関係を満たすものとされる。
 また、リージョンBに関しては、時刻T2を経過した後に1秒間隔で、カウントTCとして「1」、「2」、「3」、「4」、「5」、「FFFF」をそれぞれ含む制御コマンド(command=0x03)のセグメントパケット(subtitle segment_type = 0xA2)をペイロードに配置したPESパケットが順次生成されて送信される。
 この場合、カウントTCとして「5」に係るPESパケットの送信後にリージョンBの表示終了時刻がT5と分かったので、その次のカウントTCとして表示終了を示す「FFFF」がタイムオフセット“offset”を付加して送られ、このときのPTSはPTS(8)である。ここで、T5=PTS(8)+offsetの関係を満たすものとされる。
 また、リージョンCに関しては、時刻T4を経過した後に1秒間隔で、カウントTCとして「1」、「2」、「FFFF」をそれぞれ含む制御コマンド(command=0x03)のセグメントパケット(subtitle segment_type = 0xA2)をペイロードに配置したPESパケットが順次生成されて送信される。
 この場合、カウントTCとして「2」に係るPESパケットの送信後にリージョンCの表示終了時刻がT6と分かったので、その次のカウントTCとして表示終了を示す「FFFF」がタイムオフセット“offset”を付加して送られ、このときのPTSはPTS(11)である。ここで、T6=PTS(11)+offsetの関係を満たすものとされる。
 図2に戻って、TSフォーマッタ116は、ビデオエンコーダ112で生成されたビデオストリーム、オーディオエンコーダ113で生成されたオーディオストリームおよびサブタイトルエンコーダ115で生成されたサブタイトルストリームを、トランスポートパケット化して多重化し、多重化ストリームとしてのトランスポートストリームTSを得る。
 図2に示すストリーム生成部110の動作を簡単に説明する。画像データDVは、ビデオエンコーダ112に供給される。ビデオエンコーダ112では、この画像データDVに対して符号化が施され、ペイロードに符号化画像データを持つビデオPESパケットからなるビデオストリーム(PESストリーム)が生成される。このビデオストリームは、TSフォーマッタ116に供給される。
 また、音声データDAは、オーディオエンコーダ113に供給される。オーディオエンコーダ113では、音声データDAに対して符号化が施され、符号化音声データを持つオーディオPESパケットからなるオーディオストリーム(PESストリーム)が生成される。このオーディオストリームは、TSフォーマッタ116に供給される。
 また、サブタイトル情報としてのテキストデータ(文字コード)DTは、テキストフォーマット変換部114に供給される。このキストフォーマット変換部114では、表示タイミング情報を持つ所定フォーマットのサブタイトルのテキスト情報、ここではTTMLが得られる。このTTMLは、サブタイトルエンコーダ115に供給される。
 サブタイトルエンコーダ115では、テキストフォーマット変換部114で得られるTTMLのドキュメントを含むセグメントパケット(タイムド・テキスト・サブタイトリング・セグメント:TT subtitling segment)が生成される。そして、サブタイトルエンコーダ115では、ペイロードにそのセグメントパケットが配置されサブタイトルPESパケットが生成される。
 サブタイトルエンコーダ115では、サブタイトルPESパケットが、サンプル毎に生成される。また、サブタイトルエンコーダ115では、ライブでのサブタイトル配信(Live subtitle delivery)の場合、最初は、リージョン表示終了時刻が不明なので、サブタイトルPESパケットに含まれるTTMLドキュメントにリージョンの表示終了時刻を挿入できないので、ブランク状態とされる。
 その後、リージョン表示終了時刻がわかったとき、サブタイトルエンコーダ115では、リージョン表示終了時刻情報を受信側に与える、あるいは明示するために、新たなサブタイトルPESパケットが生成される。
 第1の方法が採用されるとき、サブタイトルエンコーダ115では、リージョン終了時刻情報が補填されたTTMLドキュメントを含むセグメントパケット(Subtitle segment_type=0xA0)が生成され、それをペイロードに配置したサブタイトルPESパケットが新たに生成される。
 一方、第2の方法が採用されるとき、サブタイトルエンコーダ115では、リージョンの表示終了時刻情報を与えるための制御コマンドを含むセグメントパケット(Subtitle segment_type=0xA2)が生成され、それをペイロードに配置したサブタイトルPESパケットが新たに生成される。
 また、サブタイトルエンコーダ115では、TTMLのフォント指定情報で指定されているフォントのファイルをダウンロードするためのダウンロード情報を含むセグメントパケットが生成され、それがPESパケットのペイロードに配置される。
 サブタイトルエンコーダ115では上述の各サブタイトルPESパケットにより構成されるサブタイトルストリーム(PESストリーム)が生成される。このサブタイトルストリームは、TSフォーマッタ116に供給される。TSフォーマッタ116では、各エンコーダで生成されたストリームが、トランスポートパケット化されて多重化され、多重化ストリームとしてのトランスポートストリームTSが生成される。
 図24は、トランスポートストリームTSの構成例を示している。この構成例では、PID1で識別されるビデオストリームのPESパケットであるビデオPESパケット「Video PES」が存在する。また、この構成例では、PID2で識別されるオーディオストリームのPESパケットであるオーディオPESパケット「Audio PES」が存在する。また、この構成例では、PID3で識別されるサブタイトルストリームのPESパケットであるサブタイトルPESパケット「Subtitle PES」が存在する。
 PESパケットは、PESヘッダ(PES header)とPESペイロード(PES payload)からなっている。ビデオPESパケットにおいて、PESヘッダにはDTS/PTSのタイムスタンプが挿入されており、PESペイロードにはビデオ符号化ストリーム(符号化画像データ)が挿入されている。また、オーディオPESパケットにおいて、PESヘッダにはPTSのタイムスタンプが挿入されており、PESペイロードにはオーディオ符号化ストリーム(符号化音声データ)が挿入されている。
 また、サブタイトルPESパケットにおいて、PESヘッダにはPTSのタイムスタンプが挿入されており、PESペイロードには、TTMLドキュメント、制御コマンド、フォントダウンロード情報等を持つセグメントパケット(タイムド・テキスト・サブタイトリング・セグメント:TT subtitling segment)が挿入されている。
 また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。このPSIは、トランスポートストリームTSに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。
 PMTには、プログラム全体に関連する情報を記述するプログラム・デスクリプタ(Program Descriptor)が存在する。また、このPMTには、各エレメンタリストリームに関連した情報を持つエレメンタリストリーム・ループが存在する。この構成例では、ビデオエレメンタリストリーム・ループ(Video ES loop)、オーディオエレメンタリストリーム・ループ(Audio ES loop)、サブタイトルエレメンタリストリーム・ループ(Subtitle ES loop)が存在する。各ループには、パケット識別子(PID)等の情報が配置される。
 [テレビ受信機の構成例]
 図25は、テレビ受信機200の構成例を示している。このテレビ受信機200は、受信部201と、TS解析部(デマルチプレクサ)202と、ビデオデコーダ203と、ビデオ重畳部204と、パネル駆動回路205と、表示パネル206を有している。また、このテレビ受信機200は、オーディオデコーダ207と、音声出力回路208と、スピーカ209と、サブタイトルデコーダ210を有している。また、このテレビ受信機200は、CPU221と、フラッシュROM222と、DRAM223と、内部バス224と、リモコン受信部225と、リモコン送信機226を有している。
 CPU221は、テレビ受信機200の各部の動作を制御する。フラッシュROM222は、制御ソフトウェアの格納およびデータの保管を行う。DRAM223は、CPU221のワークエリアを構成する。CPU221は、フラッシュROM222から読み出したソフトウェアやデータをDRAM223上に展開してソフトウェアを起動させ、テレビ受信機200の各部を制御する。
 リモコン受信部225は、リモコン送信機226から送信されたリモートコントロール信号(リモコンコード)を受信し、CPU221に供給する。CPU221は、このリモコンコードに基づいて、テレビ受信機200の各部を制御する。CPU221、フラッシュROM222およびDRAM223は、内部バス224に接続されている。
 受信部201は、放送送出システム100から放送波に載せて送られてくるトランスポートストリームTSを受信する。このトランスポートストリームTSには、上述したように、ビデオストリーム、オーディオストリームおよびサブタイトルストリームが含まれている。TS解析部202は、トランスポートストリームTSからビデオ、オーディオ、サブタイトルの各ストリームを抽出する。
 オーディオデコーダ207は、TS解析部202で抽出されるオーディオストリームにデコード処理を施し、音声データを得る。音声出力回路208は、音声データに対して、D/A変換や増幅等の必要な処理を施し、スピーカ209に供給する。ビデオデコーダ203は、TS解析部202で抽出されるビデオストリームにデコード処理を施し、画像データを得る。
 サブタイトルデコーダ210は、TS解析部202で抽出されるサブタイトルストリームにデコード処理を施し、画像データに重畳すべき各リージョンのビットマップデータを得る。ここで、サブタイトルデコーダ210は、TTMLドキュメントを含むセグメントパケットから当該セグメントパケットを抽出し、このTTMLのドキュメントに基づいて各リージョンのビットマップデータを得る。
 また、サブタイトルデコーダ210は、リージョンの表示終了時刻情報を与えるための制御コマンドを含むセグメントパケットから当該セグメントパケットを抽出し、この制御コマンドをCPU221に送る。CPU221は、この制御コマンドに基づいて、リージョンの表示終了時刻を取得する。
 ここで、CPU221は、制御コマンド(command=0x01)の場合には、PESパケットのヘッダに挿入されているPTSをリージョンの表示終了時刻として取得する。また、CPU221は、制御コマンド(command=0x03)の場合には、カウントが最後であることを示すときに、このカウントに付加されているタイムオフセットをPESパケットのヘッダに挿入されているPTSに加算したものを表示終了時刻として取得する。
 また、サブタイトルデコーダ210は、フォントダウンロード情報を含むセグメントパケットから当該セグメントパケットを抽出し、このフォントダウンロード情報をCPU221に送る。CPU221は、このフォント・ダウンロード・セグメントから、少なくともTTMLドキュメントのフォント指定情報で指定されているフォントのファイルをダウンロードするための情報を取得する。
 ビデオ重畳部204は、ビデオデコーダ203で得られた画像データに、サブタイトルデコーダ210から得られる各リージョンのビットマップデータを重畳する。この場合、ビデオ重畳部204は、各リージョンのビットマップデータを、それぞれの表示開始時刻から表示終了時刻までの期間だけ重畳する。
 ここで、表示開始時刻に関しては、TTMLドキュメントに含まれるリージョンの表示開始時刻情報から得られる。表示終了時刻に関しては、プリオーサーでのサブタイトル配信(Pre-authored subtitle delivery)の場合には、TTMLドキュメントに含まれるリージョンの表示終了時刻情報から得られる(図13、図17参照)。
 また、表示終了時刻に関しては、ライブでのサブタイトル配信(Live subtitle delivery)の場合には、第1の方法が採用されているとき、アップデートされたTTMLドキュメントに含まれるリージョンの表示終了時刻情報から得られ(図19参照)、第2の方法が採用されているとき、制御コマンドから得られる(図15、図21、図23参照)。
パネル駆動回路205は、ビデオ重畳部204で得られる表示用の画像データに基づいて、表示パネル206を駆動する。表示パネル206は、例えば、LCD(Liquid Crystal Display)、有機ELディスプレイ(organic electroluminescence display)などで構成されている。
 図25に示すテレビ受信機200の動作を簡単に説明する。受信部201では、放送送出システム100から放送波に載せて送られてくるトランスポートストリームTSが受信される。このトランスポートストリームTSには、ビデオストリーム、オーディオストリームおよびサブタイトルストリームが含まれている。
 このトランスポートストリームTSは、TS解析部202に供給される。TS解析部202では、トランスポートストリームTSからビデオ、オーディオ、サブタイトルの各ストリームが抽出される。TS解析部202で抽出されるビデオストリーム(PESストリーム)は、ビデオデコーダ203に供給される。ビデオデコーダ203では、ビデオストリームにデコード処理が施されて、画像データが得られる。この画像データは、ビデオ重畳部204に供給される。
 また、TS解析部202で抽出されるサブタイトルストリーム(PESストリーム)は、サブタイトルデコーダ210に供給される。サブタイトルデコーダ210では、サブタイトルストリームにデコード処理が施され、画像データに重畳すべき各リージョンのビットマップデータが得られる。
 また、サブタイトルデコーダ210では、リージョンの表示終了時刻情報を与えるための制御コマンドを含むセグメントパケットから当該セグメントパケットが抽出され、制御コマンドがCPU221に送られる。CPU221では、この制御コマンドに基づいて、リージョンの表示終了時刻が取得される。
 また、サブタイトルデコーダ210では、フォントダウンロード情報を含むセグメントパケットから当該セグメントパケットが抽出され、このフォントダウンロード情報がCPU221に送られる。CPU221では、このフォント・ダウンロード・セグメントから、少なくともTTMLドキュメントのフォント指定情報で指定されているフォントのファイルをダウンロードするための情報が取得される。この情報は、当該フォントファイルを取得するために必要に応じて使用される。
 サブタイトルデコーダ210から出力される各リージョンのビットマップデータは、ビデオ重畳部204に供給される。ビデオ重畳部204では、ビデオデコーダ203で得られた画像データに、サブタイトルデコーダ210から出力される各リージョンのビットマップデータが重畳される。この場合、各リージョンのビットマップデータは、それぞれの表示開始時刻から表示終了時刻までの期間だけ重畳される。
 ここで、表示開始時刻に関しては、TTMLドキュメントに含まれるリージョンの表示開始時刻情報から得られる。また、表示終了時刻に関しては、プリオーサーでのサブタイトル配信の場合には、TTMLドキュメントに含まれるリージョンの表示終了時刻情報から得られる(図13、図17参照)。また、表示終了時刻に関しては、ライブでのサブタイトル配信の場合には、第1の方法が採用されているとき、アップデートされたTTMLドキュメントに含まれるリージョンの表示終了時刻情報から得られ(図19参照)、第2の方法が採用されているとき、制御コマンドから得られる(図15、図21、図23参照)。
 ビデオ重畳部204で得られる表示用の画像データは、パネル駆動回路205に供給される。パネル駆動回路205では、表示用のビデオデータに基づいて、表示パネル206を駆動することが行われる。これにより、表示パネル206には、各リージョンが重畳された画像が表示される。
 以上説明したように、図1に示す送受信システム10において、放送送出システム100は、TTMLドキュメントを持つセグメントパケットがペイロードに配置されたサブタイトルPESパケットをサンプル毎に生成するが、そのサンプルの期間を、例えば、サブタイトルの表示の変化期間に合わせて変化させる。そのため、サブタイトルPESパケットの送信頻度を抑制でき、伝送効率を高めることが可能となる。
 また、図1に示す送受信システム10において、放送送出システム100は、ライブでのサブタイトル配信の場合、リージョンの表示終了時刻がわかったとき、TTMLレイヤ(第1の方法)あるいはコンテナレイヤ(第2の方法)でリージョンの表示終了時刻情報を送る。そのため、受信側にリージョンの表示終了時刻情報を与えることができ、受信側ではリージョンの表示終了処理を適切に行うことが可能となる。
 また、図1に示す送受信システム10において、放送送出システム100は、ライブでのサブタイトル配信の場合、リージョンの表示終了時刻がわかったとき、例えば、リージョンの表示終了時刻情報を与えるための制御コマンドを持つセグメントパケットがペイロードに挿入されたPESパケットを新たに生成して送信する(第2の方法)。そのため、サンプルの期間が固定である場合にあっても、受信側にリージョンの表示終了時刻情報を良好に与えることができ、受信側ではリージョンの表示終了処理を適切に行うことが可能となる。
 <2.変形例>
 なお、上述の図15では、コマンドのパケット伝送が固定サンプルに制限されない場合について説明した。しかし、TTMLドキュメントの伝送と同様に、コマンドのパケット伝送が固定サンプルの制限下で行われる場合も想定される。その場合、図26に示すように、表示終了のコマンド実行はPTSからの「latency(LTEn)」をシグナルすることで(図9参照)、所望のタイミング指定が可能となる。
 また、上述実施の形態においては、表示タイミング情報を持つ所定フォーマットのサブタイトルのテキスト情報としてTTMLを用いる例を示した。しかし、本技術は、これに限定されず、TTMLと同等の情報を持つその他のタイムドテキスト情報を用いることも考えられる。例えば、TTMLの派生フォーマットを用いてもよい。
 また、上述実施の形態においては、放送送出システム100とテレビ受信機200とからなる送受信システム10を示したが、本技術を適用し得る送受信システムの構成は、これに限定されるものではない。例えば、テレビ受信機200の部分が、HDMI(High-Definition Multimedia Interface)などのデジタルインタフェースで接続されたセットトップボックスおよびモニタの構成などであってもよい。なお、「HDMI」は登録商標である。
 また、上述実施の形態においては、コンテナ(多重化ストリーム)がMPEG-2トランスポートストリームである例を示した。本技術は、多重化ストリームがMMTストリームあるいはDASH/ISOBMFFストリームなどである場合にも、同様に適用できることは勿論である。
 また、本技術は、以下のような構成を取ることもできる。
 (1)サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを生成するパケット生成部と、
 上記パケット生成部で生成されたパケットを送信する送信部を備え、
 上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化する
 送信装置。
 (2)上記パケットのヘッダには、対応する上記サンプルの開始時刻を示すタイムスタンプが含まれる
 前記(1)に記載の送信装置。
 (3)上記パケットは、PESパケットである
 前記(1)または(2)に記載の送信装置。
 (4)上記パケット生成部で生成されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、
 上記パケット生成部は、
 上記リージョンの表示終了時刻情報が補填された上記サブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットをさらに生成する
 前記(1)から(3)のいずれかに記載の送信装置。
 (5)上記パケット生成部で生成されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、
 上記パケット生成部は、
 上記リージョンの表示終了時刻情報を与えるための制御コマンドがペイロードに配置されたパケットをさらに生成する
 前記(1)から(3)のいずれかに記載の送信装置。
 (6)上記制御コマンドは、リージョンの表示終了を示し、
 上記リージョンの表示終了時刻情報は、上記パケットのヘッダに含まれるタイムスタンプで与えられる
 前記(5)に記載の送信装置。
 (7)上記制御コマンドは、リージョンの表示状態を予め定義された時間間隔でのカウントで示し、
 上記リージョンの表示終了時刻情報は、上記カウントが最後であることを示すときに、該カウントに付加されているタイムオフセットを、上記パケットのヘッダに含まれるタイムスタンプに加算することで与えられる
 前記(5)に記載の送信装置。
 (8)パケット生成部が、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを生成するパケット生成ステップと、
 送信部が、上記パケット生成部で生成されたパケットを送信する送信ステップを有し、
 上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化する
 送信方法。
 (9)サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを受信する受信部を備え、
 上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化し、
 上記パケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントに基づいてリージョン表示を制御する制御部をさらに備える
 受信装置。
 (10)上記受信されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、
 上記制御部は、その後に受信されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントに補填されているリージョンの表示終了時刻情報に基づいて上記リージョンの表示終了を制御する
 前記(9)に記載の受信装置。
 (11)上記受信されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、
 上記制御部は、その後に受信されたパケットのペイロードに配置されたリージョンの表示終了時刻情報を与えるための制御コマンドに基づいて上記リージョンの表示終了を制御する
 前記(9)に記載の受信装置。
 (12)受信部が、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを受信する受信ステップを有し、
 上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化し、
 制御部が、に配置された上記サブタイトルのテキスト情報のドキュメントに基づいてリージョン表示を制御する制御ステップをさらに有する
 受信方法。
 (13)サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを生成するパケット生成部と、
 上記パケット生成部で生成されたパケットを送信する送信部を備え、
 上記パケット生成部で生成されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、
 上記パケット生成部は、
 上記リージョンの表示終了時刻情報を与えるための制御コマンドがペイロードに配置されたパケットをさらに生成する
 送信装置。
 (14)上記サンプルの期間は、固定とされている
 前記(13)に記載の送信装置。
 (15)上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化する
 前記(13)に記載の送信装置。
 (16)上記パケットのヘッダには、対応する上記サンプルの開始時刻を示すタイムスタンプが含まれている
 前記(13)から(15)のいずれかに記載の送信装置。
 (17)上記パケットは、PESパケットである
 前記(13)から(16)のいずれかに記載の送信装置。
 (18)パケット生成部が、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを生成するパケット生成ステップと、
 送信部が、上記パケット生成部で生成されたパケットを送信する送信ステップを有し、
 上記パケット生成ステップでは、上記生成されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、上記リージョンの表示終了時刻情報を与えるための制御コマンドがペイロードに配置されたパケットをさらに生成する
 送信方法。
 (19)サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを受信する受信部と、
 上記パケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントに基づいてリージョン表示を制御する制御部を備え、
 上記制御部は、上記受信されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、その後に受信されたパケットのペイロードに配置されたリージョンの表示終了時刻情報を与えるための制御コマンドに基づいて上記リージョンの表示終了を制御する
 受信装置。
 (20)受信部が、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを受信する受信ステップと、
 制御部が、上記パケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントに基づいてリージョン表示を制御する制御ステップを有し、
 上記制御ステップでは、上記受信されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、その後に受信されたパケットのペイロードに配置されたリージョンの表示終了時刻情報を与えるための制御コマンドに基づいて上記リージョンの表示終了を制御する
 受信方法。
 本技術の主な特徴は、サンプルの期間をサブタイトルの表示の変化期間に合わせて変化させることで、TTMLドキュメントを含むサブタイトルPESパケットの送信頻度を抑制し、伝送効率を高めることを可能としたことである(図17参照)。また、本技術の主な特徴は、ライブでのサブタイトル配信の場合、リージョンの表示終了時刻がわかったとき、TTMLレイヤあるいはコンテナレイヤでリージョンの表示終了時刻情報を送ることで、受信側でリージョンの表示終了処理を適切に行い得るようにしたことである(図15、図19、図21、図23参照)。
 10・・・送受信システム
 100・・・放送送出システム
 110・・・ストリーム生成部
 111・・・制御部
 112・・・ビデオエンコーダ
 113・・・オーディオエンコーダ
 114・・・テキストフォーマット変換部
 115・・・サブタイトルエンコーダ
 116・・・TSフォーマッタ
 200・・・テレビ受信機
 201・・・受信部
 202・・・TS解析部
 203・・・ビデオデコーダ
 204・・・ビデオ重畳部
 205・・・パネル駆動回路
 206・・・表示パネル
 207・・・オーディオデコーダ
 208・・・音声出力回路
 209・・・スピーカ
 210・・・サブタイトルデコーダ
 221・・・CPU
 222・・・フラッシュROM
 223・・・DRAM
 224・・・内部バス
 225・・・リモコン受信部
 226・・・リモコン送信機

Claims (20)

  1.  サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを生成するパケット生成部と、
     上記パケット生成部で生成されたパケットを送信する送信部を備え、
     上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化する
     送信装置。
  2.  上記パケットのヘッダには、対応する上記サンプルの開始時刻を示すタイムスタンプが含まれる
     請求項1に記載の送信装置。
  3.  上記パケットは、PESパケットである
     請求項1に記載の送信装置。
  4.  上記パケット生成部で生成されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、
     上記パケット生成部は、
     上記リージョンの表示終了時刻情報が補填された上記サブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットをさらに生成する
     請求項1に記載の送信装置。
  5.  上記パケット生成部で生成されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、
     上記パケット生成部は、
     上記リージョンの表示終了時刻情報を与えるための制御コマンドがペイロードに配置されたパケットをさらに生成する
     請求項1に記載の送信装置。
  6.  上記制御コマンドは、リージョンの表示終了を示し、
     上記リージョンの表示終了時刻情報は、上記パケットのヘッダに含まれるタイムスタンプで与えられる
     請求項5に記載の送信装置。
  7.  上記制御コマンドは、リージョンの表示状態を予め定義された時間間隔でのカウントで示し、
     上記リージョンの表示終了時刻情報は、上記カウントが最後であることを示すときに、該カウントに付加されているタイムオフセットを、上記パケットのヘッダに含まれるタイムスタンプに加算することで与えられる
     請求項5に記載の送信装置。
  8.  パケット生成部が、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを生成するパケット生成ステップと、
     送信部が、上記パケット生成部で生成されたパケットを送信する送信ステップを有し、
     上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化する
     送信方法。
  9.  サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを受信する受信部を備え、
     上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化し、
     上記パケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントに基づいてリージョン表示を制御する制御部をさらに備える
     受信装置。
  10.  上記受信されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、
     上記制御部は、その後に受信されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントに補填されているリージョンの表示終了時刻情報に基づいて上記リージョンの表示終了を制御する
     請求項9に記載の受信装置。
  11.  上記受信されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、
     上記制御部は、その後に受信されたパケットのペイロードに配置されたリージョンの表示終了時刻情報を与えるための制御コマンドに基づいて上記リージョンの表示終了を制御する
     請求項9に記載の受信装置。
  12.  受信部が、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを受信する受信ステップを有し、
     上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化し、
     制御部が、に配置された上記サブタイトルのテキスト情報のドキュメントに基づいてリージョン表示を制御する制御ステップをさらに有する
     受信方法。
  13.  サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを生成するパケット生成部と、
     上記パケット生成部で生成されたパケットを送信する送信部を備え、
     上記パケット生成部で生成されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、
     上記パケット生成部は、
     上記リージョンの表示終了時刻情報を与えるための制御コマンドがペイロードに配置されたパケットをさらに生成する
     送信装置。
  14.  上記サンプルの期間は、固定とされている
     請求項13に記載の送信装置。
  15. 上記サンプルの期間は、サブタイトルの表示の変化期間に合わせて変化する
     請求項13に記載の送信装置。
  16.  上記パケットのヘッダには、対応する上記サンプルの開始時刻を示すタイムスタンプが含まれている
     請求項13に記載の送信装置。
  17.  上記パケットは、PESパケットである
     請求項13に記載の送信装置。
  18.  パケット生成部が、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを生成するパケット生成ステップと、
     送信部が、上記パケット生成部で生成されたパケットを送信する送信ステップを有し、
     上記パケット生成ステップでは、上記生成されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、上記リージョンの表示終了時刻情報を与えるための制御コマンドがペイロードに配置されたパケットをさらに生成する
     送信方法。
  19.  サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを受信する受信部と、
     上記パケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントに基づいてリージョン表示を制御する制御部を備え、
     上記制御部は、上記受信されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、その後に受信されたパケットのペイロードに配置されたリージョンの表示終了時刻情報を与えるための制御コマンドに基づいて上記リージョンの表示終了を制御する
     受信装置。
  20.  受信部が、サンプル毎に表示タイミング情報を持つサブタイトルのテキスト情報のドキュメントがペイロードに配置されたパケットを受信する受信ステップと、
     制御部が、上記パケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントに基づいてリージョン表示を制御する制御ステップを有し、
     上記制御ステップでは、上記受信されたパケットのペイロードに配置された上記サブタイトルのテキスト情報のドキュメントにリージョンの表示終了時刻情報がないとき、その後に受信されたパケットのペイロードに配置されたリージョンの表示終了時刻情報を与えるための制御コマンドに基づいて上記リージョンの表示終了を制御する
     受信方法。
PCT/JP2017/026080 2016-07-26 2017-07-19 送信装置、送信方法、受信装置および受信方法 WO2018021107A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201780044904.6A CN109479154B (zh) 2016-07-26 2017-07-19 发送装置、发送方法、接收装置和接收方法
EP21204372.3A EP3979654A1 (en) 2016-07-26 2017-07-19 Transmission device, transmission method, reception device, and reception method
JP2018529802A JPWO2018021107A1 (ja) 2016-07-26 2017-07-19 送信装置、送信方法、受信装置および受信方法
EP17834115.2A EP3493548B1 (en) 2016-07-26 2017-07-19 Transmission device, transmission method, reception device, and reception method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016-146812 2016-07-26
JP2016146812 2016-07-26

Publications (1)

Publication Number Publication Date
WO2018021107A1 true WO2018021107A1 (ja) 2018-02-01

Family

ID=61016167

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/026080 WO2018021107A1 (ja) 2016-07-26 2017-07-19 送信装置、送信方法、受信装置および受信方法

Country Status (4)

Country Link
EP (2) EP3979654A1 (ja)
JP (1) JPWO2018021107A1 (ja)
CN (1) CN109479154B (ja)
WO (1) WO2018021107A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008193203A (ja) * 2007-02-01 2008-08-21 Mitsubishi Electric Corp デジタル映像情報データ生成装置、デジタル映像情報記録装置、デジタル映像情報再生装置、及びデジタル映像情報データ生成方法
JP2016110645A (ja) * 2014-11-28 2016-06-20 日本放送協会 分割装置および解析装置、ならびにプログラム
WO2016098790A1 (ja) * 2014-12-19 2016-06-23 ソニー株式会社 送信装置、送信方法、受信装置および受信方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006238147A (ja) * 2005-02-25 2006-09-07 Toshiba Corp コンテンツ再生装置、字幕再生方法及びプログラム
JP4518194B2 (ja) * 2008-06-10 2010-08-04 ソニー株式会社 生成装置、生成方法、及び、プログラム
JP5685969B2 (ja) 2011-02-15 2015-03-18 ソニー株式会社 表示制御方法、表示制御装置
KR102023788B1 (ko) * 2011-07-29 2019-09-20 소니 주식회사 스트리밍 배신 장치 및 방법, 스트리밍 수신 장치 및 방법, 스트리밍 시스템, 프로그램과 기록 매체
JP6399686B2 (ja) * 2014-02-21 2018-10-03 日本放送協会 受信機
JP5672409B1 (ja) * 2014-10-31 2015-02-18 ソニー株式会社 受信装置、およびデータ処理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008193203A (ja) * 2007-02-01 2008-08-21 Mitsubishi Electric Corp デジタル映像情報データ生成装置、デジタル映像情報記録装置、デジタル映像情報再生装置、及びデジタル映像情報データ生成方法
JP2016110645A (ja) * 2014-11-28 2016-06-20 日本放送協会 分割装置および解析装置、ならびにプログラム
WO2016098790A1 (ja) * 2014-12-19 2016-06-23 ソニー株式会社 送信装置、送信方法、受信装置および受信方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3493548A4 *

Also Published As

Publication number Publication date
CN109479154B (zh) 2021-11-05
CN109479154A (zh) 2019-03-15
JPWO2018021107A1 (ja) 2019-05-09
EP3979654A1 (en) 2022-04-06
EP3493548A4 (en) 2019-06-05
EP3493548A1 (en) 2019-06-05
EP3493548B1 (en) 2022-01-26

Similar Documents

Publication Publication Date Title
JP7020406B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP7176598B2 (ja) 送信方法
RU2701172C2 (ru) Передающее устройство, способ передачи, приемное устройство и способ приема
JP6825558B2 (ja) 送信装置、送信方法、再生装置および再生方法
JP6760296B2 (ja) 送信装置、送信方法、再生装置および再生方法
US11765330B2 (en) Transmitter, transmission method, receiver, and reception method
WO2018021107A1 (ja) 送信装置、送信方法、受信装置および受信方法
WO2017126509A1 (ja) 送信装置、送信方法、受信装置および受信方法
JP2024152974A (ja) 送信方法、送信装置、受信方法および受信装置

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2018529802

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17834115

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2017834115

Country of ref document: EP

Effective date: 20190226