WO2017130804A1 - 受信装置、受信方法および送信装置 - Google Patents

受信装置、受信方法および送信装置 Download PDF

Info

Publication number
WO2017130804A1
WO2017130804A1 PCT/JP2017/001438 JP2017001438W WO2017130804A1 WO 2017130804 A1 WO2017130804 A1 WO 2017130804A1 JP 2017001438 W JP2017001438 W JP 2017001438W WO 2017130804 A1 WO2017130804 A1 WO 2017130804A1
Authority
WO
WIPO (PCT)
Prior art keywords
subtitle
display position
display
information
video
Prior art date
Application number
PCT/JP2017/001438
Other languages
English (en)
French (fr)
Inventor
塚越 郁夫
高林 和彦
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to CN201780007170.4A priority Critical patent/CN108476341B/zh
Priority to US16/070,815 priority patent/US10511882B2/en
Priority to JP2017564186A priority patent/JP6969386B2/ja
Priority to EP17744034.4A priority patent/EP3410730A4/en
Publication of WO2017130804A1 publication Critical patent/WO2017130804A1/ja
Priority to US16/665,370 priority patent/US20200068247A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2355Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages
    • H04N21/2358Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages for generating different versions, e.g. for different recipient devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • H04N21/4355Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream involving reformatting operations of additional data, e.g. HTML pages on a television screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • H04N7/087Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only
    • H04N7/088Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital
    • H04N7/0884Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection
    • H04N7/0885Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection for the transmission of subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8233Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a character code signal

Definitions

  • the present technology relates to a receiving device, a receiving method, and a transmitting device, and particularly to a transmitting device that transmits subtitle information together with video data.
  • subtitle information is transmitted as bitmap data.
  • character code of text that is, on a text basis.
  • TTML Timed Text Markup Language
  • W3C World Wide Web Consortium
  • a caption display position in, for example, a relative position with respect to a video area in caption display position information included in caption information.
  • a part of the subtitle may not be displayed outside the display area depending on the display method.
  • the purpose of the present technology is to enable the subtitle display to be performed satisfactorily when the subtitle display position is designated as a relative position.
  • a receiver that receives a container including a video stream having video data and a subtitle stream having subtitle information including subtitle display position information that specifies a subtitle display position relative to a subtitle display range;
  • the subtitle display position is determined based on the subtitle display position information using the display video area as the subtitle display range, the resizing process is performed on the determined subtitle display position, and the subtitle display position subjected to the resizing process is determined.
  • a display position control process for controlling the display position of the caption bitmap data, and a controller for controlling a video superimposition process for superimposing the caption bitmap data for which the display position control has been performed on the video data. It is in the receiving device.
  • the receiving unit receives a container including a video stream having video data and a subtitle stream having subtitle information.
  • the caption display position information included in the caption information the caption display position is specified as a relative position with respect to the caption display range.
  • the control unit controls video decoding processing, subtitle decoding processing, display position control processing, and superimposition processing.
  • video data is obtained by decoding a video stream.
  • the subtitle decoding process the subtitle stream is decoded to obtain subtitle bitmap data.
  • the display position control process when the aspect ratio of the video area is different from the aspect ratio of the display video area, the display video area is set as the subtitle display range, and the subtitle display position is determined based on the subtitle display position information.
  • the determined subtitle display position is resized, and the display position control is performed on the subtitle bitmap data based on the subtitle display position on which the resize process has been performed.
  • the bitmap data of the caption for which the display position control is performed is superimposed on the video data. For example, in the resizing process, if the determined caption display position is compressed only in the horizontal direction, it is also compressed in the same direction in the vertical direction.
  • the resize processing is further performed on the subtitle display position determined by setting the display video area as the subtitle display range. Therefore, even when the aspect ratio of the video area and the aspect ratio of the display video area are different, the original shape can be maintained as the subtitle display position, and the subtitle display can be performed satisfactorily without giving the viewer a sense of incongruity. Can be done.
  • the compression when the vertical size is compressed in the subtitle display position resizing process, the compression may be performed with the predetermined line position fixed.
  • the predetermined line position fixed for example, when there are two subtitle display positions, the vertical interval between the two subtitle display positions is maintained even if the resizing process is performed. It becomes possible.
  • the subtitle information included in the subtitle stream includes information related to the resizing process.
  • the resizing process is performed on the determined subtitle display position using the information related to the resizing process. May be applied.
  • the information related to the resizing process may be information indicating a line position that should be a fixed position when the vertical size is compressed in the subtitle display position resizing process.
  • a receiving unit that receives a container including a video stream having video data and a subtitle stream including subtitle information including subtitle display position information that specifies a subtitle display position relative to the subtitle display range; , When the video area aspect ratio and the display video area aspect ratio differ between the video decoding process that decodes the video stream to obtain video data and the subtitle decoding process that decodes the subtitle stream to obtain subtitle bitmap data.
  • a subtitle display range is set in the display video area, a subtitle display position is determined based on the subtitle display position information, and display position control is performed on bitmap data of the subtitle based on the determined subtitle display position
  • a control unit for controlling the video superimposition process for superimposing the bitmap data of the caption on which the display position control has been performed on the video data.
  • the receiving unit receives a container including a video stream having video data and a subtitle stream having subtitle information.
  • the caption display position information included in the caption information the caption display position is specified as a relative position with respect to the caption display range.
  • the control unit controls video decoding processing, subtitle decoding processing, display position control processing, and superimposition processing.
  • video decoding process video data is obtained by decoding a video stream.
  • subtitle decoding process the subtitle stream is decoded to obtain subtitle bitmap data.
  • a subtitle display range is set in the display video area, and the subtitle display position is determined based on the subtitle display position information.
  • the display position control is performed on the bitmap data of the caption based on the caption display position. For example, a caption display range having the same aspect ratio as that of the video area is set in the display video area.
  • the video superimposing unit superimposes the subtitle bitmap data on which display position control has been performed on the video data.
  • the subtitle display range is set in the display video area, and the subtitle display position is determined based on the subtitle display position information. Therefore, even when the aspect ratio of the video area and the aspect ratio of the display video area are different, the original shape can be maintained as the subtitle display position, and the subtitle display can be performed satisfactorily without giving the viewer a sense of incongruity. Can be done.
  • the subtitle information included in the subtitle stream includes the subtitle display range information.
  • the subtitle display range information is added to the display video area using the subtitle display range information. May be set.
  • the subtitle display range information may be subtitle display range reference point information and aspect ratio information, or subtitle display range reference point information.
  • the caption display position information included in the caption information is specified as a relative position to the caption display range,
  • the above caption information is
  • the transmission apparatus includes information related to the subtitle display position resizing process performed based on the subtitle display position information performed on the reception side when the aspect ratio of the video area and the aspect ratio of the display video area are different.
  • the transmission unit transmits a container including a video stream having video data and a subtitle stream having subtitle information.
  • the container includes containers of various formats such as MPEG-2 TS transport stream or MMT transport stream adopted in the digital broadcasting standard, ISOBMFF (MP4) used in Internet distribution.
  • the caption display position information included in the caption information is specified as a relative position to the caption display range.
  • the subtitle information includes information related to the resize processing of the subtitle display position determined based on the subtitle display position information, which is performed on the receiving side when the aspect ratio of the video area is different from the aspect ratio of the display video area.
  • the information related to the resizing process may be information indicating a line position that should be a fixed position when the vertical size is compressed in the subtitle display position resizing process.
  • the subtitle information includes information related to the resizing process performed on the receiving side. Since the information related to the resizing process is included in the caption information in this way, the receiving side can easily perform the resizing process appropriately by performing the resizing process based on this information.
  • the caption display position information included in the caption information is specified as a relative position to the caption display range,
  • the above caption information is It exists in the transmitting apparatus including the information of the caption display range.
  • the transmission unit transmits a container including a video stream having video data and a subtitle stream having subtitle information.
  • the caption display position information included in the caption information is specified by a relative position with respect to the caption display range.
  • the caption information includes the caption display range information.
  • the caption display range information may be reference point information and aspect ratio information of the caption display range, or reference point information of the caption display range.
  • the caption information includes the caption display range information.
  • the caption information includes the caption display range information, and the reception side can easily set the caption display range appropriately in the display video area by setting the caption display range based on this information. It becomes possible.
  • subtitle display can be performed satisfactorily when the subtitle display position is designated as a relative position.
  • the effects described in the present specification are merely examples and are not limited, and may have additional effects.
  • the display video area is set as the subtitle display range, and the subtitle display position is determined based on the subtitle display position information (first method)
  • the subtitle display position is determined based on the subtitle display position information (first method)
  • the display video area is set as the subtitle display range
  • the subtitle display position is determined based on the subtitle display position information
  • the resize processing is performed. It is a figure which shows the example of a subtitle display in a case (1st method) (two subtitle display positions).
  • the subtitle display range is set in the display video area, and the subtitle display position is determined based on the subtitle display position information (second method) )
  • the subtitle display range is set in the display video area, and the subtitle display position is determined based on the subtitle display position information (second method) )
  • FIG. 1 shows a configuration example of a transmission / reception system 10 as an embodiment.
  • the transmission / reception system 10 includes a broadcast transmission system 100 and a television receiver 200.
  • the broadcast transmission system 100 transmits a transport stream of MPEG-2 TS (hereinafter simply referred to as “transport stream TS”) as a container (multiplexed stream) on a broadcast wave.
  • transport stream TS MPEG-2 TS
  • the transport stream TS includes a video stream having video data and a subtitle stream having subtitle information.
  • the caption information is text information of a caption in a predetermined format.
  • this text information for example, TTML or a TTML derivative format can be considered.
  • TTML is assumed.
  • the caption display position information included in this TTML the caption display position (region) is specified by a relative position (proportional value) to the caption display range.
  • This TTML includes information related to the resize processing of the subtitle display position determined based on the subtitle display position information performed on the receiving side when the aspect ratio of the video area and the aspect ratio of the display video area are different.
  • the information related to the resizing process is information indicating a line position that should be a fixed position when the vertical size is compressed in the subtitle display position resizing process.
  • the TTML also includes information on the subtitle display range.
  • the caption display range information is reference point information and aspect ratio information of the caption display range, or reference point information of the caption display range.
  • the television receiver 200 receives the transport stream TS sent from the broadcast transmission system 100.
  • the television receiver 200 performs decoding processing on a video stream having video data to obtain video data, and performs decoding processing on a subtitle stream having subtitle information to obtain subtitle bitmap data.
  • the caption display position information included in the caption information the caption display position is specified as a relative position with respect to the caption display range.
  • the television receiver 200 determines the caption display position based on the caption display position information, and performs display position control for the bitmap data of the caption based on the determined caption display position.
  • the television receiver 200 superimposes subtitle bitmap data on which display position control has been performed on the video data to obtain video data for display.
  • the television receiver 200 When the aspect ratio of the video area is different from the aspect ratio of the display video area (video area displayed on the monitor) as the display position control for the caption bitmap data, the television receiver 200 performs the following first method or first method. Method 2 is selectively executed.
  • the television receiver 200 determines the caption display position based on the caption display position information with the display video area as the caption display range. Then, a resizing process is performed on the determined caption display position, and display position control is performed on the bitmap data of the caption based on the caption display position on which the resizing process has been performed.
  • the resizing process is a process for restoring the original shape as the caption display position. For example, when the determined caption display position is compressed only in the horizontal direction, it is compressed in the vertical direction at the same rate. For example, when compressing the size in the vertical direction by resizing, the compression is performed with a predetermined line position such as the top line (upper line), bottom line (lower line), or middle line (middle line) fixed. To do.
  • the television receiver 200 can use the information.
  • the television receiver 200 sets a subtitle display range in the display video area and sets the subtitle display position based on the subtitle display position information.
  • the display position is controlled for the bitmap data of the caption based on the determined caption display position.
  • a caption display range having the same aspect ratio as that of the video area is set in the display video area.
  • the television receiver 200 can appropriately set the subtitle display range using the information. For example, the television receiver 200 selects the second method when the subtitle information included in the subtitle stream includes the subtitle display range information, and selects the first method when the subtitle stream does not include the subtitle display range information.
  • FIG. 2 shows an example of the subtitle display position (region) determined by the subtitle display position information.
  • “RP” indicates the reference point (Reference Pont) which is the top-left of the caption display range.
  • FIG. 2A shows an example in which the video area has the same aspect ratio as the display video area.
  • the aspect ratio of the video area is 16: 9
  • the aspect ratio of the monitor is 16: 9
  • the aspect ratio of the display video area is 16: 9.
  • the display video area is set as the caption display range
  • the caption display position is determined based on the caption display position information specified by the relative position to the display video area.
  • FIG. 2B shows a case where the aspect ratio of the video area is different from the aspect ratio of the display video area.
  • the display video area is set as the subtitle display range, and the subtitle display position is determined based on the subtitle display position information.
  • This is an example of a case (first method).
  • the aspect ratio of the video area is 16: 9, the aspect ratio of the monitor is 4: 3, and the display method is center-cut.
  • the ratio is 4: 3.
  • the subtitle display position has the same width in the vertical direction as compared with the case of FIG. 2A, but the width is compressed in the horizontal direction.
  • the shape of the caption display position is different from that in the case of FIG.
  • FIG. 2C shows a case where the aspect ratio of the video area is different from the aspect ratio of the display video area.
  • a subtitle display range is set in the display video area, and the subtitle display position is determined based on the subtitle display position information.
  • the aspect ratio of the video area is 16: 9
  • the aspect ratio of the monitor is 4: 3
  • the display method is center-cut.
  • the ratio is 4: 3.
  • the caption display position has a compressed width in both the vertical direction and the horizontal direction as compared with the case of FIG.
  • the aspect ratio of the set caption display range is 16: 9
  • the shape of the caption display position is the same as in the case of FIG.
  • FIG. 3 shows an example of a TTML structure.
  • TTML is described based on XML.
  • the language (language) and name space (name space) are defined in the tt root container.
  • a namespace is defined as a unique element name that can be uniquely identified in all elements in the system or standard system.
  • tts: extent first declares the target area of 100% of the video that is the target of the position information of subtitles
  • “Fullvideo” is for 4K video Indicates the entire video with a resolution of 3840 (H) ⁇ 2160 (V), and when the target is 2K (full HD) video, indicates the entire video with a resolution of 1920 (H) ⁇ 1080 (V).
  • “Dto: dispasp “ 16: 9 ”” indicates the aspect ratio information of the subtitle display range, and indicates that the subtitle display range is an area having an aspect ratio of 16: 9. In the example shown in the figure, the aspect ratio of the subtitle display range is 16: 9, but the aspect ratio of the subtitle display range is specified as 4: 3, 21: 9, as shown in FIG. It is also possible to do.
  • “Dto: RPoffset “ Ax%, By% ”” indicates the reference point information of the subtitle display range, and as shown in FIG. 4, the subtitle display range when the horizontal and vertical directions of the display video area are each 100%. The position of the reference point (RP: Reference Point) is indicated by the ratio of the offset from the top-left of the display video area.
  • the XML ID is indicated by “p1”, the region ID is indicated by “r1”, and text data of the subtitle (subtitle) is described.
  • the text data is “ABCDE”.
  • the line position to be fixed is shown as the top line (upper line).
  • the bottom line (lower line) and the middle line (intermediate line) are shown.
  • Etc. can also be specified.
  • FIG. 5 also shows an example of the TTML structure.
  • the XML ID is indicated by “p1”
  • the region ID is indicated by “r1”
  • the text data of the subtitle (subtitle) is described in relation to the first subtitle position.
  • the text data is “ABCDE”.
  • the line position that should be the fixed position is the bottom line (lower line).
  • the XML ID is indicated by “p2”
  • the region ID is indicated by “r2”
  • the text data of the subtitle (subtitle) is described in relation to the second subtitle position.
  • the text data is “FGH”.
  • the line position that should be the fixed position is the top line (upper line).
  • FIG. 6 shows a display example of subtitles (subtitles) when the aspect ratio of the video area and the aspect ratio of the display video area (video area displayed on the monitor) are the same.
  • the video area has an aspect ratio of 16: 9 and the monitor has an aspect ratio of 16: 9, and has a TTML structure (one caption display position) as shown in FIG. It is an example.
  • the video area is indicated by a broken line frame
  • the monitor area is indicated by a solid line frame.
  • the display video area is set as the caption display range
  • “RP” indicates the reference point (Reference Pont) which is the top-left of the caption display range.
  • the subtitle “ABCDE” based on text data is displayed at the subtitle display position determined in this way.
  • the frames indicating the video area, the monitor area, and the caption display range are displayed in a shifted manner, but this is a measure for clearly displaying each frame. ing. Although the description is omitted, the same display is performed in each of the following drawings.
  • FIG. 7 also shows a display example of subtitles (subtitles) when the aspect ratio of the video area and the aspect ratio of the display video area (video area displayed on the monitor) are the same.
  • the video area has an aspect ratio of 16: 9 and the monitor has an aspect ratio of 16: 9, and has a TTML structure (two subtitle display positions) as shown in FIG. It is an example.
  • the video area is indicated by a broken line frame
  • the monitor area is indicated by a solid line frame.
  • the display video area is the subtitle display range
  • the subtitle “ABCDE” based on text data is displayed at the first subtitle display position (first region), and the subtitle “FGH” based on text data is displayed at the second subtitle display position (second region). Yes.
  • the interval between the two caption display positions (regions) is, for example, 10 lines.
  • FIG. 8 shows a case where the aspect ratio of the video area is different from the aspect ratio of the display video area (video area displayed on the monitor), where the display video area is the subtitle display range, and the subtitle is displayed based on the subtitle display position information
  • the example of a subtitle (subtitle) display in the case where the display position is determined (first method) is shown.
  • the aspect ratio of the video area is 16: 9 and the aspect ratio of the monitor is 4: 3, and the TTML structure (with one caption display position) as shown in FIG. 3 is used. It is an example.
  • the video area is indicated by a broken line frame
  • the monitor area is indicated by a solid line frame.
  • the subtitle “ABCDE” based on the text data is displayed at the subtitle display position.
  • the caption display position has the same width in the vertical direction as compared with the case of FIG. 6, but the width is compressed in the horizontal direction.
  • the font size of the caption is adjusted to a smaller size as the width of the caption display position is compressed.
  • FIG. 9 shows a display example when the resizing process is performed.
  • the display position is compressed in the vertical direction at the same rate.
  • the compression in the vertical width is performed in a state where a predetermined line position is fixed.
  • the broken line frame indicates the caption display position before the compression of the width in the vertical direction.
  • FIG. 10 also shows a case where the aspect ratio of the video area is different from the aspect ratio of the display video area (video area displayed on the monitor).
  • the example of a subtitle (subtitle) display in the case where the display position is determined (first method) is shown.
  • the video area has an aspect ratio of 16: 9 and the monitor has an aspect ratio of 4: 3, and has a TTML structure (two subtitle display positions) as shown in FIG.
  • the display example when resizing processing is performed is shown.
  • the video area is indicated by a broken line frame
  • the monitor area is indicated by a solid line frame.
  • the display video area is the subtitle display range
  • the subtitle “ABCDE” based on text data is displayed at the first subtitle display position (first region), and the subtitle “FGH” based on text data is displayed at the second subtitle display position (second region). Yes.
  • the font size of the subtitle is adjusted to match it.
  • the predetermined line position is the bottom line (lower line). This is an example.
  • the predetermined line position is the top line (upper line) It is.
  • FIG. 11 shows a case where the aspect ratio of the video area is different from the aspect ratio of the display video area (video area displayed on the monitor), and a subtitle display range is set in the display video area, based on the subtitle display position information.
  • a display example of subtitles (subtitles) when the subtitle display position is determined (second method) is shown.
  • the aspect ratio of the video area is 16: 9 and the aspect ratio of the monitor is 4: 3, and the TTML structure (with one caption display position) as shown in FIG. 3 is used.
  • a display example is shown.
  • the video area is indicated by a broken line frame
  • the monitor area is indicated by a solid line frame.
  • the subtitle “ABCDE” based on the text data is displayed at the subtitle display position. In this case, according to the compression of the subtitle display position (region), the font size of the subtitle is adjusted to match it.
  • a caption display range having the same aspect ratio as that of the video area is set in the display video area.
  • a subtitle display range having an aspect ratio of 16: 9 is set in the display video area.
  • the subtitle display position is the width compressed in both the vertical direction and the horizontal direction
  • the shape of the subtitle display position is the same as that in FIG. 6, and the subtitle display position accompanying the adjustment of the font size of the subtitles. No adjustment (resizing process) is required.
  • FIG. 12 also shows a case where the aspect ratio of the video area is different from the aspect ratio of the display video area (video area displayed on the monitor), and a subtitle display range is set in the display video area, based on the subtitle display position information.
  • a display example of subtitles (subtitles) when the subtitle display position is determined (second method) is shown.
  • the video area has an aspect ratio of 16: 9 and the monitor has an aspect ratio of 4: 3, and has a TTML structure (two subtitle display positions) as shown in FIG.
  • a display example is shown.
  • the video area is indicated by a broken line frame
  • the monitor area is indicated by a solid line frame.
  • the display video area is the subtitle display range
  • the first and second subtitle display positions (regions) are determined.
  • the subtitle “ABCDE” based on text data is displayed at the first subtitle display position (first region)
  • the subtitle “FGH” based on text data is displayed at the second subtitle display position (second region). Yes.
  • FIG. 13 illustrates a configuration example of the stream generation unit 110 of the broadcast transmission system 100.
  • the stream generation unit 110 includes a control unit 111, a video encoder 112, an audio encoder 113, a text format conversion unit 114, a subtitle encoder 115, and a TS formatter (multiplexer) 116.
  • the control unit 111 is configured to include, for example, a CPU (Central Processing Unit), and controls the operation of each unit of the stream generation unit 110.
  • the video encoder 112 receives the video data DV, encodes the video data DV, and generates a video stream (PES stream) composed of video PES packets having encoded video data in the payload.
  • PES stream video stream
  • the audio encoder 113 receives the audio data DA, encodes the audio data DA, and generates an audio stream (PES stream) composed of audio PES packets having encoded audio data.
  • the text format conversion unit 114 receives text data (character code) DT and obtains TTML (Timed Text Markup Language) as caption information (see FIGS. 3 and 5).
  • the caption display position information included in this TTML is specified by a relative position (proportional value) to the caption display range. Also, in this TTML, information on the resize processing of the subtitle display position performed on the receiving side when the aspect ratio of the video area and the aspect ratio of the display video area are different, for example, the vertical size in the resize process of the subtitle display position. Information indicating a line position to be a fixed position in the case of compression is included.
  • the TTML also includes information on the caption display range (reference point information and aspect ratio information on the caption display range).
  • the subtitle encoder 115 converts the TTML obtained by the text format conversion unit 114 into various segments, and generates a subtitle stream (PES stream) composed of subtitle PES packets in which the segments are arranged in the payload.
  • PES stream a subtitle stream
  • the TS formatter 116 transports and multiplexes the video stream generated by the video encoder 112, the audio stream generated by the audio encoder 113, and the subtitle stream generated by the subtitle encoder 115 into a container (multiplexed stream). As a transport stream TS.
  • the video data DV is supplied to the video encoder 112.
  • the video data DV is encoded, and a video stream (PES stream) composed of video PES packets having encoded image data in the payload is generated.
  • This video stream is supplied to the TS formatter 116.
  • the audio data DA is supplied to the audio encoder 113.
  • the audio encoder 113 encodes the audio data DA and generates an audio stream (PES stream) including audio PES packets having encoded audio data. This audio stream is supplied to the TS formatter 116.
  • the text data (character code) DT is supplied to the text format conversion unit 114.
  • the text format conversion unit 114 obtains TTML as caption information (see FIGS. 3 and 5).
  • This TTML is supplied to the subtitle encoder 115.
  • TTML is converted into various segments, and a subtitle stream including subtitle PES packets in which those segments are arranged in the payload is generated.
  • This subtitle stream is supplied to the TS formatter 116.
  • the video stream generated by the video encoder 112 the audio stream generated by the audio encoder 113, and the subtitle stream generated by the subtitle encoder 115 are transport packetized and multiplexed, and the container (multiplexed) A transport stream TS as a stream) is generated.
  • FIG. 14 shows a configuration example of the television receiver 200.
  • the television receiver 200 includes a receiving unit 201, a TS analyzing unit (demultiplexer) 202, a video decoder 203, a video superimposing unit 204, a panel driving circuit 205, and a display panel 206 as a monitor (display). is doing.
  • the television receiver 200 includes an audio decoder 207, an audio output circuit 208, a speaker 209, and a subtitle decoder 210.
  • the television receiver 200 also includes a CPU 221, a flash ROM 222, a DRAM 223, an internal bus 224, a remote control receiver 225, and a remote control transmitter 226.
  • the CPU 221 controls the operation of each part of the television receiver 200.
  • the flash ROM 222 stores control software and data.
  • the DRAM 223 constitutes a work area for the CPU 221.
  • the CPU 221 develops software and data read from the flash ROM 222 on the DRAM 223 to activate the software, and controls each unit of the television receiver 200.
  • the remote control receiving unit 225 receives the remote control signal (remote control code) transmitted from the remote control transmitter 226 and supplies it to the CPU 221.
  • the CPU 221 controls each part of the television receiver 200 based on this remote control code.
  • the CPU 221, flash ROM 222, and DRAM 223 are connected to the internal bus 224.
  • the receiving unit 201 receives the transport stream TS transmitted from the broadcast transmission system 100 on a broadcast wave.
  • the transport stream TS includes a video stream, an audio stream, and a subtitle stream.
  • the TS analysis unit 202 extracts PES packets of video, audio, and subtitle streams from the transport stream TS.
  • the audio decoder 207 performs decoding processing on the audio PES packet obtained by the TS analysis unit 202 to obtain audio data.
  • the audio output circuit 208 performs necessary processing such as D / A conversion and amplification on the audio data and supplies the audio data to the speaker 209.
  • the video decoder 203 performs a decoding process on the video PES packet obtained by the TS analysis unit 202 to obtain video data. Note that the video decoder 203 also performs resolution conversion of video data as appropriate according to the display mode and the like. For example, when the aspect ratio of the video area is 16: 9, the aspect ratio of the monitor (display) is 4: 3, and the display mode is letterbox, the resolution conversion of the video data is performed.
  • the subtitle decoder 210 performs decoding processing on the subtitle PES packet obtained by the TS analysis unit 202, and converts the subtitle (subtitle) text data (font data) of each subtitle display position (region) included in the TTML into bitmap data. (Binary image information) is converted.
  • the font size of the subtitle is determined by the subtitle display position information under the control of the CPU 221 or is a font specified by TTML according to the size of the subtitle display position obtained by further resizing processing. The size is adjusted appropriately.
  • the subtitle decoder 210 extracts various information from the TTML and supplies it to the CPU 221.
  • This information includes attribute information (attribute information) defined by ⁇ tt> and ⁇ head>.
  • the CPU 221 determines a caption display position based on the caption display position information, and further performs a resizing process on the determined caption display position as necessary. Details of the subtitle display position determination and resizing process performed by the CPU 221 will be described later.
  • the video superimposing unit 204 superimposes the subtitle bitmap data of each subtitle display position obtained by the subtitle decoder 210 on the video data obtained by the video decoder 203 to obtain display video data.
  • the CPU 221 determines that the superimposed position of the caption bitmap data becomes the caption display position based on the caption display position determined by the caption display position information as described above or obtained by further resizing. To control.
  • the panel drive circuit 205 drives the display panel 206 based on the display video data obtained by the video superimposing unit 204.
  • the display panel 206 includes, for example, an LCD (Liquid Crystal Display), an organic EL display (organic electroluminescence display), and the like.
  • the receiving unit 201 receives the transport stream TS transmitted from the broadcast transmission system 100 on the broadcast wave.
  • the transport stream TS includes a video stream, an audio stream, and a subtitle stream.
  • the transport stream TS is supplied to the TS analysis unit 202.
  • the TS analysis unit 202 extracts PES packets of video, audio, and subtitle streams from the transport stream TS.
  • the video PES packet extracted by the TS analysis unit 202 is supplied to the video decoder 203.
  • the video PES packet is decoded to obtain video data.
  • the video decoder 203 also appropriately converts the resolution of the video data according to the display mode.
  • the subtitle PES packet extracted by the TS analysis unit 202 is supplied to the subtitle decoder 210.
  • the subtitle PES packet obtained by the TS analysis unit 202 is decoded, and based on the text data included in the TTML, subtitle bitmap data at each subtitle display position to be superimposed on the video data. Is obtained.
  • various information is extracted from the TTML and supplied to the CPU 221.
  • This information includes attribute information (attribute information) defined by ⁇ tt> and ⁇ head>.
  • the CPU 221 determines the caption display position based on the caption display position information, and further performs the resizing process on the determined caption display position as necessary.
  • Bitmap data of subtitles at each subtitle display position output from the subtitle decoder 210 is supplied to the video superimposing unit 204.
  • the video superimposing unit 204 superimposes subtitle bitmap data at each subtitle display position obtained by the subtitle decoder 210 on the video data obtained by the video decoder 203 to obtain video data for display.
  • the CPU 221 controls the superimposed position of the caption bitmap data to be the caption display position based on the caption display position determined by the caption display position information or obtained by further resizing. .
  • the display video data obtained by the video superimposing unit 204 is supplied to the panel drive circuit 205.
  • the panel drive circuit 205 drives the display panel 206 based on the display video data. Thereby, the display panel 206 displays an image in which a caption (subtitle) is superimposed on each caption display position (region).
  • the audio PES packet extracted by the TS analysis unit 202 is supplied to the audio decoder 207.
  • the audio PES packet is decoded and audio data is obtained.
  • This audio data is supplied to the audio output circuit 208.
  • the audio output circuit 208 performs necessary processing such as D / A conversion and amplification on the audio data.
  • the processed audio data is supplied to the speaker 209. Thereby, an audio output corresponding to the display image on the display panel 206 is obtained from the speaker 209.
  • Subtitle display position determination and resizing procedure Details of the procedure for determining the subtitle display position and resizing processing in the CPU 221 will be described.
  • the flowchart in FIG. 15 shows an example of the procedure for determining the caption display position and resizing processing in the CPU 221.
  • the aspect ratio of the video area is 16: 9.
  • the aspect ratio of the designated subtitle display range is 16: 9 and 4: 3
  • the monitor (display) has an aspect ratio of 16: 9 and 4: 3.
  • step ST2 the CPU 221 starts a process by step ST1, and moves to the process of step ST2 after that.
  • the CPU 221 determines whether or not the receiver display is a mode for displaying the entire video area. For example, when the aspect ratio of the monitor is 16: 9 (see FIG. 17A), or when the monitor aspect ratio is 4: 3 and a letterbox display method is adopted (FIG. 17 ( In b), it is determined that the mode is a mode for displaying the entire video area. Further, for example, when the aspect ratio of the monitor is 4: 3 and the center-cut display method is employed (see FIG. 17C), it is determined that the mode does not display the entire video area. To do.
  • step ST3 the CPU 221 determines whether or not a caption display range is designated. For example, when the reference point information (RPoffset) and aspect ratio information (dispasp) of the caption display range exist in the TTML tt root container, it is determined that the caption display range is designated.
  • RPoffset reference point information
  • dispasp aspect ratio information
  • FIG. 18A shows an example when the aspect ratio of the monitor is 16: 9.
  • FIG. 18B shows an example in which the aspect ratio of the monitor is 4: 3 and the letterbox display method is adopted.
  • RP indicates a reference point (Reference Pont) that is the top-left of the caption display range.
  • step ST4 After the process in step ST4, the CPU 221 ends the process in step ST5.
  • step ST6 the CPU 221 determines a caption display position (region) in the designated caption display range.
  • the CPU 221 uses only the aspect ratio information (dispasp) as the caption display range information, and sets the caption display range on the display video area.
  • FIG. 19A shows an example in which the aspect ratio of the monitor is 16: 9 and the aspect ratio indicated by the aspect ratio information (dispasp) is 16: 9.
  • FIG. 19B shows an example in which the aspect ratio of the monitor is 16: 9 and the aspect ratio indicated by the aspect ratio information (dispasp) is 4: 3.
  • the CPU 221 matches the vertical width or horizontal width at the center of the display video area and the aspect ratio information ( Set the subtitle display range of the aspect ratio indicated by (dispasp).
  • the aspect ratio of the monitor is 16: 9
  • the aspect ratio information (dispasp) is 4: 3, so that the vertical widths match.
  • FIG. 19C shows an example in which the monitor aspect ratio is 4: 3, the letterbox display method is used, and the aspect ratio indicated by the aspect ratio information (dispasp) is 16: 9.
  • FIG. 19D shows an example in which the aspect ratio of the monitor is 4: 3, the letterbox display method is used, and the aspect ratio indicated by the aspect ratio information (dispasp) is 4: 3. .
  • step ST6 the CPU 221 ends the process in step ST5.
  • step ST7 the CPU 221 determines whether or not a caption display range is designated. For example, when the reference point information (RPoffset) and aspect ratio information (dispasp) of the caption display range exist in the TTML tt root container, it is determined that the caption display range is designated.
  • RPoffset reference point information
  • dispasp aspect ratio information
  • FIG. 20A shows an example in which the aspect ratio of the monitor is 4: 3 and a center-cut display method is adopted.
  • the vertical width of the caption display position is compressed from EV% to EV u% by resizing processing.
  • step ST8 the CPU 221 ends the process in step ST5.
  • step ST9 the CPU 221 determines a caption display position (region) in the designated caption display range. At this time, the CPU 221 sets the subtitle display range on the display video area using the subtitle display range information (reference point information (RPoffset), aspect ratio information (dispasp)).
  • the subtitle display range information reference point information (RPoffset), aspect ratio information (dispasp)
  • the CPU 221 sets the position shifted from the top-left of the display video area by the reference point information (RPoffset) as the top-left of the caption display range, and aspect ratio information (dispasp)
  • the range corresponding to the aspect ratio indicated by is set as the caption display range.
  • the horizontal width of the caption display range is the same as the horizontal width of the display video area.
  • FIG. 20B shows an example in which the aspect ratio of the monitor is 4: 3, the center cut display method is used, and the aspect ratio indicated by the aspect ratio information (dispasp) is 16: 9.
  • FIG. 20C illustrates an example in which the aspect ratio of the monitor is 4: 3, the center cut display method is employed, and the aspect ratio indicated by the aspect ratio information (dispasp) is 4: 3. .
  • step ST9 the CPU 221 ends the process in step ST5.
  • the television receiver 200 uses the display video area as the subtitle display range as the subtitle display position information. Further resize processing is performed on the subtitle display position determined based on this to obtain a final subtitle display position, or a subtitle display range is set in the display video area, and the subtitle display position is determined based on the subtitle display position information . Therefore, even when the aspect ratio of the video area and the aspect ratio of the display video area are different, the original shape can be maintained as the subtitle display position, and the subtitle display can be performed satisfactorily without giving the viewer a sense of incongruity. Can be done.
  • the broadcast transmission system 100 compresses the size in the vertical direction by, for example, the resize processing of the subtitle display position, as information on the resize processing performed on the receiving side, to TTML as subtitle information
  • information indicating a line position to be a fixed position is included. Therefore, the receiving side can easily perform the resizing process appropriately based on this information.
  • the broadcast transmission system 100 includes information on the caption display range in TTML serving as caption information. Therefore, the reception side can easily set the caption display range in the display video area by setting the caption display range based on this information.
  • the broadcast transmission system 100 includes the reference point information (RPoffset) and the aspect ratio information (dispasp) as information of the caption display range in the TTML.
  • the broadcast transmission system 100 may include only the reference point information (RPoffset) as the caption display range information in the TTML.
  • 21 and 22 show an example of the TTML structure in that case. Although detailed description is omitted, these TTML structure examples are the same as the TTML structure examples shown in FIGS. 3 and 5 except that there is no aspect ratio information (dispasp) of the caption display range.
  • FIG. 1 An example of how the CPU 221 of the television receiver 200 sets the caption display range when only the reference point information (RPoffset) is given will be described with reference to FIG.
  • the illustrated example shows a case where the aspect ratio of the video area is 16: 9 and the aspect ratio of the display video area is 4: 3.
  • the CPU 221 Based on the reference point information (RPoffset), the CPU 221 first sets a position shifted from the top-left of the display video area by the reference point information (RPoffset) as the reference point RP of the caption display range.
  • the center position of the display video area is OP
  • the coordinate position of point symmetry with respect to OP of the reference point RP is TP.
  • a position symmetric with respect to the horizontal line JK passing through OP of the reference point RP is defined as VP.
  • a line symmetric position with respect to the vertical line ST passing through OP of the reference point RP is defined as HP.
  • the caption display range is a rectangular area surrounded by RP-HP-TP-VP.
  • the broadcast transmission system 100 transmits only the reference point information (RPoffset) as the subtitle display range information, it is more than the case where both the reference point information (RPoffset) and the aspect ratio information (dispasp) are transmitted.
  • Flexible subtitle display range can be specified.
  • FIG. 24 shows an example of the procedure for determining the caption display position and resizing processing in the CPU 221 of the television receiver 200 when only the reference point information (RPoffset) is sent as the caption display range information.
  • RPoffset reference point information
  • step ST4 After the process in step ST4, the CPU 221 ends the process in step ST5.
  • TTML is used as text information of subtitles in a predetermined format.
  • the present technology is not limited to this, and other text information having information equivalent to TTML may be used.
  • a TTML derivative format may be used.
  • the transmission / reception system 10 including the broadcast transmission system 100 and the television receiver 200 is shown, but the configuration of the transmission / reception system to which the present technology can be applied is not limited thereto.
  • a configuration of a set top box and a monitor in which the television receiver 200 is connected by a digital interface such as HDMI (High-Definition Multimedia Interface) may be used.
  • HDMI High-Definition Multimedia Interface
  • HDMI High-Definition Multimedia Interface
  • the container is an MPEG-2 TS transport stream.
  • the present technology can also be applied to a case where the container is an MMT transport stream or a DASH / ISOBMFF stream.
  • this technique can also take the following structures.
  • a receiving unit that receives a container in a predetermined format including a video stream having video data and a subtitle stream having subtitle information;
  • a video decoding unit that obtains video data by performing a decoding process on the video stream;
  • a subtitle decoding unit that obtains subtitle bitmap data by performing decoding processing on the subtitle stream;
  • the caption display position information included in the caption information the caption display position is specified as a relative position to the caption display range,
  • the aspect ratio of the video area is different from the aspect ratio of the display video area
  • the display video area is set as the subtitle display range
  • the subtitle display position is determined based on the subtitle display position information, and the resize processing is performed on the determined subtitle display position.
  • a display control unit that performs display position control on the subtitle bitmap data based on the subtitle display position on which the resize processing has been performed;
  • a receiving apparatus further comprising: a video superimposing unit that superimposes the subtitle bitmap data on which the display position control has been performed on the video data.
  • the display control unit The receiving device according to (1), wherein when the size in the vertical direction is compressed by the resizing process of the caption display position, the compression is performed in a state where a predetermined line position is fixed.
  • the subtitle information of the subtitle stream includes information related to the resizing process,
  • the display control unit The receiving device according to (1) or (2), wherein the resize processing is performed on the determined caption display position using information related to the resizing processing.
  • the caption display position information included in the caption information the caption display position is specified as a relative position to the caption display range,
  • the aspect ratio of the video area is different from the aspect ratio of the display video area, the display video area is set as the subtitle display range, the subtitle display position is determined based on the subtitle display position information, and the resize processing is performed on the determined subtitle display position.
  • a receiving unit that receives a container in a predetermined format including a video stream having video data and a subtitle stream having subtitle information;
  • a video decoding unit that obtains video data by performing a decoding process on the video stream;
  • a subtitle decoding unit that obtains subtitle bitmap data by performing decoding processing on the subtitle stream;
  • the caption display position information included in the caption information the caption display position is specified as a relative position to the caption display range, When the aspect ratio of the video area and the aspect ratio of the display video area are different, a subtitle display range is set in the display video area, the subtitle display position is determined based on the subtitle display position information, and the determined subtitle display position
  • a display control unit that performs display position control on the caption bitmap data based on A receiving apparatus, further comprising: a video superimposing unit that superimposes the subtitle bitmap data on which the display position control has been performed on the video data.
  • the subtitle information included in the subtitle stream includes information on the subtitle display range.
  • the display control unit The receiving device according to (5), wherein a caption display range is set in the display video area using the caption display range information.
  • the reception device according to (6), wherein the information on the caption display range is reference point information and aspect ratio information on the caption display range, or reference point information on the caption display range.
  • the caption display position information included in the caption information the caption display position is specified as a relative position to the caption display range, When the aspect ratio of the video area and the aspect ratio of the display video area are different, a subtitle display range is set in the display video area, the subtitle display position is determined based on the subtitle display position information, and the determined subtitle display position
  • a receiving method further comprising a video superimposing step of superimposing the subtitle bitmap data subjected to the display position control on the video data.
  • the transmission unit that transmits a container of a predetermined format including a video stream having video data and a subtitle stream having subtitle information;
  • the caption display position information included in the caption information is specified as a relative position to the caption display range,
  • the above caption information is A transmission device including information related to a subtitle display position resizing process performed based on the subtitle display position information, which is performed on a reception side when an aspect ratio of a video area is different from an aspect ratio of a display video area.
  • the information related to the resizing process is information indicating a line position that should be a fixed position when the vertical size is compressed by the resizing process of the caption display position.
  • a transmission unit that transmits a container of a predetermined format including a video stream having video data and a subtitle stream having subtitle information;
  • the caption display position information included in the caption information is specified as a relative position to the caption display range,
  • the above caption information is A transmission device including information on the subtitle display range.
  • the information on the caption display range is reference point information and aspect ratio information on the caption display range, or reference point information on the caption display range.
  • the main feature of this technology is that when the aspect ratio of the video area is different from the aspect ratio of the display video area, the display video area is used as the subtitle display range and the subtitle display position determined based on the subtitle display position information is further resized.
  • the aspect ratio of the video area and the display video area Even when the aspect ratios are different, the original shape of the subtitle display position can be maintained, and the subtitle display can be performed satisfactorily without giving the viewer a sense of incongruity (see FIG. 20). ).
  • DESCRIPTION OF SYMBOLS 10 ... Transmission / reception system 100 ... Broadcast transmission system 110 ... Stream generation part 111 ... Control part 112 ... Video encoder 113 ... Audio encoder 114 ... Text format conversion part 115 ... Subtitle encoder 116 ... TS formatter 200 ... TV receiver 201 ... receiving unit 202 ... TS analysis unit 203 ... video decoder 204 ... video superimposing unit 205 ... panel drive circuit 206 ..Display panel 207 ... Audio decoder 208 ... Audio output circuit 209 ... Speaker 210 ... Subtitle decoder 221 ... CPU

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

字幕表示位置を相対位置で指定する場合における字幕表示を良好に行い得るようにする。 ビデオストリームをデコードしてビデオデータを得、字幕情報を持つサブタイトルストリームをデコードして字幕のビットマップデータを得る。字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されている。ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として字幕表示位置を決定し、さらにリサイズ処理を施し、リサイズ処理後の字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御をする。表示位置制御が行われた字幕のビットマップデータをビデオデータに重畳して表示用ビデオデータを得る。

Description

受信装置、受信方法および送信装置
 本技術は、受信装置、受信方法および送信装置に関し、特に、ビデオデータと共に字幕情報を送信する送信装置等に関する。
 従来、例えば、DVB(Digital Video Broadcasting)の放送などでは、字幕情報をビットマップデータで送信する運用が行われている。近時、字幕情報をテキストの文字コードで、つまりテキストベースで送信することが提案されている。このテキスト情報として、例えば、W3C(World Wide Web Consortium)でTTML(Timed Text Markup Language)が提唱されている(特許文献1参照)。
 従来、字幕情報に含まれる字幕表示位置情報において字幕表示位置を、例えばビデオ領域に対する相対位置で指定することが知られている。この場合、ビデオ領域のアスペクト比とディスプレイ領域のアスペクト比とが一致しない場合には、表示方法によって字幕の一部がディスプレイ領域からはみ出して表示されないことがあった。
特開2012-169885号公報
 上述したように表示方法によって字幕の一部がディスプレイ領域からはみ出して表示されないことを回避するため、例えば、受信側において、ビデオ領域に対する相対位置ではなく、モニタ(ディスプレイ)に表示されるビデオ領域(表示ビデオ領域)に対する相対位置として処理を行うことが考えられる。その場合、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比とが異なる場合、例えば字幕表示位置が水平方向にだけ圧縮されたものとなり、視聴者に違和感を与える字幕表示になる可能性がある。
 本技術の目的は、字幕表示位置を相対位置で指定する場合における字幕表示を良好に行い得るようにすることにある。
 本技術の概念は、
 ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信部と、
 上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置にリサイズ処理を施し、該リサイズ処理が施された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御部を備える
 受信装置にある。
 本技術において、受信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナが受信される。ここで、字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されている。制御部により、ビデオデコード処理、サブタイトルデコード処理、表示位置制御処理および重畳処理が制御される。
 ビデオデコード処理では、ビデオストリームがデコードされてビデオデータが得られる。サブタイトルデコード処理では、サブタイトルストリームがデコードされて字幕のビットマップデータが得られる。表示位置制御処理では、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域が字幕表示範囲とされて字幕表示位置情報に基づいて字幕表示位置が決定される。
 そして、この表示位置制御処理では、この決定された字幕表示位置にリサイズ処理が施され、このリサイズ処理が施された字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御が行われる。ビデオ重畳処理では、表示位置制御が行われた字幕のビットマップデータがビデオデータに重畳される。例えば、リサイズ処理では、決定された字幕表示位置が水平方向にだけ圧縮されたものである場合、垂直方向にも同じ割合で圧縮される。
 このように本技術においては、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域が字幕表示範囲とされて決定された字幕表示位置にさらにリサイズ処理が施される。そのため、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であっても、字幕表示位置として本来の形状を保つことができ、視聴者に違和感を与えることがなく、字幕表示を良好に行い得る。
 なお、本技術において、例えば、表示制御処理では、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合、所定のライン位置を固定した状態で圧縮する、ようにされてもよい。このように所定のライン位置を固定した状態で圧縮することで、例えば、2つの字幕表示位置があった場合、その2つの字幕表示位置の垂直方向の間隔を、リサイズ処理を行っても維持することが可能となる。
 また、本技術において、例えば、サブタイトルストリームが持つ字幕情報に、リサイズ処理に関する情報が含まれており、表示位置制御処理では、リサイズ処理に関する情報を用いて、決定された字幕表示位置にリサイズ処理を施す、ようにされてもよい。例えば、リサイズ処理に関する情報は、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報である、ようにされてもよい。このようにリサイズ処理に関する情報に基づいてリサイズ処理を施すことで、リサイズ処理を適切に行うことが容易に可能となる。
 また、本技術の他の概念は
 ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信部と、
 上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域に字幕表示範囲を設定し、上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御部を備える
 受信装置にある。
 本技術において、受信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナが受信される。ここで、字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されている。制御部により、ビデオデコード処理、サブタイトルデコード処理、表示位置制御処理および重畳処理が制御される。ビデオデコード処理では、ビデオストリームがデコードされてビデオデータが得られる。サブタイトルデコード処理では、サブタイトルストリームがデコードされて字幕のビットマップデータが得られる。
 表示位置制御処理では、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域に字幕表示範囲が設定され、この字幕表示位置情報に基づいて字幕表示位置が決定され、この決定された字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御が行われる。例えば、表示ビデオ領域に、ビデオ領域のアスペクト比と同じアスペクト比の字幕表示範囲が設定される。ビデオ重畳部により、表示位置制御が行われた字幕のビットマップデータがビデオデータに重畳される。
 このように本技術においては、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される。そのため、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であっても、字幕表示位置として本来の形状を保つことができ、視聴者に違和感を与えることがなく、字幕表示を良好に行い得る。
 なお、本技術において、例えば、サブタイトルストリームが持つ字幕情報に、字幕表示範囲の情報が含まれており、表示位置制御処理では、この字幕表示範囲の情報を用いて表示ビデオ領域に字幕表示範囲を設定する、ようにされてもよい。この場合、例えば、字幕表示範囲の情報は、字幕表示範囲の基準点情報およびアスペクト比情報、あるいは字幕表示範囲の基準点情報である、ようにされてもよい。このように字幕表示範囲の情報に基づいて字幕表示範囲を設定することで、表示ビデオ領域に字幕表示範囲を適切に設定することが容易に可能となる。
 また、本技術の他の概念は、
 ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナを送信する送信部を備え、
 上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
 上記字幕情報は、
 ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる、上記字幕表示位置情報に基づいて決定される字幕表示位置のリサイズ処理に関する情報を含む
 送信装置にある。
 本技術において、送信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナが送信される。例えば、コンテナとしては、デジタル放送規格で採用されているMPEG-2 TSトランスポートストリームあるいはMMTトランスポートストリーム、インターネット配信で使用されているISOBMFF(MP4)などの種々のフォーマットのコンテナが該当する。
 字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定される。字幕情報に、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる、字幕表示位置情報に基づいて決定される字幕表示位置のリサイズ処理に関する情報が含まれる。例えば、リサイズ処理に関する情報は、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報である、ようにされてもよい。
 このように本技術においては、字幕情報に、受信側で行われるリサイズ処理に関する情報が含まれるものである。このように字幕情報にリサイズ処理に関する情報が含まれることで、受信側では、この情報に基づいてリサイズ処理を施すことで、リサイズ処理を適切に行うことが容易に可能となる。
 また、本技術の他の概念は、
 ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナを送信する送信部を備え、
 上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
 上記字幕情報は、
 上記字幕表示範囲の情報を含む
 送信装置にある。
 本技術において、送信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナが送信される。字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定される。字幕情報に、字幕表示範囲の情報が含まれる。例えば、字幕表示範囲の情報は、字幕表示範囲の基準点情報およびアスペクト比情報、あるいは字幕表示範囲の基準点情報である、ようにされてもよい。
 このように本技術においては、字幕情報に、字幕表示範囲の情報が含まれるものである。このように字幕情報に字幕表示範囲の情報が含まれることで、受信側では、この情報に基づいて字幕表示範囲を設定することで、表示ビデオ領域に字幕表示範囲を適切に設定することが容易に可能となる。
 本技術によれば、字幕表示位置を相対位置で指定する場合における字幕表示を良好に行い得る。なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。
実施の形態としての送受信システムの構成例を示すブロック図である。 字幕表示位置情報で決定される字幕表示位置(リージョン)の一例を示す図である。 TTMLの構造例(字幕表示位置が1個)を示す図である。 TTML構造における主要な情報の内容を示す図である。 TTMLの構造例(字幕表示位置が2個)を示す図である。 ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が同じである場合における字幕の表示例(字幕表示位置が1個)を示す図である。 ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が同じである場合における字幕の表示例(字幕表示位置が2個)を示す図である。 ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域が字幕表示範囲とされ、字幕表示位置情報に基づいて字幕表示位置が決定される場合(第1の方法)における字幕の表示例(字幕表示位置が1個)を示す図である。 リサイズ処理が施された場合の表示例を示す図である。 ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域が字幕表示範囲とされ、字幕表示位置情報に基づいて字幕表示位置が決定され、さらにリサイズ処理が施された場合(第1の方法)における字幕の表示例(字幕表示位置が2個)を示す図である。 ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される場合(第2の方法)における字幕の表示例(字幕表示位置が1個)を示す図である。 ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される場合(第2の方法)における字幕の表示例(字幕表示位置が2個)を示す図である。 放送送出システムのストリーム生成部の構成例を示すブロック図である。 テレビ受信機の構成例を示すブロック図である。 テレビ受信機のCPUにおける字幕表示位置の決定およびリサイズ処理の手順の一例を示すフローチャートである。 ビデオ領域のアスペクト比とモニタ(ディスプレイ)のアスペクト比の一例を示す図である。 ビデオ全領域を表示するモードか否かの判断例の説明に供する図である。 ビデオ全領域を表示するモードで、かつ字幕表示範囲の指定がない場合における字幕表示位置の決定の説明に供する図である。 ビデオ全領域を表示するモードで、かつ字幕表示範囲の指定がある場合における字幕表示位置の決定の説明に供する図である。 ビデオ全領域を表示しないモードで、かつ字幕表示範囲の指定がない場合およびある場合における字幕表示位置の決定の説明に供する図である。 字幕表示範囲の情報として基準点情報(RPoffset)のみが含まれる場合におけるTTMLの構造例(字幕表示位置が1個)を示す図である。 字幕表示範囲の情報として基準点情報(RPoffset)のみが含まれる場合におけるTTMLの構造例(字幕表示位置が2個)を示す図である。 基準点情報(RPoffset)のみが与えられる場合に、テレビ受信機のCPUがどのようにして字幕表示範囲を設定するかについて説明するための図である。 テレビ受信機のCPUにおける字幕表示位置の決定およびリサイズ処理の手順の他の一例を示すフローチャートである。
 以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明を以下の順序で行う。
 1.実施の形態
 2.変形例
 <1.実施の形態>
 [送受信システムの構成例]
 図1は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、放送送出システム100とテレビ受信機200により構成されている。放送送出システム100は、コンテナ(多重化ストリーム)としてのMPEG-2 TSのトランスポートストリーム(以下、単に、「トランスポートストリームTS」という)を、放送波に載せて送信する。
 トランスポートストリームTSには、ビデオデータを持つビデオストリームと、字幕(サブタイトル)情報を持つサブタイトルストリームが含まれる。ここで、字幕情報は、所定フォーマットの字幕のテキスト情報である。このテキスト情報として、例えば、TTMLあるいはTTMLの派生フォーマットなどが考えられるが、この実施の形態においては、TTMLであるとする。このTTMLに含まれる字幕表示位置情報において、字幕表示位置(リージョン)は字幕表示範囲に対する相対位置(プロポーショナルな値)で指定される。
 このTTMLに、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる、字幕表示位置情報に基づいて決定された字幕表示位置のリサイズ処理に関する情報が含まれる。この実施の形態において、このリサイズ処理に関する情報は字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報とされる。
 また、このTTMLに、字幕表示範囲の情報が含まれる。この実施の形態において、この字幕表示範囲の情報は、字幕表示範囲の基準点情報およびアスペクト比情報、あるいは字幕表示範囲の基準点情報とされる。
 テレビ受信機200は、放送送出システム100から送られてくるトランスポートストリームTSを受信する。テレビ受信機200は、ビデオデータを持つビデオストリームにデコード処理を施してビデオデータを得ると共に、字幕情報を持つサブタイトルストリームにデコード処理を施して字幕のビットマップデータを得る。上述したように字幕情報に含まれる字幕表示位置情報において、字幕表示位置は字幕表示範囲に対する相対位置で指定されている。
 テレビ受信機200は、字幕表示位置情報に基づいて字幕表示位置を決定し、この決定された字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御をする。テレビ受信機200は、表示位置制御が行われた字幕のビットマップデータをビデオデータに重畳して、表示用のビデオデータを得る。
 テレビ受信機200は、字幕のビットマップデータに対する表示位置制御として、ビデオ領域のアスペクト比と表示ビデオ領域(モニタに表示されるビデオ領域)のアスペクト比が異なる場合、以下の第1の方法あるいは第2の方法を選択的に実行する。
 第1の方法では、テレビ受信機200は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として字幕表示位置情報に基づいて字幕表示位置を決定した後、この決定された字幕表示位置にリサイズ処理を施し、このリサイズ処理が施された字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御をする。
 リサイズ処理では、字幕表示位置として本来の形状を回復する処理であり、例えば、決定された字幕表示位置が水平方向にだけ圧縮されたものである場合、垂直方向にも同じ割合で圧縮する。例えば、リサイズ処理で垂直方向のサイズを圧縮する場合、トップライン(上のライン)、ボトムライン(下のライン)、あるいはミドルライン(中間のライン)などの所定のライン位置を固定した状態で圧縮する。
 この所定のライン位置を適切に選択することで、例えば、2つの字幕表示位置があった場合、その2つの字幕表示位置の垂直方向の間隔を、リサイズ処理を行っても維持することが可能となる。テレビ受信機200は、サブタイトルストリームが持つ字幕情報に、リサイズ処理に関する情報として、固定位置とすべきライン位置を示す情報が含まれているとき、その情報を利用できる。
 第2の方法では、テレビ受信機200は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域に字幕表示範囲を設定し、字幕表示位置情報に基づいて字幕表示位置を決定し、この決定された字幕表示位置に基づいて字幕のビットマップデータに対して表示位置制御をする。この場合、例えば、表示ビデオ領域に、ビデオ領域のアスペクト比と同じアスペクト比の字幕表示範囲を設定する。
 テレビ受信機200は、サブタイトルストリームが持つ字幕情報に字幕表示範囲の情報が含まれているとき、その情報を利用して字幕表示範囲を適切に設定できる。例えば、テレビ受信機200は、サブタイトルストリームが持つ字幕情報に字幕表示範囲の情報が含まれているときは第2の方法を選択し、それが含まれていないとき第1の方法を選択する。
 図2は、字幕表示位置情報で決定される字幕表示位置(リージョン)の一例を示している。この例は、TTMLで、字幕表示位置情報が、字幕表示位置の基点(origin)を示す情報「origin=“OH%OV%”」と、字幕表示位置の領域(extent)を示す情報「extent=“EH%EV%”」で与えられている場合を示している。“RP”は、字幕表示範囲のトップ―レフト(top-left)である基準点(Reference Pont)を示している。
 図2(a)は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が同じ場合の例を示している。この例では、ビデオ領域のアスペクト比が16:9に対して、モニタのアスペクト比は16:9であって、表示ビデオ領域のアスペクト比が16:9となっている。この場合、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報に基づき字幕表示位置が決定される。
 図2(b)は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域が字幕表示範囲とされ、字幕表示位置情報に基づいて字幕表示位置が決定される場合(第1の方法)の例である。この例では、ビデオ領域のアスペクト比が16:9に対して、モニタのアスペクト比は4:3であり、表示方法がセンターカット(Center-cut)である場合であって、表示ビデオ領域のアスペクト比が4:3となっている。この場合、字幕表示位置は、図2(a)の場合と比較して、垂直方向には同じ幅となるが、水平方向には、その幅が圧縮されたものとなる。この場合、字幕表示位置の形状は、図2(a)の場合とは異なったものとなる。
 図2(c)は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であって、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される場合(第2の方法)の例である。この例では、ビデオ領域のアスペクト比が16:9に対して、モニタのアスペクト比は4:3であり、表示方法がセンターカット(Center-cut)である場合であって、表示ビデオ領域のアスペクト比が4:3となっている。この場合、字幕表示位置は、図2(a)の場合と比較して、垂直方向および水平方向の双方に、その幅が圧縮されたものとなる。設定される字幕表示範囲のアスペクト比が16:9である場合には、字幕表示位置の形状は、図2(a)の場合と同じくなる。
 図3は、TTML構造の一例を示している。この例は、字幕表示位置(リージョン)が1個の場合の例である。TTMLは、XMLを基本に記載される。ttルートコンテナには、ランゲージ(言語)やネームスペース(名前空間)が定義されている。ネームスペースは、システムあるいは規格体系において全要素中で一意に識別できるための固有の要素名として定義されるものである。また、<tt>において、「tts:extent」は、字幕の位置情報の対象の元となるビデオ100%の対象領域を最初に宣言するもので、“Fullvideo”は、4Kビデオが対象である場合は3840(H)×2160(V)の解像度のビデオ全体を示し、2K(フルHD)ビデオが対象である場合は1920(H)×1080(V)の解像度のビデオ全体を示す。
 「xmlns=http://www.w3.org/ns/ttml」、「xmlns:ttp=http://www.w3.org/ns/ttml#parameter」、「xmlns:tts=http://www.w3.org/ns/ttml#styling」のネームスペースは、詳細説明は省略するが、予めW3CでTTMLの属性分類として確保されているパラメータ、スタイリングなどのネームスペースである。
 「xmlns:dto=http://www.example.org/ns/displaytextoverlay」は、新規に定義するネームスペースである。このネームスペースは、字幕表示範囲の情報を挿入するためのものである。そして、「dto:dispasp=“16:9”」および「dto:RPoffset=“Ax%, By%”」が、字幕表示範囲の情報を示す。
 「dto:dispasp=“16:9”」は、字幕表示範囲のアスペクト比情報を示し、字幕表示範囲は16:9のアスペクト比の領域であることを示している。図示の例では、字幕表示範囲のアスペクト比が16:9であることを示しているが、字幕表示範囲のアスペクト比としては、図4に示すように、4:3、21:9などを指定することも可能である。「dto:RPoffset=“Ax%, By%”」は字幕表示範囲の基準点情報を示し、図4に示すように、表示ビデオ領域の水平垂直のそれぞれを100%としたときの字幕表示範囲の基準点(RP:Reference Point)の位置を、表示ビデオ領域のトップ-レフト(top-left)からのオフセットの比率で示している。
 ヘッダ(head)には、レイアウト(layout)の要素が存在している。リージョンIDが“r1”で示され、字幕表示位置情報として字幕表示位置の起点(origin)と、その領域(extent)が相対位置で示されている。すなわち、「origin=“OH%OV%”」は字幕表示位置の基点を示し、起点が左(left)からOHで、上(top)からOV%であることが示されている。また、「extent=“EH%EV%”」は字幕表示位置の領域を示し、横幅がEH%で、縦幅がEV%であることが示されている。
 ボディ(body)には、XML IDが“p1”で示され、リージョンIDが“r1”で示されると共に、字幕(サブタイトル)のテキストデータが記載されている。ここでは、テキストデータが「ABCDE」とされている。「dto:scalingjustify=top」は、リサイズ処理に関する情報を構成しており、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示している。図示の例では、固定位置とすべきライン位置がトップライン(上のライン)であることを示しているが、図4に示すように、ボトムライン(下のライン)、ミドルライン(中間のライン)などを指定することも可能である。
 図5も、TTML構造の一例を示している。この例は、字幕表示位置(リージョン)が2個の場合の例である。ttルートコンテナは、図3と同様であるので、その説明は省略する。
 ヘッダ(head)には、レイアウト(layout)の要素が存在している。第1の字幕表示位置のリージョンIDが“r1”で示され、字幕表示位置情報として字幕表示位置の起点(origin)と、その領域(extent)が相対位置で示されている。すなわち、「origin=“OH1%OV1%”」により、起点が左(left)からOH1%で、上(top)からOV1%であることが示されている。また、「extent=“EH1%EV1%”」により、領域の横幅がEH1%で、その縦幅がEV1%であることが示されている。
 また、第2の字幕表示位置のリージョンIDが“r2”で示され、字幕表示位置情報として字幕表示位置の起点(origin)と、その領域(extent)が相対位置で示されている。すなわち、「origin=“OH2%OV2%”」により、起点が左(left)からOH2%で、上(top)からOV2%であることが示されている。また、「extent=“EH2%EV2%”」により、領域の横幅がEH2%で、その縦幅がEV2%であることが示されている。
 ボディ(body)には、第1の字幕位置に関連して、XML IDが“p1”で示され、リージョンIDが“r1”で示されると共に、字幕(サブタイトル)のテキストデータが記載されている。ここでは、テキストデータが「ABCDE」とされている。「dto:scalingjustify=bottom」は、リサイズ処理に関する情報を構成しており、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示している。図示の例では、固定位置とすべきライン位置がボトムライン(下のライン)であることを示している。
 また、ボディ(body)には、第2の字幕位置に関連して、XML IDが“p2”で示され、リージョンIDが“r2”で示されると共に、字幕(サブタイトル)のテキストデータが記載されている。ここでは、テキストデータが「FGH」とされている。「dto:scalingjustify=top」は、リサイズ処理に関する情報を構成しており、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示している。図示の例では、固定位置とすべきライン位置がトップライン(上のライン)であることを示している。
 図6は、ビデオ領域のアスペクト比と表示ビデオ領域(モニタに表示されるビデオ領域)のアスペクト比が同じである場合における字幕(サブタイトル)の表示例を示している。図示の例は、ビデオ領域のアスペクト比が16:9で、モニタのアスペクト比も16:9である場合であって、図3に示すようなTTML構造(字幕表示位置が1個)を持つ場合の例である。
 図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報(「origin=“OH%OV%”」、「extent=“EH%EV%”」)に基づき字幕表示位置(リージョン)が決定されている。“RP”は、字幕表示範囲のトップ―レフト(top-left)である基準点(Reference Pont)を示している。
 このように決定された字幕表示位置に、テキストデータによる字幕「ABCDE」が表示されている。なお、図示の例では、ビデオ領域、モニタ領域および字幕表示範囲を示す各枠がずれて表示されているが、各枠を明確に表示するための処置であり、実際には、各枠は重なっている。説明は省略するが、以下の各図においても、同様の表示がなされている。
 図7も、ビデオ領域のアスペクト比と表示ビデオ領域(モニタに表示されるビデオ領域)のアスペクト比が同じである場合における字幕(サブタイトル)の表示例を示している。図示の例は、ビデオ領域のアスペクト比が16:9で、モニタのアスペクト比も16:9である場合であって、図5に示すようなTTML構造(字幕表示位置が2個)を持つ場合の例である。
 図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報(「origin=“OH1%OV1%”」、「extent=“EH1%EV1%”」、「origin=“OH2%OV2%”」、「extent=“EH2%EV2%”」)に基づき、第1、第2の字幕表示位置(リージョン)が決定されている。
 そして、第1の字幕表示位置(第1のリージョン)にテキストデータによる字幕「ABCDE」が表示され、第2の字幕表示位置(第2のリージョン)にテキストデータによる字幕「FGH」が表示されている。この場合、2つの字幕表示位置(リージョン)の間隔は、例えば10ラインとされている。
 図8は、ビデオ領域のアスペクト比と表示ビデオ領域(モニタに表示されるビデオ領域)のアスペクト比が異なる場合であって、表示ビデオ領域が字幕表示範囲とされ、字幕表示位置情報に基づいて字幕表示位置が決定される場合(第1の方法)における字幕(サブタイトル)の表示例を示している。図示の例は、ビデオ領域のアスペクト比が16:9で、モニタのアスペクト比は4:3である場合であって、図3に示すようなTTML構造(字幕表示位置が1個)を持つ場合の例である。
 図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報(「origin=“OH%OV%”」、「extent=“EH%EV%”」)に基づき字幕表示位置(リージョン)が決定されている。そして、字幕表示位置に、テキストデータによる字幕「ABCDE」が表示されている。
 この場合、字幕表示位置は、図6の場合と比較して、垂直方向には同じ幅となるが、水平方向にはその幅が圧縮されたものとなる。この場合、字幕表示位置の幅が圧縮されることに伴って字幕のフォントサイズも小さいサイズに調整される。このように字幕のフォントサイズが調整されることで、図示のように、水平方向に関しては字幕表示位置とそれに表示される字幕との関係は整合した状態となるが、字幕表示位置の幅が圧縮されていない垂直方向に関しては字幕表示位置とそれに表示される字幕との関係は不整合な状態となる。この場合、視聴者は、字幕表示位置の黒領域が浮いたような感じを受けるようになる。
 そこで、上述したように第1の方法においては、決定された字幕表示位置にリサイズ処理が施され、字幕表示位置とそれに表示される字幕との関係が水平方向だけでなく垂直方向にも整合した状態とされる。図9は、リサイズ処理が施された場合の表示例を示している。この場合、リサイズ処理により、字幕表示位置情報(「origin=“OH%OV%”」、「extent=“EH%EV%”」)に基づいて決定されることで水平方向にだけ圧縮された字幕表示位置が、垂直方向にも同じ割合で圧縮されたものとされる。この場合、結果的に、字幕表示位置は、字幕表示位置情報(「origin=“OH%OV%”」、「extent=“EH%EVu%”」)で決定されたものとなる。この場合、EVu=3/4*EVの関係となる。
 このようにリサイズ処理が行われる場合、所定のライン位置が固定された状態で垂直方向の幅の圧縮が行われる。図示の例は、TTMLに含まれる「dto:scalingjustify=top」の情報に基づいて、所定のライン位置がトップライン(上のライン)とされた例である。なお、図示の例において、破線枠は、垂直方向の幅の圧縮が行われる前における字幕表示位置を示している。
 図10も、ビデオ領域のアスペクト比と表示ビデオ領域(モニタに表示されるビデオ領域)のアスペクト比が異なる場合であって、表示ビデオ領域が字幕表示範囲とされ、字幕表示位置情報に基づいて字幕表示位置が決定される場合(第1の方法)における字幕(サブタイトル)の表示例を示している。図示の例は、ビデオ領域のアスペクト比が16:9で、モニタのアスペクト比は4:3である場合であって、図5に示すようなTTML構造(字幕表示位置が2個)を持つ場合の例であり、リサイズ処理が施された場合の表示例を示している。
 図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報(「origin=“OH1%OV1%”」、「extent=“EH1%EV1%”」、「origin=“OH2%OV2%”」、「extent=“EH2%EV2%”」)に基づき、第1、第2の字幕表示位置(リージョン)が決定され、その後にさらにリサイズ処理が施されている。
 この場合、第1の字幕表示位置(第1のリージョン)は、結果的に、字幕表示位置情報(「origin=“OH1%OV1%”」、「extent=“EH1%EV1u%”」)で決定されたものとなる。この場合、EV1u=3/4*EV1の関係となる。同様に、この場合、第2の字幕表示位置(第2のリージョン)は、結果的に、字幕表示位置情報(「origin=“OH2%OV2%”」、「extent=“EH2%EV2u%”」)で決定されたものとなる。この場合、EV2u=3/4*EV2の関係となる。
 そして、第1の字幕表示位置(第1のリージョン)にテキストデータによる字幕「ABCDE」が表示され、第2の字幕表示位置(第2のリージョン)にテキストデータによる字幕「FGH」が表示されている。この場合、字幕表示位置(リージョン)の圧縮に応じて、それに整合するように字幕のフォントサイズが調整される。
 リサイズ処理が行われる場合、所定のライン位置が固定された状態で垂直方向の幅の圧縮が行われる。図示の例は、TTMLに含まれる「dto:scalingjustify=bottom」の情報に基づいて、第1の字幕表示位置(第1のリージョン)に関しては、所定のライン位置がボトムライン(下のライン)とされた例である。また、TTMLに含まれる「dto:scalingjustify=top」の情報に基づいて、第2の字幕表示位置(第2のリージョン)に関しては、所定のライン位置がトップライン(上のライン)とされた例である。
 このように第1、第2の字幕表示位置における所定のライン位置が選択されることで、第1、第2の字幕表示位置の間隔として、図7の表示例における場合と同様に例えば10ラインが維持される。そのため、視聴者における、表示画像上における字幕(サブタイトル)の知覚性をほぼ維持することが可能となる
 図11は、ビデオ領域のアスペクト比と表示ビデオ領域(モニタに表示されるビデオ領域)のアスペクト比が異なる場合であって、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される場合(第2の方法)における字幕(サブタイトル)の表示例を示している。図示の例は、ビデオ領域のアスペクト比が16:9で、モニタのアスペクト比は4:3である場合であって、図3に示すようなTTML構造(字幕表示位置が1個)を持つ場合の表示例を示している。
 図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域に字幕表示範囲が設定され、それに対する相対位置で指定される字幕表示位置情報(「origin=“OH%OV%”」、「extent=“EH%EV%”」)に基づき字幕表示位置(リージョン)が決定されている。そして、字幕表示位置に、テキストデータによる字幕「ABCDE」が表示されている。この場合、字幕表示位置(リージョン)の圧縮に応じて、それに整合するように字幕のフォントサイズが調整される。
 この場合、例えば、表示ビデオ領域に、ビデオ領域のアスペクト比と同じアスペクト比の字幕表示範囲が設定される。図示の例は、TTMLに含まれる字幕表示範囲の情報、すなわち字幕表示範囲の基準点情報(「dto:RPoffset=“Ax%, By%”」)と、字幕表示範囲のアスペクト比情報(「dto:dispasp=“16:9”」)に基づいて、表示ビデオ領域にアスペクト比が16:9である字幕表示範囲が設定された例である。
 この場合、字幕表示位置は、垂直方向および水平方向の双方にその幅が圧縮されたものとなり、字幕表示位置の形状は図6の場合と同じくなり、字幕のフォントサイズの調整に伴う字幕表示位置の調整(リサイズ処理)は不要となる。
 図12も、ビデオ領域のアスペクト比と表示ビデオ領域(モニタに表示されるビデオ領域)のアスペクト比が異なる場合であって、表示ビデオ領域に字幕表示範囲が設定され、字幕表示位置情報に基づいて字幕表示位置が決定される場合(第2の方法)における字幕(サブタイトル)の表示例を示している。図示の例は、ビデオ領域のアスペクト比が16:9で、モニタのアスペクト比は4:3である場合であって、図5に示すようなTTML構造(字幕表示位置が2個)を持つ場合の表示例を示している。
 図示の例では、ビデオ領域を破線枠で示し、モニタ領域を実線枠で示している。この場合、一点鎖線枠で示すように、表示ビデオ領域が字幕表示範囲とされ、それに対する相対位置で指定される字幕表示位置情報(「origin=“OH1%OV1%”」、「extent=“EH1%EV1%”」、「origin=“OH2%OV2%”」、「extent=“EH2%EV2%”」)に基づき、第1、第2の字幕表示位置(リージョン)が決定されている。そして、第1の字幕表示位置(第1のリージョン)にテキストデータによる字幕「ABCDE」が表示され、第2の字幕表示位置(第2のリージョン)にテキストデータによる字幕「FGH」が表示されている。
 [放送送出システムのストリーム生成部の構成例]
 図13は、放送送出システム100のストリーム生成部110の構成例を示している。このストリーム生成部110は、制御部111と、ビデオエンコーダ112と、オーディオエンコーダ113と、テキストフォーマット変換部114と、サブタイトルエンコーダ115と、TSフォーマッタ(マルチプレクサ)116を有している。
 制御部111は、例えば、CPU(Central Processing Unit)を備えた構成とされており、ストリーム生成部110の各部の動作を制御する。ビデオエンコーダ112は、ビデオデータDVを入力し、このビデオデータDVに対して符号化を施し、ペイロードに符号化ビデオデータを持つビデオPESパケットにより構成されるビデオストリーム(PESストリーム)を生成する。
 オーディオエンコーダ113は、オーディオデータDAを入力し、このオーディオデータDAに対して符号化を施し、符号化オーディオデータを持つオーディオPESパケットにより構成されるオーディオストリーム(PESストリーム)を生成する。テキストフォーマット変換部114は、テキストデータ(文字コード)DTを入力し、字幕情報としてのTTML(Timed Text Markup Language)を得る(図3、図5参照)。
 このTTMLに含まれる字幕表示位置情報において、字幕表示位置(リージョン)は字幕表示範囲に対する相対位置(プロポーショナルな値)で指定される。また、このTTMLに、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる字幕表示位置のリサイズ処理に関する情報、例えば、字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報が含まれる。また、このTTMLに、字幕表示範囲の情報(字幕表示範囲の基準点情報およびアスペクト比情報)が含まれる。
 サブタイトルエンコーダ115は、テキストフォーマット変換部114で得られるTTMLを種々のセグメントに変換し、ペイロードにそれらのセグメントを配置したサブタイトルPESパケットにより構成されるサブタイトルストリーム(PESストリーム)を生成する。
 TSフォーマッタ116は、ビデオエンコーダ112で生成されたビデオストリーム、オーディオエンコーダ113で生成されたオーディオストリームおよびサブタイトルエンコーダ115で生成されたサブタイトルストリームを、トランスポートパケット化して多重し、コンテナ(多重化ストリーム)としてのトランスポートストリームTSを得る。
 図13に示すストリーム生成部110の動作を簡単に説明する。ビデオデータDVは、ビデオエンコーダ112に供給される。ビデオエンコーダ112では、このビデオデータDVに対して符号化が施され、ペイロードに符号化画像データを持つビデオPESパケットからなるビデオストリーム(PESストリーム)が生成される。このビデオストリームは、TSフォーマッタ116に供給される。
 また、オーディオデータDAは、オーディオエンコーダ113に供給される。オーディオエンコーダ113では、オーディオデータDAに対して符号化が施され、符号化音声データを持つオーディオPESパケットからなるオーディオストリーム(PESストリーム)が生成される。このオーディオストリームは、TSフォーマッタ116に供給される。
 また、テキストデータ(文字コード)DTは、テキストフォーマット変換部114に供給される。このキストフォーマット変換部114では、字幕情報としてのTTMLが得られる(図3、図5参照)。このTTMLは、サブタイトルエンコーダ115に供給される。このサブタイトルエンコーダ115では、TTMLが種々のセグメントに変換され、ペイロードにそれらのセグメントを配置したサブタイトルPESパケットからなるサブタイトルストリームが生成される。このサブタイトルストリームは、TSフォーマッタ116に供給される。
 TSフォーマッタ116では、ビデオエンコーダ112で生成されたビデオストリーム、オーディオエンコーダ113で生成されたオーディオストリームおよびサブタイトルエンコーダ115で生成されたサブタイトルストリームが、トランスポートパケット化されて多重化され、コンテナ(多重化ストリーム)としてのトランスポートストリームTSが生成される。
 [テレビ受信機の構成例]
 図14は、テレビ受信機200の構成例を示している。このテレビ受信機200は、受信部201と、TS解析部(デマルチプレクサ)202と、ビデオデコーダ203と、ビデオ重畳部204と、パネル駆動回路205と、モニタ(ディスプレイ)としての表示パネル206を有している。また、このテレビ受信機200は、オーディオデコーダ207と、オーディオ出力回路208と、スピーカ209と、サブタイトルデコーダ210を有している。また、このテレビ受信機200は、CPU221と、フラッシュROM222と、DRAM223と、内部バス224と、リモコン受信部225と、リモコン送信機226を有している。
 CPU221は、テレビ受信機200の各部の動作を制御する。フラッシュROM222は、制御ソフトウェアの格納およびデータの保管を行う。DRAM223は、CPU221のワークエリアを構成する。CPU221は、フラッシュROM222から読み出したソフトウェアやデータをDRAM223上に展開してソフトウェアを起動させ、テレビ受信機200の各部を制御する。
 リモコン受信部225は、リモコン送信機226から送信されたリモートコントロール信号(リモコンコード)を受信し、CPU221に供給する。CPU221は、このリモコンコードに基づいて、テレビ受信機200の各部を制御する。CPU221、フラッシュROM222およびDRAM223は、内部バス224に接続されている。
 受信部201は、放送送出システム100から放送波に載せて送られてくるトランスポートストリームTSを受信する。このトランスポートストリームTSには、上述したように、ビデオストリーム、オーディオストリームおよびサブタイトルストリームが含まれている。TS解析部202は、トランスポートストリームTSからビデオ、オーディオ、サブタイトルの各ストリームのPESパケットを抽出する。
 オーディオデコーダ207は、TS解析部202で得られたオーディオPESパケットにデコード処理を施し、オーディオデータを得る。オーディオ出力回路208は、オーディオデータに対して、D/A変換や増幅等の必要な処理を施し、スピーカ209に供給する。ビデオデコーダ203は、TS解析部202で得られたビデオPESパケットにデコード処理を施し、ビデオデータを得る。なお、ビデオデコーダ203は、表示モードなどに応じて、適宜、ビデオデータの解像度変換も行う。例えば、ビデオ領域のアスペクト比が16:9でモニタ(ディスプレイ)のアスペクト比が4:3であって、表示モードがレターボックスである場合には、ビデオデータの解像度変換が行われる。
 サブタイトルデコーダ210は、TS解析部202で得られたサブタイトルPESパケットにデコード処理を施し、TTMLに含まれる各字幕表示位置(リージョン)の字幕(サブタイトル)のテキストデータ(フォントデータ)を、ビットマップデータ(バイナリイメージ情報)を変換する。この場合、字幕のフォントサイズは、CPU221の制御のもと、字幕表示位置情報により決定された、あるいはさらにリサイズ処理されて得られた字幕表示位置の大きさに応じて、TTMLで指定されたフォントサイズから適宜調整されたものとされる。
 また、サブタイトルデコーダ210は、TTMLから種々の情報を抽出し、CPU221に供給する。この情報には、<tt>と<head>で定義する属性情報(attribute information)も含まれる。CPU221は、字幕表示位置情報に基づいて字幕表示位置を決定し、さらに、必要に応じて、決定された字幕表示位置にリサイズ処理を施す。CPU221における字幕表示位置の決定およびリサイズ処理の手順の詳細については、さらに後述する。
 ビデオ重畳部204は、ビデオデコーダ203で得られたビデオデータに、サブタイトルデコーダ210で得られた各字幕表示位置の字幕のビットマップデータを重畳し、表示用ビデオデータを得る。この場合、CPU221は、上述したように字幕表示位置情報により決定された、あるいはさらにリサイズ処理されて得られた字幕表示位置に基づいて、字幕のビットマップデータの重畳位置が字幕表示位置となるように制御する。
 パネル駆動回路205は、ビデオ重畳部204で得られる表示用のビデオデータに基づいて、表示パネル206を駆動する。表示パネル206は、例えば、LCD(Liquid Crystal Display)、有機ELディスプレイ(organic electroluminescence display)などで構成されている。
 図14に示すテレビ受信機200の動作を簡単に説明する。受信部201では、放送送出システム100から放送波に載せて送られてくるトランスポートストリームTSが受信される。このトランスポートストリームTSには、ビデオストリーム、オーディオストリームおよびサブタイトルストリームが含まれている。このトランスポートストリームTSは、TS解析部202に供給される。TS解析部202では、トランスポートストリームTSからビデオ、オーディオ、サブタイトルの各ストリームのPESパケットが抽出される。
 TS解析部202で抽出されたビデオPESパケットは、ビデオデコーダ203に供給される。ビデオデコーダ203では、このビデオPESパケットにデコード処理が施されて、ビデオデータが得られる。この場合、ビデオデコーダ203では、表示モードなどに応じて、適宜、ビデオデータの解像度変換も行われる。
 また、TS解析部202で抽出されるサブタイトルPESパケットは、サブタイトルデコーダ210に供給される。このサブタイトルデコーダ210では、TS解析部202で得られたサブタイトルPESパケットにデコード処理が施され、TTMLに含まれるテキストデータに基づいて、ビデオデータに重畳すべき各字幕表示位置の字幕のビットマップデータが得られる。
 また、サブタイトルデコーダ210では、TTMLから種々の情報が抽出され、CPU221に供給される。この情報には、<tt>と<head>で定義する属性情報(attribute information)も含まれる。CPU221では、字幕表示位置情報に基づいて字幕表示位置が決定され、さらに、必要に応じて、決定された字幕表示位置にリサイズ処理が施される。
 サブタイトルデコーダ210から出力される各字幕表示位置の字幕のビットマップデータは、ビデオ重畳部204に供給される。ビデオ重畳部204では、ビデオデコーダ203で得られたビデオデータに、サブタイトルデコーダ210で得られた各字幕表示位置の字幕のビットマップデータが重畳され、表示用のビデオデータが得られる。この場合、CPU221により、字幕表示位置情報により決定された、あるいはさらにリサイズ処理されて得られた字幕表示位置に基づいて、字幕のビットマップデータの重畳位置が字幕表示位置となるように制御される。
 ビデオ重畳部204で得られた表示用のビデオデータは、パネル駆動回路205に供給される。パネル駆動回路205では、表示用のビデオデータに基づいて、表示パネル206を駆動することが行われる。これにより、表示パネル206には、各字幕表示位置(リージョン)に字幕(サブタイトル)が重畳された画像が表示される。
 また、TS解析部202で抽出されたオーディオPESパケットは、オーディオデコーダ207に供給される。オーディオデコーダ207では、このオーディオPESパケットにデコード処理が施され、オーディオデータが得られる。このオーディオデータは、オーディオ出力回路208に供給される。オーディオ出力回路208では、オーディオデータに対して、D/A変換や増幅等の必要な処理が行われる。そして、処理後のオーディオデータはスピーカ209に供給される。これにより、スピーカ209からは表示パネル206の表示画像に対応した音声出力が得られる。
 「字幕表示位置の決定およびリサイズ処理の手順」
 CPU221における字幕表示位置の決定およびリサイズ処理の手順の詳細について説明する。図15のフローチャートは、CPU221における字幕表示位置の決定およびリサイズ処理の手順の一例を示している。
 この例では、ビデオ領域のアスペクト比が16:9であることを想定している。そして、図16(a)に示すようにTTMLで字幕表示範囲の指定がない場合と、図16(b),(c)に示すようにTTMLで字幕表示範囲の指定がある場合の双方があることを想定している。なお、ここでは、指定される字幕表示範囲のアスペクト比が16:9と4:3である例を示しているが、指定される字幕表示範囲のアスペクト比がこれに限定されるものではない。また、ここでは、モニタ(ディスプレイ)のアスペクト比が16:9の場合と4:3の場合の双方があることを想定している。
 CPU221は、ステップST1で処理を開始し、その後に、ステップST2の処理に移る。このステップST2において、CPU221は、受信機表示はビデオ全領域を表示するモードか否かを判断する。例えば、モニタのアスペクト比が16:9である場合(図17(a)参照)、あるいはモニタのアスペクト比が4:3であってレターボックス(Letter box)の表示方法を採る場合(図17(b)参照)には、ビデオ全領域を表示するモードであると判断する。また、例えば、モニタのアスペクト比が4:3であってセンターカット(Center-cut)の表示方法を採る場合(図17(c)参照)には、ビデオ全領域を表示しないモードであると判断する。
 CPU221は、ビデオ全領域を表示するモードであると判断するとき、ステップST3の処理に移る。このステップST3において、CPU221は、字幕表示範囲の指定があるか否かを判断する。例えば、TTMLのttルートコンテナに字幕表示範囲の基準点情報(RPoffset)およびアスペクト比情報(dispasp)が存在する場合には、字幕表示範囲の指定があると判断する。
 字幕表示範囲の指定がないとき、CPU221は、ステップST4の処理に移る。このステップST4において、CPU221は、表示ビデオ領域を字幕表示範囲として、字幕表示位置(リージョン)を決定する。このとき、CPU221は、表示ビデオ領域のトップ―レフト(top-left)を基準点RPとし、字幕表示範囲に対する相対位置で指定されている字幕表示位置情報(「origin=“OH%OV%”」、「extent=“EH%EV%”」)の指示通りに字幕表示位置(リージョン)を決定する。
 図18(a)は、モニタのアスペクト比が16:9である場合の例を示している。図18(b)は、モニタのアスペクト比が4:3であってレターボックス(Letter box)の表示方法を採る場合の例を示している。なお、“RP”は、字幕表示範囲のトップ―レフト(top-left)である基準点(Reference Pont)を示している。
 このステップST4の処理の後、CPU221は、ステップST5において、処理を終了する。
 上述のステップST3で字幕表示範囲の指定があるとき、CPU221は、ステップST6の処理に移る。このステップST6において、CPU221は、指定された字幕表示範囲において、字幕表示位置(リージョン)を決定する。このとき、CPU221は、字幕表示範囲の情報としてアスペクト比情報(dispasp)のみを用い、表示ビデオ領域上に字幕表示範囲を設定する。そして、CPU221は、字幕表示範囲のトップ―レフト(top-left)を基準点RPとし、字幕表示範囲に対する相対位置で指定されている字幕表示位置情報(「origin=“OH%OV%”」、「extent=“EH%EV%”」)の指示通りに字幕表示位置(リージョン)を決定する。
 図19(a)は、モニタのアスペクト比が16:9であり、かつアスペクト比情報(dispasp)が示すアスペクト比が16:9である場合の例を示している。図19(b)は、モニタのアスペクト比が16:9であり、かつアスペクト比情報(dispasp)が示すアスペクト比が4:3である場合の例を示している。
 なお、このようにアスペクト比情報(dispasp)が示すアスペクト比がモニタのアスペクト比と異なる場合、CPU221は、表示ビデオ領域の中央に、垂直方向幅あるいは水平方向幅が一致し、かつアスペクト比情報(dispasp)が示すアスペクト比の字幕表示範囲を設定する。図示の例においては、モニタのアスペクト比が16:9であり、かつアスペクト比情報(dispasp)が4:3であるので、垂直方向幅が一致している。
 図19(c)は、モニタのアスペクト比が4:3であってレターボックスの表示方法を採り、かつアスペクト比情報(dispasp)が示すアスペクト比が16:9である場合の例を示している。図19(d)は、モニタのアスペクト比が4:3であってレターボックスの表示方法を採り、かつアスペクト比情報(dispasp)が示すアスペクト比が4;3である場合の例を示している。
 このステップST6の処理の後、CPU221は、ステップST5において、処理を終了する。
 上述のステップST2でビデオ全領域を表示しないモードであると判断するとき、ステップST7の処理に移る。このステップST7において、CPU221は、字幕表示範囲の指定があるか否かを判断する。例えば、TTMLのttルートコンテナに字幕表示範囲の基準点情報(RPoffset)およびアスペクト比情報(dispasp)が存在する場合には、字幕表示範囲の指定があると判断する。
 字幕表示範囲の指定がないとき、CPU221は、ステップST8の処理に移る。このステップST8において、CPU221は、表示ビデオ領域を字幕表示範囲として、字幕表示位置(リージョン)を決定する。このとき、CPU221は、表示ビデオ領域のトップ―レフト(top-left)を基準点RPとし、字幕表示範囲に対する相対位置で指定されている字幕表示位置情報(「origin=“OH%OV%”」、「extent=“EH%EV%”」)の指示通りに字幕表示位置(リージョン)を決定する。
 このように決定された字幕表示位置は、水平方向のみその幅が圧縮されたものとなる。そのため、CPU221は、さらに、決定された字幕表示位置にリサイズ処理を施し、垂直方向の幅も圧縮し、最終的な字幕表示位置を得る。この場合、CPU221は、例えば、TTMLに含まれる「dto:scalingjustify=top」の情報に基づいて、所定のライン位置を固定した状態で垂直方向の幅の圧縮をする。
 図20(a)は、モニタのアスペクト比が4:3であってセンターカット(Center-cut)の表示方法を採る場合の例を示している。字幕表示位置の垂直方向の幅は、リサイズ処理によって、EV%からEVu%に圧縮されている。
 このステップST8の処理の後、CPU221は、ステップST5において、処理を終了する。
 上述のステップST7で字幕表示範囲の指定があるとき、CPU221は、ステップST9の処理に移る。このステップST9において、CPU221は、指定された字幕表示範囲において、字幕表示位置(リージョン)を決定する。このとき、CPU221は、字幕表示範囲の情報(基準点情報(RPoffset)、アスペクト比情報(dispasp))を用い、表示ビデオ領域上に字幕表示範囲を設定する。
 この場合、CPU221は、表示ビデオ領域のトップ―レフト(top-left)から基準点情報(RPoffset)だけずらした位置を字幕表示範囲のトップ―レフト(top-left)とし、アスペクト比情報(dispasp)が示すアスペクト比に対応した範囲を字幕表示範囲に設定する。この場合、字幕表示範囲の水平方向幅は、表示ビデオ領域の水平方向幅と一致したものとされる。
 そして、CPU221は、上述したように設定された字幕表示範囲のトップ―レフト(top-left)を基準点RPとし、字幕表示範囲に対する相対位置で指定されている字幕表示位置情報(「origin=“OH%OV%”」、「extent=“EH%EV%”」)の指示通りに字幕表示位置(リージョン)を決定する。
 図20(b)は、モニタのアスペクト比が4:3であってセンターカットの表示方法を採り、かつアスペクト比情報(dispasp)が示すアスペクト比が16:9である場合の例を示している。図20(c)は、モニタのアスペクト比が4:3であってセンターカットの表示方法を採り、かつアスペクト比情報(dispasp)が示すアスペクト比が4:3である場合の例を示している。
 このステップST9の処理の後、CPU221は、ステップST5において、処理を終了する。
 以上説明したように、図1に示す送受信システム10において、テレビ受信機200は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として字幕表示位置情報に基づいて決定された字幕表示位置にさらにリサイズ処理を施して最終的な字幕表示位置を得るか、あるいは表示ビデオ領域に字幕表示範囲を設定し、字幕表示位置情報に基づいて字幕表示位置を決定する。そのため、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であっても、字幕表示位置として本来の形状を保つことができ、視聴者に違和感を与えることがなく、字幕表示を良好に行い得る。
 また、図1に示す送受信システム10において、放送送出システム100は、字幕情報としてのTTMLに、受信側で行われるリサイズ処理に関する情報として、例えば字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報を含める。そのため、受信側では、この情報に基づいてリサイズ処理を適切に行うことが容易に可能となる。
 また、図1に示す送受信システム10において、放送送出システム100は、字幕情報としてのTTMLに、字幕表示範囲の情報を含める。そのため、受信側では、この情報に基づいて字幕表示範囲を設定することで、表示ビデオ領域に字幕表示範囲を適切に設定することが容易に可能となる。
 <2.変形例>
 なお、上述実施の形態においては、放送送出システム100がTTMLに字幕表示範囲の情報として基準点情報(RPoffset)とアスペクト比情報(dispasp)を含める例を説明した。しかし、放送送出システム100は、TTMLに字幕表示範囲の情報として基準点情報(RPoffset)のみを含めることも考えられる。図21、図22は、その場合におけるTTML構造の一例を示している。これらのTTML構造例は、詳細説明は省略するが、字幕表示範囲のアスペクト比情報(dispasp)がないことを除き、図3、図5に示すTTML構造例と同様である。
 基準点情報(RPoffset)のみが与えられる場合に、テレビ受信機200のCPU221がどのようにして字幕表示範囲を設定するかについて、その一例を、図23を参照して説明する。図示の例は、ビデオ領域のアスペクト比が16:9で表示ビデオ領域のアスペクト比が4:3である場合を示している。
 CPU221は、基準点情報(RPoffset)に基づいて、まず、表示ビデオ領域のトップ―レフト(top-left)から基準点情報(RPoffset)だけずらした位置を字幕表示範囲の基準点RPとする。表示ビデオ領域の中心位置をOPとし、基準点RPのOPに関して点対称の座標位置をTPとする。また、基準点RPのOPを通る水平線JKに関して線対称な位置をVPとする。また、基準点RPのOPを通る垂直線STに関して線対称な位置をHPとする。そして、字幕表示範囲を、RP-HP-TP-VPで囲まれる矩形領域を字幕表示範囲とする。
 このように放送送出システム100が字幕表示範囲の情報として基準点情報(RPoffset)のみを送る場合には、基準点情報(RPoffset)とアスペクト比情報(dispasp)の双方を送る場合に比べて、よりフレキシブルな字幕表示範囲の指定が可能となる。
 図24のフローチャートは、字幕表示範囲の情報として基準点情報(RPoffset)のみを送る場合における、テレビ受信機200のCPU221における字幕表示位置の決定およびリサイズ処理の手順の一例を示している。この図24において、図15と対応する部分には同一符号を付して示している。
 ステップST2でビデオ全領域を表示するモードであると判断するとき、CPU221は、ステップST4において、表示ビデオ領域を字幕表示範囲として、字幕表示位置(リージョン)を決定する。このとき、CPU221は、表示ビデオ領域のトップ―レフト(top-left)を基準点RPとし、字幕表示範囲に対する相対位置で指定されている字幕表示位置情報(「origin=“OH%OV%”」、「extent=“EH%EV%”」)の指示通りに字幕表示位置(リージョン)を決定する。
 このステップST4の処理の後、CPU221は、ステップST5において、処理を終了する。
 詳細説明は省略するが、図24のフローチャートのその他のステップは、図15のフローチャートと同様である。
 また、上述実施の形態においては、所定フォーマットの字幕のテキスト情報としてTTMLを用いる例を示した。しかし、本技術は、これに限定されず、TTMLと同等の情報を持つその他のテキスト情報を用いることも考えらえる。例えば、TTMLの派生フォーマットを用いてもよい。
 また、上述実施の形態においては、放送送出システム100とテレビ受信機200とからなる送受信システム10を示したが、本技術を適用し得る送受信システムの構成は、これに限定されるものではない。例えば、テレビ受信機200の部分が、HDMI(High-Definition Multimedia Interface)などのデジタルインタフェースで接続されたセットトップボックスおよびモニタの構成などであってもよい。なお、「HDMI」は登録商標である。
 また、上述実施の形態においては、コンテナがMPEG-2 TSのトランスポートストリームである例を示した。本技術は、コンテナがMMTのトランスポートストリームあるいはDASH/ISOBMFFストリームなどである場合にも、同様に適用できることは勿論である。
 また、本技術は、以下のような構成を取ることもできる。
 (1)ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを受信する受信部と、
 上記ビデオストリームにデコード処理を施してビデオデータを得るビデオデコード部と、
 上記サブタイトルストリームにデコード処理を施して字幕のビットマップデータを得るサブタイトルデコード部を備え、
 上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されており、
 ビデオ領域のアスペクト比と上記表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置にリサイズ処理を施し、該リサイズ処理が施された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示制御部と、
 上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳部をさらに備える
 受信装置。
 (2)上記表示制御部は、
 上記字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合、所定のライン位置を固定した状態で圧縮する
 前記(1)に記載の受信装置。
 (3)上記サブタイトルストリームが持つ字幕情報に、上記リサイズ処理に関する情報が含まれており、
 上記表示制御部は、
 上記リサイズ処理に関する情報を用いて上記決定された字幕表示位置にリサイズ処理を施す
 前記(1)または(2)に記載の受信装置。
 (4)受信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを受信する受信ステップと、
 上記ビデオストリームにデコード処理を施してビデオデータを得るビデオデコードステップと、
 上記サブタイトルストリームにデコード処理を施して字幕のビットマップデータを得るサブタイトルデコードステップを有し、
 上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されており、
 ビデオ領域のアスペクト比と上記表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置にリサイズ処理を施し、該リサイズ処理が施された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示制御ステップと、
 上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳ステップをさらに有する
 受信方法。
 (5)ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを受信する受信部と、
 上記ビデオストリームにデコード処理を施してビデオデータを得るビデオデコード部と、
 上記サブタイトルストリームにデコード処理を施して字幕のビットマップデータを得るサブタイトルデコード部を備え、
 上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されており、
 ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域に字幕表示範囲を設定し、上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示制御部と、
 上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳部をさらに備える
 受信装置。
 (6)上記サブタイトルストリームが持つ字幕情報に、上記字幕表示範囲の情報が含まれており、
 上記表示制御部は、
 上記字幕表示範囲の情報を用いて上記表示ビデオ領域に字幕表示範囲を設定する
 前記(5)に記載の受信装置。
 (7)上記字幕表示範囲の情報は、上記字幕表示範囲の基準点情報およびアスペクト比情報、あるいは上記字幕表示範囲の基準点情報である
 前記(6)に記載の受信装置。
 (8)受信部により、ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを受信する受信ステップと、
 上記ビデオストリームにデコード処理を施してビデオデータを得るビデオデコードステップと、
 上記サブタイトルストリームにデコード処理を施して字幕のビットマップデータを得るサブタイトルデコードステップを有し、
 上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定されており、
 ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域に字幕表示範囲を設定し、上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示制御ステップと、
 上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳ステップをさらに有する
 受信方法。
 (9)ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
 上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
 上記字幕情報は、
 ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる、上記字幕表示位置情報に基づいて決定される字幕表示位置のリサイズ処理に関する情報を含む
 送信装置。
 (10)上記リサイズ処理に関する情報は、上記字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報である
 前記(9)に記載の送信装置。
 (11)ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
 上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
 上記字幕情報は、
 上記字幕表示範囲の情報を含む
 送信装置。
 (12)上記字幕表示範囲の情報は、上記字幕表示範囲の基準点情報およびアスペクト比情報、あるいは上記字幕表示範囲の基準点情報である
 前記(11)に記載の送信装置。
 本技術の主な特徴は、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、表示ビデオ領域を字幕表示範囲として字幕表示位置情報に基づいて決定された字幕表示位置にさらにリサイズ処理を施して最終的な字幕表示位置を得るか、あるいは表示ビデオ領域に字幕表示範囲を設定し、字幕表示位置情報に基づいて字幕表示位置を決定することで、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合であっても、字幕表示位置として本来の形状を保つことができ、視聴者に違和感を与えることがなく、字幕表示を良好に行い得るようにしたことである(図20参照)。
 10・・・送受信システム
 100・・・放送送出システム
 110・・・ストリーム生成部
 111・・・制御部
 112・・・ビデオエンコーダ
 113・・・オーディオエンコーダ
 114・・・テキストフォーマット変換部
 115・・・サブタイトルエンコーダ
 116・・・TSフォーマッタ
 200・・・テレビ受信機
 201・・・受信部
 202・・・TS解析部
 203・・・ビデオデコーダ
 204・・・ビデオ重畳部
 205・・・パネル駆動回路
 206・・・表示パネル
 207・・・オーディオデコーダ
 208・・・オーディオ出力回路
 209・・・スピーカ
 210・・・サブタイトルデコーダ
 221・・・CPU

Claims (12)

  1.  ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信部と、
     上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域を字幕表示範囲として上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置にリサイズ処理を施し、該リサイズ処理が施された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御部を備える
     受信装置。
  2.  上記表示位置制御処理では、
     上記字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合、所定のライン位置を固定した状態で圧縮する
     請求項1に記載の受信装置。
  3.  上記サブタイトルストリームが持つ字幕情報に、上記リサイズ処理に関する情報が含まれており、
     上記表示位置制御処理では、
     上記リサイズ処理に関する情報を用いて上記決定された字幕表示位置にリサイズ処理を施す
     請求項1に記載の受信装置。
  4.  受信部が、ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信ステップと、
     制御部が、上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域を字幕表示範囲として上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置にリサイズ処理を施し、該リサイズ処理が施された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御ステップを有する
     受信方法。
  5.  ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信部と、
     上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域に字幕表示範囲を設定し、上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御部を備える
     受信装置。
  6.  上記サブタイトルストリームが持つ字幕情報に、上記字幕表示範囲の情報が含まれており、
     上記表示位置制御処理では、
     上記字幕表示範囲の情報を用いて上記表示ビデオ領域に字幕表示範囲を設定する
     請求項5に記載の受信装置。
  7.  上記字幕表示範囲の情報は、上記字幕表示範囲の基準点情報およびアスペクト比情報、あるいは上記字幕表示範囲の基準点情報である
     請求項6に記載の受信装置。
  8.  受信部が、ビデオデータを持つビデオストリームと字幕表示位置を字幕表示範囲に対する相対位置で指定する字幕表示位置情報を含む字幕情報を持つサブタイトルストリームを含むコンテナを受信する受信ステップと、
     制御部が、上記ビデオストリームをデコードしてビデオデータを得るビデオデコード処理と、上記サブタイトルストリームをデコードして字幕のビットマップデータを得るサブタイトルデコード処理と、ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合、上記表示ビデオ領域に字幕表示範囲を設定し、上記字幕表示位置情報に基づいて字幕表示位置を決定し、該決定された字幕表示位置に基づいて上記字幕のビットマップデータに対して表示位置制御をする表示位置制御処理と、上記表示位置制御が行われた字幕のビットマップデータを上記ビデオデータに重畳するビデオ重畳処理を制御する制御ステップを有する
     受信方法。
  9.  ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナを送信する送信部を備え、
     上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
     上記字幕情報は、
     ビデオ領域のアスペクト比と表示ビデオ領域のアスペクト比が異なる場合に受信側で行われる、上記字幕表示位置情報に基づいて決定される字幕表示位置のリサイズ処理に関する情報を含む
     送信装置。
  10.  上記リサイズ処理に関する情報は、上記字幕表示位置のリサイズ処理で垂直方向のサイズを圧縮する場合に固定位置とすべきライン位置を示す情報である
     請求項9に記載の送信装置。
  11.  ビデオデータを持つビデオストリームと字幕情報を持つサブタイトルストリームを含むコンテナを送信する送信部を備え、
     上記字幕情報に含まれる字幕表示位置情報において字幕表示位置は字幕表示範囲に対する相対位置で指定され、
     上記字幕情報は、
     上記字幕表示範囲の情報を含む
     送信装置。
  12.  上記字幕表示範囲の情報は、上記字幕表示範囲の基準点情報およびアスペクト比情報、あるいは上記字幕表示範囲の基準点情報である
     請求項11に記載の送信装置。
PCT/JP2017/001438 2016-01-26 2017-01-17 受信装置、受信方法および送信装置 WO2017130804A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201780007170.4A CN108476341B (zh) 2016-01-26 2017-01-17 接收设备、接收方法和发送设备
US16/070,815 US10511882B2 (en) 2016-01-26 2017-01-17 Reception apparatus, reception method, and transmission apparatus
JP2017564186A JP6969386B2 (ja) 2016-01-26 2017-01-17 受信装置、受信方法、送信装置および送信方法
EP17744034.4A EP3410730A4 (en) 2016-01-26 2017-01-17 Reception device, reception method, and transmission device
US16/665,370 US20200068247A1 (en) 2016-01-26 2019-10-28 Reception apparatus, reception method, and transmission apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016-012856 2016-01-26
JP2016012856 2016-01-26

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US16/070,815 A-371-Of-International US10511882B2 (en) 2016-01-26 2017-01-17 Reception apparatus, reception method, and transmission apparatus
US16/665,370 Continuation US20200068247A1 (en) 2016-01-26 2019-10-28 Reception apparatus, reception method, and transmission apparatus

Publications (1)

Publication Number Publication Date
WO2017130804A1 true WO2017130804A1 (ja) 2017-08-03

Family

ID=59398039

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/001438 WO2017130804A1 (ja) 2016-01-26 2017-01-17 受信装置、受信方法および送信装置

Country Status (5)

Country Link
US (2) US10511882B2 (ja)
EP (1) EP3410730A4 (ja)
JP (1) JP6969386B2 (ja)
CN (1) CN108476341B (ja)
WO (1) WO2017130804A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110363832B (zh) * 2019-07-24 2021-05-25 广州方硅信息技术有限公司 字幕生成方法及装置
CN110740372B (zh) * 2019-10-17 2021-12-21 海信视像科技股份有限公司 字幕的展示方法、装置和设备
CN111225288A (zh) 2020-01-21 2020-06-02 北京字节跳动网络技术有限公司 展示字幕信息的方法、装置以及电子设备
CN114598915A (zh) * 2020-12-03 2022-06-07 南京中兴软件有限责任公司 一种媒体服务方法、装置、设备及计算机存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3090704U (ja) * 2002-06-13 2002-12-26 船井電機株式会社 画像復調装置
JP2012169885A (ja) 2011-02-15 2012-09-06 Sony Corp 表示制御方法、記録媒体、表示制御装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3742167B2 (ja) * 1996-12-18 2006-02-01 株式会社東芝 画像表示制御装置
JPH11196386A (ja) * 1997-10-30 1999-07-21 Toshiba Corp コンピュータシステムおよびクローズドキャプション表示方法
GB0105994D0 (en) * 2001-03-10 2001-05-02 Pace Micro Tech Plc Video display resizing
US20030189669A1 (en) * 2002-04-05 2003-10-09 Bowser Todd S. Method for off-image data display
JP4178544B2 (ja) * 2002-08-20 2008-11-12 カシオ計算機株式会社 データ通信装置、データ通信システム、動画付き文書表示方法および動画付き文書表示プログラム
KR20050035678A (ko) * 2003-10-14 2005-04-19 엘지전자 주식회사 광디스크 장치의 부가 데이터 재생방법 및 장치와, 이를위한 광디스크
US8161388B2 (en) * 2004-01-21 2012-04-17 Rodriguez Arturo A Interactive discovery of display device characteristics
WO2005076601A1 (en) * 2004-02-10 2005-08-18 Lg Electronic Inc. Text subtitle decoder and method for decoding text subtitle streams
EP1730947A2 (en) * 2004-02-10 2006-12-13 LG Electronics Inc. Recording medium having a data structure for managing various data streams and recording and reproducing methods and apparatuses
TWI273547B (en) * 2004-10-22 2007-02-11 Via Tech Inc Method and device of automatic detection and modification of subtitle position
EP1855479A4 (en) * 2005-02-28 2009-10-14 Panasonic Corp CAPTION DISPLAY
US7760269B2 (en) * 2005-08-22 2010-07-20 Hewlett-Packard Development Company, L.P. Method and apparatus for sizing an image on a display
KR20090010494A (ko) * 2007-07-23 2009-01-30 엘지전자 주식회사 자막을 갖는 영상의 크기 조절 방법 및 그 디지털 티브이
US8817188B2 (en) * 2007-07-24 2014-08-26 Cyberlink Corp Systems and methods for automatic adjustment of text
PL2362671T3 (pl) * 2008-07-25 2014-05-30 Koninklijke Philips Nv Obsługa napisów przez wyświetlacz 3D
US9544569B2 (en) * 2009-02-12 2017-01-10 Lg Electronics Inc. Broadcast receiver and 3D subtitle data processing method thereof
EP2521366B1 (en) * 2009-02-19 2014-09-17 Panasonic Corporation Playback device
CN102845067B (zh) * 2010-04-01 2016-04-20 汤姆森许可贸易公司 三维(3d)呈现中的字幕
US8754984B2 (en) * 2011-05-02 2014-06-17 Futurewei Technologies, Inc. System and method for video caption re-overlaying for video adaptation and retargeting
EP2525568B1 (en) * 2011-05-19 2017-11-15 EchoStar Technologies L.L.C. Automatic subtitle resizing
JPWO2013108531A1 (ja) * 2012-01-19 2015-05-11 ソニー株式会社 受信装置、受信方法および電子機器
US8695048B1 (en) * 2012-10-15 2014-04-08 Wowza Media Systems, LLC Systems and methods of processing closed captioning for video on demand content
CN102932607B (zh) * 2012-10-29 2015-05-20 北京东方艾迪普科技发展有限公司 一种字幕图文信息生成方法及装置
US9967305B2 (en) * 2013-06-28 2018-05-08 Divx, Llc Systems, methods, and media for streaming media content
US20160322080A1 (en) * 2015-04-30 2016-11-03 Microsoft Technology Licensing, Llc Unified Processing of Multi-Format Timed Data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3090704U (ja) * 2002-06-13 2002-12-26 船井電機株式会社 画像復調装置
JP2012169885A (ja) 2011-02-15 2012-09-06 Sony Corp 表示制御方法、記録媒体、表示制御装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3410730A4

Also Published As

Publication number Publication date
CN108476341B (zh) 2021-06-25
US20190028757A1 (en) 2019-01-24
JPWO2017130804A1 (ja) 2018-11-15
US10511882B2 (en) 2019-12-17
EP3410730A1 (en) 2018-12-05
JP6969386B2 (ja) 2021-11-24
CN108476341A (zh) 2018-08-31
US20200068247A1 (en) 2020-02-27
EP3410730A4 (en) 2018-12-26

Similar Documents

Publication Publication Date Title
WO2017130804A1 (ja) 受信装置、受信方法および送信装置
JP7259901B2 (ja) 送信方法および送信装置
JP6724791B2 (ja) 送信装置、送信方法、受信装置および受信方法
WO2017159482A1 (ja) 送信装置、送信方法、受信装置および受信方法
JP6881303B2 (ja) 受信装置、受信方法、送信装置および送信方法
WO2009128197A1 (ja) デジタルテレビ信号処理装置及び字幕表示方法
JP2010057069A (ja) 映像表示装置、映像表示システムおよび映像表示方法
JP6519329B2 (ja) 受信装置、受信方法、送信装置および送信方法
WO2017006948A1 (ja) 受信装置、受信方法、送信装置および送信方法
KR20170007333A (ko) 방송 신호 송수신 방법 및 장치
WO2017047540A1 (ja) 送信装置、送信方法、再生装置および再生方法
JP2024015131A (ja) 送信装置、送信方法、受信装置および受信方法
JP2011182008A (ja) 字幕合成装置
JP6868776B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP7056576B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP2004207831A (ja) デジタル放送送受信方法と装置及び進行状況字幕送信装置と進行状況画面送信装置並びにコンピュータ・ソフトウエア

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17744034

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017564186

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2017744034

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2017744034

Country of ref document: EP

Effective date: 20180827