CN108886627A - 发送装置、发送方法、接收装置、以及接收方法 - Google Patents

发送装置、发送方法、接收装置、以及接收方法 Download PDF

Info

Publication number
CN108886627A
CN108886627A CN201780015897.7A CN201780015897A CN108886627A CN 108886627 A CN108886627 A CN 108886627A CN 201780015897 A CN201780015897 A CN 201780015897A CN 108886627 A CN108886627 A CN 108886627A
Authority
CN
China
Prior art keywords
information
subtitle
font
displaying location
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780015897.7A
Other languages
English (en)
Other versions
CN108886627B (zh
Inventor
塚越郁夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN108886627A publication Critical patent/CN108886627A/zh
Application granted granted Critical
Publication of CN108886627B publication Critical patent/CN108886627B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23614Multiplexing of additional data and video streams
    • H04N21/23617Multiplexing of additional data and video streams by inserting additional data into a data carousel, e.g. inserting software modules into a DVB carousel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • H04N7/087Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only
    • H04N7/088Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital
    • H04N7/0884Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection
    • H04N7/0885Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection for the transmission of subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440263Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA
    • H04N21/440272Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA for performing aspect ratio conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/278Subtitling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • H04N5/44504Circuit details of the additional information generator, e.g. details of the character or graphics signal generator, overlay mixing circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/025Systems for the transmission of digital non-picture data, e.g. of text during the active part of a television frame

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computer Graphics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Studio Circuits (AREA)

Abstract

本发明使得可以在接收侧上良好地执行字幕显示。发送预定格式的容器,容器包括包含视频数据的视频流和包含字幕文本信息的字幕流,字幕文本信息具有用于指定字幕显示位置为相对于字幕显示范围的相对位置的字幕显示位置信息。将在使用字幕位置信息显示字幕时所使用的补充信息插入到字幕流的容器中。例如,补充信息是与尺寸调整处理有关的信息、用于确定字幕显示范围的信息等。

Description

发送装置、发送方法、接收装置、以及接收方法
技术领域
本技术涉及一种发送装置、发送方法、接收装置、以及接收方法,并且具体地,涉及一起发送字幕的文本信息及视频数据的发送装置等。
背景技术
按照惯例,例如,在数字视频广播(DVB)的广播中,已经执行了发送字幕信息作为位图数据的操作。最近,已经构想了发送字幕信息作为文本字符码,即,基于文本的发送。例如,作为文本信息,万维网联盟(W3C)已经提出了计时文本标记语言(TTML)(参见专利文献1)。
按照惯例,例如,已知指定字幕的文本信息中所包括的字幕显示位置信息中的字幕显示位置作为相对于视频区域的相对位置。在这种情况下,在视频区域的长宽比与显示区域的长宽比不一致的情况下,字幕的一部分有时突出至显示区域以外并且不能根据显示方法进行显示。此外,按照惯例,已知发送包括字体规范信息的字幕文本信息。
引用列表
专利文献
专利文献1:日本专利申请特开公开号2012-169885
发明内容
发明解决的问题
如上所述,例如,为了避免字幕的一部分突出至显示区域以外并且避免不能进行显示,构想了在这样的接收侧中执行处理,即,并非相对于视频区域的相对位置,而是相对于监控器(显示器)上所显示的视频区域(显示视频区域)的相对位置。在这种情况下,例如,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,仅在水平方向上压缩字幕显示位置,并且存在字幕显示赋予观看着不舒服的感觉的可能性。此外,在发送包括上述所述字体规范信息的字幕文本信息的情况下,在接收侧上未安装所指定的字体的文件的情况下,不可以利用指定的字体进行字幕显示,并且存在字幕显示不能达到创建者意图的可能性。
本技术的目标是使得可以在接收侧中良好地执行字幕显示。
问题的解决方法
本发明的一个构思在于:
一种发送装置,包括:
发送单元,发送预定格式的容器,该容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,该文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息;和
信息插入单元,所述信息插入单元将通过使用字幕位置信息显示所述字幕时待使用的辅助信息插入到所述字幕流的容器中。
在本技术中,发送单元发送预定格式的容器,该容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流。该字幕的文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息。
信息插入单元将通过使用字幕位置信息显示字幕时待使用的辅助信息插入到字幕流的容器中。优选地,例如,将辅助信息插入到PES包和/或节目映射表中。
优选地,例如,辅助信息包括关于基于字幕显示位置信息确定的字幕显示位置的尺寸调整处理的信息,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,在接收侧中执行尺寸调整处理。在这种情况下,优选地,例如,在字幕显示位置的尺寸调整处理中压缩竖直方向上的尺寸的情况下,关于尺寸调整处理的信息是指示将行位置设置成固定位置的信息。
此外,优选地,例如,辅助信息包括用于确定字幕显示范围的信息。在这种情况下,优选地,例如,用于确定字幕显示范围的信息是字幕显示范围的参考点信息和长宽比信息。
如上所述,在本技术中,将通过使用字幕位置信息显示字幕时待使用的辅助信息插入到字幕流的容器中。出于该原因,在接收侧中,通过一起使用辅助信息以及字幕位置信息,其变得可以适当地获取字幕显示位置并且良好地执行字幕显示。
此外,本技术的另一构思在于:
一种接收装置,包括:
接收单元,接收预定格式的容器,该容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息;和
控制单元,该控制单元控制解码视频流以获得视频数据的处理,控制解码字幕流以获得字幕的位图数据的处理,控制基于通过使用字幕显示位置信息和当通过使用插入在字幕流的容器中的字幕位置信息显示字幕时而使用的辅助信息而获得的字幕显示位置而对字幕的位图数据执行显示位置控制的处理,并且控制将被执行了显示位置控制的字幕的位图数据叠加到视频数据上的处理。
在本技术中,接收单元接收预定格式的容器,容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流。字幕的文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息。将使用字幕位置信息显示字幕是所使用的辅助信息插入到字幕流的容器中。
控制单元控制解码视频流以获得视频数据的处理,控制对字幕流执行解码处理以获得字幕的位图数据的处理,控制基于通过使用字幕显示位置信息及辅助信息获取的字幕显示位置而对字幕的位图数据执行显示位置控制的处理,并且控制将执行了显示位置控制的字幕的位图数据叠加到视频数据上的处理。
例如,优选地,辅助信息包括关于基于字幕显示位置信息确定的字幕显示位置的尺寸调整处理的信息,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,在接收侧中执行尺寸调整处理,并且在执行显示位置控制的处理中,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,将显示视频区域设置为字幕显示范围并且基于字幕显示位置信息确定字幕显示位置,通过使用关于对所确定的字幕显示位置进行的尺寸调整处理的信息执行尺寸调整处理,并且基于执行了尺寸调整处理的字幕显示位置对字幕的位图数据执行显示位置控制。
此外,例如,优选地,辅助信息包括用于确定字幕显示范围的信息,并且在执行显示位置控制的处理中,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,基于用于确定字幕显示范围的信息在显示视频区域中设置字幕显示范围,基于字幕显示位置信息确定字幕显示位置,并且基于所确定的字幕显示位置对字幕的位图数据执行显示位置控制。
如上所述,在本技术中,将通过使用字幕位置信息显示字幕时待使用的辅助信息插入到字幕流的容器中,并且基于通过使用字幕显示位置信息及辅助信息获取的字幕显示位置对字幕的位图数据执行显示位置控制。出于此原因,变得可以良好地执行字幕显示。
此外,本技术的另一构思在于:
一种发送装置,包括:
发送单元,发送预定格式的容器,容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,文本信息包括字体规范信息;和
信息插入单元,该信息插入单元将用于下载至少由字体规范信息指定的字体的文件的下载信息插入到字幕流的容器中。
在本技术中,发送单元发送预定格式的容器,该容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流。字幕的文本信息包括字体规范信息。
信息插入单元将用于下载至少由字体规范信息指定的字体的文件的下载信息插入到字幕流的容器中。优选地,例如,将辅助信息插入到PES包和/或节目映射表中。优选地,例如,下载信息是用于从广播信号获取字体的文件的信息、或用于从网络上的服务器获取字体的文件的信息。
如上所述,在本技术中,将用于下载至少由字体规范信息指定的字体的文件的下载信息插入到字幕流的容器中。出于此原因,在接收侧中,在不包括由字体规范信息指定的字体的文件的情况下,变得可以基于下载信息获取由字体规范信息指定的字体的文件并且良好地执行字幕显示。
此外,本技术的另一构思在于:
一种接收装置,包括:
接收单元,接收预定格式的容器,容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,文本信息包括字体规范信息;和
控制单元,控制解码视频流以获得视频数据的处理,控制基于用于下载至少由字体规范信息指定的字体的文件的、插入到字幕流的容器中的下载信息获取由字体规范信息指定的字体的字体文件的处理,控制解码字幕流并基于所获取的字体文件获得字幕的位图数据的处理,并且控制将字幕的位图数据叠加到视频数据上的处理。
在本技术中,接收单元接收预定格式的容器,容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流。字幕的文本信息包括字体规范信息。将用于下载至少由字体规范信息指定的字体的文件的下载信息插入到字幕流的容器中。
控制单元控制解码视频流以获得视频数据的处理,控制基于下载信息获取由字体规范信息指定的字体的字体文件的处理,控制基于所获取的字体文件解码字幕流并且获得字幕的位图数据的处理,并且控制将字幕的位图数据叠加到视频数据上的处理。
如上所述,在本技术中,将用于下载至少由字体规范信息指定的字体的文件的下载信息插入到字幕流的容器中,并且基于下载信息获取由字体规范信息指定的字体的字体文件,并且当获得字幕的位图数据时使用由字体规范信息指定的字体的字体文件。出于此原因,甚至在不包括由字体规范信息指定的字体的文件的情况下,也变得可以良好地执行字幕显示。
此外,本技术的另一构思在于:
一种发送装置,包括:
节表插入单元,将分别包括不同字体文件的预定数目的节表按顺序并且重复地插入到传输流中;和
发送单元,发送插入了节表的传输流。
在本技术中,节表插入单元将分别包括不同字体文件的预定数目的节表按顺序并且重复地插入到传输流中。发送单元发送插入了节表的传输流。在这种情况下,通过数据轮播按顺序并且重复地发送预定数目的节表。
如上所述,在本技术中,将分别包括不同字体文件的预定数目的节表按顺序并且重复地插入到传输流中。出于此原因,在接收侧中,变得可以容易从传输流获取由例如字幕的文本信息中所包括的字体规范信息指定的字体的字体文件。
发明效果
根据本技术,变得可以在接收侧中良好地执行字幕显示。应注意,本说明书中描述的有利效果仅是实施例并且本技术的有利效果并不局限于此并且可以包括额外的效果。
附图说明
[图1]是示出作为实施方式的发送/接收系统的示例性配置的框图。
[图2]是示出通过字幕显示位置信息确定的字幕显示位置(区域)的实施例的示图。
[图3]是示出TTML的示例性结构(一个字幕显示位置)的示图。
[图4]是示出TTML结构中的主要信息的细节的示图。
[图5]是示出TTML的示例性结构(两个字幕显示位置)的示图。
[图6]是示出视频区域的长宽比与显示视频区域的长宽比相同的情况下的字幕的显示实施例(一个字幕显示位置)的示图。
[图7]是示出视频区域的长宽比与显示视频区域的长宽比相同的情况下的字幕的显示实施例(两个字幕显示位置)的示图。
[图8]是示出视频区域的长宽比与显示视频区域的长宽比不同、将显示视频区域设置成字幕显示范围、并且基于字幕显示位置信息确定字幕显示位置(第一方法)的情况下的字幕的显示实施例(一个字幕显示位置)的示图。
[图9]是示出执行尺寸调整处理的情况下的显示实施例的示图。
[图10]是示出视频区域的长宽比与显示视频区域的长宽比不同、将显示视频区域设置成字幕显示范围、并且基于字幕显示位置信息确定字幕显示位置、以及进一步执行尺寸调整处理(第一方法)的情况下的字幕的显示实施例(两个字幕显示位置)的示图。
[图11]是示出视频区域的长宽比与显示视频区域的长宽比不同、在显示视频区域中设置字幕显示范围、并且基于字幕显示位置信息确定字幕显示位置(第二方法)的情况下的字幕的显示实施例(一个字幕显示位置)的示图。
[图12]是示出视频区域的长宽比与显示视频区域的长宽比不同、在显示视频区域中设置字幕显示范围、并且基于字幕显示位置信息确定字幕显示位置(第二方法)的情况下的字幕的显示实施例(两个字幕显示位置)的示图。
[图13]是示出广播发送系统的流生成单元的示例性配置的框图。
[图14]是示出字幕PES包的示例性结构和“PES_data_byte_field()”的示例性结构的示图。
[图15]是示出片段类型的定义的实施例的示图。
[图16]是示出TTML显示片段的示例性结构的示图。
[图17]是示出TTML显示片段的示例性结构中的主要信息的细节的示图。
[图18]是示出字体下载片段的示例性结构的示图。
[图19]是示出字体下载片段的示例性结构中的主要信息的细节的示图。
[图20]是示出URL信令片段的示例性结构的示图。
[图21]是示出信令片段的示例性结构中的主要信息的细节的示图。
[图22]是示出TTML显示描述符的示例性结构的示图。
[图23]是示出字体下载描述符的示例性结构的示图。
[图24]是示出字体下载描述符的示例性结构的示图。
[图25]是示出从传输流TS(广播信号)获取由TTML的字体规范信息指定的字体的文件的情况(情况1)和从网络上的服务器获取文件的情况(情况2)的概况的示图。
[图26]是示意性示出通过数据轮播重复发送包括字体表(Font Table)的一个节表的示图,各自包括字体文件(Font file)的N个节表中除外。
[图27]是示出字体下载节表的示例性结构的示图。
[图28]是示出字体下载节表的示例性结构中的主要信息的细节的示图。
[图29]是示意性示出当“data_downloading_id”是“0×00”时的字体下载节表中所描述的字体表信息的示图。
[图30]是示出“font_group_id”的值与字体组之间的对应性的示图。
[图31]是示出字体表描述符的示例性结构的示图。
[图32]是示意性示出当“data_downloading_id”不是“0×00”时的字体下载节表中所描述的字体表信息的示图。
[图33]是示出字体文件描述符的示例性结构的示图。
[图34]是示出传输流TS的示例性配置的示图。
[图35]是示出电视接收器的示例性配置的框图。
[图36]是示出电视接收器的CPU中的字幕显示位置的确定与尺寸调整处理的程序的实施例的流程图。
[图37]是视频区域的长宽比与监控器(显示器)的长宽比的实施例的示图,并且用于说明确定是否是用于显示整个视频区域的模式的实施例。
[图38]是未指定字幕显示范围的情况下的用于说明在显示整个视频区域的模式中确定字幕显示位置的示图。
[图39]是指定了字幕显示范围的情况下的用于说明在显示整个视频区域的模式中确定字幕显示位置的示图。
[图40]是在未指定字幕显示范围的情况与指定了字幕显示范围的情况下的用于说明在不显示整个视频区域的模式中确定字幕显示位置的示图。
[图41]是示出电视接收器的CPU中所使用的字体文件的确定处理的程序的实施例的流程图。
[图42]是示出TTML的示例性结构(两个字幕显示位置)的示图。
具体实施方式
下列是用于完成本发明的模式的描述(以下将模式称之为“实施方式”)。应注意,将按照下列顺序进行说明。
1.实施方式
2.变形
<1.实施方式>
[发送/接收系统的示例性配置]
图1示出作为实施方式的发送/接收系统10的示例性配置。发送/接收系统10由广播发送系统100和电视接收器200配置。广播发送系统100通过广播波发送MPEG-2TS的传输流(以下简称为“传输流TS”)作为容器(多路复用流)。
传输流TS包括包含视频数据的视频流和包含字幕的文本信息的字幕流。此处,作为字幕的文本信息(例如,TTML),可以考虑TTML的导出格式等;然而,在实施方式中,假设为TTML。TTML包括字幕显示位置信息,并且字幕显示位置信息指定字幕显示位置(区域)为相对于字幕显示范围的相对位置(比例值)。此外,TTML包括字体规范信息。
广播发送系统100将使用字幕显示位置信息显示字幕时所使用的辅助信息插入到TTML的容器和/或字幕流中。在实施方式中,广播发送系统100包括TTML中的辅助信息并且还将辅助信息插入到包化基本流(PES)包和节目映射表(PMT)中。
辅助信息包括关于基于字幕显示位置信息确定的字幕显示位置的尺寸调整处理的信息,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,在接收侧中执行尺寸调整处理。例如,在字幕显示位置的尺寸调整处理中压缩竖直方向上的尺寸的情况下,关于尺寸调整处理的信息是指示将行位置设置成固定位置的信息。此外,辅助信息包括用于确定字幕显示范围的信息。例如,用于确定字幕显示范围的信息是字幕显示范围的参考点信息和长宽比信息。
此外,广播发送系统100将用于下载至少由字体规范信息指定的字体的文件的下载信息插入到字幕流的容器中。下载信息是用于从广播信号(传输流TS)获取字体文件的信息、用于从网络上的服务器获取字体文件的信息等。在实施方式中,广播发送系统100将下载信息插入到包化基本流(PES)包和节目映射表(PMT)中。
此外,广播发送系统100将分别包括不同字体文件的预定数目的节表按顺序并且重复地插入到作为广播信号的传输流TS中。即,广播发送系统100通过数据轮播重复地发送预定数目的节表。应注意,插入了各自包括字体文件的节表的传输流TS不一定必须与包括字幕流的上述所述传输流TS相同并且可以是另一服务的传输流TS。
电视接收器200接收从广播发送系统100发送的传输流TS。电视接收器200对包括视频数据的视频流执行解码处理,以获得视频数据,并且电视接收器200对包括TTML(作为字幕的文本信息)的字幕流执行解码处理,以获得字幕的位图数据。
当获得字幕的位图数据时,电视接收器200使用由TTML中包括的字体规范信息指定的字体的文件。如上所述,将用于下载至少由字体规范信息指定的字体的文件的下载信息插入到PES包和节目映射表(PMT)中。当未安装由字体规范信息指定的字体的文件时,电视接收器200基于下载信息下载并且使用字体文件。
如上所述,在TTML包括的字幕显示位置信息中,指定字幕显示位置为相对于字幕显示范围的相对位置。此外,如上所述,使用字幕显示位置信息显示字幕时所使用的辅助信息包括在TTML中并且还被插入到PES包和PMT中。
电视接收器200使用字幕显示位置信息和辅助信息获取字幕显示位置并且基于所获取的字幕显示位置对字幕的位图数据执行显示位置控制。电视接收器200将执行了显示位置控制的字幕的位图数据叠加到视频数据上,以获得用于显示的视频数据。
在视频区域的长宽比与显示视频区域(监控器上所显示的视频区域)的长宽比不同的情况下,作为对字幕的位图数据的显示位置控制,电视接收器200选择性地执行下面第一方法或第二方法。
在第一方法中,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,电视接收器200将显示视频区域设置成字幕显示范围并且基于字幕显示位置信息确定字幕显示位置,并且然后,对所确定的字幕显示位置执行尺寸调整处理,以获取最终的字幕显示位置。电视接收器200基于由此获取的字幕显示位置对字幕的位图数据执行显示位置控制。
尺寸调整处理是用于恢复字幕显示位置的最初形状的处理,并且例如,在仅在水平方向上压缩所确定的字幕显示位置的情况下,还以相同的比例在竖直方向上执行压缩。例如,在尺寸调整处理中压缩竖直方向上的尺寸的情况下,在诸如顶行(上行)、底行(下行)、或中间行(居间行)等预定的行位置固定的状态下,执行压缩。
例如,在存在两个字幕显示位置的情况下,通过适当地选择预定的行位置,即使执行尺寸调整处理,也变得可以维持两个字幕显示位置在竖直方向上的间隔。当将指示设置行位置作为固定位置的信息作为关于尺寸调整处理的信息插入到TTML、PES包、PMT中时,电视接收器200能使用信息。
在第二方法中,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,电视接收器200在显示视频区域中设置字幕显示范围、基于字幕显示位置信息确定字幕显示位置、并且获取最终的字幕显示位置。电视接收器200基于由此获取的字幕显示位置对字幕的位图数据执行显示位置控制。
当将用于确定字幕显示范围的信息插入到TTML、PES包、PMT等中时,电视接收器200能使用信息适当地设置字幕显示范围。例如,当TTML、PES包、PMT等中包括用于确定字幕显示范围的信息时,电视接收器200选择第二方法,并且当不包括信息时,电视接收器200选择第一方法。
图2示出了由字幕显示位置信息确定的字幕显示位置(区域)的实施例。实施例示出了TTML中给出字幕显示位置信息作为指示字幕显示位置的原点的信息“origin=“OH%OV%””和指示字幕显示位置的区域(extent)的信息“extent=“EH%EV%””的情况。“RP”指示参考点(Reference Pont),即,字幕显示范围的左上侧。
图2中的(a)示出了视频区域的长宽比与显示视频区域的长宽比相同的情况下的实施例。在实施例中,视频区域的长宽比是16:9,监控器的长宽比是16:9,并且显示视频区域的长宽比是16:9。在这种情况下,将显示视频区域设置成字幕显示范围,并且基于指定为相对于字幕显示范围的相对位置的字幕显示位置信息确定字幕显示位置。
图2的(b)是视频区域的长宽比与显示视频区域的长宽比不同、将显示视频区域设置成字幕显示范围,并且基于字幕显示位置信息确定字幕显示位置(第一方法)的情况下的实施例。实施例是视频区域的长宽比是16:9、监控器的长宽比是4:3、显示方法是中心切割、并且显示视频区域的长宽比是4:3的情况。在这种情况下,与图2的(a)的情况相比较,字幕显示位置在竖直方向上具有相同的宽度,但是,其水平方向上的宽度被压缩了。在这种情况下,字幕显示位置的形状与图2的(a)的情况不同。
图2的(c)是视频区域的长宽比与显示视频区域的长宽比不同、在显示视频区域中设置字幕显示范围、并且基于字幕显示位置信息确定字幕显示位置(第二方法)的情况下的实施例。实施例是视频区域的长宽比是16:9、监控器的长宽比是4:3、显示方法是中心切割、并且显示视频区域的长宽比是4:3的情况。在这种情况下,与图2的(a)的情况相比较,竖直方向和水平方向上的字幕显示位置的宽度被压缩。在将字幕显示范围的长宽比设置为16:9的情况下,字幕显示位置的形状与图2的(a)的情况相同。
图3示出了TTML结构的实施例。实施例是存在一个字幕显示位置(区域)的情况。XML中基本描述了TTML。在tt根容器中,限定了语言和域名空间。将域名空间限定为系统或标准系统的全部元素中能被唯一地限定的唯一元素名称。此外,在<tt>中,“tts:extent”首先声明视频的100%的目标区域作为字幕位置信息的目标的来源,并且“fullvideo”指示4K视频是目标的情况下的3840(H)×2160(V)的分辨率的整个视频、并且指示2K(全HD)视频是目标的情况下的1920(H)×1080(V)的分辨率的整个视频。
尽管省去了细节描述,然而,“xmlns=http://www.w3.org/ns/ttml”、“xmlns:ttp=http://www.w3.org/ns/ttml#parameter”、以及“xmlns:tts=http://www.w3.org/ns/ttml#styling”是诸如参数、式样等提前被固定为W3C中的TTML的属性分类的域名空间。
“xmlns:dto=http://www.example.org/ns/displaytextoverlay”是新定义的域名空间。域名空间用于插入关于字幕显示范围的信息。因此,“dto:dispasp=“16:9””和“dto:RPoffset=“Ax%,By%””指示关于字幕显示范围的信息。
“dto:dispasp=“16:9””指示字幕显示范围的长宽比信息并且指示字幕显示范围是长宽比为16:9的区域。在示出的实施例中,示出了字幕显示范围的长宽比为16:9;然而,如图4中示出的,作为字幕显示范围的长宽比,还可以指定为4:3、21:9等。“dto:RPoffset=“Ax%,By%””指示字幕显示范围的参考点信息,并且如图4中示出的,指示将显示视频区域的水平范围和竖直范围中的每个设置成100%时的字幕显示范围的参考点(ReferencePoint(RP))的位置作为与显示视频区域的左上侧的偏移量的比率。
报头中存在布局的元素。以“r1”指示区域ID,并且作为字幕显示位置信息,指示字幕显示位置的原点和区域(范围)作为相对位置。即,“origin=“OH%OV%””指示字幕显示位置的原点并且指示原点距离左侧为OH并且距离顶部为OV%。此外,“extent=“EH%EV%””指示字幕显示位置的区域并且指示水平宽度为EH%并且竖直宽度为EV%。
此外,报头中存在样式的元素。“fontFamily=“proportionalSansSerif””是字体规范信息。此处,“proportionalSansSerif”指示字体的类属族(类属名称)。
在主体中,以“p1”指示XML ID,以“r1”指示区域ID,制作字体规范,并且描述字幕的文本数据。此处,将文本数据设置成“ABCDE”。“Font-family:‘Arial’,‘Tahoma’,sans-serif”是指定p元素的字体的字体规范信息。此处,“Arial”和“Tahoma”指示字体名称并且“sans-serif”指示字体的类属族(类属名称)。
“dto:scalingjustify=top”构成关于尺寸调整处理的信息,并且在通过字幕显示位置的尺寸调整处理压缩竖直方向上的尺寸的情况下,“dto:scalingjustify=top”指示将行位置设置成固定位置。在示出的实施例中,示出了被设置成固定位置的行位置是顶行(上行);然而,如图4中示出的,也可以指定底行(下行)、中间行(居间行)等。
图5还示出了TTML结构的实施例。实施例是存在两个字幕显示位置(区域)的情况,tt根容器与图3中的相同,因此,将省去其描述。
报头中存在布局的元素。以“r1”指示第一字幕显示位置的区域ID,并且作为字幕显示位置信息,指示字幕显示位置的原点和区域(范围)作为相对位置。即,“origin=“OH1%OV1%””指示原点距离左侧为OH1%并且距离顶部为OV1%。此外,“extent=“EH1%EV1%””指示区域的水平宽度为EH1%并且区域的竖直宽度为EV1%。
此外,以“r2”指示第二字幕显示位置的区域ID,并且作为字幕显示位置信息,指示字幕显示位置的原点和区域(范围)作为相对位置。即,“origin=“OH2%OV2%””指示原点距离左侧为OH2%并且距离顶部为OV2%。此外,“extent=“EH2%EV2%””指示区域的水平宽度为EH2%并且区域的竖直宽度为EV2%。
此外,报头中存在样式的元素。“fontFamily=“proportionalSansSerif””是字体规范信息。此处,“proportionalSansSerif”指示字体的类属族(类属名称)。
在主体中,与第一字幕位置相关联,以“p1”指示XML ID,以“r1”指示区域ID,制作字体规范,并且描述字幕的文本数据。此处,将文本数据设置成“ABCDE”。“Font-family:‘Arial’,‘Tahoma’,sans-serif”是指定p元素的字体的字体规范信息。此处,“Arial”和“Tahoma”指示各个字体名称并且“sans-serif”指示字体的类属族(类属名称)。
“Dto:scalingjustify=bottom”构成关于尺寸调整处理的信息,并且在通过字幕显示位置的尺寸调整处理压缩竖直方向上的尺寸的情况下,“Dto:scalingjustify=bottom”指示将行位置设置成固定位置。在示出的实施例中,示出了被设置成固定位置的行位置是底行(下行)。
此外,在主体中,与第二字幕位置相关联,以“p2”指示XML ID,以“r2”指示区域ID,并且描述了字幕的文本数据。此处,将文本数据设置成“FGH”。“font-family=“monospaceSerif””是指定p元素的字体的字体规范信息。此处,“monospaceSerif”指示字体的类属族(类属名称)。
“dto:scalingjustify=top”构成关于尺寸调整处理的信息,并且在通过字幕显示位置的尺寸调整处理压缩竖直方向上的尺寸的情况下,“dto:scalingjustify=top”指示将行位置设置成固定位置。在示出的实施例中,示出了被设置成固定位置的行位置是顶行(上行)。
图6示出了视频区域的长宽比与显示视频区域(监控器上所显示的视频区域)的长宽比相同的情况下的字幕的显示实施例。示出的实施例是视频区域的长宽比为16:9并且监控器的长宽比为16:9的情况,并且图3中示出了TTML结构(一个字幕显示位置)。
在示出的实施例中,以虚线框指示视频区域,并且以实线框指示监控器区域。在这种情况下,如由一个点链线框指示的,将显示视频区域设置成字幕显示范围,并且基于被指定为相对于字幕显示范围的相对位置的字幕显示位置信息(“origin=“OH%OV%””、“extent=“EH%EV%””)确定字幕显示位置(区域)。“RP”指示参考点(Reference Pont),即,字幕显示范围的左上侧。
在由此确定的字幕显示位置处显示文本数据的字幕“ABCDE”。应注意,在示出的实施例中,指示视频区域、监控器区域、以及字幕显示范围的框发生相互移位并且进行显示,但是,这是用于清晰的显示每个框的程序,并且实际上,框彼此重叠。尽管省去了描述,然而,在下列图中进行相似的显示。
图7还示出了视频区域的长宽比与显示视频区域(监控器上所显示的视频区域)的长宽比相同的情况下的字幕的显示实施例。示出的实施例是视频区域的长宽比为16:9并且监控器的长宽比也为16:9的情况,并且图5中示出了TTML结构(两个字幕显示位置)。
在示出的实施例中,以虚线框指示视频区域,并且以实线框指示监控器区域。在这种情况下,如由一个点链线框指示的,将显示视频区域设置成字幕显示范围,并且基于被指定为相对于字幕显示范围的相对位置的字幕显示位置信息(“origin=“OH1%OV1%””、“extent=“EH1%EV1%””、“origin=“OH2%OV2%””、“extent=“EH2%EV2%””)确定第一字幕显示位置(区域)和第二字幕显示位置(区域)。
然后,在第一字幕显示位置(第一区域)中显示文本数据的字幕“ABCDE”,并且在第二字幕显示位置(第二区域)中显示文本数据的字幕“FGH”。在这种情况下,例如,两个字幕显示位置(区域)之间的间隔为10行。
图8示出了视频区域的长宽比与显示视频区域(监控器上所显示的视频区域)的长宽比不同、将显示视频区域设置成字幕显示范围、并且基于字幕显示位置信息确定字幕显示位置(第一方法)的情况下的字幕的显示实施例。示出的实施例是视频区域的长宽比为16:9并且监控器的长宽比为4:3的情况,并且图3中示出了TTML结构(一个字幕显示位置)。
在示出的实施例中,以虚线框指示视频区域,并且以实线框指示监控器区域。在这种情况下,如由一个点链线框指示的,将显示视频区域设置成字幕显示范围,并且基于被指定为相对于字幕显示范围的相对位置的字幕显示位置信息(“origin=“OH%OV%””、“extent=“EH%EV%””)确定字幕显示位置(区域)。然后,在字幕显示位置中显示文本数据的字幕“ABCDE”。
在这种情况下,与图6中的情况相比较,字幕显示位置在竖直方向上具有相同的宽度,但是,其在水平方向上的宽度被压缩了。在这种情况下,由于字幕显示位置的宽度被压缩,将字幕的字体尺寸也调整至更小的尺寸。按照这种方式调整字幕的字体尺寸,如图中示出的,在水平方向上,字幕显示位置与字幕显示位置中所显示的字幕之间的关系处于匹配状态;然而,在字幕显示位置的宽度未被压缩的竖直方向上,字幕显示位置与字幕显示位置中所显示的字幕之间的关系处于不匹配的状态。在这种情况下,观看者接收字幕显示位置处的黑色区域浮动的感觉。
鉴于上述情况,在第一方法中,如上所述,对所确定的字幕显示位置执行尺寸调整处理,并且使得字幕显示位置与在字幕显示位置上显示的字幕之间的关系不仅在水平方向上、而且还在竖直方向上处于匹配状态。图9示出了执行尺寸调整处理的情况下的显示实施例。在这种情况下,基于字幕显示位置信息(“origin=“OH%OV%””、““extent=“EH%EV%””)通过尺寸调整处理确定,不仅在水平方向上压缩、还在竖直方向上以相同的比例压缩字幕显示位置。因此,在这种情况下,通过字幕显示位置信息(“origin=“OH%OV%””、“extent=“EH%EVu%””)确定字幕显示位置。在这种情况下,EVu=3/4*EV。
在按照这种方式执行尺寸调整处理的情况下,在预定的行位置固定的状态下,执行竖直方向上的宽度的压缩。示出的实施例是基于TTML中包括的“dto:scalingjustify=top”的信息将预定的行位置设置成顶行(上行)的情况。应注意,在示出的实施例中,虚线框指示在压缩竖直方向上的宽度之前执行字幕显示位置。
图10还示出了视频区域的长宽比与显示视频区域(监控器上所显示的视频区域)的长宽比不同、将显示视频区域设置成字幕显示范围、并且基于字幕显示位置信息确定字幕显示位置(第一方法)的情况下的字幕的显示实施例。示出的实施例是视频区域的长宽比为16:9并且监控器的长宽比为4:3的情况下的显示实施例,并且图5中示出了TTML结构(两个字幕显示位置),并且执行尺寸调整处理。
在示出的实施例中,以虚线框指示视频区域,并且以实线框指示监控器区域。在这种情况下,如由一个点链线框指示的,将显示视频区域设置成字幕显示范围,并且基于被指定为相对于字幕显示范围的相对位置的字幕显示位置信息(“origin=“OH1%OV1%””、“extent=“EH1%EV1%””、“origin=“OH2%OV2%””、“extent=“EH2%EV2%””)确定第一字幕显示位置信息(区域)和第二字幕显示位置(区域),然后,进一步执行尺寸调整处理。
因此,在这种情况下,通过字幕显示位置信息(“origin=“OH1%OV1%””、“extent=“EH1%EV1u%””)确定第一字幕显示位置(第一区域)。在这种情况下,EV1u=3/4*EV1。因此,相似地,在这种情况下,通过字幕显示位置信息(“origin=“OH2%OV2%””、“extent=“EH2%EV2u%””)确定第二字幕显示位置(第二区域)。在这种情况下,EV2u=3/4*EV2。
然后,在第一字幕显示位置(第一区域)中显示文本数据的字幕“ABCDE”,并且在第二字幕显示位置(第二区域)中显示文本数据的字幕“FGH”。在这种情况下,根据字幕显示位置(区域)的压缩,调整字幕的字体尺寸,以与被压缩的字幕显示位置匹配。
在执行尺寸调整处理的情况下,在预定的行位置固定的状态下,执行竖直方向上的宽度的压缩。示出的实施例是基于TTML中包括的“dto:scalingjustify=bottom”的信息将预定的行位置设置成第一字幕显示位置(第一区域)中的底行(下行)的情况。此外,实施例是基于TTML中包括的“dto:scalingjustify=top”的信息将预定的行位置设置成第二字幕显示位置(第二区域)中的顶行(上行)的情况。
按照这种方式在第一字幕显示位置和第二字幕显示位置中选择预定的行位置,因此,例如,与图7中的显示实施例中的情况相似,维持第一字幕显示位置与第二字幕显示位置之间的间隔为10行。出于此原因,变得可以大致维持观看者对显示图像的字幕的感知度。
图11示出了视频区域的长宽比与显示视频区域(监控器上所显示的视频区域)的长宽比不同、在显示视频区域中设置字幕显示范围、并且基于字幕显示位置信息确定字幕显示位置(第二方法)的情况下的字幕的显示实施例。示出的实施例是视频区域的长宽比为16:9并且监控器的长宽比为4:3的情况下的显示实施例,并且图3中示出了TTML结构(一个字幕显示位置)。
在示出的实施例中,以虚线框指示视频区域,并且以实线框指示监控器区域。在这种情况下,如由一个点链线框指示的,在显示视频区域中设置字幕显示范围,并且基于被指定为相对于字幕显示范围的相对位置的字幕显示位置信息(“origin=“OH%OV%””、“extent=“EH%EV%””)确定字幕显示位置(区域)。然后,在字幕显示位置中显示文本数据的字幕“ABCDE”。在这种情况下,根据字幕显示位置(区域)的压缩,调整字幕的字体尺寸,以与被压缩的字幕显示位置匹配。
在这种情况下,例如,在显示视频区域中,将字幕显示范围设置成具有与视频区域的长宽比相同的长宽比。示出的实施例是基于关于TTML中包括的字幕显示范围的信息在显示视频区域中设置具有长宽比为16:9的字幕显示范围的情况,即,字幕显示范围的参考点信息(“dto:RPoffset=“Ax%,By%””)和字幕显示范围的长宽比信息(“dto:dispasp=“16:9””)。
在这种情况下,在竖直方向和水平方向上压缩字幕显示位置的宽度,字幕显示位置的形状与图6中的情况相同,并且由于字幕显示位置的调整,字幕的字体尺寸的调整(尺寸调整处理)则变得没必要。
图12还示出了视频区域的长宽比与显示视频区域(监控器上所显示的视频区域)的长宽比不同、在显示视频区域中设置字幕显示范围、并且基于字幕显示位置信息确定字幕显示位置(第二方法)的情况下的字幕的显示实施例。示出的实施例是视频区域的长宽比为16:9并且监控器的长宽比为4:3的情况下的显示实施例,并且图5中示出了TTML结构(两个字幕显示位置)。
在示出的实施例中,以虚线框指示视频区域,并且以实线框指示监控器区域。在这种情况下,如由一个点链线框指示的,将显示视频区域设置成字幕显示范围,并且基于被指定为相对于字幕显示范围的相对位置的字幕显示位置信息(“origin=“OH1%OV1%””、“extent=“EH1%EV1%””、“origin=“OH2%OV2%””、“extent=“EH2%EV2%””)确定第一字幕显示位置(区域)和第二字幕显示位置(区域)。然后,在第一字幕显示位置(第一区域)中显示文本数据的字幕“ABCDE”,并且在第二字幕显示位置(第二区域)中显示文本数据的字幕“FGH”。
[广播发送系统的流生成单元的示例性配置]
图13示出了广播发送系统100的流生成单元110的示例性配置。流生成单元110包括控制单元111、视频编码器112、音频编码器113、文本格式转换单元114、字幕编码器115、以及TS格式器(多路复用器)116。
控制单元111被制成具有包括例如中央处理单元(CPU)的配置并且控制流生成单元110的每个单元的操作。视频编码器112输入视频数据DV并且对视频数据DV执行编码,以生成由包括有效载荷中的编码视频数据的视频PES包配置的视频流(PES流)。音频编码器113输入音频数据DA并且对音频数据DA执行编码,以生成由包括编码音频数据的音频PES包配置的音频流(PES流)。
文本格式转换单元114输入文本数据(字符代码)DT并且获得计时文本标记语言(TTML)作为字幕信息(见图3和图5)。TTML包括字幕显示位置信息。在字幕显示位置信息中,指定字幕显示位置(区域)为相对于字幕显示范围的相对位置(比例值)。此外,TTML中包括字体规范信息。
此外,TTML包括在视频区域的长宽比与显示视频区域的长宽比不同的情况下的在接收侧中执行关于字幕显示位置的尺寸调整处理的信息,例如,在字幕显示位置的尺寸调整处理中压缩竖直方向上的尺寸的情况下,指示将行位置设置成固定位置的信息。此外,TTML包括用于确定字幕显示范围的信息(字幕显示范围的参考点信息和长宽比信息)。
字幕编码器115将通过文本格式转换单元114获得的TTML转换成各个片段并且生成由字幕PES包(其中,这些片段布置在有效载荷中)配置的字幕流(PES流)。
在这种情况下,字幕编码器115将关于尺寸调整处理的信息和用于确定与TTML中包括的这些相似的字幕显示范围的信息插入到PES包中。具体地,生成包括这些信息碎片(pieces)的新定义的TTML显示片段(TTML_display_segment)并且将片段插入到PES包中。
此外,字幕编码器115将用于下载至少由TTML的字体规范信息指定的字体的文件的下载信息插入到PES包中。具体地,生成包括用于从广播信号(transport stream TS)下载的信息的新定义字体下载片段(Font_download_segment)和包括用于从网络上的服务器下载的信息的新定义URL信令片段(URL_signaling_segment),并且将这些片段插入到PES包中。
图14的(a)示出了字幕PES包(PES_packet)的示例性结构(语法)。在“PES_startcode_prefix”的24位字段中,布置了固定pattern“0x000001”。8位字段“stream_id”指示流识别符。在字幕PES包的情况下,将其设置为“10111101”,即,指示“私有流1(privatestream1)”的值。16位字段“PES_packet_length”指示后续字节的数目作为PES包的长度(大小)。
在“PES_packet_length”之后,存在字段“Optional_PES_header()”。在字段中,布置了PTS和DTS的时间戳等。在字段之后,存在字段“PES_packet_data_byte”。字段与PES有效载荷对应。在字段中,布置了用于容纳数据的“PES_data_byte_field()”。
图14的(b)示出了“PES_data_byte_field()”的示例性结构(语法)。8位字段“data_identifier”是容器部分并且指示用于识别数据的类型的识别符。因为假设由“0x20”指示常规字幕(在位图的情况下),所以在文本的情况下,能通过新值识别字幕,例如,“0x21”。
8位的字段“subtitle_stream_id”指示用于识别字幕流的类型的识别符。在发送文本信息的字幕流的情况下,例如,将新值设置为“0x01”,并且可以区分值与发送位图的常规字幕流“0x00”。
在字段“subtitle_stream_id”之后,存在执行了“00001111”模式的字段“TimedTextSubtitling_segments()”。字段中布置了片段包。在字段之后,存在8位字段“end_of_PES_data_field_marker”。字段是指示PES包结束的标志(marker)。
图15示出了片段类型(segment_type)的定义的实施例。“0xA0”指示其是发送整个TTML文档的片段。“0xA1”指示其是发送<tt>部分的片段。“0xA2”指示其是发送<head>部分的片段。“0xA3”指示其是发送<body>部分的片段包。“0xA4”指示其是TTML显示片段。“0xA5”指示其是字体下载片段。“0xA6”指示其是URL信令片段。
图16示出了TTML显示片段(TTML_display_segment)的示例性结构(语法)。图17示出了示例性结构中的主要信息(语义)的细节。8位字段“sync_byte”是指示片段的开始的唯一字。8位字段“segment_type”指示片段的类型。在TTML显示片段的情况下,将“segment_type”设置为“0×A4”(见图15),并且“segment_type”指示其是TTML显示片段。16位字段“segment_length”指示后续字节的数目作为TTML显示片段的长度(大小)。
4位字段“tds_version_number”指示TTML显示片段的更新。在元素存在变化的情况下,值增加一。8位字段“display_aspect_type”指示字幕显示范围的长宽比。例如,“0x01”指示16:9,“0x02”指示4:3,并且“0x03”指示21:9。字段的信息与TTML中的“dto:dispasp”的信息对应(见图3和图5)。
8位字段“reference_point_offset_v”指示将显示视频区域的竖直范围和水平范围中的每个设置成100%时的字幕显示范围的参考点的竖直位置作为与显示视频区域的左上侧的偏移量的比率。8位字段“reference_point_offset_h”指示将显示视频区域的竖直范围和水平范围中的每个设置成100%时的字幕显示范围的参考点的水平位置作为与显示视频区域的左上侧的偏移量的比率。这些字段的信息与TTML中的“dto:RPoffset”的信息对应(见图3和图5)。
1位字段“scaling_justify_flag”指示在执行区域的缩放的情况下是否指定缩放的参考点。“1”指示指定了参考点,并且“0”指示未指定参考点。在指定参考点的情况下,当存在多个区域时,对于最高位置处的区域,将区域的下半部分设置成参考(bottom_line_justified),并且对于最低位置处的区域,将区域的上半部分设置成参考(top_line_justified)。字段的信息与TTML中的“dto:scalingjustify”的信息对应(见图3和图5)。
图18示出了字体下载片段(Font_download_segment)的示例性结构(语法)。图19示出了示例性结构中的主要信息(语义)的细节。8位字段“sync_byte”是指示片段的开始的唯一字。8位字段“segment_type”指示片段的类型。在字体下载片段的情况下,将“segment_type”设置成“0xA5”(见图15),并且“segment_type”指示其是字体下载片段。16位字段“segment_length”指示后续字节的数目作为字体下载片段的长度(大小)。4位字段“fds_version_number”指示字体下载片段的更新。在元素存在变化的情况下,值增加一。
16位字段“original_network_id”指示发送下载数据的网络的识别信息。16位字段“transport_stream_id”指示各个传输流的识别信息。16位字段“service_id”指示待下载的服务的识别信息。在分配媒介之间具有共同的下载目标的情况下,不在其自身的传输流中、而在另一传输流中发送字体文件,并且作为用于指定在该情况下参考的私有节(private section,私有部分)的信息,能指定这些片段“original_network_id”、“transport_stream_id”、以及“service_id”的信息。
8位字段“font_file_id”指示指派给字体文件的识别号。24位字段“ISO_639_language_code”指示包括用于识别语言的三个字符的代码。例如,“jpn”指示日语并且“eng”指示英语。8位字段“font_group_id”指示字体组的识别信息并且与TTML的类属族对应。8位字段“font_name_id”指示各个字体名称。
8位字段“text_length”指示字节中的后续字符代码部分的长度(大小)。字符代码布置在“char”的字段中。例如,可以布置指示各个字体名称的字符代码作为字符代码。
应注意,在图18的实施例中,包括了一个字体文件的下载信息,但是,也可以包括多个字体文件的下载信息。在这种情况下,结构具有重复字段“original_network_id”的for循环。可替代地,通过发送多个字体下载片段(Font_download_segment)也可以供应多个字体文件的下载信息。
图20示出了URL信令片段(URL_signaling_segment)的示例性结构(语法。图21示出了示例性结构中的主要信息(语义)的细节。8位字段“sync_byte”是指示片段的开始的唯一字。8位字段“segment_type”指示片段的类型。在URL信令片段的情况下,将“segment_type”设置成“0×A6”(见图15),并且“segment_type”指示其是URL信令片段。16位字段“segment_length”指示后续字节的数目作为字体下载片段的长度(大小)。4位字段“uss_version_number”指示URL信令片段的更新。在元素存在变化的情况下,值增加一。
24位字段“ISO_639_language_code”指示包括用于识别语言的三个字符的代码。例如,“jpn”指示日语并且“eng”指示英语。8位字段“font_group_id”指示字体组的识别信息并且与TTML的类属族对应。8位字段“font_name_id”指示各个字体名称。
8位字段“url_type”指示服务器的类型。例如,“0x01”指示字体服务器(未经压缩的URL),“0x02”指示一般服务器(未经压缩的URL),“0x11”指示字体服务器(压缩URL),并且“0x12”指示一般服务器(压缩URL)。8位字段“url_string_length”指示字符代码部分(指示字节中的后续URL的字符串)的长度(大小)。字符代码布置在“char”的字段中。
应注意,在图20的实施例中,包括了一个字体文件的下载信息,但是,也可以包括多个字体文件的下载信息。在这种情况下,结构具有重复字段“ISO_639_language_code”的for循环。可替代地,通过发送多个URL信令片段(URL_signaling_segment)也可以供应多个字体文件的下载信息。
返回参考图13,TS格式器116使得通过视频编码器112生成的视频流、通过音频编码器113生成的音频流、以及通过字幕编码器115生成的字幕流进入传送包中,以对其进行多路复用,以获得作为容器的传输流TS(多路复用流)。
在这种情况下,TS格式器116将关于尺寸调整处理的信息和用于确定字幕显示范围的、与TTML中包括的这些信息相似的信息插入到节目映射表(PMT)中。具体地,生成包括这些信息碎片的新定义的TTML显示描述符(TTML_display_descriptor)并且将描述符插入到PMT中。
此外,TS格式器116将用于下载至少由TTML的字体规范信息指定的字体的文件的下载信息插入到PMT中。具体地,生成包括用于从广播信号(传输流TS)下载的信息的新定义的字体下载描述符(Font_download_descriptor)和包括用于从网络上的服务器下载的信息的新定义的URL信令描述符(URL_signaling_descriptor),并且将这些描述符插入到PMT中。
图22示出了TTML显示描述符(TTML_display_descriptor)的示例性结构(语法)。8位字段“descriptor_tag”指示描述符类型,并且此处指示其是TTML显示描述符。8位字段“descriptor_length”指示描述符的长度(大小)并且指示后续字节的数目作为描述符的长度。
8位字段“display_aspect_type”指示字幕显示范围的长宽比。字段的信息与TTML中的“dto:dispasp”的信息对应(见图3和图5)。
8位字段“reference_point_offset_v”指示将显示视频区域的竖直范围和水平范围中的每个设置成100%时的字幕显示范围的参考点的竖直位置作为从显示视频区域的左上侧的偏移量的比率。8位字段“reference_point_offset_h”指示将显示视频区域的竖直范围和水平范围中的每个设置成100%时的字幕显示范围的参考点的水平位置作为与显示视频区域的左上侧的偏移量的比率。这些字段的信息与TTML中的“dto:RPoffset”的信息对应(见图3和图5)。
1位字段“scaling_justify_flag”指示在执行region的缩放的情况下是否指定缩放的参考点。“1”指示指定了参考点,并且“0”指示未指定参考点。字段的信息与TTML中的“dto:scalingjustify”的信息对应(见图3和图5)
8位字段“text_length”指示字节中的后续字符代码部分的长度(大小)。字符代码布置在“char”的字段中。例如,可以布置指示长宽比等的字符代码作为字符代码。
图23示出了字体下载描述符(Font_download_descriptor)的示例性结构(语法)。8位字段“descriptor_tag”指示描述符类型并且此处指示其是字体下载描述符。8位字段“descriptor_length”指示描述符的长度(大小)并且指示后续字节的数目作为描述符的长度。
16位字段“original_network_id”指示发送下载数据的网络的识别信息。16位字段“transport_stream_id”指示各个传输流的识别信息。16位字段“service_id”指示待下载的服务的识别信息。在分配媒介之间具有共同的下载目标的情况下,不在其自身的传输流中、而在另一传输流中发送字体文件,并且作为用于指定在该情况下参考的私有节(private section)的信息,能指定这些“original_network_id”、“transport_stream_id”、以及“service_id”的信息。
8位字段“font_file_id”指示指派给字体文件的识别号。24位字段“ISO_639_language_code”指示包括用于识别语言的三个字符的代码。8位字段“font_group_id”指示字体组的识别信息并且与TTML的类属族对应。8位字段“font_name_id”指示各个字体名称。
8位字段“text_length”指示字节中的后续字符代码部分的长度(大小)。字符代码布置在“char”的字段中。例如,可以布置指示各个字体名称等的字符代码作为字符代码。
应注意,在图23的实施例中,包括了一个字体文件的下载信息,但是,也可以包括多个字体文件的下载信息。在这种情况下,结构具有重复字段“original_network_id”的for循环。
图24示出了字体下载描述符(Font_download_descriptor)的示例性结构(语法)。8位字段“descriptor_tag”指示描述符的类型并且此处指示其是字体下载描述符。8位字段“descriptor_length”指示描述符的长度(大小)并且指示后续字节的数目作为描述符的长度。
24位字段“ISO_639_language_code”指示包括用于识别语言的三个字符的代码。8位字段“font_group_id”指示字体组的识别信息并且与TTML的类属族对应。8位字段“font_name_id”指示各个字体名称。8位字段“url_type”指示服务器的类型。8位字段“url_string_length”指示字符代码部分(指示字节中的后续URL的字符串)的长度(大小)。字符代码布置在“char”的字段中。
应注意,在图24的实施例中,包括了一个字体文件的下载信息,但是,也可以包括多个字体文件的下载信息。在这种情况下,结构具有重复字段“ISO_639_language_code”的for循环。
如上所述,基于被插入到PES包中的字体下载片段(见图18)或被插入到PMT中的字体下载描述符(见图23)中包括的信息,电视接收器200能从图25的(a)中作为“字体下载情况(情况1)”示出的传输流TS(广播信号)获取由TTML的字体规范信息指定的字体的文件。
此外,如上所述,基于被插入到PES包中的URL信令片段(见图20)或被插入到PMT中的字体下载描述符(见图24)中包括的信息,电视接收器200能从图25的(b)中作为“字体下载情况(情况2)”示出的网络上的服务器获取由TTML的字体规范信息指定的字体的文件。
返回参考图13,TS格式器116将分别包括不同字体文件(Font files)的预定数目的节表按顺序并且重复地插入到传输流TS中。即,广播发送系统100通过数据轮播重复地发送预定数目的节表。
图26示意性地示出了通过数据轮播重复发送包括字体表(Font Table)的一个节表,各自包括字体文件(Font file)的N各节表除外,并且接收器200能在不限制其计时的情况下接收这些节表。
此处。作为包括字体文件和字体表的节表,将字体下载节表(FDT)(Font_downloading_section table)重新定义为私有节表。在字体下载节表中,尽管后面描述了表结构,然而,存在诸如“data_downloading_id”、“section_number”、以及“last_section_number”等字段。
如图26中示出的,例如,将值0至N插入到字体下载节表循环的“data_downloading_id”的字段中,并且能识别每个节表。将与“data_downloading_id”字段的值相似的值也插入到字体下载节表循环的“section_number”字段中,并且将值N插入到每个节表的“last_section_number”字段中。
接收器200能在循环供应过程中辨别与所接收的字体下载节表的字段“section_number”和“last_section_number”的值的位置关系。即,接收器200辨别具有“section_number”字段的值的当前节表的位置、当“section_number”字段的值与“last_section_number”字段的值相吻合时辨别最后节表循环、并且能在一次循环中使用值获取全部节表。
图27示出了字体下载节表(Font_downloading_section table)的示例性结构(语法)。图28示出了示例性结构中的主要信息(语义)的细节。
8位字段“table_id”指示表识别信息。将指示字体下载节表的值指定为表识别信息。16位字段“data_downloading_id”是下载数据的识别信息并且指示针对各个“original_network_id”定义的唯一值。例如,“0x00”指示其是字体表信息,不同于“0x00”指示其是字体文件信息。5位字段“version_number”指示字体下载节表的更新。在元素存在变化的情况下,值增加一。
16位字段“original_network_id”指示发送下载数据的网络的识别信息。16位字段“transport_stream_id”指示各个传输流的识别信息。16位字段“service_id”指示待下载的服务的识别信息。通过一起使用这三个识别信息碎片,变得可以使得其成为分配媒介之间的共同下载目标。
在“descriptor()”字段中,当“data_downloading_id”是“0x00”时,布置字体表描述符(Font_table_descriptor),并且当“data_downloading_id”不是“0x00”时,布置字体文件描述符(Font_file_descriptor)。此外,当“data_downloading_id”不是“0x00”时,字体文件(Font file)布置在“data_byte”字段中。
图29示意性地示出了当“data_downloading_id”是“0x00”时的字体下载节表中所描述的字体表信息。在这种情况下,如上所述,字体表描述符(Font_table_descriptor)布置在字体下载节表的“descriptor()”字段中。
在字体表描述符中,描述了关于待循环发送的预定数目的字体文件的信息。作为关于字体文件的信息,包括诸如“Font_file_id”、“ISO_639_language_code”、“font_group_id”、以及“font_name_id”等信息碎片。“Font_file_id”指示指派给字体文件的识别号。“ISO_639_language_code”指示语言的识别码。“font_group_id”指示字体组的识别信息。“font_name_id”指示各个字体名称。图30示出了“font_group_id”的值与字体组之间的对应性。
图31示出了字体表描述符(Font_table_descriptor)的示例性结构(语法)。8位字段“descriptor_tag”指示描述符类型并且此处指示其是字体表描述符。8位字段“descriptor_length”指示描述符的长度(大小)并且指示后续字节的数目作为描述符的长度。
8位字段“number_of_font_files”指示字体文件的数目。存在与字体文件的数目同样多的8位字段“font_file_id”、24位字段“ISO_639_language_code”、8位字段“font_group_id”、以及8位字段“font_name_id”。
8位字段“text_length”指示字节中的后续字符代码部分的长度(大小)。字符代码布置在“char”的字段中。例如,可以布置指示各个字体名称等的字符代码作为字符代码。
图32示意性地示出了当“data_downloading_id”不是“0x00”时的字体下载节表中所描述的字体表信息。在这种情况下,如上所述,在字体下载节表中,字体文件描述符(Font_file_descriptor)布置在字段“descriptor()”中,并且进一步地,字体文件(Fontfile)布置在字段“data_byte”中。
字体文件描述符中描述了关于待发送的字体文件的信息。作为关于字体文件的信息,包括诸如“Font_file_id”、“ISO_639_language_code”、“font_group_id”、以及“font_name_id”等信息碎片。“Font_file_id”指示指派给字体文件的识别号。“ISO_639_language_code”指示语言的表示码。“font_group_id”指示字体组的识别信息。“font_name_id”指示各个字体名称。
图33示出了字体文件描述符(Font_file_descriptor)的示例性结构(语法)。8位字段“descriptor_tag”指示描述符类型并且此处指示其是字体文件描述符。8位字段“descriptor_length”指示描述符的长度(大小)并且指示后续字节的数目作为描述符的长度。
存在指示关于待发送的字体文件的信息的8位字段“Font_file_id”、24位字段“ISO_639_language_code”、8位字段“font_group_id”、以及8位字段“font_name_id”。8位字段“text_length”指示字节中的后续字符代码部分的长度(大小)。字符代码布置在“char”字段中。例如,可以布置指示各个字体名称等的字符代码作为字符代码。
简要描述了图13中示出的流生成单元110的操作。将视频数据DV供应至视频编码器112。视频编码器112对视频数据DV执行编码,以生成由包括有效载荷中的编码图像数据的视频PES包配置的视频流(PES流)。将视频流供应至TS格式器116。
此外,将音频数据DA供应至音频编码器113。音频编码器113对音频数据DA执行编码,以生成包括含编码音频数据的音频PES包的音频流(PES流)。将音频流供应至TS格式器116。
此外,将文本数据(字符代码)DT供应至文本格式转换单元114。在文本格式转换单元114中,获得作为字幕信息的TTML(见图3和图5)。TTML包括用于指定字幕显示位置(区域)为相对于字幕显示范围的相对位置(比例值)的字幕显示位置信息。此外,TTML中包括字体规范信息。此外,TTML包括使用字幕显示位置信息显示字幕时所使用的辅助信息(关于尺寸调整处理的信息、用于确定字幕显示范围的信息)。
将TTML供应至字幕编码器115。字幕编码器115将TTML转换成各个片段,以生成由字幕PES包(其中,这些片段布置在有效载荷中)配置的字幕流。将字幕流供应至TS格式器116。
在这种情况下,字幕编码器115将使用字幕显示位置信息显示字幕时所使用的辅助信息(关于尺寸调整处理的信息、用于确定字幕显示范围的信息)插入到PES包中,辅助信息与TTML中包括的信息相似。具体地,生成包括这些信息碎片的TTML显示片段(见图16),并且将片段插入到PES包中。
此外,字幕编码器115将用于下载至少由TTML的字体规范信息指定的字体的文件的下载信息插入到PES包中。具体地,生成包括用于从广播信号(发送流TS)下载的信息的字体下载片段(见图18)和包括用于从网络上的服务器下载的信息的URL信令片段(见图20),并且将这些片段插入到PES包中。
TS格式器116使得通过视频编码器112生成的视频流、通过音频编码器113生成的音频流、以及通过字幕编码器115生成的字幕流进入传送包中,以对其进行多路复用,以生成作为容器的传输流TS(多路复用流)。
在这种情况下,TS格式器116将使用字幕显示位置信息显示字幕时所使用的辅助信息(关于尺寸调整处理的信息、用于确定字幕显示范围的信息)插入到PMT中,辅助信息与TTML中包括的信息相似。具体地,生成包括这些信息碎片的TTMK显示描述符(见图22),并且将描述符插入到PMT中。
此外,TS格式器116将用于下载至少由TTML的字体规范信息指定的字体的文件的下载信息插入到PMT中。具体地,生成包括用于从广播信号(传输流TS)下载的信息的字体下载描述符(见图23)和包括用于从网络上的服务器下载的信息的新定义的URL信令描述符(见图24),并且将这些描述符插入到PMT中。
[传输流TS的示例性配置]
图34示出了传输流TS的示例性配置。在示例性配置中,省去了视频部分与音频部分的配置。在示例性配置中,存在字幕PES包“Subtitle PES”(字幕流的PES包)。
在字幕PES包中,将PTS的时间戳插入到PES报头中,并且将包括TTML文档的分隔部分的整个TTML文档或片段(计时文本字幕片段:TimedText subtitle segments)插入到PES有效载荷中。片段包括关于尺寸调整处理(“dto:scalingjustify”)的信息、用于确定字幕显示范围(“dto:dispasp”、“dto:RPoffset”)的信息。
此外,片段包括字体规范信息(“fontFamily”)。应注意,如后面所述,在片段中,还构思为包括下载信息(“fontdlurl=http://www.w3.org/ns/fontdlservice”、“fontdlurl:iso639languagecode=“value””、“fontdlurl:fontgroupid=“value””、“fontdlurl:fontnameid=“value””、“fontdlurl:fontname=“value””。
此外,将TTML显示片段(TTML_display_segment)(见图16)插入到字幕PES包的PES有效载荷中。将分别与上述所述计时文本字幕片段(TimedText subtitle segments)中包括的关于尺寸调整处理(“dto:scalingjustify”)的信息和用于确定字幕显示范围(“dto:dispasp”、“dto:RPoffset”)的信息对应的关于尺寸调整处理(“scaling_justify_flag”)的信息和用于确定字幕显示范围的信息(“display_aspect_type”、“reference_point_offset_v,reference_point_offset_h”)插入到片段中。
此外,将字体下载片段(Font_download_segment)(见图18)插入到字幕PES包的PES有效载荷中。将用于从广播信号(传输流TS)下载由上述所述计时文本字幕片段(TimedText subtitle segments)中包括的字体规范信息(“fontFamily”)指定的字体的文件的信息(“font_file_id”、“ISO_639_language_code”、“font_group_id”、“font_name_id”等)插入到片段中。
此外,将URL信令片段(URL_signalin_segment)(见图20)插入到字幕PES包的PES有效载荷中。将用于从网络上的服务器下载由上述所述计时文本字幕片段(TimedTextsubtitle segments)中包括的字体规范信息(“fontFamily”)指定的字体的文件的信息(“ISO_639_language_code”、“font_group_id”、“font_name_id”、“url_type”、“URL”等)插入到片段中。
此外,传输流TS包括作为节目指定信息(PSI)的节目映射表(PMT)。PSI是描述传输流TS中包括的各个基本流属于哪一节目的信息。在PMT中,存在包括与字幕流相关联的信息的字幕基本流循环(Subtitle ES loop)。
在字幕基本流循环中,布置了与字幕流对应的诸如包识别符(PID)等信息,并且还布置了描述与字幕流相关联的信息的描述符。作为描述符,布置了TTML显示描述符(TTML_display_descriptor)(见图22)、字体下载描述符(Font_download_descriptor)(见图23)、以及URL信令描述符(URL_signaling_descriptor)(见图24)。
将关于尺寸调整处理(“scaling_justify_flag”)的信息和用于确定字幕显示范围的信息(“display_aspect_type”、“reference_point_offset_v,reference_point_offset_h”)插入到TTML显示描述符中。将与字体下载片段相似的下载信息(“font_file_id”、“ISO_639_language_code”、“font_group_id”、“font_name_id”等)插入到字体下载描述符中。将与URL信令片段相似的下载信息(“ISO_639_language_code”、“font_group_id”、“font_name_id”、“url_type”、“URL”等)插入到URL信令描述符中。
应注意,字体下载描述符和URL信令描述符可以布置在传输流TS的事件信息表(EIT)下方。这使得可以描述关于各个节目的下载信息。
此外,传输流TS包括FDT(Font_downloading_section table)(见图27)。利用FDT,通过数据轮播循环地供应字体表文件。将字体表描述符(Font_table_descriptor)(见图31)、或字体文件描述符(Font_file_descriptor)(见图33)、以及字体文件(Font_file)插入到FDT中。应注意,存在FDT并不存在于传输流TS中的情况。在这种情况下,在基于PES包的字体下载片段或PMT的字体下载描述符中包括的下载信息下载字体文件的情况下,接收器200从另一传输流TS下载字体文件。
[电视接收器的示例性配置]
图35示出了电视接收器200的示例性配置。电视接收器200包括接收单元201、TS分析单元(解多路复用器)202、视频解码器203、视频叠加单元204、面板驱动电路205、以及作为监控器(显示器)的显示面板206。此外,电视接收器200包括音频解码器207、音频输出电路208、扬声器209、以及字幕解码器210。此外,电视接收器200包括CPU 221、闪存ROM 222、DRAM 223、内部总线224、远程控制接收单元225、远程控制发送器226、以及通信接口227。
CPU 221控制电视接收器200的各个单元的操作。闪存ROM 222存储控制软件并且保存数据。DRAM 223配置CPU 221的工作区。CPU 221部署软件并且从DRAM 223上的闪存ROM222读取数据而启动软件、并且控制电视接收器200的各个单元。
远程控制接收单元225接收从远程控制发送器226发送的远程控制信号(远程控制代码)并且将信号供应至CPU 221。CPU 221基于远程控制代码控制电视接收器200的各个单元。CPU 221、闪存ROM 222、以及DRAM 223连接至内部总线224。
在CPU 221的控制下,通信接口227与诸如因特网等网络上存在的服务器通信。通信接口227连接至内部总线224。
接收单元201通过从广播发送系统100发送的广播波接收传输流TS。如上所述,传输流TS包括视频流、音频流、以及字幕流。TS分析单元202从传输流TS提取视频流、音频流、以及字幕流各自的PES包。在这种情况下,TS分析单元202分析被插入到各个TS包的报头中的各种类型的信息、基于“PID”选择性地提取包括视频、音频、以及字幕PES包的数据的TS包,以获得视频、音频、以及字幕PES包。
此外,TS分析单元202分析被插入到各个TS包的报头中的各种类型的信息、基于“PID”提取被插入到传输流TS中的各种类型的信息、并且将信息发送至CPU 221。信息还包括TTML显示描述符(TTML_display_descriptor)(见图22)、字体下载描述符(Font_download_descriptor)(见图23)、以及URL信令描述符(URL_signaling_descriptor)(见图24)。
CPU 221从TTML显示描述符获取关于尺寸调整处理(“scaling_justify_flag”)的信息和用于确定字幕显示范围的信息(“display_aspect_type”、“reference_point_offset_v,reference_point_offset_h”)作为使用字幕流中包括的TTML的字幕显示位置信息显示字幕时所使用的辅助信息。
此外,CPU 221从字体下载描述符获取用于从广播信号(传输流TS)下载由字幕流中包括的TTML包括的字体规范信息指定的字体的文件的信息(“font_file_id”、“ISO_639_language_code”、“font_group_id”、“font_name_id”等)。
此外,CPU 221从URL信令描述符获取用于从网络上的服务器下载由字幕流中包括的TTML包括的字体规范信息指定的字体的文件的信息(“ISO_639_language_code”、“font_group_id”、“font_name_id”、“url_type”、“URL”等)。
此外,在从广播信号(传输流TS)下载由字幕流中包括的TTML包括的字体规范信息指定的字体的文件的情况下,通过TS分析单元202提取的信息还包括FDT(Font_downloading_section table)(见图27)。CPU 221从FDT获取由字幕流中包括的TTML包括的字体规范信息指定的字体的文件。
音频解码器207对通过TS分析单元202获得的音频PES包执行解码处理,以获得音频数据。音频输出电路208对音频数据执行诸如D/A转换或放大等必要的处理并且将数据供应至扬声器209。视频解码器203对通过TS分析单元202获得的视频PES包执行解码处理,以获得视频数据。应注意,视频解码器203还根据显示模式等执行视频数据的分辨率转换,视情况而定。例如,在视频区域的长宽比是16:9并且监控器(显示器)的长宽比是4:3、并且显示模式是信箱(Letter box)的情况下,执行视频数据的分辨率转换。
字幕解码器210对通过TS分析单元202获得的字幕PES包执行解码处理,以从计时文本字幕片段(TimedText subtitle segments)获得TTML,并且将TTML发送至CPU 221。CPU221从TTML获取用于指定字幕显示位置(区域)为相对于字幕显示范围的相对位置(比例值)的字幕显示位置信息,并且进一步获取关于尺寸调整处理(“dto:scalingjustify”)的信息和用于确定字幕显示范围(“dto:dispasp”、“dto:RPoffset”)的信息作为使用字幕显示位置信息等显示字幕时所使用的辅助信息。
此外,字幕解码器210提取通过TS分析单元202获得的字幕PES包中包括的TTML显示片段(TTML_display_segment)(见图16)、字体下载片段(Font_download_segment)(见图18)、以及URL信令片段(URL_signalin_segment)(见图20)并且将其发送至CPU 221。
CPU 221从TTML显示片段获取关于尺寸调整处理(“scaling_justify_flag”)的信息和用于确定字幕显示范围的信息(“display_aspect_type”、“reference_point_offset_v,reference_point_offset_h”)作为使用字幕流中包括的TTML的字幕显示位置信息显示字幕时所使用的辅助信息。
此外,CPU 221从字体下载片段获取用于从广播信号(传输流TS)下载由字幕流中包括的TTML包括的字体规范信息指定的字体的文件的信息(“font_file_id”、“ISO_639_language_code”、“font_group_id”、“font_name_id”等)。
此外,CPU 221从URL信令片段获取用于从网络上的服务器下载由字幕流中包括的TTML包括的字体规范信息指定的字体的文件的信息(“ISO_639_language_code”、“font_group_id”、“font_name_id”、“url_type”、“URL”等)。
此外,在CPU 221的控制下,字幕解码器210将TTML中包括的各个字幕显示位置(区域)的字幕的文本数据(字体数据)转换成位图数据(二进制图像信息)。在这种情况下,在CPU 221的控制下,根据通过字幕显示位置信息确定或通过执行了进一步的尺寸调整处理而获得的字幕显示位置的尺寸从TTML中指定的字体大小适当地调整字幕的字体大小。
CPU 221基于字幕显示位置信息确定字幕显示位置并且对所确定的字幕显示位置进一步执行尺寸调整处理,视情况而定。此时,CPU 221适当地使用上述所述被插入到TTML、PES包、PMT等中的辅助信息(关于尺寸调整处理的信息、用于确定字幕显示范围的信息)。后面将描述CPU221中的字幕显示位置的确定与尺寸调整处理的程序的细节。
此外,在CPU 221的控制下,字幕解码器210在获得字幕的位图数据时使用由TTML中包括的字体规范信息指定的字体的文件。当电视接收器200不安装由字体规范信息指定的字体的文件时,CPU 221基于上述所述被插入到PES包、PMT等中的下载信息从广播信号(传输流TS)或网络上的服务器适当地下载字体文件并且使用字体文件。应注意,当文件不能下载时,使用代替的字体文件(例如,默认字体文件)。后面将进一步描述CPU 221中所使用的字体文件的确定处理的程序的细节。
在CPU 221的控制下,视频叠加单元204将通过字幕解码器210获得的各个字幕显示位置处的字幕的位图数据叠加在通过视频解码器203获得的视频数据上,以获得用于显示的视频数据。在这种情况下,CPU 221基于通过字幕显示位置信息确定或通过执行了上述所述进一步的尺寸调整处理获得的字幕显示位置执行控制,以使得字幕位图数据的叠加位置变成字幕显示位置。
面板驱动电路205基于通过视频叠加单元204获得的用于显示的视频数据驱动显示面板206。例如,显示面板206由液晶显示器(LCD)、有机场致发光(EL)显示器等配置。
简要描述图35中示出的电视接收器200的操作。在接收单元201中,通过广播波加载接收传输流TS并且从广播发送系统100发送传输流TS。传输流TS包括视频流、音频流、以及字幕流。将传输流TS供应至TS分析单元202。TS分析单元202从传输流TS提取视频流、音频流、以及字幕流各自的PES包。
此外,TS分析单元202提取被插入到传输流TS中的各种类型的信息并且将信息发送至CPU 221。信息还包括TTML显示描述符)、字体下载描述符、以及URL信令描述符。
由此,CPU 221获取使用字幕流中包括的TTML的字幕显示位置信息显示字幕时所使用的辅助信息(关于尺寸调整处理的信息、用于确定字幕显示范围的信息)。此外,CPU221从广播信号(传输流TS)或网络上的服务器获取用于下载由字幕流中包括的TTML包括的字体规范信息指定的字体的文件的下载信息。
此外,当从广播信号(传输流TS)下载由字幕流中包括的TTML包括的字体规范信息指定的字体的文件时,TS分析单元202从传输流TS提取FDT并且将FDT发送至CPU 221。由此,CPU 221获取由字幕流中包括的TTML包括的字体规范信息指定的字体的文件。
将通过TS分析单元202提取的视频PES包供应至视频解码器203。视频解码器203对视频PES包执行解码处理,以获得视频数据。在这种情况下,视频解码器203还根据显示模式等执行视频数据的分辨率转换,视情况而定。
此外,将通过TS分析单元202提取的字幕PES包供应至字幕解码器210。字幕解码器210对通过TS分析单元202获得的字幕PES包执行解码处理,以获得TTML。将TTML发送至CPU221。CPU 221从TTML获取用于指定字幕显示位置(区域)为相对于字幕显示范围的相对位置(比例值)的字幕显示位置信息并且进一步获取使用字幕显示位置信息显示字幕时所使用的辅助信息(关于尺寸调整处理的信息、用于确定字幕显示范围的信息)。
此外,字幕解码器210从通过TS分析单元202获得的字幕PES包提取TTML显示片段、字体下载片段、以及URL信令片段、并且将片段发送至CPU 221。
由此,CPU 221获取使用字幕流中包括的TTML的字幕显示位置信息显示字幕时所使用的辅助信息(关于尺寸调整处理的信息、用于确定字幕显示范围的信息)。此外,CPU221从广播信号(传输流TS)或网络上的服务器获取用于下载由字幕流中包括的TTML包括的字体规范信息指定的字体的文件的下载信息。
在CPU 221的控制下,字幕解码器210将TTML中包括的各个字幕显示位置(区域)的字幕的文本数据(字体数据)转换成位图数据(二进制图像信息)。在这种情况下,在CPU 221的控制下,根据通过字幕显示位置信息确定的或通过执行了进一步尺寸调整处理获得的字幕显示位置的尺寸从TTML中指定的字体尺寸适当地调整字幕的字体大小。
此外,在这种情况下,基本上,当获得字幕的位图数据时,使用由TTML中包括的字体规范信息指定的字体的文件。当电视接收器200不安装由字体规范信息指定的字体的文件时,基于被插入到PES包、PMT等中的下载信息从广播信号(传输流TS)或网络上的服务器下载字体文件并且使用字体文件。此时,当字体文件不能下载时,使用替代的字体文件。
CPU 221基于字幕显示位置信息确定字幕显示位置并且对所确定的字幕显示位置进一步执行尺寸调整处理,视情况而定。此时,CPU 221适当地使用被插入到上述所述TTML、PES包、PMT等中的辅助信息(关于尺寸调整处理的信息、用于确定字幕显示范围的信息)。
将从字幕解码器210输出的各个字幕显示位置的位图数据供应至视频叠加单元204。视频叠加单元204将通过字幕解码器210获得的各个字幕显示位置处的字幕的位图数据叠加在通过视频解码器203获得的视频数据上,以获得用于显示的视频数据。在这种情况下,CPU 221基于通过字幕显示位置信息确定的或通过执行了进一步尺寸调整处理获得的字幕显示位置执行控制,以使得字幕位图数据的叠加位置变成字幕显示位置。
将通过视频叠加单元204获得的用于显示的视频数据供应至面板驱动电路205。在面板驱动电路205中,基于用于显示的视频数据驱动显示面板206。由此,显示面板206显示图像,其中,将字幕叠加在各个字幕显示位置(区域)上。
此外,将通过TS分析单元202提取的音频PES包供应至音频解码器207。音频解码器207对音频PES包执行解码处理,以获得音频数据。将音频数据供应至音频输出电路208。音频输出电路208对音频数据执行诸如D/A转换或放大等必要的处理。然后,将处理之后的音频数据供应至扬声器209。由此,从扬声器209获得与显示面板206上的显示图像对应的音频输出。
“字幕显示位置的确定与尺寸调整处理的程序”
将描述CPU 221中的字幕显示位置的确定与尺寸调整处理的程序的细节。图36中的流程图示出了CPU 221中的字幕显示位置的确定与尺寸调整处理的程序的实施例。
在实施例中,假设视频区域的长宽比是16:9。因此,假设存在如图37中的(a)示出的TTML中未指定字幕显示范围与如图37中的(b)和图37中的(c)示出的TTML中指定了字幕显示范围的两种情况。应注意,此处,示出了所指定的字幕显示范围的长宽比是16:9和4:3的实施例;然而,所指定的字幕显示范围的长宽比并不局限于此。此外,此处,假设存在监控器(显示器)的长宽比是16:9和长宽比是4:3的两种情况。
CPU 221在步骤ST1开始处理,并且然后,进行至步骤ST2的处理。在步骤ST2中,CPU221确定接收器显示器是否处于用于显示整个视频区域的模式。例如,在监控器的长宽比是16:9(见图37中的(f))的情况下或在监控器的长宽比是4:3并且采用视频黑边(Letterbox)的显示方法(见图37中的(g))的情况下,确定显示器处于用于显示整个视频区域的模式。进一步地,例如,在监控器的长宽比是4:3并且采用中心切割的显示方法的情况下(见图37中的(h)),确定显示器处于不显示整个视频区域的模式。
当确定显示器处于用于显示整个视频区域的模式时,CPU 221进行至步骤ST3中的处理。在步骤ST3中,CPU 221确定是否指定了字幕显示范围。例如,在字幕显示范围的参考点信息(RPoffset)和长宽比信息(dispasp)存在于TTML的tt根容器中的情况下,确定指定了字幕显示范围。
当未指定字幕显示范围时,CPU 221进行至步骤ST4中的处理。在步骤ST4中,CPU221将显示视频区域设置成字幕显示范围并且确定字幕显示位置(区域)。此时,CPU 221将显示视频区域的左上侧设置成参考点RP并且根据被指定为相对于字幕显示范围的相对位置的字幕显示位置信息(“origin=“OH%OV%””、“extent=“EH%EV%””)的指令确定字幕显示位置(区域)。
图38的(a)示出了监控器的长宽比是16:9的情况的实施例。图38的(b)示出了监控器的长宽比是4:3并且采用信箱(Letter box)的显示方法的情况的实施例。应注意,“RP”指示参考点(Reference Pont),即,字幕显示范围的左上侧。
在步骤ST4中的处理之后,在步骤ST5,CPU 221结束处理。
当在上述所述步骤ST3中指定了字幕显示范围时,CPU 221进行至步骤ST6中的处理。在步骤ST6中,CPU 221确定所指定的字幕显示范围中的字幕显示位置(区域)。此时,CPU221仅使用长宽比信息(dispasp)作为有关字幕显示范围的信息并且在显示视频区域上设置字幕显示范围。然后,CPU 221将字幕显示范围的左上侧设置为参考点RP并且根据被指定为相对于字幕显示范围的相对位置的字幕显示位置信息(“origin=“OH%OV%””、“extent=“EH%EV%””)的指令确定字幕显示位置(区域)。
图39的(a)示出了监控器的长宽比是16:9并且由长宽比信息(dispasp)指示的长宽比是16:9的情况的实施例。图39的(b)示出了监控器的长宽比是16:9并且由长宽比信息(dispasp)指示的长宽比是4:3的情况的实施例。
应注意,在由长宽比信息(dispasp)指示的长宽比与上述所述监控器的长宽比不同的情况下,CPU 221在显示视频区域的中心处设置字幕显示范围,字幕显示范围的竖直方向宽度或水平方向宽度吻合并且具有由长宽比信息(dispasp)指示的长宽比。在示出的实施例中,因为监控器的长宽比是16:9并且长宽比信息(dispasp)是4:3,所以竖直方向宽度彼此吻合。
图39的(c)示出了监控器的长宽比是4:3并且采用信箱(Letter box)的显示方法、并且由长宽比信息(dispasp)指示的长宽比是16:9的情况的实施例。图39的(d)示出了监控器的长宽比是4:3并且采用信箱(Letter box)的显示方法、并且由长宽比信息(dispasp)指示的长宽比是4:3的情况的实施例。
在步骤ST6中的处理之后,在步骤ST5,CPU 221结束处理。
当在上述所述步骤ST2中确定显示器处于不显示整个视频区域的模式时,处理进行至步骤ST7。在步骤ST7中,CPU 221确定是否指定了字幕显示范围。例如,在字幕显示范围的参考点信息(RPoffset)和长宽比信息(dispasp)存在于TTML的tt根容器中的情况下,确定指定了字幕显示范围。
当未指定字幕显示范围时,CPU 221进行至步骤ST8中的处理。在步骤ST8中,CPU221将显示视频区域设置成字幕显示范围并且确定字幕显示位置(区域)。此时,CPU 221将显示视频区域的左上侧设置成参考点RP并且根据被指定为相对于字幕显示范围的相对位置的字幕显示位置信息(“origin=“OH%OV%””、“extent=“EH%EV%””)的指令确定字幕显示位置(区域)。
在由此确定的字幕显示位置中,仅在水平方向上压缩宽度。出于此原因,CPU 221对所确定的字幕显示位置进一步执行尺寸调整处理,从而也在竖直方向上压缩宽度,并且获得最终字幕显示位置。在这种情况下,CPU221在例如基于TTML中包括的“dto:scalingjustify=top”的信息固定预定的行位置的状态下压缩竖直方向上的宽度。
图40的(a)示出了监控器的长宽比是4:3并且采用中心切割的显示方法的情况的实施例。通过尺寸调整处理将字幕显示位置的竖直方向上的宽度从EV%压缩至EVu%。
在步骤ST8中的处理之后,在步骤ST5,CPU 221结束处理。
当在上述所述步骤ST7中指定字幕显示范围时,CPU 221进行至步骤ST9中的处理。在步骤ST9中,CPU 221确定所指定的字幕显示范围中的字幕显示位置(区域)。此时,CPU221使用关于字幕显示范围的信息(参考点信息(RPoffset)、长宽比信息(dispasp))在显示视频区域上设置字幕显示范围。
在这种情况下,CPU 221通过参考点信息(RPoffset)将从显示视频区域的左上侧移位的位置设置成字幕显示范围的左上侧并且在字幕显示范围中设置与由长宽比信息(dispasp)指示的长宽比对应的范围。在这种情况下,字幕显示范围的水平方向宽度与显示视频区域的水平方向宽度吻合。
然后,CPU 221将上述所述设置的字幕显示范围的左上侧设置成参考点RP并且根据被指定为相对于字幕显示范围的相对位置的字幕显示位置信息(“origin=“OH%OV%””、“extent=“EH%EV%””)的指令确定字幕显示位置(区域)。
图40的(b)示出了监控器的长宽比是4:3并且采用中心切割的显示方法、并且由长宽比信息(dispasp)指示的长宽比是16:9的情况的实施例。图40的(c)示出了监控器的长宽比是4:3并且采用中心切割的显示方法、并且由长宽比信息(dispasp)指示的长宽比是4:3的情况的实施例。
在步骤ST9中的处理之后,在步骤ST5,CPU 221结束处理。
“所使用的字体文件的确定处理的程序”
将描述CPU 221中所使用的字体文件的确定处理的程序的细节。图41中的流程图示出了CPU 221中所使用的字体文件的确定处理的程序的实施例。
CPU 221在步骤ST11开始处理,并且然后,进行至步骤ST12中的处理。在步骤ST12中,CPU 221接收TTML中的字体规范。即,CPU 221从字幕解码器210接收包括字体规范信息的TTML。
接着,在步骤ST13中,CPU 221确定电视接收器200是否安装了指定的字体文件,通过TTML中的字体规范信息指定字体文件。当确定安装了所指定的字体文件时,CPU 221确定使用在步骤ST14中安装的指定字体文件,并且然后,在步骤ST15结束处理。
当确定在步骤ST13中未安装指定的字体文件时,CPU 221在步骤ST16中确定私有节表(即,FDT(Font_downloading_section table))中是否供应指定的字体文件。在这种情况下,在字体下载片段(Font_download_segment)(见图18)或字体描述符(Font_download_descriptor)(见图23)包括指定字体文件的下载信息的情况下,CPU 221确定FDT中供应指定的字体文件。
当确定FDT中供应指定的字体文件时,在步骤ST17中,CPU 221确定是否能从轮播发送下载指定的字体文件。当指定的字体文件不能下载时,CPU 221确定使用在步骤ST14中下载的指定字体文件,并且然后,在步骤ST15,结束处理。
当在步骤ST17中不能下载指定的字体文件时,CPU 221进行至步骤ST18中的处理。当在步骤ST16中确定FDT中未供应指定的字体文件时,CPU 221也进行至步骤ST18中的处理。
在步骤ST18中,CPU 221确定是否存在用于下载指定的字体文件的URL信息。在这种情况下,在URL信令片段(URL_signalin_segment)(见图20)或URL信令描述符(URL_signaling_descriptor)(见图24)包括用于下载指定的字体文件的URL信息的情况下,CPU221确定存在用于下载指定的字体文件的URL信息。
当确定存在用于下载指定的字体文件的URL信息时,在步骤ST19中,CPU 221确定是否能从网络上的服务器下载指定的字体文件。当能下载指定的字体文件时,CPU 221确定使用在步骤ST14中下载的指定字体文件,并且然后,在步骤ST15,结束处理。
在步骤ST19中,当不能下载指定的字体文件时,CPU 221进行至步骤ST20中的处理。当在步骤ST18中确定不存在用于下载指定的字体文件的URL信息时,CPU 221也进行至步骤ST20中的处理。
在步骤ST20中,CPU 221确定不使用指定的字体文件,而使用替代的字体文件,例如,默认设置的字体文件,然后,在步骤ST15,结束处理。
如上所述,在图1示出的发送/接收系统10中,广播发送系统100将使用字幕位置信息显示字幕时所使用的辅助信息(关于尺寸调整处理的信息、用于确定字幕显示范围的信息)插入到字幕流容器(例如,PES包、PMT)中。出于此原因,在接收侧,通过一起使用辅助信息和字幕位置信息,变得可以适当地获取字幕显示位置并且良好地执行字幕显示。
此外,在图1示出的发送/接收系统10中,电视接收器200基于通过使用字幕显示位置信息和辅助信息获取的字幕显示位置对字幕的位图数据执行显示位置控制。出于此原因,变得可以良好地执行字幕显示。
此外,在图1示出的发送/接收系统10中,广播发送系统100将用于下载至少由TTML的字体规范信息指定的字体文件的下载信息插入到字幕流的容器(例如,PES包、PMT)中。出于此原因,在接收侧中,在不包括由字体规范信息指定的字体文件的情况下,基于下载信息变得可以获取由字体规范信息指定的字体文件,并且良好地执行字幕显示。
此外,在图1示出的发送/接收系统10中,电视接收器200基于下载信息获取由字体规范信息指定的字体的字体文件并且在获得字幕的位图数据时使用字体文件。出于此原因,甚至在不包括由字体规范信息指定的字体文件的情况下,也变得可以良好地执行字幕显示。
<2.变型例>
在上述实施方式中,已经描述了未将字体下载信息插入到TTML中的实施例(见图3和图5)。然而,可以构思为将字体下载信息插入到TTML中。图42示出了该情况下的TTML结构的实施例。实施例是存在与图5中的情况相似的两个字幕显示位置(区域)的情况。
“fontdlurl=http://www.w3.org/ns/fontdlservice”、“fontdlurl:iso639languagecode=“value””、“"fontdlurl:fontgroupid="value"”、“fontdlurl:fontnameid=“value””、以及“fontdlurl:fontname=“value””中的每个信息碎片均构成下载信息。应注意,当是“fontdlurl:fontname”的“值”时,反映了‘Arial’和‘Tahoma’的规范。
此外,在上述所述实施方式中,已经描述了使用TTML作为预定格式的字幕的文本信息的实施例。然而,本技术并不局限于此,并且还可以构思为使用包括与TTML等同的信息的另一文本信息。例如,可以使用TTML的派生格式。
此外,在上述实施方式中,已经描述了由广播发送系统100和电视接收器200配置的发送/接收系统10;然而,能够应用本技术的发送/接收系统的配置并不局限于此。例如,电视接收器200可以具有经由诸如高清多媒体接口(HDMI)等数字接口连接在一起的机顶盒和监控器的配置。顺便提及,“HDMI”是注册商标。
此外,在上述所述实施方式中,已经描述了容器是MPEG-2TS的传输流的实施例。无需多言,本技术同样能够应用于容器是MMT的传输流、DASH/ISOBMFF流等的情况。
此外,本技术还可以涵盖下面所述配置。
(1)一种发送装置,包括:
发送单元,该发送单元发送预定格式的容器,该容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息;和
信息插入单元,该信息插入单元将通过使用字幕位置信息显示所述字幕时待使用的辅助信息插入到所述字幕流的容器中。
(2)根据(1)所述的发送装置,其中,
辅助信息包括:
关于基于字幕显示位置信息所确定的字幕显示位置的尺寸调整处理的信息,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,在接收侧中执行尺寸调整处理。
(3)根据(2)所述的发送装置,其中,
在所述字幕显示位置的所述尺寸调整处理中压缩竖直方向上的尺寸的情况下,关于所述尺寸调整处理的信息是指示待被设置成固定位置的行位置的信息。
(4)根据(1)至(3)中任一项所述的发送装置,其中,
辅助信息包括:
用于确定字幕显示范围的信息。
(5)根据(4)所述的发送装置,其中,
用于确定字幕显示范围的信息是字幕显示范围的参考点信息和长宽比信息。
(6)根据(1)至(5)中任一项所述的发送装置,其中,
信息插入单元将辅助信息插入到PES包和/或节目映射表中。
(7)一种发送方法,包括:
发送步骤,通过发送单元发送预定格式的容器,所述容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,所述文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息;和
信息插入步骤,将通过使用字幕位置信息显示所述字幕时待使用的辅助信息插入到所述字幕流的容器中。
(8)一种接收装置,包括:
接收单元,该接收单元接收预定格式的容器,容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息;
视频解码单元,对视频流执行解码处理以获得视频数据;以及
字幕解码单元,对字幕流执行解码处理以获得字幕的位图数据;其中,
将通过使用字幕位置信息显示字幕时所使用的辅助信息插入到字幕流的容器中;并且
接收装置进一步包括:
显示控制单元,基于通过使用字幕显示位置信息及辅助信息获取的字幕显示位置对字幕的位图数据执行显示位置控制;和
视频叠加单元,将执行了显示位置控制的字幕的位图数据叠加到视频数据上。
(9)根据(8)所述的接收装置,其中,
辅助信息包括关于基于字幕显示位置信息确定的字幕显示位置的尺寸调整处理的信息,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,在接收侧中执行尺寸调整处理;并且
显示控制单元,
在视频区域的长宽比与显示视频区域的长宽比不同的情况下,将显示视频区域设置为字幕显示范围,并且基于字幕显示位置信息确定字幕显示位置,通过使用关于所述尺寸调整处理的信息对所确定的字幕显示位置执行所述尺寸调整处理,并且基于执行了尺寸调整处理的字幕显示位置对字幕的位图数据执行显示位置控制。
(10)根据(8)所述的接收装置,其中,
辅助信息包括用于确定字幕显示范围的信息;并且
显示控制单元,
在视频区域的长宽比与显示视频区域的长宽比不同的情况下,基于用于确定字幕显示范围的信息而在显示视频区域中设置字幕显示范围,基于字幕显示位置信息确定字幕显示位置,并且基于所确定的字幕显示位置对字幕的位图数据执行显示位置控制。
(11)一种接收方法,包括:
接收步骤,通过接收单元接收预定格式的容器,该容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息;
视频解码步骤,对视频流执行解码处理以获得视频数据;以及
字幕解码步骤,对字幕流执行解码处理以获得字幕的位图数据;其中,
将当通过使用字幕位置信息显示所述字幕时所使用的辅助信息插入到所述字幕流的容器中;并且
接收方法进一步包括:
显示控制步骤,基于通过使用字幕显示位置信息及辅助信息获取的字幕显示位置对字幕的位图数据执行显示位置控制;和
视频叠加步骤,将执行了显示位置控制的字幕的位图数据叠加到视频数据上。
(12)一种发送装置,包括:
发送单元,发送预定格式的容器,该容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,文本信息包括字体规范信息;和
信息插入单元,将用于下载至少由字体规范信息指定的字体的文件的下载信息插入到字幕流的容器中。
(13)根据(12)所述的发送装置,其中,
下载信息是用于从广播信号获取字体的文件的信息。
(14)根据(12)或(13)所述的发送装置,其中,
下载信息是用于从网络上的服务器获取字体的文件的信息。
(15)根据(12)至(14)中任一项所述的发送装置,其中,
信息插入单元将下载信息插入到PES包和/或节目映射表中。
(16)一种发送方法,包括:
发送步骤,通过发送单元发送预定格式的容器,容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,文本信息包括字体规范信息;和
信息插入步骤,将用于下载至少由字体规范信息指定的字体的文件的下载信息插入到字幕流的容器中。
(17)一种接收装置,包括:
接收单元,接收预定格式的容器,容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,文本信息包括字体规范信息;和
视频解码单元,对视频流执行解码处理以获得视频数据,其中,
将用于下载至少由字体规范信息指定的字体的文件的下载信息插入到字幕流的容器中;并且
接收单元进一步包括:
字体文件下载单元,基于下载信息获取由字体规范信息指定的字体的字体文件;
字幕解码单元,对字幕流执行解码处理并且基于所获取的字体文件获得字幕的位图数据;
显示控制单元,基于通过使用字幕显示位置信息获得的字幕显示位置对字幕的位图数据执行显示位置控制;和
视频叠加单元,将执行了显示位置控制的字幕的位图数据叠加到视频数据上。
(18)一种接收方法,包括:
接收步骤,通过接收单元接收预定格式的容器,容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,文本信息包括字体规范信息;和
视频解码步骤,解码视频流以获得视频数据;其中,
将用于下载至少由字体规范信息指定的字体的文件的下载信息插入到字幕流的容器中;并且
接收方法进一步包括:
字体文件下载步骤,基于下载信息获取由字体规范信息指定的字体的字体文件;
字幕解码步骤,对字幕流执行解码处理并且基于所获取的字体文件获得字幕的位图数据;
显示控制步骤,基于通过使用字幕显示位置信息获得的字幕显示位置对字幕的位图数据执行显示位置控制;以及
视频叠加步骤,将执行了显示位置控制的字幕的位图数据叠加到视频数据上。
(19)一种发送装置,包括:
节表插入单元,将分别包括不同字体文件的预定数目的节表按顺序并且重复地插入到传输流中;和
发送单元,发送插入了节表的传输流。
(20)一种发送方法,包括:
节表插入步骤,将分别包括不同字体文件的预定数目的节表按顺序并且重复地插入到传输流中;和
发送步骤,通过发送单元发送插入了节表的传输流。
本技术的主要特征在于,在接收侧中,通过将使用字幕位置信息显示字幕时所使用的辅助信息(关于尺寸调整处理的信息、用于确定字幕显示范围的信息)插入到字幕流的容器(例如,PES包、PMT)中,通过一起使用辅助信息与字幕位置信息变得可以适当地获取字幕显示位置,并且良好地执行字幕显示(见图34)。
此外,本技术的主要特征在于,在不包括由字体规范信息指定的字体文件的情况下,通过将用于下载至少由TTML中的字体规范信息指定的字体的文件的下载信息插入到字幕流的容器(例如,PES包、PMT)中,基于下载信息变得可以获取由字体规范信息指定的字体的文件,并且良好地执行字幕显示(见图34)。
参考识别列表
10 发送/接收系统
100 广播发送系统
110 流生成单元
111 控制单元
112 视频编码器
113 音频编码器
114 文本格式转换单元
115 字幕编码器
116 TS格式器
200 电视接收器
201 接收单元
202 TS分析单元
203 视频解码器
204 视频叠加单元
205 面板驱动电路
206 显示面板
207 音频解码器
208 音频输出电路
209 扬声器
210 字幕解码器
221 CPU
227 通信接口。

Claims (20)

1.一种发送装置,包括:
发送单元,所述发送单元发送预定格式的容器,所述容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,所述文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息;和
信息插入单元,所述信息插入单元将通过使用字幕位置信息显示所述字幕时待使用的辅助信息插入到所述字幕流的容器中。
2.根据权利要求1所述的发送装置,其中,
所述辅助信息包括:
关于基于所述字幕显示位置信息所确定的字幕显示位置的尺寸调整处理的信息,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,在接收侧中执行所述尺寸调整处理。
3.根据权利要求2所述的发送装置,其中,
在所述字幕显示位置的所述尺寸调整处理中压缩竖直方向上的尺寸的情况下,关于所述尺寸调整处理的信息是指示待被设置成固定位置的行位置的信息。
4.根据权利要求1所述的发送装置,其中,
所述辅助信息包括:
用于确定所述字幕显示范围的信息。
5.根据权利要求4所述的发送装置,其中,
用于确定所述字幕显示范围的信息是所述字幕显示范围的参考点信息和长宽比信息。
6.根据权利要求1所述的发送装置,其中,
所述信息插入单元将所述辅助信息插入到PES包和/或节目映射表中。
7.一种发送方法,包括:
发送步骤,通过发送单元发送预定格式的容器,所述容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,所述文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息;和
信息插入步骤,将通过使用字幕位置信息显示所述字幕时待使用的辅助信息插入到所述字幕流的容器中。
8.一种接收装置,包括:
接收单元,所述接收单元接收预定格式的容器,所述容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,所述文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息;和
控制单元,所述控制单元控制解码所述视频流以获得所述视频数据的处理,控制解码所述字幕流以获得所述字幕的位图数据的处理,控制基于通过使用所述字幕显示位置信息和当通过使用插入在所述字幕流的容器中的字幕位置信息显示字幕时而使用的辅助信息而获得的字幕显示位置而对所述字幕的所述位图数据执行显示位置控制的处理,并且控制将被执行了所述显示位置控制的字幕的位图数据叠加到所述视频数据上的处理。
9.根据权利要求8所述的接收装置,其中,
所述辅助信息包括关于基于所述字幕显示位置信息确定的字幕显示位置的尺寸调整处理的信息,在视频区域的长宽比与显示视频区域的长宽比不同的情况下,在接收侧中执行所述尺寸调整处理;并且
在执行所述显示位置控制的处理中,
在所述视频区域的长宽比与所述显示视频区域的长宽比不同的情况下,将所述显示视频区域设置为所述字幕显示范围,并且基于所述字幕显示位置信息确定所述字幕显示位置,通过使用关于所述尺寸调整处理的信息对所确定的字幕显示位置执行所述尺寸调整处理,并且基于被执行了所述尺寸调整处理的字幕显示位置对所述字幕的位图数据执行所述显示位置控制。
10.根据权利要求8所述的接收装置,其中,
所述辅助信息包括用于确定所述字幕显示范围的信息;并且
在执行所述显示位置控制的处理中,
在视频区域的长宽比与显示视频区域的长宽比不同的情况下,基于用于确定所述字幕显示范围的信息在所述显示视频区域中设置所述字幕显示范围,基于所述字幕显示位置信息确定所述字幕显示位置,并且基于所确定的字幕显示位置对所述字幕的所述位图数据执行所述显示位置控制。
11.一种接收方法,包括:
接收步骤,通过接收单元接收预定格式的容器,所述容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,所述文本信息包括用于将字幕显示位置指定为相对于字幕显示范围的相对位置的字幕显示位置信息;
视频解码步骤,对所述视频流执行解码处理以获得所述视频数据;以及
字幕解码步骤,对所述字幕流执行解码处理以获得所述字幕的位图数据;其中,
将当通过使用字幕位置信息显示所述字幕时所使用的辅助信息插入到所述字幕流的容器中;并且
所述接收方法进一步包括:
显示控制步骤,基于通过使用所述字幕显示位置信息和所述辅助信息所获取的字幕显示位置对所述字幕的位图数据执行显示位置控制;和
视频叠加步骤,将被执行了所述显示位置控制的字幕的所述位图数据叠加到所述视频数据上。
12.一种发送装置,包括:
发送单元,发送预定格式的容器,所述容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,所述文本信息包括字体规范信息;和
信息插入单元,将用于下载至少由所述字体规范信息指定的字体的文件的下载信息插入到所述字幕流的容器中。
13.根据权利要求12所述的发送装置,其中,
所述下载信息是用于从广播信号获取所述字体的文件的信息。
14.根据权利要求12所述的发送装置,其中,
所述下载信息是用于从网络上的服务器获取所述字体的文件的信息。
15.根据权利要求12所述的发送装置,其中,
所述信息插入单元将所述下载信息插入到PES包和/或节目映射表中。
16.一种发送方法,包括:
发送步骤,通过发送单元发送预定格式的容器,所述容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,所述文本信息包括字体规范信息;和
信息插入步骤,将用于下载至少由所述字体规范信息指定的字体的文件的下载信息插入到所述字幕流的容器中。
17.一种接收装置,包括:
接收单元,接收预定格式的容器,所述容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,所述文本信息包括字体规范信息;和
控制单元,所述控制单元控制解码所述视频流以获得所述视频数据的处理,控制基于用于下载至少由所述字体规范信息指定的字体的文件的、插入到所述字幕流的容器中的下载信息获取由所述字体规范信息指定的字体的字体文件的处理,控制解码所述字幕流并基于所获取的字体文件获得所述字幕的位图数据的处理,并且控制将所述字幕的位图数据叠加到所述视频数据上的处理。
18.一种接收方法,包括:
接收步骤,通过接收单元接收预定格式的容器,所述容器包括包含视频数据的视频流和包含字幕的文本信息的字幕流,所述文本信息包括字体规范信息;和
视频解码步骤,解码所述视频流以获得所述视频数据;其中,
将用于下载至少由所述字体规范信息指定的字体的文件的下载信息插入到所述字幕流的容器中;并且
所述接收方法进一步包括:
字体文件下载步骤,基于所述下载信息获取由所述字体规范信息指定的字体的字体文件;
字幕解码步骤,对所述字幕流执行解码处理并且基于所获取的字体文件获得所述字幕的位图数据;以及
视频叠加步骤,将所述字幕的位图数据叠加到所述视频数据上。
19.一种发送装置,包括:
节表插入单元,将分别包括不同字体文件的预定数目的节表按顺序并且重复地插入到传输流中;和
发送单元,发送插入了所述节表的所述传输流。
20.一种发送方法,包括:
节表插入步骤,将分别包括不同字体文件的预定数目的节表按顺序并且重复地插入到传输流中;和
发送步骤,通过发送单元发送插入了所述节表的所述传输流。
CN201780015897.7A 2016-03-15 2017-03-08 发送装置、发送方法、接收装置、以及接收方法 Active CN108886627B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016051657 2016-03-15
JP2016-051657 2016-03-15
PCT/JP2017/009182 WO2017159482A1 (ja) 2016-03-15 2017-03-08 送信装置、送信方法、受信装置および受信方法

Publications (2)

Publication Number Publication Date
CN108886627A true CN108886627A (zh) 2018-11-23
CN108886627B CN108886627B (zh) 2022-06-03

Family

ID=59852292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780015897.7A Active CN108886627B (zh) 2016-03-15 2017-03-08 发送装置、发送方法、接收装置、以及接收方法

Country Status (7)

Country Link
US (1) US10979664B2 (zh)
EP (2) EP3734978A1 (zh)
JP (1) JP7063261B2 (zh)
CN (1) CN108886627B (zh)
ES (1) ES2859660T3 (zh)
TW (1) TWI728061B (zh)
WO (1) WO2017159482A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100873651B1 (ko) * 2008-08-21 2008-12-11 김광한 잔디 식재기
JP6329687B1 (ja) * 2017-12-08 2018-05-23 株式会社フォトロン テロップ編集装置及びテロップ編集プログラム
KR102067446B1 (ko) 2018-06-04 2020-01-17 주식회사 엔씨소프트 자막 생성 방법 및 시스템
US11070891B1 (en) * 2019-12-10 2021-07-20 Amazon Technologies, Inc. Optimization of subtitles for video content
CN112738629B (zh) * 2020-12-29 2023-03-10 北京达佳互联信息技术有限公司 视频展示方法、装置、电子设备和存储介质
CN113438514B (zh) * 2021-04-26 2022-07-08 深圳Tcl新技术有限公司 字幕处理方法、装置、设备及存储介质
CN113452935B (zh) * 2021-08-31 2021-11-09 成都索贝数码科技股份有限公司 横屏和竖屏直播视频生成系统及方法
CN114222193B (zh) * 2021-12-03 2024-01-05 北京影谱科技股份有限公司 一种视频字幕时间对齐模型训练方法及系统

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1585464A (zh) * 2003-08-20 2005-02-23 三星电子株式会社 控制字幕位置的装置和方法
US20050207442A1 (en) * 2003-12-08 2005-09-22 Zoest Alexander T V Multimedia distribution system
CN1692638A (zh) * 2002-11-29 2005-11-02 松下电器产业株式会社 图像重放装置及图像重放方法
CN1705911A (zh) * 2002-08-12 2005-12-07 数字剧场系统股份有限公司 影片辅助字幕系统和方法
CN1723696A (zh) * 2002-12-09 2006-01-18 皇家飞利浦电子股份有限公司 具有部分字符集发生器的交互式电视系统
CN1726715A (zh) * 2002-12-16 2006-01-25 皇家飞利浦电子股份有限公司 存储介质上用于交互式电视录制和重放的字体库
WO2007052736A1 (ja) * 2005-11-02 2007-05-10 Matsushita Electric Industrial Co., Ltd. デジタル放送システム、受信装置、及び送出装置
CN101064802A (zh) * 2006-04-28 2007-10-31 佳能株式会社 数字广播接收设备及其控制方法
JP2008104038A (ja) * 2006-10-20 2008-05-01 Sony Corp 情報処理装置、情報処理方法、およびプログラム
CN101360193A (zh) * 2008-09-04 2009-02-04 北京中星微电子有限公司 一种视频字幕处理装置及方法
CN101902582A (zh) * 2010-07-09 2010-12-01 清华大学 一种立体视频字幕添加方法及装置
US20100321393A1 (en) * 2009-06-22 2010-12-23 Monotype Imaging Inc. Font data streaming
US20110119709A1 (en) * 2009-11-13 2011-05-19 Samsung Electronics Co., Ltd. Method and apparatus for generating multimedia stream for 3-dimensional reproduction of additional video reproduction information, and method and apparatus for receiving multimedia stream for 3-dimensional reproduction of additional video reproduction information
US20120170906A1 (en) * 2011-01-05 2012-07-05 Rovi Technologies Corporation Systems and methods for adaptive bitrate streaming of media including subtitles
CN103416069A (zh) * 2012-01-13 2013-11-27 索尼公司 发送设备、发送方法、接收设备以及接收方法
EP2675174A1 (en) * 2012-01-19 2013-12-18 Sony Corporation Receiving device, receiving method, and electronic device
JP5586770B2 (ja) * 2011-05-19 2014-09-10 日本放送協会 受信機
US20150124888A1 (en) * 2012-11-07 2015-05-07 Lg Elelctronics Inc. Apparatus for transreceiving signals and method for transreceiving signals
CN105052158A (zh) * 2012-11-26 2015-11-11 索尼公司 传输设备、传输方法、接收设备、接收方法与接收显示方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3670934B2 (ja) * 2000-06-01 2005-07-13 三洋電機株式会社 デジタルテレビ放送受信機における文字データの表示方法
JP3090704U (ja) * 2002-06-13 2002-12-26 船井電機株式会社 画像復調装置
KR20040099058A (ko) * 2003-05-17 2004-11-26 삼성전자주식회사 서브타이틀 처리 방법, 그 재생 장치 및 그 정보저장매체
KR20050018314A (ko) * 2003-08-05 2005-02-23 삼성전자주식회사 자막 데이터와 비디오 맵핑 데이터 정보를 저장하는정보저장매체, 그 재생 장치 및 방법
US8817188B2 (en) * 2007-07-24 2014-08-26 Cyberlink Corp Systems and methods for automatic adjustment of text
US9013551B2 (en) * 2008-12-01 2015-04-21 Imax Corporation Methods and systems for presenting three-dimensional motion pictures with content adaptive information
WO2010096030A1 (en) * 2009-02-18 2010-08-26 Thomson Licensing Method and apparatus for preparing subtitles for display
JP4985807B2 (ja) * 2009-04-15 2012-07-25 ソニー株式会社 再生装置および再生方法
JP5685969B2 (ja) 2011-02-15 2015-03-18 ソニー株式会社 表示制御方法、表示制御装置
JP6366070B2 (ja) * 2014-07-10 2018-08-01 日本放送協会 テキストコンテンツ生成装置、送信装置、受信装置、およびプログラム。

Patent Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1705911A (zh) * 2002-08-12 2005-12-07 数字剧场系统股份有限公司 影片辅助字幕系统和方法
CN1692638A (zh) * 2002-11-29 2005-11-02 松下电器产业株式会社 图像重放装置及图像重放方法
US20060168639A1 (en) * 2002-12-09 2006-07-27 Koninklijke Philips Electronics N.V. Interactive television system with partial character set generator
CN1723696A (zh) * 2002-12-09 2006-01-18 皇家飞利浦电子股份有限公司 具有部分字符集发生器的交互式电视系统
CN1726715A (zh) * 2002-12-16 2006-01-25 皇家飞利浦电子股份有限公司 存储介质上用于交互式电视录制和重放的字体库
US20070113245A1 (en) * 2002-12-16 2007-05-17 Koninklijke Philips Electronics N.V. Font library for interactive television recording and playback on a storage medium
CN1585464A (zh) * 2003-08-20 2005-02-23 三星电子株式会社 控制字幕位置的装置和方法
US20050207442A1 (en) * 2003-12-08 2005-09-22 Zoest Alexander T V Multimedia distribution system
CN101124561A (zh) * 2003-12-08 2008-02-13 Divx公司 多媒体分发系统
US20090138934A1 (en) * 2005-11-02 2009-05-28 Matsushita Electric Industrial Co., Ltd. Digital broadcast system, receiving apparatus and transmitting apparatus
WO2007052736A1 (ja) * 2005-11-02 2007-05-10 Matsushita Electric Industrial Co., Ltd. デジタル放送システム、受信装置、及び送出装置
CN101064802A (zh) * 2006-04-28 2007-10-31 佳能株式会社 数字广播接收设备及其控制方法
JP2008104038A (ja) * 2006-10-20 2008-05-01 Sony Corp 情報処理装置、情報処理方法、およびプログラム
CN101360193A (zh) * 2008-09-04 2009-02-04 北京中星微电子有限公司 一种视频字幕处理装置及方法
US20100321393A1 (en) * 2009-06-22 2010-12-23 Monotype Imaging Inc. Font data streaming
US20110119709A1 (en) * 2009-11-13 2011-05-19 Samsung Electronics Co., Ltd. Method and apparatus for generating multimedia stream for 3-dimensional reproduction of additional video reproduction information, and method and apparatus for receiving multimedia stream for 3-dimensional reproduction of additional video reproduction information
CN102640505A (zh) * 2009-11-13 2012-08-15 三星电子株式会社 产生用于附加视频再现信息的3维再现的多媒体流的方法和设备,以及接收用于附加视频再现信息的3维再现的多媒体流的方法和设备
CN101902582A (zh) * 2010-07-09 2010-12-01 清华大学 一种立体视频字幕添加方法及装置
US20120170906A1 (en) * 2011-01-05 2012-07-05 Rovi Technologies Corporation Systems and methods for adaptive bitrate streaming of media including subtitles
JP5586770B2 (ja) * 2011-05-19 2014-09-10 日本放送協会 受信機
CN103416069A (zh) * 2012-01-13 2013-11-27 索尼公司 发送设备、发送方法、接收设备以及接收方法
EP2675174A1 (en) * 2012-01-19 2013-12-18 Sony Corporation Receiving device, receiving method, and electronic device
US20150124888A1 (en) * 2012-11-07 2015-05-07 Lg Elelctronics Inc. Apparatus for transreceiving signals and method for transreceiving signals
CN104769953A (zh) * 2012-11-07 2015-07-08 Lg电子株式会社 用于收发信号的装置和用于收发信号的方法
CN105052158A (zh) * 2012-11-26 2015-11-11 索尼公司 传输设备、传输方法、接收设备、接收方法与接收显示方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵凯等: "3GP文件格式研究及其字幕解码实现", 《中国科技信息》 *

Also Published As

Publication number Publication date
CN108886627B (zh) 2022-06-03
EP3734978A1 (en) 2020-11-04
EP3432585B1 (en) 2021-02-17
EP3432585A4 (en) 2019-07-17
EP3432585A1 (en) 2019-01-23
ES2859660T3 (es) 2021-10-04
JP7063261B2 (ja) 2022-05-09
US10979664B2 (en) 2021-04-13
WO2017159482A1 (ja) 2017-09-21
US20190037168A1 (en) 2019-01-31
TWI728061B (zh) 2021-05-21
TW201739241A (zh) 2017-11-01
JPWO2017159482A1 (ja) 2019-01-24

Similar Documents

Publication Publication Date Title
CN108886627A (zh) 发送装置、发送方法、接收装置、以及接收方法
JP7020406B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP6729379B2 (ja) 送信装置及び送信方法、並びに受信装置及び受信方法
KR101797497B1 (ko) 방송 신호로 전송되는 비실시간 방송 서비스 및 콘텐트 처리 방법 및 장치
JP6868790B2 (ja) 送信方法
CN104813672A (zh) 信号收发装置和信号收发方法
RU2701172C2 (ru) Передающее устройство, способ передачи, приемное устройство и способ приема
JP6406416B2 (ja) 送信装置及び送信方法
AU2016323754A1 (en) Transmission device, transmission method, reproduction device, and reproduction method
US10511882B2 (en) Reception apparatus, reception method, and transmission apparatus
KR20180040571A (ko) 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법
JP7176588B2 (ja) 受信装置並びに受信方法
US11290785B2 (en) Transmission apparatus, transmission method, reception apparatus, and reception method for transmitting subtitle text information
EP3435679A1 (en) Broadcast signal transmission and reception method and device
JP2011223353A (ja) デジタル放送のデータ送出方法
EP3407614A1 (en) Method and apparatus for transmitting and receiving broadcast signal
JP6904467B2 (ja) 送信方法
CN109479154B (zh) 发送装置、发送方法、接收装置和接收方法
EP3370429A1 (en) Transmission device, transmission method, receiver, and reception method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant