CN1918649A - 用于解码文本字幕流的记录介质和方法及装置 - Google Patents
用于解码文本字幕流的记录介质和方法及装置 Download PDFInfo
- Publication number
- CN1918649A CN1918649A CN 200580004498 CN200580004498A CN1918649A CN 1918649 A CN1918649 A CN 1918649A CN 200580004498 CN200580004498 CN 200580004498 CN 200580004498 A CN200580004498 A CN 200580004498A CN 1918649 A CN1918649 A CN 1918649A
- Authority
- CN
- China
- Prior art keywords
- style
- player
- dialog
- text
- text subtitle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Television Signal Processing For Recording (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
至少一个文本字幕流记录在记录介质上。各文本字幕流包括定义一组区域样式的对话样式段和至少一个对话呈现段。各对话呈现段包含对话文本的至少一个区域,并与该样式组的至少一个样式链接。对话样式段包括一播放器样式标记,指示是否允许播放器生成它自己的播放器样式组。如果播放器样式标记指示许可,则使用播放器样式组来解码各对话呈现段。
Description
技术领域
本发明涉及一种记录介质,以及一种用于解码记录在记录介质上的文本字幕流的记录介质和方法及装置。
背景技术
光盘被广泛地用作用于记录大量数据的光学记录介质。目前,在各种各样的光盘中,诸如蓝光盘(下文称为“BD”)之类的新的高密度光学记录介质(下文称为“HD-DVD”)正在开发中,用于记录高清晰度的视频和音频数据。当前,众所周知作为下一代HD-DVD技术的BD的全球标准技术规范正在被建立成为能具有大大超越常规DVD以及许多其它数字装置的数据的下一代光学记录方案。
因此,同时还在开发应用蓝光盘(BD)标准的光学再现装置。然而,因为蓝光盘(BD)标准仍有待完善,在开发完备的光学再现装置的过程中存在许多困难。特别是为了有效地从蓝光盘(BD)再现数据,不仅应提供主AV数据以及方便用户所需的各种数据,诸如作为与主AV数据相关的补充数据的字幕信息,还应系统化和提供用于再现记录在光盘中的主要数据和字幕数据的管理信息。
然而,在现有的蓝光盘(BD)标准中,因为补充数据,特别是字幕流文件的标准并尚未完全统一,在基于蓝光盘(BD)的光学再现装置的全面研发中存在许多限制。并且,这些限制在向用户提供诸如字幕之类的补充数据的过程中会引起一些问题。
发明公开
因此,本发明涉及一种用于解码记录在记录介质上的文本字幕流的文本字幕解码器以及方法,它们基本上避免了由于相关技术的限制和缺点而引起的一个或多个问题。
本发明的一个目的是提供一种包括对话样式段的记录介质,它包括用于指示是否允许播放器产生它自己的播放器样式组的播放器样式标记。
本发明的另一个目的是一种用于解码文本字幕流的方法和装置,其中文本字幕解码器读取包括在对话样式段中的播放器样式标记,以确定是否允许播放器产生它自己的播放器样式组。
本发明的其它优点、目的和特征的一部分将在下面的说明书中阐述,一部分将在本领域普通技术人员阅读以下说明后变得显而易见,或者可以从本发明的实践中认识到。本发明的目的和其它优点可以通过在所写说明书及其权利要求、以及附图中特别指出的结构来实现和获得。
为了实现这些目的和其它优点,并根据在本文中体现并广泛说明的本发明用途,一种记录介质包括储存至少一个文本字幕流的数据区。储存在数据区中的各文本字幕流包括定义一组样式的对话样式段和至少一个对话呈现段。各对话呈现段包含对话文本的至少一个区域,并与该组样式的至少一个样式链接。对话样式段包括一播放器样式标记,它指示是否允许播放器生成它自己的播放器样式组。在对话样式段中定义的该组样式可以是一组用户定义的区域样式。
在本发明的另一方面中,提供了一种用于解码记录在记录介质上的文本字幕流的方法和装置。字幕载入缓冲器从记录介质中载入文本字幕流。所载入的文本字幕流包括定义一组样式的对话样式段和至少一个对话呈现段,各对话呈现段包含对话文本的至少一个区域,并与该组样式的至少一个样式链接。然后,文本字幕解码器读取包括在对话样式段中的播放器样式标记,以确定是否允许播放器产生它自己的播放器样式组。如果该允许由播放器样式标记指示,则文本字幕解码器现在能在解码每个对话呈现段时使用该播放器样式组。
在第一示例中,每个播放器样式可表示一个区域样式,指定用于对话文本区域的一组独立的区域呈现属性。在另一示例中,每个播放器样式可被配置成改变由所链接的样式指定的区域呈现属性的至少之一。它可指定至少一个区域呈现属性中的改变的方向和幅度。
可以理解,本发明的在前概述及下列详述是示例性和说明性的,且旨在提供对所要求保护的本发明的进一步说明。
附图简述
包括在内以提供对本发明的进一步理解、并结合其中构成本申请的一部分的附图示出本发明的各个实施例,并与说明书一起用于说明本发明的原理。在附图中:
图1示出根据本发明一示例的记录在光盘中的数据文件的文件结构;
图2示出根据本发明一示例的光盘的数据存储区;
图3示出在再现文本字幕流和主AV流时呈现在显示屏上的文本字幕和主图像;
图4示出播放列表(PlayList)对主AV剪辑和文本字幕剪辑的再现控制的示意图;
图5A示出根据本发明一示例的呈现在显示屏幕上的对话;
图5B示出根据本发明一示例的对话的多个区域;
图5C示出根据本发明一示例的用于对话的多个区域的区域和行内(inline)样式;
图6A示出文本字幕对话按呈现时间戳(PTS)间隔在显示屏上的呈现;
图6B示出按PTS间隔在显示屏上呈现的文本字幕对话之间的连续性;
图7A示出根据本发明一示例的文本字幕流文件;
图7B示出根据本发明一示例的文本字幕流中所包括的DPU和DSU中所包含的特定信息;
图8示出根据本发明一示例的文本字幕流文件的语法;
图9A示出根据本发明一示例的对话样式单元中所包括的对话样式单元的语法;
图9B示出根据本发明一示例的对话样式单元中所包括的对话样式组的语法;
图9C示出根据本发明一示例的对话样式组中所包括的用户可变样式组的语法;
图10示出根据本发明的用于解码主AV流和文本字幕流的装置的一个示例;
图11示出根据本发明的用于解码记录在光盘上的文本字幕流的一方法示例。
实现本发明的最佳方式
现在将详细参考本发明的较佳实施例,其示例在附图中示出。在可能的情况下,在全部附图中用相同的标号来指示相同或相似的部件。
在本详细说明中,主数据表示属于由作者记录在光盘中的标题(例如电影标题)的音频/视频(AV)数据。通常,AV数据以MPEG2格式记录,并常常被称为AV流或主AV流。另外,补充数据表示再现主数据所需的所有其它数据,其示例是文本字幕流、交互式图形流、呈现图形流和补充音频流(例如,用于可浏览幻灯片)。这些补充数据流可以用MPEG2格式或任何其它数据格式记录。它们能与AV流多路复用或能在光盘中作为独立数据文件存在。
字幕表示对应于所再现的视频(图像)数据的说明信息,并且它可用预定语言表示。例如,当用户在观看显示屏上的图像时选择观看以各种语言表示的多个字幕之一的选项时,对应于选定字幕的说明信息被显示在显示屏的预定部分上。如果所显示的说明信息是文本数据(例如字符),则选定字幕常被称为“文本字幕”。根据本发明一方面,多个MPEG2格式的文本字幕流可记录在光盘中,并且它们可作为多个独立的流文件存在。各个文本字幕流文件包括用于文本字幕的文本数据,以及呈现文本数据所需的再现控制数据。根据本发明的另一方面,只有MPEG2格式的单个文本字幕流可被记录在光盘中。
图1示出根据本发明的记录在光盘(其示例为蓝光盘,下文称为“BD”)中的数据文件的文件结构。参看图1,根目录(root)中包括至少一个BD目录(BDMV)。各BD目录包括用于与一个或多个用户交互的索引文件(index.bdmv)和对象文件(MovieObject.bdmv)。例如,索引文件可包含表示具有多个可选择菜单和电影标题的索引表的数据。各BD目录还包括四个文件目录,它们包括要再现的音频/视频(AV)数据和再现AV数据所需的各种数据。
各BD目录中所包括的文件目录是流目录(STREAM)、剪辑信息目录(CLIPINF)、播放列表目录(PLAYLIST)、和辅助数据目录(AUXDATA)。首先,流目录(STREAM)包括具有特定数据格式的音频/视频(AV)流文件。例如,AV流文件可以是MPEG2传输分组的形式,并被命名为“*.m2ts”,如图1所示。该流目录还可包括一个或多个文本字幕流文件,其中各文本字幕流文件包括用特定语言表示的文本字幕的文本(例如字符)数据,以及该文本数据的再现控制信息。文本字幕流文件作为独立的流文件存在于流目录内,并可被命名为“*.m2ts”或“*.txtst”,如图1所示。流目录中所包括的AV流文件或文本字幕流文件常被称为剪辑流文件。
接着,剪辑信息目录(CLIPINF)包括分别对应于流目录中所包括的流文件(AV或文本字幕)的剪辑信息文件。各剪辑信息文件包含相应流文件的属性和再现定时信息。例如,剪辑信息文件可包括映射信息,其中呈现时间戳(PIS)和源分组号(SPN)是通过入口点映射(EPM)一对一映射的。使用该映射信息,可根据由播放项(PlayItem)或子播放项(SubPlayItem)提供的定时信息(进入时间(In-time)和跳出时间(Out-Time))来确定流文件的特定位置,下面将进行详细讨论。在行业标准中,每一对流文件及其相应的剪辑信息文件被指定为一个剪辑。例如,CLIPINF中所包括的01000.clpi包括STREAM中所包括的01000.m2ts的属性和再现定时信息,且01000.clpi和01000.m2ts形成一个剪辑。
再参看图1,播放列表目录(PLAYLIST)包括一个或多个播放列表文件(*.mpls),其中每个播放列表文件包括至少一个播放项,它指定至少一个主AV剪辑和该主AV剪辑的再现时间。更具体地,播放项包含指定进入时间和跳出时间的信息,该信息表示由播放项内的Clip_Information_File_Name(剪辑信息文件名)指定的主AV剪辑的开始和结束时间。因此,播放列表文件表示一个或多个主AV剪辑的基本再现控制信息。另外,播放列表文件还可包括子播放项,它表示用于文本字幕流文件的基本再现控制信息。当子播放项被包括在播放列表中以再现一个或多个文本字幕流文件时,该子播放项与播放项同步。另一方面,当子播放项用于再现可浏览幻灯片时,它可以不与播放项同步。根据本发明,子播放项的主要功能在于控制一个或多个文本字幕流文件的再现。
最后,辅助数据目录(AUX DATA)可包括补充数据流文件,其示例是字体文件(例如,*.font或*.otf)、弹出式菜单文件(未示出)、和用于产生咔嗒声的声音文件(例如,Sound.bdmv)。前述文本字幕流文件可包括在辅助数据目录而非流目录中。
图2示出根据本发明的光盘的数据存储区。参看图2,光盘包括占用盘卷的最里面部分的文件系统信息区,占用盘卷的最外面部分的流区,以及占据在文件系统信息区域和流区域之间的数据库区。在文件系统信息区中,存储用于管理图1所示的全部数据文件的系统信息。接着,AV流和一个或多个文本字幕流被存储在流区中。通用文件、播放列表文件和剪辑信息文件被存储在盘卷的数据库区中。如上所述,通用文件包括索引文件和对象文件,而播放列表文件和剪辑信息文件包括再现存储在流区中的AV流和文本字幕流所需的信息。使用存储在数据库区和/或流区中的信息,用户能选择特定回放模式并以选定的回放模式再现主AV和文本字幕流。
图3示出在再现文本字幕流和主AV流时呈现在显示屏上的文本字幕和主图像。当同步再现主AV流和相应的文本字幕流时,该主图像和文本字幕被同时显示在显示屏上。
图4示出播放列表对主AV剪辑和文本字幕剪辑的再现控制的示意图。参看图4,播放列表文件包括控制至少一个主AV剪辑的再现的至少一个播放项、和控制多个文本字幕剪辑的再现的子播放项。图4所示的用作英文和韩文文本字幕的文本字幕剪辑1和文本字幕剪辑2之一可与主AV剪辑同步,从而主图像和相应的文本字幕在特定呈现时间同时显示在显示屏上。为了在显示屏上显示该文本字幕,需要显示控制信息(例如位置和大小信息)和呈现时间信息,其示例在图5A到图5C中示出。
图5A示出根据本发明的在显示屏上呈现的对话。对话表示在给定呈现时间期间显示屏上显示的全部文本字幕数据。通常,对话的呈现时间可用呈现时间戳(PTS)表示。例如,图5A所示的对话的呈现在PTS(k)处开始并在PTS(k+1)处结束。因此,图5A所示的对话表示在PTS(k)和PTS(k+1)之间显示在显示屏上的整个文本字幕数据单元。一个对话包括至少一行字幕文本(字符)。当在对话中有两行或多行字幕文本时,全部文本数据可根据为对话定义的样式来显示。一个对话中所包括的最多字符数量可限制为约100个。
此外,图5B示出根据本发明的对话的多个区域。区域表示在给定呈现时间期间在显示屏上显示的文本字幕数据(对话)的细分部分。换言之,对话包括至少一个区域,且各区域可包括至少一行字幕文本。可根据分配给该区域的区域样式(全局样式)在显示屏上显示表示一个区域的全部文本字幕数据。应根据字幕数据的期望解码速率确定包括在一个对话中的最多区域数量,因为区域数量越多通常导致解码率越低。例如,可以将一个对话的最多区域数量限制为2,以实现合理的高解码速率。然而,出于其它目的,最大数量可大于2。
图5C示出根据本发明的用于对话的多个区域的杆式信息。样式信息表示定义显示对话中所包括区域的至少一部分所需的属性的信息。样式信息的某些示例是位置、区域大小、背景色、文本对齐、文本流向信息等等。样式信息可被分类成区域样式信息(全局样式信息)和行内样式信息(局部样式信息)。区域样式信息定义应用于对话的整个区域的区域样式(全局样式)。例如,区域样式信息可包含区域的区域位置、区域大小、字体颜色、背景色、文本流向、文本对齐、行距、字体名称、字体样式和字体大小的至少之一。例如,两个不同的区域样式应用于区域1和区域2,如图5C所示。具有位置1、大小1及蓝色背景色的区域样式被应用于区域1,而具有位置2、大小2及红色背景色的不同的区域样式被应用于区域2。
另一方面,行内样式信息定义应用于区域中所包括的文本字符串的特定部分的行内样式(局部样式)。例如,行内样式信息可包含字体类型、字体大小、字体样式、和字体颜色的至少之一。文本字符串的特定部分可以是区域中的整个文本行或该文本行的特定部分。参见图5C,特定行内样式被应用于区域1中包括的文本部分“mountain”。换言之,文本字符串的特定部分的字体类型、字体大小、字体样式和字体颜色的至少之一与区域1中文本字符串的其余部分不同。
图6A示出文本字幕对话按呈现时间戳(PTS)间隔在显示屏上的呈现。有四个对话在PST1到PST6之间显示。更具体地,对话#1仅具有一个区域,且文本#1在PTS1到PTS2之间显示于该区域内。然后,对话#2具有区域1和区域2,且文本#1和文本#2分别在PTS2到PTS3之间显示于区域1和区域2内。然后,对话#3也只具有一个区域,且文本#2在PTS3和PTS4之间显示于该区域内。在PTS4到PTS5之间没有对话呈现,且文本#3在PTS5到PTS6之间显示于对话#4的区域内。定义对话的信息包括对话呈现时间信息,以及包括样式信息和要在每个对话区域内显示的文本字符串的对话文本数据。呈现时间信息的一个示例是PTS开始和PTS结束的一个组,且样式信息包括上述区域(全局)样式信息和行内(局部)样式信息。如图6所示,不同的样式信息组可应用于对话中。
图6B示出按PTS间隔在显示屏上呈现的文本字幕对话之间的连续性。参看图6B,对话#1的呈现结束时间与对话#2的呈现开始时间相同。因此,在对话#1和对话#2之间存在连续性。文本#1在对话#1的区域中的显示与文本#1在对话#2的区域1中的显示相连续。换言之,两个对话的PTS间隔是连续的,且当在两个区域内呈现文本#1时使用相同的样式信息(区域和行内)。类似地,在对话#2和对话#3之间存在另一连续性,因为文本#2在对话#2的区域2中的显示与文本#2在对话#3的区域中的显示相连续。为了确保显示相同字幕文本的两个接连对话之间的连续性,对话的呈现时间(PTS间隔)必须是连续的。此外,当在多个区域中分别呈现相同文本时,必须使用相同的区域和行内样式信息。再参看图6B,在对话#3和对话#4之间没有连续性,因为它们的PTS间隔不连续。指示符(例如continuous_presentation_flag(连续呈现标记))可包括在当前对话的呈现信息中,以指示该对话是否与前一对话连续。
图7A示出根据本发明的文本字幕流文件(例如,图1所示的10001.m2ts)。它由包括多个传输分组(TP)的MPEG2传输流形成,所有传输分组都具有相同的分组标识符(例如,PID=0x18xx)。当盘片播放器接收到包括特定文本字幕流在内的许多输入流时,它用它们的PID找到属于该文本字幕流的所有传输分组。参看图7,传输分组的每个子集形成一个分组流元(PES)分组。图7所示的PES分组之一对应于定义一组区域样式的对话样式单元(DSU)。DSU常常也被称为对话样式段(DSS)。所有其余PES分组对应于对话呈现单元(DPU),每个对话呈现单元都包括用于具有至少一个区域的对话的呈现信息、以及包括每个区域的区域样式指示符、行内样式信息和文本字符串的对话文本数据。类似地,DPU也常常被称为对话呈现段(DPS)。
图7B示出根据本发明的文本字幕流中所包括的DPU和DSU内包含的特定信息。DSU包含定义一组区域样式的信息集,各区域样式应用于对话的相应区域。此外,DPU包含对话的对话文本数据和对话呈现信息。对话文本数据包括各对话区域中所包括的文本字符串、应用于文本字符串的特定部分的行内样式信息、以及指示要应用于每个对话区域的区域样式的区域样式标识符。该区域样式标识符标识DSU中定义的该组区域样式中的一个区域样式。另一方面,对话呈现信息包括对话的呈现时间信息和调色板(颜色)更新信息。呈现时间信息可包括用于在显示屏上呈现对话的呈现开始时间(例如PTS_start)和呈现结束时间(例如PTS_end),且调色板更新信息可包括一指示符(例如palette_update_flag(调色板更新标记)),指示是否要更新对话的显示颜色,以及更新显示颜色时要应用的调色板信息(例如用于更新的调色板)。
文本字幕流中所包括的全部数据可基于其基本功能分成三类数据。例如,该数据可被分成对话文本数据、合成信息、以及表现信息,如图7B所示。对话文本数据包括用于对话各区域的文本字符串、行内样式信息、以及区域样式标识符。合成信息包括呈现时间信息,其示例为呈现开始和结束时间、对话区域的位置信息、以及对话的调色板更新信息。最后,表现信息可包括将文本字符串表现为用于呈现的图形数据所需的信息。参看图7B,DSU中所包括的每个区域的水平和竖直位置是合成信息的一部分,且DSU中所包括的区域宽度、区域高度、字体颜色、背景色、文本流向、文本对齐、行距、字体名称、字体样式和字体大小之一表示表现信息。
DSU包括一组区域样式信息(对话样式组),分别定义有限数量的作者定义的区域样式。例如,DSU中定义的区域样式的最多数量可限制为60,且区域样式可由其区域样式标识(region_style_id)标识。因此,作者将仅定义有限数量的区域样式的DSU储存在光盘中。当再现记录在光盘中的文本字幕流时,由盘片播放器使用区域样式。或者,盘片播放器可使用由从其它源提供的另一组样式信息定义的其它区域样式。这种源的一个示例是包括在盘片播放器中的本地数据存储。结果,从记录在光盘上的文本字幕流再现的字幕区域可具有各种区域样式。
图8示出根据本发明一示例的文本字幕流的语法(Text_subtitle_stream())。如前所述,文本字幕流语法包括用于对话样式单元的语法(dialog_style_unit()),包括分别定义一组区域样式的一组信息;以及用于多个对话呈现单元的语法(dialog_presentation_unit()),其中各DPU语法包括对话呈现信息和至少一个对话文本区域。各对话文本区域包括一区域样式标识符、一个或多个文本字符串、以及行内样式信息,而区域样式标识符标识在DSU语法中定义的该组区域样式中的一个区域样式。
图9A示出包括在图8所示的文本字幕流语法中的用于对话样式单元的语法(dialog_style_unit())。该对话样式单元语法包括用于对话样式组的语法(dialog_styleset()),在该对话样式组中定义了一组作者定义的区域样式。图9B示出包括在图9A所示的对话样式单元语法中的用于对话样式组的语法(dialog_styleset())。该对话样式组语法包括分别定义一组区域样式(region_style())的一组区域样式信息、指示作者是否允许播放器对文本字幕生成除在region_style()中定义的一组作者定义样式之外的它自己的样式组(播放器样式)的数据字段或标记(player_style_flag)。该对话样式语法还包括用于定义一组用户控制样式的用户可变样式组的语法(user_changeable_styleset())。
参看图9B,区域样式标识(region_style_id)被分别分配给一组区域样式(region_style()),并且每个区域样式信息表示要应用于对话文本的全部区域的全局样式信息。包括在每个区域的DPU中的该区域样式标识符包括区域样式标识之一。因此,当再现每个DPU中所包含的对话文本的至少一个区域时,应用与区域样式标识符相对应的区域样式。
现在将参考在每个区域样式(region_style())中定义的特定区域再现属性。区域水平位置(region_horizontal_position)指定区域左上像素在图形平面中的水平地址,而区域垂直位置(region_vertical_position)指定区域左上像素在图形平面中的垂直地址。此外,区域宽度(region_width)指定矩形区域从区域水平位置起的水平长度,而区域高度(region_height)指定矩形区域从区域垂直位置起的垂直长度。区域背景色索引(region_bg_color_index)指定指示区域背景色的索引值。
此外,文本水平位置(text_horizontal_position)指定区域中文本原点的水平位置,而文本垂直位置(text_vertical_position)指定区域中文本原点的垂直位置。文本流向(text_flow)指定区域中字符行进(左到右或右到左)和行行进(上到下或下到上)的至少之一。文本对齐(text_alignment)指定区域中所表现的文本的对齐方式(左、中、或右)。当对话具有一个以上区域时,必须对所有区域应用相同文本流向,以防观众混淆。再参看图9B,行距(line_space)指定区域中两行相邻文本之间的距离。字体标识(font_id)示出在剪辑信息文件中指定的字体标识。字体样式(font_style)指定用于区域中文本的字体的样式,其示例为常规、加粗、倾斜、以及加粗和倾斜。字体大小(font_size)指定用于区域中文本的字体的大小,其示例是以像素为单位的字符的垂直大小。最后,字体颜色索引(font_color_index)指定指示区域中文本颜色的索引值。
图9B所示的播放器样式标记指示作者是否允许盘片播放器对文本字幕生成和/或使用除光盘中定义的作者定义的区域样式之外的它自己的样式组(播放器样式),其中它自己的样式组可预先储存在盘片播放器的本地数据存储中。例如,如果播放器样式标记的值被设置为1b,则作者允许播放器生成和/或使用它自己的播放器样式。另一方面,如果播放器样式标记的值被设置成0b,则作者禁止播放器生成和/或使用播放器样式组。
图9C示出图9B所示的对话样式组语法中所包括的用于用户可变样式组的语法(user_changeable_styleset())。user_changeable_styleset()包括定义一组用户控制样式(user_control_style())的一组用户控制样式信息,其中各用户控制样式被配置成改变由相应区域样式指定的区域呈现属性的至少之一。通过选择该组用户控制样式中的一个样式,用户能用非常简单的方式改变每个区域的区域样式。然而,如果由区域样式指定的全部属性可由用户改变,则用户对对话的显示控制会非常困难。因此,可通过用户控制样式改变的区域呈现属性可限制成区域水平位置、区域垂直位置、字体大小、文本水平位置、文本垂直位置、以及行距的至少之一。
根据图9B和图9C,对具有区域样式ID的每个区域样式定义一组用户控制样式,且用户样式ID(user_style_id)被分别分配给该组用户控制样式。对每个区域样式定义的用户控制样式的最大数量可被限制为25。因为在对话样式组中定义的区域样式的最大数量限制为60,所以对DPU定义的用户可变样式的总数量必须小于或等于1500。
参看图9C,为了改变区域水平位置,用户控制样式可包括指定区域水平位置的水平运动的方向的区域水平位置方向(region_horizontal_position_direction),以及以像素为单位指定水平运动量的区域水平位置增量(region_horizontal_position_delta)。例如,如果水平位置方向被设置为0则水平运动可以是向右,而如果它被设置为1则向左。为了改变区域垂直位置,用户控制样式可包括指定区域水平位置的垂直运动的方向的区域垂直位置方向(region_vertical_position_direction),以及以像素为单位指定垂直运动量的区域垂直位置增量(region_vertical_position_delta)。例如,如果垂直位置方向被设置为0则垂直运动可以是向下,而如果它被设置为1则向上。此外,为了改变具有区域样式ID的区域样式定义的字体大小,用户控制样式可包括指定字体大小改变方向的字体大小改变方向(font_size_inc_dec),以及以像素为单位指定字体大小改变量的字体大小增量(font_size_delta)。例如,如果font_size_inc_dec被设置成0则字体大小增大,如果它被设置成1则字体大小减小。
根据本发明的用户可变样式组的部分特性如下。首先,对对话样式单元中所定义的一组区域样式的每一个定义一组用户控制样式,且控制样式组的数量固定。因此,分别对两个不同区域样式定义的用户控制样式的数量相同。要在再现每个对话文本区域时使用的用户控制样式的数量是固定的。然后,用户控制样式组分别由不同的用户样式ID标识。第三,区域呈现属性中的全部改变由单个用户控制样式组合定义。例如,区域水平位置和字体大小不是通过两个不同用户控制样式分开改变的。它们由单个用户控制样式组合改变。第四,某些属性的改变用其方向和幅度、而不用实际属性值表示。实际属性值可通过将改变的幅度(增量)和方向应用于在区域样式中定义的原始属性值来获得。
总之,当作者将主AV流记录在光盘中时,作者还记录至少一个文本字幕流。各文本字幕流包括定义一组对话样式的DSU和多个DPU。该组区域样式具有不同的区域样式ID。DSU还对各区域样式定义一组用户控制样式,其中用户控制样式具有不同的用户样式ID。各用户控制样式被配置成改变由相应区域样式指定的作者定义的区域呈现属性的至少之一。此外,对话样式组包括播放器样式标记,指示作者是否允许播放器对文本字幕生成和/或使用除作者定义的样式组之外的它自己的播放器样式组。
现在将详细参考根据本发明的用于解码主AV流和文本字幕流的装置,其一个示例如图10所示。该装置包括:分组标识符(PID)过滤器5,用于基于其分组标识符将输入流分成视频流、音频流、图形流和文本字幕流;视频解码部分20,用于解码视频流;音频解码部分10,用于解码音频流;图形解码部分30,用于解码图形流;以及文本字幕解码部分40,用于解码文本字幕流。
文本字幕流可从光盘或另一外部源中提取,如图10所示。因此,该装置还包括选择输入数据源的开关6。因此,如果从光盘提取文本字幕流,则开关6选择与PID过滤器5相连的数据线A。另一方面,如果它们从外部源输入,则开关6选择与外部源相连的线B。
再参看图10,音频解码部分10、视频解码部分20、以及图形解码部分30分别包括传输缓冲器11、21和31,用于存储要解码的流数据。视频平面(VP)23和图形平面33分别包括在视频解码部分20和图形解码部分30中,用于将经解码信号转换成可显示的视频和图形图像。图形解码部分30包括颜色查找表(CLUT)34,用于控制可显示图形图像的颜色和透明度。
当文本字幕解码部分40从开关6接收到支持单种语言的文本字幕流时,该文本字幕流的全部可一次性地预载到字幕预载缓冲器(SPB)41中。或者,当有用于支持多种语言的一个以上文本字幕流时,可一次性地将全部文本字幕流载入SPB41中。因此,应基于从开关6接收到的文本字幕流文件的总量来确定SPB 41的大小。例如,SPB 41的大小应大于或等于0.5兆字节,用于预载0.5兆字节文本字幕流文件。此外,为了在用户于两个0.5兆字节文本字幕流文件之间切换时确保文本字幕的无缝呈现,SPB 41的大小应大于或等于1兆字节。SPB 41的大小应当足够大以一次性地预载全部所需文本字幕流文件。
图10所示的文本字幕解码部分40还包括字体预载缓冲器(FPB)410,用于存储可包括在图1所示辅助数据目录中的所有相关联的字体文件。类似地,FPB 410的大小应足够大到一次性地预载全部必需字体文件,以便于确保支持一种或多种语言的文本字幕的无缝呈现。因为预载了全部可用文本字幕流文件和相关的字体文件,可用简单方式完成预载数据的提取和使用。此外,因为这个原因,SPB 41和FPB 410的控制会相当简单。文本字幕解码部分40还包括:文本字幕解码器42,它解码储存在SPB 41中的各个文本字幕流;图形平面43,在其中经解码的字幕数据被合成为可显示的字幕图像;以及颜色查找表(CLUT)44,它控制经转换字幕图像的颜色和透明度的至少之一。
文本字幕解码部分还包括本地数据存储45,它存储定义要在再现预载于SPB41中的文本字幕流时选择性使用的一组播放器样式的播放器样式组。此外,本地数据存储45还可存储指定要在再现文本字幕流时选择性使用的一组用户控制样式的用户可变组。该用户可变组可与DSU中所包括的用户可变组相似,其一个示例如图9C所示。
在本发明的第一方面中,各播放器样式表示指定用于对话文本的区域的一组完整的区域呈现属性,其示例为区域水平位置、区域垂直位置、区域宽度、区域高度、区域背景色索引、文本水平位置、文本垂直位置、文本流向、文本对齐、行距、字体标识、字体样式、字体大小、以及字体颜色索引。在该情形中,储存在本地数据存储45中的该组播放器样式独立于在DSU中定义的一组区域样式而使用。
在本发明的第二方面中,各播放器样式被配置成重新定义区域呈现属性的至少之一,这些区域呈现属性开始时由DSU中定义的区域样式定义。例如,如果在DSU中定义的区域样式定义了包括字体标识的一组完整的区域呈现属性,且播放器样式重新定义了该字体标识,则组合使用该重新定义后的字体标识和由区域样式指定的全部其它属性。
在本发明的第三方面中,各播放器样式可被配置成改变开始时由DSU中定义的区域样式定义的区域呈现属性的至少之一。例如,播放器样式可指定区域样式中定义的区域水平位置中的改变的方向和幅度。在该情形中,播放器样式组与用户可变组相似,其示例如图9C所示。
图11示出根据本发明一示例的解码记录在光盘上的文本字幕流的方法。在文本字幕解码器42开始再现预载到SPB 41中的文本字幕流之后,它开始读取包括在DSU中的player_style_flag,以确定是否允许使用储存在本地数据存储45中的播放器样式组(S110)。例如,如果player_style_flag被设置成0b,则不允许使用播放器样式组。在该情形中,文本字幕解码器42必须使用记录在光盘上的作者定义的区域样式(S111)。另一方面,如果player_style_flag被设置成1b,则允许文本字幕解码器42使用储存在本地数据存储45中的播放器样式。然后文本字幕解码器42独立地确定是否使用在播放器样式组中定义的一组播放器样式的任一样式(S112)。例如,文本字幕解码器42可对播放器样式组和在文本字幕流中定义的区域样式作比较,并将该比较结果用于步骤S112的确定。如果在步骤S112未确定要使用播放器样式组,则使用记录在光盘上的区域样式(S111)。另一方面,如果在步骤S112确定了要使用播放器样式组,则文本字幕解码器42可独立地使用它们,或结合记录在盘片中的区域样式组一起使用。
此外,当文本字幕解码器42解码DPU时,它可使用由DPU中所包括的区域样式标识符所标识的区域样式。如果用户需要改变该区域样式,他或她可输入用于改变该区域样式的命令。通过选择由DSU中所定义的用户可变样式组定义的一组用户控制样式之一,可改变区域水平位置、区域垂直位置以及字体大小的至少之一。
如图10所示的装置还包括图像叠加部分50,它叠加从视频解码部分20、图像解码部分30和文本字幕解码部分40输出的图像。这些组合后的图像在显示屏上显示,如图3所示。通常,从视频解码部分20的VP 23输出的视频图像可显示为显示屏的背景,且从图形解码部分30和/或文本字幕解码部分40输出的图像可按预定顺序叠加在视频图像上。例如,如果图形解码部分30的输出图像是呈现图形图像,这些图像开始时可由第一添加器52叠加在视频图像上,随后来自文本字幕解码部分40的文本字幕图像可由第二添加器53叠加在视频图像上。然而,如果图形解码部分30的输出图像是交互式图形图像,则来自文本字幕解码部分40的文本字幕图像可在开始时由第一添加器52叠加在视频图像上。然后,交互式图形图像可由第二添加器53叠加在已叠加字幕的图像上。
最后,如图10所示的装置还包括用于解码输入传输流(例如MPEG传输流)的系统解码器4,以及用于控制上述装置的所有组件的操作的微处理器3。
工业实用性
对本领域技术人员而言显而易见的是,在本发明中可作各种更改和变化,而不背离发明的精神或范围。因而,本发明旨在涵盖本发明的更改和变化,只要它们落于所附权利要求及其等效方案的范围内即可。根据本发明,文本字幕流包括定义一组作者定义样式的对话样式段和至少一个对话呈现段,其中包含至少一个对话文本区域。该对话样式段包括一播放器样式标记,指示是否允许播放器生成和/或使用它自己的播放器样式。因此,播放器在得到许可时能使用除作者定义的区域样式组之外的播放器样式组,经解码用于呈现的各对话文本区域可具有各种区域样式。
Claims (22)
1.一种用于再现文本字幕流的记录介质,包括:
储存至少一个文本字幕流的数据区,各文本字幕流包括定义一组样式的对话样式段和至少一个对话呈现段,各对话呈现段包含的对话文本至少一个区域,并与该样式组的至少一个样式链接,所述对话样式段包括一播放器样式标记,指示是否允许播放器生成它自己的播放器样式组
2.如权利要求1所述的记录介质,其特征在于,在所述对话样式段中定义的样式组可以是一组用户定义的区域样式。
3.如权利要求1所述的记录介质,其特征在于,所述对话样式段还包括指示在所述对话样式段中定义的样式组的数量的数据字段。
4.如权利要求3所述的记录介质,其特征在于,在所述对话样式段中定义的样式组的数量小于或等于60。
5.如权利要求1所述的记录介质,其特征在于,所述播放器样式标记的值为0以表示允许播放器生成播放器样式组。
6.如权利要求1所述的记录介质,其特征在于,所述播放器样式标记的值为1以表示禁止播放器生成播放器样式组。
7.如权利要求1所述的记录介质,其特征在于,所述播放器样式组预先储存在包括播放器内的本地数据存储中。
8.如权利要求1所述的记录介质,其特征在于,各播放器样式表示指定用于对话文本的区域的一组独立的区域呈现属性的区域样式。
9.如权利要求1所述的记录介质,其特征在于,各播放器样式被配置成重新定义由所链接的样式指定的区域呈现属性的至少之一。
10.如权利要求1所述的记录介质,其特征在于,各播放器样式被配置成改变由所链接的样式指定的区域呈现属性的至少之一。
11.如权利要求10所述的记录介质,其特征在于,各播放器样式指定区域呈现属性至少之一中的改变的方向和幅度。
12.一种用于解码记录在记录介质上的文本字幕流的方法,所述方法包括:
将所述文本字幕流载入字幕载入缓冲器,所载入的文本字幕流包括定义一组样式的对话样式段和至少一个对话呈现段,各对话呈现段包含对话文本的至少一个区域,并与所述对话样式段中定义的样式组的至少一个样式链接;
读取包括在所述对话样式段中的播放器样式标记,以确定是否允许播放器生成它自己的播放器样式组;以及
如果所述播放器样式标记指示许可,则通过使用所述播放器样式组来解码各对话呈现段。
13.如权利要求12所述的方法,其特征在于,在所述对话样式段中定义的样式组是一组作者定义的区域样式。
14.如权利要求12所述的方法,其特征在于,各播放器样式表示指定用于对话文本的区域的一组独立的区域呈现属性的区域样式。
15.如权利要求12所述的方法,其特征在于,各播放器样式被配置成重新定义由所链接的样式指定的区域呈现属性的至少之一。
16.如权利要求12所述的方法,其特征在于,各播放器样式被配置成改变由所链接的样式指定的区域呈现属性的至少之一。
17.如权利要求16所述的方法,其特征在于,各播放器样式指定区域呈现属性至少之一中的改变的方向和幅度。
18.如权利要求12所述的方法,其特征在于,还包括:
如果所述播放器样式标记指示许可,则确定是否使用所述播放器样式组。
19.如权利要求12所述的方法,其特征在于,还包括:
将所述播放器样式组预先存储在本地数据存储中。
20.一种用于解码记录在记录介质上的文本字幕流的装置,所述装置包括:
字幕载入缓冲器,它被配置成载入所述文本字幕流,所载入的文本字幕流包括定义一组样式的对话样式段和至少一个对话呈现段,各对话呈现段包含对话文本的至少一个区域,并与所述样式组的至少一个样式链接;以及
文本字幕解码器,它被配置成读取包括在所述对话样式段中的播放器样式标记,以确定是否允许播放器生成它自己的播放器样式组,如果所述播放器样式标记指示许可,则所述文本字幕解码器通过使用所述播放器样式组来解码各对话呈现段。
21.如权利要求20所述的装置,其特征在于,在所述对话样式片段中定义的样式组是一组用户定义的区域样式。
22.如权利要求20所述的装置,其特征在于,还包括:
本地数据存储,它被配置成预先存储所述播放器样式组。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US54285004P | 2004-02-10 | 2004-02-10 | |
US60/542,852 | 2004-02-10 | ||
US60/542,850 | 2004-02-10 | ||
US60/543,328 | 2004-02-11 | ||
US60/544,234 | 2004-02-13 | ||
KR1020040017935 | 2004-03-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1918649A true CN1918649A (zh) | 2007-02-21 |
Family
ID=37722648
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004800415292A Expired - Fee Related CN100473133C (zh) | 2004-02-10 | 2004-10-12 | 再现文本字幕的方法和文本字幕解码系统 |
CN 200480041530 Pending CN101080770A (zh) | 2004-02-10 | 2004-10-13 | 具有用于管理各种数据流的数据结构的记录介质以及记录和再现的方法和装置 |
CN 200480042284 Pending CN1926628A (zh) | 2004-02-10 | 2004-11-26 | 具有管理与不同语言相关联的数据流的数据结构的记录介质以及记录和再现方法和装置 |
CNB2004800415273A Expired - Fee Related CN100555438C (zh) | 2004-02-10 | 2004-11-26 | 具有用于管理文本字幕的数据结构的记录介质以及记录和再现方法和装置 |
CN200710139867A Expired - Fee Related CN100585717C (zh) | 2004-02-10 | 2004-11-26 | 在记录介质上生成、记录和再现文本字幕的方法与装置 |
CN 200480041531 Pending CN1914903A (zh) | 2004-02-10 | 2004-12-08 | 用于解码文本字幕流的文本字幕解码器和方法 |
CN 200580004498 Pending CN1918649A (zh) | 2004-02-10 | 2005-01-12 | 用于解码文本字幕流的记录介质和方法及装置 |
CN 200580004499 Pending CN1918650A (zh) | 2004-02-10 | 2005-01-12 | 用于解码文本字幕流的记录介质和方法及装置 |
Family Applications Before (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004800415292A Expired - Fee Related CN100473133C (zh) | 2004-02-10 | 2004-10-12 | 再现文本字幕的方法和文本字幕解码系统 |
CN 200480041530 Pending CN101080770A (zh) | 2004-02-10 | 2004-10-13 | 具有用于管理各种数据流的数据结构的记录介质以及记录和再现的方法和装置 |
CN 200480042284 Pending CN1926628A (zh) | 2004-02-10 | 2004-11-26 | 具有管理与不同语言相关联的数据流的数据结构的记录介质以及记录和再现方法和装置 |
CNB2004800415273A Expired - Fee Related CN100555438C (zh) | 2004-02-10 | 2004-11-26 | 具有用于管理文本字幕的数据结构的记录介质以及记录和再现方法和装置 |
CN200710139867A Expired - Fee Related CN100585717C (zh) | 2004-02-10 | 2004-11-26 | 在记录介质上生成、记录和再现文本字幕的方法与装置 |
CN 200480041531 Pending CN1914903A (zh) | 2004-02-10 | 2004-12-08 | 用于解码文本字幕流的文本字幕解码器和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200580004499 Pending CN1918650A (zh) | 2004-02-10 | 2005-01-12 | 用于解码文本字幕流的记录介质和方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (8) | CN100473133C (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100727921B1 (ko) * | 2004-02-28 | 2007-06-13 | 삼성전자주식회사 | 텍스트 기반의 서브타이틀 스트림을 기록한 저장 매체,재생 장치 및 그 재생 방법 |
US7529467B2 (en) | 2004-02-28 | 2009-05-05 | Samsung Electronics Co., Ltd. | Storage medium recording text-based subtitle stream, reproducing apparatus and reproducing method for reproducing text-based subtitle stream recorded on the storage medium |
JP4569673B2 (ja) * | 2008-06-24 | 2010-10-27 | Necカシオモバイルコミュニケーションズ株式会社 | 字幕付映像再生装置、字幕付映像再生方法及びプログラム |
CN101764949B (zh) * | 2008-11-10 | 2013-05-01 | 新奥特(北京)视频技术有限公司 | 一种基于区域划分的定时字幕的冲突检测方法 |
KR20110018261A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 텍스트 서브타이틀 데이터 처리 방법 및 재생 장치 |
CN103067665A (zh) * | 2012-12-25 | 2013-04-24 | 天津市亚安科技股份有限公司 | 基于视频亮度自适应叠加字符颜色的实现方法 |
CN105338394B (zh) * | 2014-06-19 | 2018-11-30 | 阿里巴巴集团控股有限公司 | 字幕数据的处理方法及系统 |
EP3236659B1 (en) * | 2014-12-19 | 2020-11-04 | Sony Corporation | Transmission device, transmission method, reception device, and reception method |
CN106652983B (zh) * | 2016-09-18 | 2021-04-02 | 福建网龙计算机网络信息技术有限公司 | 一种字幕制作方法及系统 |
CN108012176A (zh) * | 2016-10-28 | 2018-05-08 | 深圳市中兴微电子技术有限公司 | 一种数据切换方法、装置及终端 |
CN108040277B (zh) | 2017-12-04 | 2020-08-25 | 海信视像科技股份有限公司 | 针对解码后得到的多语种字幕的字幕切换方法及装置 |
CN110109965A (zh) * | 2018-02-02 | 2019-08-09 | 上海颐为网络科技有限公司 | 知识分享平台上建立知识结构的辅助提示方法和组件 |
CN108924622B (zh) * | 2018-07-24 | 2022-04-22 | 腾讯科技(深圳)有限公司 | 一种视频处理方法及其设备、存储介质、电子设备 |
CN111399788B (zh) * | 2018-12-29 | 2023-09-08 | 西安诺瓦星云科技股份有限公司 | 媒体文件播放方法和媒体文件播放装置 |
CN116634218B (zh) * | 2023-05-25 | 2024-04-02 | 优酷网络技术(北京)有限公司 | 推广信息显示方法、装置、设备、介质 |
-
2004
- 2004-10-12 CN CNB2004800415292A patent/CN100473133C/zh not_active Expired - Fee Related
- 2004-10-13 CN CN 200480041530 patent/CN101080770A/zh active Pending
- 2004-11-26 CN CN 200480042284 patent/CN1926628A/zh active Pending
- 2004-11-26 CN CNB2004800415273A patent/CN100555438C/zh not_active Expired - Fee Related
- 2004-11-26 CN CN200710139867A patent/CN100585717C/zh not_active Expired - Fee Related
- 2004-12-08 CN CN 200480041531 patent/CN1914903A/zh active Pending
-
2005
- 2005-01-12 CN CN 200580004498 patent/CN1918649A/zh active Pending
- 2005-01-12 CN CN 200580004499 patent/CN1918650A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN101093709A (zh) | 2007-12-26 |
CN101080770A (zh) | 2007-11-28 |
CN1914903A (zh) | 2007-02-14 |
CN1926628A (zh) | 2007-03-07 |
CN100585717C (zh) | 2010-01-27 |
CN1914906A (zh) | 2007-02-14 |
CN100555438C (zh) | 2009-10-28 |
CN1918650A (zh) | 2007-02-21 |
CN100473133C (zh) | 2009-03-25 |
CN1914684A (zh) | 2007-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1918649A (zh) | 用于解码文本字幕流的记录介质和方法及装置 | |
CN101127922B (zh) | 再现和记录文本字幕流的方法和解码文本字幕流的装置 | |
US7587405B2 (en) | Recording medium and method and apparatus for decoding text subtitle streams | |
US7643732B2 (en) | Recording medium and method and apparatus for decoding text subtitle streams | |
US20070127885A1 (en) | Recording medium and method and apparatus for reproducing and recording text subtitle streams | |
CN1914927A (zh) | 记录介质以及记录和再现方法和装置 | |
CN1934642B (zh) | 用于再现记录在记录介质上的文本字幕流的记录介质以及方法和设备 | |
CN1918652A (zh) | 用于再现和记录文本字幕流的记录介质和方法及装置 | |
RU2377668C2 (ru) | Носитель записи и способ и устройство для воспроизведения и записи потоков текстовых субтитров | |
CN1950903B (zh) | 再现文本字幕数据的方法和装置 | |
CN1922866A (zh) | 用于再现和记录文本字幕流的记录介质和方法及装置 | |
RU2378720C2 (ru) | Носитель записи и способ и устройство воспроизведения и записи потоков текстовых субтитров | |
RU2380768C2 (ru) | Носитель записи, способ и устройство для декодирования потоков текстовых субтитров | |
CN1934645A (zh) | 用于再现文本字幕流的记录介质、方法和装置 | |
KR20060136441A (ko) | 기록매체, 기록매체의 텍스트 서브타이틀 스트림 기록 및재생 방법과 장치 | |
KR20070032289A (ko) | 기록매체 및 텍스트 서브타이틀 스트림 디코딩 방법과 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20070221 |
|
C20 | Patent right or utility model deemed to be abandoned or is abandoned |