CN1918650A - 用于解码文本字幕流的记录介质和方法及装置 - Google Patents

用于解码文本字幕流的记录介质和方法及装置 Download PDF

Info

Publication number
CN1918650A
CN1918650A CN 200580004499 CN200580004499A CN1918650A CN 1918650 A CN1918650 A CN 1918650A CN 200580004499 CN200580004499 CN 200580004499 CN 200580004499 A CN200580004499 A CN 200580004499A CN 1918650 A CN1918650 A CN 1918650A
Authority
CN
China
Prior art keywords
style
region
text
dialog
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200580004499
Other languages
English (en)
Inventor
刘齐镛
徐康洙
金柄辰
朴成浣
沈永善
李承勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN1918650A publication Critical patent/CN1918650A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

至少一个字幕文本流被记录在记录介质上。每一文本字幕流包括定义一组区域样式的对话样式段以及至少一个对话呈现段。每一对话呈现段包含对话文本的至少一个区域,并被链接到该组区域样式中的至少一个。对话样式段还为每一区域样式定义了一组用户控制样式。每一用户控制样式可由用户选择,并被配置成改变由对应的区域样式指定的区域呈现属性中的至少一个。

Description

用于解码文本字幕流的记录介质和方法及装置
技术领域
本发明涉及用于解码记录在记录介质上的文本字幕流的记录介质和方法及装置。
背景技术
广泛地使用光盘作为用于记录大量数据的光学记录介质。目前,在各种各样的光盘中,正在开发诸如蓝光盘(下文称为“BD”)等一种新的高密度数字视频盘(下文称为“HD-DVD”)来记录高清晰度视频和音频数据。当前,正在建立称为下一代HD-DVD技术的BD全球标准技术规范作为能够具有显著超过常规DVD的数据的下一代光学记录解决方案,同时正在开发许多其它数字装置。
因此,也在开发应用了蓝光盘(BD)标准的光学再现装置。然而,由于蓝光盘(BD)标准尚待完善,因此,在开发完善的光学再现装置方面还存在许多难题。特别地,为了有效地从蓝光盘(BD)再现数据,不仅应提供主AV数据以及用户的便利所需的各种数据(诸如作为与主AV数据有关的补充数据的字幕信息),而且还应当系统化和提供用于再现记录在光盘中的主数据和字幕数据的管理信息。
然而,在当前的蓝光盘(BD)标准中,由于补充数据(尤其是字幕信息)的标准尚未完全统一,因此在对基于蓝光盘(BD)的光学再现装置的大规模开发中存在许多限制。并且,这些限制在向用户提供诸如字幕等补充数据时会造成问题。
发明公开
因此,本发明针对一种用于对记录在记录介质上的字幕文本流进行解码的文本字幕解码器和方法,该解码器和方法基本上消除了由于现有技术的限制和缺点所引起的一个或多个问题。
本发明的一个目的是提供一种记录介质,包括定义一组用户控制样式的对话样式段,每一用户控制样式能够改变由区域样式指定的区域呈现属性中的至少一个。
本发明的另一目的是提供一种通过使用用户控制样式来对文本字幕流进行解码的方法和装置,该用户控制样式改变由区域样式指定的区域呈现属性的至少一个。
本发明的其它优点、目的和特征的一部分将在以下描述中阐述,而另一部分在仔细阅读了以下内容之后会对本领域的技术人员显而易见,或者可从对本发明的实践中获知。本发明的目的和其它优点可通过书面描述和所附权利要求书以及附图中特别指出的结构来实现和获得。
为实现这些目的和其它优点,并根据本发明的意图,如此处所具体化并宽泛地描述的,一种记录介质包括储存至少一个文本字幕流的数据区,每一文本字幕流包括定义一组要应用于对话文本的至少一个区域的区域样式的对话样式段。每一文本字幕流还包括至少一个对话呈现段,每一对话呈现段包含对话文本的至少一个区域并链接到该组区域样式中的至少一个。该对话样式段还对每一区域样式定义了一组用户控制样式,其中每一用户控制样式是可选择的,并被配置成改变由对应的区域样式指定的区域呈现属性中的至少一个。例如,每一用户控制样式可指定区域水平位置、区域垂直位置、文本水平位置、文本垂直位置、行距以及字体大小中的至少一个的变化的方向和大小,所有这些都在对应的区域样式中指定。
在本发明的另一方面,提供了一种用于对记录在记录介质上的文本字幕流进行解码的方法和装置。一种字幕加载缓冲器加载该文本字幕流,该文本字幕流包括定义一组区域样式的对话样式段以及至少一个对话呈现段。每一对话样式包含对话文本的至少一个区域,并链接到该组区域样式中的至少一个。该对话样式段还对每一区域定义了一组用户控制样式,其中每一用户控制样式是可选择的,并被配置成改变由对应的区域样式指定的区域呈现属性中的至少一个。文本字幕解码器能够使用链接的区域样式和对话呈现段中定义的该组用户控制样式之一来对每一对话呈现段进行解码。
每一用户控制样式可指定由对应的区域样式指定的区域呈现属性的改变的方向和大小。区域呈现属性包括区域水平位置、区域垂直位置、文本水平位置、文本垂直位置、行距以及字体大小中的至少一个,这些都是在对应的区域样式中指定的。
可以理解,本发明的以上概括描述和以下详细描述都是示例性和解释性的,且旨在提供对要求保护的本发明的进一步解释。
附图说明
附图被包括在内以提供对本发明的进一步理解,并结合在本申请中构成其一部分,附图示出了本发明的实施例,并连同说明书一起用于解释本发明的原理。附图中:
图1根据本发明的一个示例示出了记录在光盘上的数据文件的文件结构;
图2根据本发明的一个示例示出了光盘的数据存储区;
图3示出了当再现文本字幕流和主AV流时呈现在显示屏幕上的文本字幕和主图像;
图4是示出播放列表对主AV剪辑和文本字幕剪辑的再现控制的示意图;
图5A根据本发明的一个示例示出了呈现在显示屏幕上的对话;
图5B根据本发明的一个示例示出了对话的区域;
图5C根据本发明的一个示例示出了用于对话区域的区域和行内样式;
图6A示出了文本字幕对话按呈现时间戳(PTS)间隔在显示屏幕上的呈现;
图6B示出了按PTS间隔呈现在显示屏幕上的文本字幕对话之间的连续性;
图7A根据本发明的一个示例示出了文本字幕流文件;
图7B根据本发明的一个示例示出了包括在文本字幕流中的DPU和DSU内所包含的特定信息;
图8根据本发明的一个示例示出了用于文本字幕流的句法;
图9A根据本发明的一个示例示出了用于对话样式单元的句法;
图9B根据本发明的一个示例示出了用于包括在对话样式单元中的对话单元组的句法;
图9C根据本发明的一个示例示出了用于包括在对话样式组中的用户可改变样式组的句法;
图10示出了根据本发明的用于解码主AV流和文本字幕流的装置的示例;以及
图11示出了根据本发明的用于对记录在光盘上的文本字幕流进行解码的方法的示例。
实现本发明的最佳方式
现在将详细参考本发明的较佳实施例,其示例在附图中示出。只要有可能,就在所有附图中使用相同的参考标号来表示相同或相似的部分。
在该详细描述中,主数据表示属于由作者记录在光盘中的标题(例如,电影标题)的音频/视频(AV)数据。一般而言,AV数据以MPEG2格式记录,且通常被称为AV流或主AV流。另外,补充数据表示再现主数据所需的所有其它数据,其示例有文本字幕流、交互式图形流、演示图形流、以及补充音频流(例如,用于可浏览幻灯片)。这些补充数据流可用MPEG2格式或任何其它数据格式来记录。它们可与AV流多路复用,或者可作为独立的数据文件存在于光盘中。
字幕表示对应于正被再现的视频(图像)数据的说明信息,并且它可用预定的语言来表示。例如,当用户选择在观看显示屏幕上的图像的同时查看用各种语言表示的多个字幕之一时,在显示屏幕的预定部分上显示对应于所选择的字幕的说明信息。如果所显示的说明信息是文本数据(例如,字符),则所选择的字幕常被称为文本字幕。根据本发明的一方面,可将MPEG2格式的多个文本字幕流记录在光盘中,并且它们可作为多个独立的流文件而存在。每一文本字幕流文件包括用于文本字幕的文本数据以及再现该文本数据所需的再现控制数据。根据本发明的另一方面,仅将MPEG2格式的单个文本字幕流记录在光盘中。
图1根据本发明示出了记录在光盘(其一个示例是蓝光盘(后文称为“BD”))中的数据文件的文件结构。参考图1,至少一个BD目录(BDMV)被包括在根目录(root)中。每一BD目录包括索引文件(index.bdmv)和对象文件(MovieObject.bdmv),它们用于与一个或多个用户交互。例如,索引文件可包含表示具有多个可选择菜单和电影标题的索引表的数据。每一BD目录还包括四个文件目录,这些目录包括要再现的音频/视频(AV)数据和再现该AV数据所需的各种数据。
包括在每一BD目录中的文件目录有流目录(STREAM)、剪辑信息目录(CLIPINF)、播放列表目录(PLAYLIST)、以及辅助数据目录(AUX DATA)。首先,流目录(STREAM)包括具有特定数据格式的音频/视频(AV)流文件。例如,AV流文件可以采用MPEG2传输分组的形式,并且被命名为“*.m2ts”,如图1所示。流目录还可包括一个或多个文本字幕流文件,其中每一文本字幕流文件包括用于以特定语言表示的文本字幕的文本(例如,字符)数据以及该文本数据的再现控制信息。文本字幕流文件作为独立的流文件存在于流目录中,并且可被命名为“*.m2ts”或“*.txtst”,如图1所示。包括在流目录中的AV流文件或文本字幕流文件通常被称为剪辑流文件。
接着,剪辑信息目录(CLIPINF)包括分别对应于包括在流目录中的流文件(AV或文本字幕)的剪辑信息文件。每一剪辑信息文件包含对应的流文件的属性和再现定时信息。例如,剪辑信息文件可包括映射信息,其中呈现时间戳(PTS)和源分组号(SPN)通过入口点映射(EPM)来一对一映射。使用映射信息,可从由播放项(PlayItem)或子播放项(SubPlayItem)提供的定时信息(进入时间(In-Time)和离开时间(Out-Time)中确定流文件的特定位置,这些将在下文中详细讨论。在行业标准中,每一对流文件及其对应的剪辑信息文件被指定为一个剪辑。例如,包括在CLIPINF中的01000.clpi包括STREAM中所包括的01000.m2ts的属性和再现定时信息,并且01000.clpi和01000.m2ts形成一个剪辑。
回头参考图1,播放列表目录(PLAYLIST)包括一个或多个播放列表文件(*.mpls),其中每一播放列表文件包括指定至少一个主AV剪辑和该主AV剪辑的再现时间的至少一个播放项(PlayItem)。更具体地,播放项包含指定进入时间和离开时间的信息,该时间表示由播放项中的Clip_Information_File_Name(剪辑信息文件名)指定的主AV剪辑的再现开始和结束时间。因此,播放列表文件表示一个或多个主AV剪辑的基本再现控制信息。另外,播放列表文件还可包括子播放项(SubPlayItem),它表示文本字幕流文件的基本再现控制信息。当子播放项被包括在播放列表文件中以再现一个或多个文本字幕流文件时,将子播放项与播放项同步。另一方面,当子播放项用于再现可浏览幻灯片时,它可以不与播放项同步。根据本发明,子播放项的主要功能是控制一个或多个文本字幕流文件的再现。
最后,辅助数据目录(AUX DATA)可包括补充数据流文件,其示例是字体文件(例如,*.font或*.otf)、弹出菜单文件(未示出)和用于生成嘀嗒声的声音文件(例如,Sound.bdmv)。先前提到的文本字幕流文件可被包括在辅助数据目录而非流目录中。
图2根据本发明示出了光盘的数据存储区。参考图2,光盘包括占据光盘卷的最内部分的文件系统信息区、占据光盘卷的最外部分的流区、以及占据文件系统信息区和流区之间的数据库区。在文件系统信息区中,储存了用于管理如图1所示的整个数据文件的系统信息。接着,在流区中储存AV流和一个或多个文本字幕流。图1所示的通用文件、播放列表文件和剪辑信息文件被储存在光盘卷的数据库区中。如上所述,通用文件包括索引文件和对象文件,而播放列表文件和剪辑信息文件包括再现储存在流区中的AV流和文本字幕流所需的信息。使用储存在数据库区和/或流区中的信息,用户能够选择特定的回放模式,并按所选择的回放模式再现主AV和文本字幕流。
图3示出了当再现文本字幕流和主AV流时呈现在显示屏幕上的文本字幕和主图像。当同步再现主AV和对应的文本字幕流时,该主图像和文本字幕同时显示在显示屏幕上。
图4是示出播放列表对主AV剪辑和文本字幕剪辑的再现控制的示意图。参考图4,播放列表文件包括控制至少一个主AV剪辑的再现的至少一个播放项,以及控制多个文本字幕剪辑的再现的子播放项。图4所示的用于英语和韩语文本字幕的文本字幕剪辑1和文本字幕剪辑2之一可与主AV剪辑同步,以使主图像和对应的文本字幕在特定的呈现时间同时显示在显示屏幕上。为了在显示屏幕上显示文本字幕,需要显示控制信息(例如,位置和大小信息)和呈现时间信息,其示例在图5A到5C中示出。
图5A根据本发明示出了呈现在显示屏幕上的对话。对话表示在给定呈现时间期间显示在显示屏幕上的整个文本字幕数据。一般而言,对话的呈现时间可用呈现时间戳(PTS)来表示。例如,图5A所示的对话的呈现在PTS(k)处开始,并在PTS(k+1)处结束。因此,图5A所示的对话表示在PTS(k)和PTS(k+1)之间显示在显示屏幕上的整个文本字幕数据单元。对话包括字幕文本(字符)的至少一行。当对话中有两行或多行字幕文本时,可根据为该对话定义的样式来显示整个文本数据。包括在一个对话中的字符的最大个数可被限于约100。
另外,图5B根据本发明示出了对话的区域。区域表示在给定呈现时间期间显示在显示屏幕上的文本字幕数据(对话)的划分部分。换言之,对话包括至少一个区域,且每一区域可包括至少一行字幕文本。表示区域的整个字幕文本数据可根据分配给该区域的区域样式(全局样式)显示在显示屏幕上。包括在对话中的区域的最大个数应基于字幕数据的期望解码速率来确定,因为区域数越大,导致解码率越低。例如,对话的区域的最大个数可被限于2,以实现合理的高解码速率。然而,最大个数可以为其它目的而大于2。
图5C根据本发明示出了用于对话的区域的样式信息。样式信息表示定义显示包括在对话中的区域的至少一部分所需的属性的信息。样式信息的一些示例是位置、区域大小、背景色、文本对齐、文本流向信息以及许多其它信息。样式信息可被分类成区域样式信息(全局样式信息)和行内样式信息(局部样式信息)。区域样式信息定义了应用于对话的整个区域的区域样式(全局样式)。例如,区域样式信息可包含区域的区域位置、区域大小、字体颜色、背景色、文本流向、文本对齐、行距、字体名称、字体样式以及字体大小中的至少一个。例如,两个区域样式被应用于区域1和区域2,如图5C所示。位置1、大小1和蓝色背景色的区域样式被应用于区域1,而位置2、大小2和红色背景色的不同的区域样式被应用于区域2。
另一方面,行内样式信息定义了应用于包括在区域中的文本串的一个特定部分的行内样式(局部样式)。例如,行内样式信息可包含字体类型、字体大小、字体样式以及字体颜色中的至少一个。文本串的特定部分可以是区域内的整个文本行或文本行的特定一部分。参考图5C,一个特定的行内样式被应用于区域1中包括的文本部分“mountain”。换言之,文本串的该特定部分的字体类型、字体大小、字体样式和字体颜色的至少一个不同于区域1内的文本串的其余部分。
图6A示出了文本字幕对话按呈现时间戳(PTS)间隔在显示屏幕上的呈现。在PTS1到PTS6之间有4个对话要显示。更具体低,对话#1仅有一个区域,且文本#1在PTS1到PTS2之间被显示在该区域内。接着,对话#2具有区域1和区域2,且文本#1和文本#2在PTS2到PTS3之间分别被显示在区域1和区域2内。之后,对话#3也仅有一个区域,且文本#2在PTS3和PTS4之间被显示在该区域内。在PTS4到PTS5之间没有任何对话要呈现,且文本#3在PTS5到PTS6之间被显示在对话#4的区域内。定义对话的信息包括对话呈现时间信息和对话文本数据,对话文本数据包括样式信息和要显示在对话的每一区域内的文本串。呈现时间信息的一个示例是一组PTS开始和PTS结束,并且样式信息包括上述区域(全局)样式信息和行内(局部)样式信息。图6A中示出可将不同的样式信息组应用于对话。
图6B示出了按PTS间隔呈现在显示屏幕上的文本字幕对话之间的连续性。参考图6B,对话#1的呈现结束时间与对话#2的呈现开始时间相同。因此,对话#1和对话#2之间存在连续性。文本#1在对话#1的区域内的显示与文本#1在对话#2的区域1中的显示连续。换言之,两个对话的PTS间隔是连续的,且在两个区域中呈现文本#1时使用了相同的样式信息(区域和行内)。类似地,在对话#2和对活#3之间存在另一连续性,因为文本#2在对话#2的区域2中的显示与文本#2在对话#3的区域中的显示连续。为确保显示相同的字幕文本的两个接连的对话之间的连续性,对话的呈现时间(PTS间隔)必须是连续的。另外,当分别在各区域中呈现同一文本时,必须使用相同的区域和行内样式信息。回头参考图6B,在对话#3和对话#4之间没有连续性,因为其PTS间隔不是连续的。可在当前对话的呈现信息中包括一指示符(例如,continuous_presentation_flag(连续呈现标志))以指示对话是否与前一对话连续。
图7A根据本发明示出了文本字幕流文件(例如,图1所示的10001.m2ts)。它可以由包括多个传输分组(IP)的MPEG2传输流构成,所有这些都具有相同的分组标识符(例如,PID=0x18xx)。当光盘播放器接收到包括特定文本字幕流的许多输入流时,它使用其PID找出属于该文本字幕流的所有传输分组。参考图7A,传输分组的每一子集形成了分组流元(PES)分组。图7A所示的PES分组之一对应于定义一组区域样式的对话样式单元(DSU)。DSU通常也被称为对话样式段(DSS)。所有其余的PES分组对应于对话呈现单元(DPU),其每一个包括用于具有至少一个区域的对话的呈现时间,以及包括每一区域的区域样式指示符、行内样式信息和文本串的对话文本数据。类似地,DPU通常也被称为对话呈现段(DPS)。
图7B根据本发明示出了包含在文本字幕流中所包括的DPU和DSU内的特定信息。DSU包含定义一组区域样式的信息集,其每一个被应用于对话的一个对应区域。另外,DPU包含用于对话的对话文本数据和对话呈现信息。对话文本数据包括要被包括在对话的每一区域中的文本串、要应用于文本串的特定部分的行内样式信息、以及指示要应用于每一对话区域的区域样式的区域样式标识符。区域样式标识符标识了DSU内定义的该组区域样式中的一个。另一方面,对话呈现信息包括对话的呈现时间信息和调色板(颜色)更新信息。呈现时间信息可包括在显示屏幕上呈现对话的呈现开始时间(例如,PTS_start(PTS开始))和呈现结束时间(例如,PTS_end(PTS结束)),而调色板更新信息可包括指示是否更新对话的显示颜色的指示符(例如,palette_update_flag(调色板更新标志))以及当更新显示颜色时要应用的调色板信息(例如,用于更新的调色板(Palette))。
包括在文本字幕流中的所有数据可基于其基本功能被分类成三种类型的数据。例如,数据可被分类成对话文本数据、合成信息和表现信息,如图7B所示。对话文本数据包括对话的每一区域的文本串、行内样式信息和区域样式标识符。合成信息包括呈现时间信息,其示例是呈现开始和结束时间、对话区域的位置信息以及对话的调色板更新信息。最后,表现信息包括将文本串表现为图形数据以呈现所需的信息。参考图7B,包括在DSU中的每一区域的水平和垂直位置是合成信息的一部分,而包括在DSU中的区域宽度、区域高度、字体颜色、背景色、文本流向、文本对齐、行距、字体名称、字体样式和字体大小表示表现信息。
DSU包括分别定义有限个数的作者定义区域样式的一组区域样式信息(对话样式集)。例如,DSU中定义的区域样式的最大个数可被限于60,且区域样式可由其区域样式标识符(region_sytle_id(区域样式id))来标识。因此,作者在光盘中储存仅定义了有限个数的区域样式的DSU。区域样式由光盘播放器在再现记录在光盘上的文本字幕流时使用。或者,光盘播放器可使用可从其它来源提供的由另一组样式信息定义的其它区域样式。来源的一个示例是包括在光盘播放器中的本地数据存储。结果,从记录在光盘上的文本字幕流再现的字幕区域可具有各种区域样式。图8根据本发明的一个示例示出了用于文本字幕流的句法(Text_subtitle_stream()(文本字幕流))。如先前提到的,文本字幕流句法包括包含分别定义一组区域样式的一组信息的用于对话样式单元的句法(dialog_style_unit()(对话样式单元)),以及用于多个对话呈现单元的句法(dialog_presentation_unit()(对话呈现单元)),其中每一DPU句法包括对话文本的对话呈现信息和至少一个区域。对话文本的每一区域包括区域样式标识符、一个或多个文本串、以及行内样式信息,并且对话样式标识符标识了DSU句法中定义的该组区域样式中的一个。图9A示出了包括在图8所示的文本字幕流句法中的用于对话样式单元的句法(dialog_style_unit())。对话样式单元句法包括用于其中定义了一组作者定义区域样式的对话样式集的句法(dialog_styleset()(对话样式集))。图9B示出了包括在图9A所示的对话样式单元句法中的用于对话样式集的句法(dialog_styleset())。对话样式集句法包括分别定义一组区域样式的一组区域样式信息(region_style()(区域样式)),以及指示作者是否准许播放器为文本字幕生成除region_style()中定义的该组作者定义样式之外的其自己的一组样式(播放器样式)的数据字段或标志(player_style_flag(播放器样式标志))。对话样式集句法还包括用于定义一组用户控制样式的用户可改变样式集的句法(user_changable_styleset()(用户可改变样式集))。
参考图9B,区域样式标识(region_stlyle_id)分别被分配给该组区域样式(region_style()),且每一区域样式信息表示要应用于对话文本的一个区域的整个部分的全局样式信息。包括在每一区域的DPU中的区域样式标识符包括区域样式标识之一。因此,当再现包含在每一DPU中的对话文本的至少一个区域时应用对应于区域样式标识符的区域样式。
现在将详细参考每一区域样式(region_style())中定义的特定区域呈现属性。区域水平位置(region_horizontal_position)指定了区域的左上角像素在图形平面中的水平地址,而区域垂直位置(region_vertical_position)指定了区域的左上角像素在图形平面中的垂直地址。另外,区域宽度(region_width)指定了区域矩形从区域水平位置开始的水平长度,而区域高度(region_height)指定了区域矩形从区域垂直位置开始的垂直长度。区域背景色索引(region_bg_color_index)指定了指示区域的背景色的索引值。
另外,文本水平位置(text_horizontal_position)指定了区域中的文本原点的水平地址,而文本处置位置(text_vertical_position)指定了区域中的文本原点的垂直地址。文本流向(text_flow)指定了区域中的字符行进(从左到右或从右到左)和行行进(从上到下或从下到上)中的至少一个。文本对齐(text_alignment)指定了区域中所表现的文本的对齐(左、中或右)。当对话具有一个以上区域时,必须向所有区域应用同一文本流向,以防止观众的混淆。回头参考图9B,行距(line_space)指定了区域中的两行相邻文本之间的距离。字体标识(font_id)指示了剪辑信息文件中所指定的字体标识。字体样式(font_style)指定了区域中的文本的字体样式,其示例有常规、加粗、倾斜和加粗倾斜。字体大小(font_size)指定了区域中的文本的字体大小,其示例有以像素为单位的字符的垂直大小。最后,字体颜色索引(font_color_index)指定了指示区域中的文本的颜色的索引值。
图9B所示的播放器样式标志(player_style_flag)指示了作者是否准许播放器为文本字幕生成和/或使用除光盘中定义的作者定义区域样式之外的其自己的一组样式(播放器样式),它可被预先储存在光盘播放器的本地数据存储中。例如,如果播放器样式标志的值被设为1b,则作者准许播放器生成和/或使用其自己的一组播放器样式。另一方面,如果播放器样式标志的值被设为0b,则作者禁止播放器生成和/或使用该组播放器样式。
图9C示出了包括在图9B所示的对话样式集句法中的用于用户可改变样式集的句法(user_changeable_styleset())。user_changeable_styleset()包括定义一组用户控制样式的一组用户控制样式信息(user_control_style()(用户控制样式)),其中每一用户控制样式被配置成改变由对应的区域样式指定的区域呈现属性的至少一个。通过选择该组用户控制样式中的一个,用户能够以非常简单的方式改变每一区域的区域样式。然而,如果由区域样式指定的所有属性都可由用户改变,则用户对对话的显示控制可能非常困难。鉴于此原因,可由用户控制样式改变的区域呈现属性可被限于区域水平位置、区域垂直位置、字体大小、文本水平位置、文本垂直位置和行距中的至少一个。
根据图9B和图9C,为具有区域样式ID的每一区域样式定义一组用户控制样式,且将用户样式ID(user_style_id)分别分配给该组用户控制样式。为每一区域样式定义的用户控制样式的最大个数可限于25。由于对话样式集中定义的区域样式的最大个数限于60,因此为DPU定义的用户可改变样式的总数必须小于等于1500。
参考图9C,为了改变区域水平位置,用户控制样式可包括指定区域水平位置的水平移动的方向的区域水平位置方向(region_horizontal_position_ditection)以及以像素为单位指定水平移动数量的区域水平位置增量(region_horizontal_position_delta)。例如,如果水平位置方向被设为0,则水平移动可以是在向右的方向上,而如果被设为1,则可以是在向左的方向上。为了改变区域垂直位置,用户控制样式可包括指定区域水平位置的垂直移动的方向的区域垂直位置方向(region_vertical_position_direction)以及以像素为单位指定垂直移动的数量的区域垂直位置增量(region_vertical_position_delta)。例如,如果垂直位置方向被设为0,则垂直移动可以是在向下的方向上,而如果被设为1,则可以是在向上的方向上。此外,为了改变由带有区域样式ID的区域样式定义的字体大小,用户控制样式可包括指定字体大小改变的方向的字体大小改变方向(font_size_inc_dec),以及以像素为单位指定字体大小改变的数量的字体大小增量(font_size_delta)。例如,如果font_size_inc_dec被设为0,则字体大小增大,而如果设为1,则减小。
根据本发明的用户可改变样式集的某些特性特征如下。首先,为对话样式单元中定义的一组区域样式的每一个定义一组用户控制样式,且该组控制样式的个数是固定的。因此,分别为两个不同的区域样式定义的用户控制样式的个数是相同的。要在再现对话文本的每一区域时使用的该组用户控制样式的个数是固定的。其次,分别由不同的用户样式ID来标识该组用户控制样式。第三,区域呈现属性中的所有改变都由单个用户控制样式来组合定义。例如,区域水平位置和字体大小不由两个不同的用户控制样式来单独改变。它们由单个用户控制样式来组合改变。第四,某一属性的改变以其方向和大小而非实际属性值来表示。实际属性值可通过向区域样式中定义的原始属性值应用改变的大小(增量)和方向来获得。
总之,当作者在光盘中记录主AV流时,作者也记录至少一个文本字幕流。每一文本字幕流包括定义一组对话样式的DSU和多个DPU。该组区域样式具有不同的区域样式ID。DSU还对每一区域样式定义一组用户控制样式,其中该用户控制样式具有不同的用户样式ID。每一用户控制样式被配置成改变由对应的区域样式指定的作者定义区域呈现属性中的至少一个。另外,对话样式集包括指示作者是否准许播放器对文本字幕生成和/或使用除作者定义样式集之外的其自己的一组播放器样式的播放器样式标记。
现在将详细参考根据本发明的用于对主AV流和文本字幕流解码的装置,其一个示例在图10中示出。该装置包括用于基于其分组标识符将输入流分成视频流、音频流、图形流和文本字幕流的分组标识符(PID)过滤器5、用于对视频流解码的视频解码部分20、用于对音频流解码的音频解码部分10、用于对图形流解码的图形解码部分30、以及用于对文本字幕流解码的文本字幕解码部分40。
文本字幕流可从光盘或从附加的外部源提取,如图10所示。鉴于此原因,该装置另外包括选择输入数据源的开关6。因此,如果文本字幕流是从光盘中提取的,则开关6选择连接到PID过滤器5的数据线A。另一方面,如果它们是从外部源输入的,则开关6选择连接到外部源的线B。
回头参考图10,音频解码部分10、视频解码部分20和图形解码部分30分别包括用于储存要解码的流数据的传输缓冲器11、21和31。视频平面(VP)23和图形平面33分别被包括在视频解码部分20和图形解码部分30中,用于将经解码的信号转换成可显示的视频和图形图像。图形解码部分30包括用于控制可显示图形图像的颜色和透明程度的颜色查找表(CLUT)34。
当文本字幕解码部分40从开关6接收到支持单个语言的文本字幕流时,可将文本字幕流的整个部分一次性预加载到字幕预加载缓冲器(SPB)41中。或者,当有一个以上支持多语言的文本字幕流时,可将所有文本字幕流一次性预加载到SPB41中。因此,SPB 41的大小应当基于从开关6接收到的文本字幕流文件的总数来确定。例如,SPB 41的大小应当大于或等于0.5兆字节来预加载0.5兆字节文本字幕流文件。另外,为了确保当用户在两个0.5兆字节文本字幕流文件之间切换时文本字幕的无缝呈现,SPB 41的大小应当大于或等于1兆字节。SPB 41的大小应当足够大以一次性预加载所有所需的文本字幕流文件。
图10所示的文本字幕解码部分40还包括用于储存可被包括在图1所示的辅助数据目录中的所有相关联字体文件的字体预加载缓冲器(FPB)410。类似地,FPB 410的大小应当足够大以一次性预加载所有所需的字体文件,以确保支持一种或多种语言的文本字幕的无缝呈现。由于所有可用的文本字幕流文件和相关的字体文件都被预加载,因此可用简单的方式来完成预加载数据的提取和使用。鉴于此原因,SPB 41和FPB 410也可以相当简单。文本字幕解码部分40还包括对储存在SPB 41中的每一文本字幕流解码的文本字幕解码器42、其中将经解码的字幕数据组成为可显示字幕图像的图形平面43、以及控制经转换的字幕图像的颜色和透明程度中的至少一个的颜色查找表(CLUT)44。
文本字幕解码部分40还包括本地数据存储45,它储存定义要在再现预加载到SPB 41中的文本字幕流时选择性地使用的一组播放器样式的播放器样式集。另外,本地数据存储45还可存储指定要在再现文本字幕流时选择性地使用的一组用户控制样式的用户可改变集。该用户可改变集可类似于其一个示例在图9C中示出的包括在DSU中的用户可改变集。
在本发明的第一方面,每一播放器样式表示为对话文本的区域指定一组完整的区域呈现属性的区域样式,这些属性的示例有区域水平位置、区域垂直位置、区域宽度、区域高度、区域背景色索引、文本水平位置、文本垂直位置、文本流向、文本对齐、行距、字体标识、字体样式、字体大小和字体颜色索引。在这一情况下,储存在本地数据存储45中的该组播放器样式独立于DSU中定义的一组区域样式来使用。
在本发明的第二方面,每一播放器样式被配置成重新定义最初由DSU中定义的区域样式所定义的区域呈现属性中的至少一个。例如,如果DSU中定义的区域样式定义了包括字体标识的一组完整的区域呈现属性,且播放器样式重新定义了字体标识,则组合使用重新定义的字体标识和由区域样式指定的所有其它属性。
在本发明的第三方面,每一播放器样式可被配置成改变最初由DSU中定义的区域样式所定义的区域呈现属性中的至少一个。例如,播放器样式可指定区域样式中定义的区域水平位置的改变的方向和大小。在这一情况下,播放器样式集类似于其示例在图9C中示出的用户可改变集。
图11示出了根据本发明的一个示例对记录在光盘上的文本字幕流进行解码的方法。在文本字幕解码器42开始再现预加载到SPB 41中的文本字幕流之后,它最初读取包括在DSU中的player_style_flag,以确定储存在本地数据存储45中的播放器样式集的使用是否被准许(S110)。例如,如果player_style_flag被设为0b,则对播放器样式集的使用不被准许。在这一情况下,文本字幕解码器42必须使用记录在光盘上的作者定义区域样式(S110)。另一方面,如果player_style_flag被设为1b,则准许文本字幕解码器42使用储存在本地数据存储45中的播放器样式集。然后,文本字幕解码器42独立地判定是否使用播放器样式集中定义的一组播放器样式中的任一个(S112)。例如,文本字幕解码器42可将该组播放器样式与文本字幕流中定义的区域样式进行比较,并对步骤S112的判定使用该比较的结果。如果在步骤S112判定不使用该组播放器样式,则使用记录在光盘上的区域样式(S111)。另一方面,如果在步骤S112中判定要使用该组播放器样式,则文本字幕解码器42可独立地使用它们或与记录在光盘上的该组区域样式组合使用。
另外,当文本字幕解码器42对DPU进行解码时,它可使用由包括在DPU中的区域样式标识符标识的区域样式。如果用户希望改变这一区域样式,则他或她可输入改变区域样式的命令。通过选择由DSU中定义的用户可改变样式集所定义的一组用户控制样式中的一个,可改变区域水平位置、区域垂直位置和字体大小中的至少一个。
图10所示的装置还包括叠加从视频解码部分20、图形解码部分30和文本字幕解码部分40输出的图像的图像叠加部分50。这些组合的图像被显示在显示屏幕上,如图3所示。一般而言,从视频解码部分20的VP 23输出的视频图像可被显示为显示屏幕的背景,而从图形解码部分30和/或文本字幕解码部分40输出的图像可按预定的顺序叠加在视频图像上。例如,如果图形解码部分30的输出图像是演示图形图像,则这些图像最初可由第一累加器52叠加在视频图像上,然后,可由第二累加器53将来自文本字幕解码部分40的文本字幕图像叠加在视频图像上。然而,如果图形解码部分30的输出图像是交互式图形图像,则来自文本字幕解码部分40的文本字幕图像最初可由第一累加器52叠加在视频图像上。之后,交互式图形图像可由第二累加器53进一步叠加在叠加了字幕的图像上。
最后,图10所示的装置还包括用于对输入传输流(例如,MPEG传输流)进行解码的系统解码器4,以及用于控制上述装置的所有组件的操作的微处理器3。
工业适用性
本领域的技术人员可以清楚,可在不脱离本发明的精神或范围的情况下对本发明进行各种修改和变化。由此,本发明旨在覆盖本发明的各种修改和变化,只要它们落入所附权利要求书及其等效技术方案的范围内即可。根据本发明,对对话样式段中定义的每一区域样式定义多个用户控制样式。每一用户控制样式可由用户选择,并被配置成改变由对应的区域样式指定的区域呈现属性。因此,用户可具有选择各种用户控制样式中的一个的选项。

Claims (15)

1.一种用于再现文本字幕流的记录介质,包括:
储存至少一个文本字幕流的数据区,每一文本字幕流包括定义要应用于对话文本的至少一个区域的一组区域样式的对话样式段,所述对话样式段还为每一区域样式定义了一组用户控制样式,每一用户控制样式是可选择的并被配置成改变由对应的区域样式指定的区域呈现属性中的至少一个。
2.如权利要求1所述的记录介质,其特征在于,所述对话样式段包括指示所述一组区域样式的个数的数据字段。
3.如权利要求2所述的记录介质,其特征在于,所述一组区域样式的个数小于或等于60。
4.如权利要求1所述的记录介质,其特征在于,所述对话样式段包括指示在所述对话样式段中为每一区域样式定义的所述一组用户控制样式的个数的数据字段。
5.如权利要求4所述的记录介质,其特征在于,为每一区域样式定义的所述一组用户控制样式的个数小于或等于25。
6.如权利要求1所述的记录介质,其特征在于,每一用户控制样式指定由所述对应的区域样式指定的区域呈现属性的至少一个中的改变的方向和大小。
7.如权利要求1所述的记录介质,其特征在于,所述区域呈现属性包括区域水平位置、区域垂直位置、文本水平位置、文本垂直位置、行距和字体大小中的至少一个。
8.如权利要求1所述的记录介质,其特征在于,每一用户控制样式指定了所述对应的区域样式中指定的区域水平位置、区域垂直位置、文本水平位置、文本垂直位置、行距和字体大小的至少一个中的改变的方向和大小。
9.如权利要求1所述的记录介质,其特征在于,所述对话样式段包括指示是否准许播放器生成除所述对话样式段中定义的所述一组区域样式之外的其自己的一组播放器样式的播放器样式标志。
10.一种用于再现文本字幕流的记录介质,包括:
储存至少一个文本字幕流的数据区,每一文本字幕流包括定义一组区域样式的对话样式段以及至少一个对话呈现段,每一对话呈现段包括对话文本的至少一个区域并被链接到所述一组区域样式中的至少一个,所述对话样式段还为每一区域样式定义一组用户控制样式,每一用户控制样式是可选择的并被配置成改变由对应的区域样式指定的区域呈现属性中的至少一个。
11.一种用于对记录在记录介质上的文本字幕流进行解码的方法,所述方法包括:
将所述文本字幕流加载到字幕加载缓冲器中,所述文本字幕流包括定义一组区域样式的对话样式段以及至少一个对话呈现段,每一对话呈现段包含对话文本的至少一个区域并且被链接到所述一组区域样式中的至少一个,所述对话样式段还为每一区域样式定义一组用户控制样式,每一用户控制样式是可选择的并被配置成改变由对应的区域样式指定的至少一个区域呈现属性;以及
使用所链接的区域样式和所述一组用户控制样式中的一个对每一对话呈现段解码。
12.如权利要求11所述的方法,其特征在于,每一用户控制样式指定了由所述对应的区域样式指定的区域呈现属性的至少一个中的改变的方向和大小。
13.如权利要求11所述的方法,其特征在于,所述区域呈现属性包括区域水平位置、区域垂直位置、文本水平位置、文本垂直位置、行距和字体大小中的至少一个。
14.如权利要求11所述的方法,其特征在于,每一用户控制样式指定所述对应的区域样式中指定的区域水平位置、区域垂直位置、文本水平位置、文本垂直位置、行距和字体大小的至少一个中的改变的方向和大小。
15.一种用于对记录在记录介质上的文本字幕流进行解码的装置,所述方法包括:
被配置成将所述文本字幕流加载到字幕预加载缓冲器的字幕加载缓冲器,所加载的文本字幕流包括定义一组区域样式的对话样式段和至少一个对话呈现段,每一对话呈现段包含对话文本的至少一个区域并且被链接到所述一组区域样式中的至少一个,所述对话样式段还为每一区域样式定义一组用户控制样式,每一用户控制样式是可选择的,并被配置成改变由对应的区域样式指定的区域呈现属性中的至少一个;以及
被配置成使用所链接的区域样式和所述一组用户控制样式中的一个对每一对话呈现段进行解码的文本字幕解码器。
CN 200580004499 2004-02-10 2005-01-12 用于解码文本字幕流的记录介质和方法及装置 Pending CN1918650A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US54285004P 2004-02-10 2004-02-10
US60/542,852 2004-02-10
US60/542,850 2004-02-10
US60/543,328 2004-02-11
KR1020040017935 2004-03-17

Publications (1)

Publication Number Publication Date
CN1918650A true CN1918650A (zh) 2007-02-21

Family

ID=37722648

Family Applications (8)

Application Number Title Priority Date Filing Date
CNB2004800415292A Expired - Fee Related CN100473133C (zh) 2004-02-10 2004-10-12 再现文本字幕的方法和文本字幕解码系统
CN 200480041530 Pending CN101080770A (zh) 2004-02-10 2004-10-13 具有用于管理各种数据流的数据结构的记录介质以及记录和再现的方法和装置
CN 200480042284 Pending CN1926628A (zh) 2004-02-10 2004-11-26 具有管理与不同语言相关联的数据流的数据结构的记录介质以及记录和再现方法和装置
CNB2004800415273A Expired - Fee Related CN100555438C (zh) 2004-02-10 2004-11-26 具有用于管理文本字幕的数据结构的记录介质以及记录和再现方法和装置
CN200710139867A Expired - Fee Related CN100585717C (zh) 2004-02-10 2004-11-26 在记录介质上生成、记录和再现文本字幕的方法与装置
CN 200480041531 Pending CN1914903A (zh) 2004-02-10 2004-12-08 用于解码文本字幕流的文本字幕解码器和方法
CN 200580004499 Pending CN1918650A (zh) 2004-02-10 2005-01-12 用于解码文本字幕流的记录介质和方法及装置
CN 200580004498 Pending CN1918649A (zh) 2004-02-10 2005-01-12 用于解码文本字幕流的记录介质和方法及装置

Family Applications Before (6)

Application Number Title Priority Date Filing Date
CNB2004800415292A Expired - Fee Related CN100473133C (zh) 2004-02-10 2004-10-12 再现文本字幕的方法和文本字幕解码系统
CN 200480041530 Pending CN101080770A (zh) 2004-02-10 2004-10-13 具有用于管理各种数据流的数据结构的记录介质以及记录和再现的方法和装置
CN 200480042284 Pending CN1926628A (zh) 2004-02-10 2004-11-26 具有管理与不同语言相关联的数据流的数据结构的记录介质以及记录和再现方法和装置
CNB2004800415273A Expired - Fee Related CN100555438C (zh) 2004-02-10 2004-11-26 具有用于管理文本字幕的数据结构的记录介质以及记录和再现方法和装置
CN200710139867A Expired - Fee Related CN100585717C (zh) 2004-02-10 2004-11-26 在记录介质上生成、记录和再现文本字幕的方法与装置
CN 200480041531 Pending CN1914903A (zh) 2004-02-10 2004-12-08 用于解码文本字幕流的文本字幕解码器和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN 200580004498 Pending CN1918649A (zh) 2004-02-10 2005-01-12 用于解码文本字幕流的记录介质和方法及装置

Country Status (1)

Country Link
CN (8) CN100473133C (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100727921B1 (ko) * 2004-02-28 2007-06-13 삼성전자주식회사 텍스트 기반의 서브타이틀 스트림을 기록한 저장 매체,재생 장치 및 그 재생 방법
US7529467B2 (en) 2004-02-28 2009-05-05 Samsung Electronics Co., Ltd. Storage medium recording text-based subtitle stream, reproducing apparatus and reproducing method for reproducing text-based subtitle stream recorded on the storage medium
JP4569673B2 (ja) * 2008-06-24 2010-10-27 Necカシオモバイルコミュニケーションズ株式会社 字幕付映像再生装置、字幕付映像再生方法及びプログラム
CN101764949B (zh) * 2008-11-10 2013-05-01 新奥特(北京)视频技术有限公司 一种基于区域划分的定时字幕的冲突检测方法
KR20110018261A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 텍스트 서브타이틀 데이터 처리 방법 및 재생 장치
CN103067665A (zh) * 2012-12-25 2013-04-24 天津市亚安科技股份有限公司 基于视频亮度自适应叠加字符颜色的实现方法
CN105338394B (zh) * 2014-06-19 2018-11-30 阿里巴巴集团控股有限公司 字幕数据的处理方法及系统
CN107005733B (zh) * 2014-12-19 2020-06-16 索尼公司 发送装置、发送方法、接收装置以及接收方法
CN106652983B (zh) * 2016-09-18 2021-04-02 福建网龙计算机网络信息技术有限公司 一种字幕制作方法及系统
CN108012176A (zh) * 2016-10-28 2018-05-08 深圳市中兴微电子技术有限公司 一种数据切换方法、装置及终端
CN108040277B (zh) * 2017-12-04 2020-08-25 海信视像科技股份有限公司 针对解码后得到的多语种字幕的字幕切换方法及装置
CN110109965A (zh) * 2018-02-02 2019-08-09 上海颐为网络科技有限公司 知识分享平台上建立知识结构的辅助提示方法和组件
CN108924622B (zh) * 2018-07-24 2022-04-22 腾讯科技(深圳)有限公司 一种视频处理方法及其设备、存储介质、电子设备
CN111399788B (zh) * 2018-12-29 2023-09-08 西安诺瓦星云科技股份有限公司 媒体文件播放方法和媒体文件播放装置
CN116634218B (zh) * 2023-05-25 2024-04-02 优酷网络技术(北京)有限公司 推广信息显示方法、装置、设备、介质

Also Published As

Publication number Publication date
CN1926628A (zh) 2007-03-07
CN1914903A (zh) 2007-02-14
CN100555438C (zh) 2009-10-28
CN100585717C (zh) 2010-01-27
CN1914684A (zh) 2007-02-14
CN1918649A (zh) 2007-02-21
CN101080770A (zh) 2007-11-28
CN101093709A (zh) 2007-12-26
CN1914906A (zh) 2007-02-14
CN100473133C (zh) 2009-03-25

Similar Documents

Publication Publication Date Title
US7587405B2 (en) Recording medium and method and apparatus for decoding text subtitle streams
CN1918650A (zh) 用于解码文本字幕流的记录介质和方法及装置
US7982802B2 (en) Text subtitle decoder and method for decoding text subtitle streams
US7643732B2 (en) Recording medium and method and apparatus for decoding text subtitle streams
CN1934624B (zh) 用于再现记录在记录介质上的文本字幕流的方法和装置
US20050196147A1 (en) Text subtitle decoder and method for decoding text subtitle streams
CN1934625A (zh) 用于再现和记录文本字幕流的记录介质以及方法和设备
US20050196146A1 (en) Method for reproducing text subtitle and text subtitle decoding system
CN101114498B (zh) 用于再现/记录至少一个文本字幕流的方法和装置
CN1922866A (zh) 用于再现和记录文本字幕流的记录介质和方法及装置
RU2380768C2 (ru) Носитель записи, способ и устройство для декодирования потоков текстовых субтитров
RU2378720C2 (ru) Носитель записи и способ и устройство воспроизведения и записи потоков текстовых субтитров
CN1934645A (zh) 用于再现文本字幕流的记录介质、方法和装置
KR20050094265A (ko) 고밀도 광디스크 및 고밀도 광디스크의 텍스트 서브타이틀재생 방법과 재생 장치
KR20070032289A (ko) 기록매체 및 텍스트 서브타이틀 스트림 디코딩 방법과 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20070221

C20 Patent right or utility model deemed to be abandoned or is abandoned