CN102065235B - 一种通用字幕的生成方法及装置 - Google Patents

一种通用字幕的生成方法及装置 Download PDF

Info

Publication number
CN102065235B
CN102065235B CN200910237576.9A CN200910237576A CN102065235B CN 102065235 B CN102065235 B CN 102065235B CN 200910237576 A CN200910237576 A CN 200910237576A CN 102065235 B CN102065235 B CN 102065235B
Authority
CN
China
Prior art keywords
captions
file
subtitle
xml
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200910237576.9A
Other languages
English (en)
Other versions
CN102065235A (zh
Inventor
冯永
孙季川
郑培枫
吕精华
刘衡娜
安战国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Digital Video Beijing Ltd
Original Assignee
China Digital Video Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Digital Video Beijing Ltd filed Critical China Digital Video Beijing Ltd
Priority to CN200910237576.9A priority Critical patent/CN102065235B/zh
Publication of CN102065235A publication Critical patent/CN102065235A/zh
Application granted granted Critical
Publication of CN102065235B publication Critical patent/CN102065235B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Systems (AREA)

Abstract

本发明公开了一种通用字幕的生成方法,包括:从源字幕文件中提取字幕的基本属性信息;其中,所述字幕的基本属性信息包括字幕的文件描述信息、字幕段的内容和显示属性信息;将所述字幕的文件描述信息作为第一XML元数据,以及,将字幕段的内容和显示属性信息作为第二XML元数据,按照预置规则组织为字幕XML文件。本发明可以保证网络化制播系统中字幕制播的通用性,提高系统的可扩展性,并有效降低成本。

Description

一种通用字幕的生成方法及装置
技术领域
本发明涉及视音频节目制作的技术领域,特别是涉及一种通用字幕的生成方法及一种通用字幕的生成装置。
背景技术
分离字幕是一种新兴的电视字幕制播方法,它基于视音频文件制作对白唱词等字幕,所谓分离就是在节目的视音频文件之外,生成视音频时码相关联的独立的字幕文件。分离字幕对于制作各种视音频节目,具有重要意义。
随着网络技术的发展,目前广电行业中多数电视台的节目制播系统也逐渐实现了网络化,在这种网络化的节目制播系统中,多个节目制作公司分别有自己的字幕机,分别采用自己的软件依据自己定义的描述方式对字幕进行制作和播出,而在实际中,某个公司制作的字幕往往需要在不同的字幕机上进行播出,例如,一个电视剧有可能在CCTV-4播出.也有可能在CCTV 9、CCTV-E/F等频道播出。或者,某个节目的字幕可能是由不同的两台字幕机制作的,在这种情况下,由于各个节目制作公司采用的字幕描述方式或定义的属性不同,某个公司往往不能分离出另一个公司制作的字幕,只能自己重新制作字幕,显然过于耗费人力、物力。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:如何能够创新地提出一种通用字幕的生成机制,以保证网络化制播系统中字幕制播的通用性,提高系统的可扩展性,并有效降低成本。
发明内容
本发明所要解决的技术问题是提供一种通用字幕的生成方法及装置,用以保证网络化制播系统中字幕制播的通用性,提高系统的可扩展性,并有效降低成本。
为了解决上述技术问题,本发明实施例公开了一种通用字幕的生成方法,包括:
从源字幕文件中提取字幕的基本属性信息;其中,所述字幕的基本属性信息包括字幕的文件描述信息、字幕段的内容和显示属性信息;
将所述字幕的文件描述信息作为第一XML元数据,以及,将字幕段的内容和显示属性信息作为第二XML元数据,按照预置规则组织为字幕XML文件。
优选的,所述字幕的文件描述信息进一步包括:字幕文件识别标识File ID、字幕文件格式版本号File Version、字幕文件所使用的字符集编号Code Page、字幕文件的标题名称Program、字幕文件支持的电视制式Video Standard、字幕段数量Section Count;
所述字幕段的内容和显示属性信息进一步包括:字幕段标识信息Text Section、字幕段结构信息Section Info、字幕屏内容信息Text Screen。
优选的,所述按照预置规则组织为字幕XML文件的步骤包括:
在XML文件中写入第一XML元数据,所述第一XML元数据嵌套的子元数据包括:字幕文件识别标识File ID、字幕文件格式版本号FileVersion、字幕文件所使用的字符集编号Code Page、字幕文件的标题名称Program、字幕文件支持的电视制式Video Standard、字幕段数量Section Count;
在XML文件中写入第二XML元数据,所述第二XML元数据嵌套的子元数据包括:字幕段标识信息Text Section、字幕段结构信息SectionInfo、字幕屏内容信息Text Screen。
优选的,所述字幕段结构信息Section Info进一步嵌套的子元数据包括:字幕中包含字幕屏的数量Screen Count、每个字幕屏所包含的最大字幕块数Block Count、各字幕块的显示参数Display Parameters、各字幕屏的时码模式Time Code Mode;
其中,所述各字幕块的显示参数Display Parameters进一步嵌套的子元数据包括:各字幕屏中所有字幕块的共有显示参数,包括:字幕块在屏幕上所占的位置Position、字幕块的字体Font、字幕块的排列方式Layout、字幕块的字符正面颜色Text Color;
所述字幕屏内容信息Text Screen进一步嵌套的子元数据包括:本屏字幕中各个字幕块的信息Text Block,其中,所述字幕块的信息TextBlock包括:本字幕块的字符串String。
优选的,所述第一XML元数据嵌套的子元数据包括:字幕文件的作者Author、描述文字Description、创作日期Creathion Date、修改日期Revision Date、修改版本号Revision Number和/或字幕语种Language;
所述字幕段结构信息Section Info进一步嵌套的子元数据包括:字幕段开始播出的绝对时码Start Time Code;各字幕屏中所有字幕块的共有显示参数还包括:字幕块中文本的语言编号Language、字幕块中的字符涉及Unicode字符集中的语言分区Unicode Bit Field、字幕块中字母数字的字体FontLatin、字幕块中字符的加边方式Edge、加边颜色EdgeColor、加阴影方式Shadow、阴影颜色Shadow Color、加衬底方式Background、衬底颜色Background Color和/或显示特技方式Effect。
优选的,所述源字幕文件包括多个,分别具有对应的描述方式;所述的方法还包括:
判断所述字幕的基本属性信息是否匹配预设的描述方式,若是,则执行组织字幕XML文件的步骤:否则,将所述字幕的基本属性信息转换为匹配的描述方式后,再执行组织字幕XML文件的步骤。
本发明实施例还公开了一种通用字幕的生成装置,包括:
通用属性提取模块,从源字幕文件中提取字幕的基本属性信息;其中,所述字幕的基本属性信息包括字幕的文件描述信息、字幕段的内容和显示属性信息;
XML组织模块,用于将所述字幕的文件描述信息作为第一XML元数据,以及,将字幕段的内容和显示属性信息作为第二XML元数据,按照预置规则组织为字幕XML文件。
优选的,所述字幕的文件描述信息进一步包括:字幕文件识别标识File ID、字幕文件格式版本号File Version、字幕文件所使用的字符集编号Code Page、字幕文件的标题名称Program、字幕文件支持的电视制式Video Standard、字幕段数量Section Count;
所述字幕段的内容和显示属性信息进一步包括:字幕段标识信息Text Section、字幕段结构信息Section Info、字幕屏内容信息Text Screen。
优选的,所述XML组织模块进一步包括:
第一XML组织子模块,用于在XML文件中写入第一XML元数据,所述第一XML元数据嵌套的子元数据包括:字幕文件识别标识File ID、字幕文件格式版本号File Version、字幕文件所使用的字符集编号CodePage、字幕文件的标题名称Program、字幕文件支持的电视制式VideoStandard、字幕段数量Section Count;
第二XML组织子模块,用于在XML文件中写入第二XML元数据,所述第二XML元数据嵌套的子元数据包括:字幕段标识信息TextSection、字幕段结构信息Section Info、字幕屏内容信息Text Screen。
优选的,所述源字幕文件包括多个,分别具有对应的描述方式;所述装置还包括:
判断模块,用于判断所述字幕的基本属性信息是否匹配预设的描述方式,若是,则触发XML组织模块:若否,则触发转换模块;
转换模块,用于将所述字幕的基本属性信息转换为匹配的描述方式后,触发XML组织模块。
与现有技术相比,本发明具有以下优点:
本发明通过提取源字幕文件中作为通用性数据的字幕基本属性信息,按照预置规则进行规范化定义,生成满足预设数据结构的字幕XML文件,即在实际中,网络内的各个节目制作公司均采用这种基于字幕基本属性信息生成字幕XML文件的方式制作字幕,从而使得字幕文件在不同制作公司的字幕机上都可以被解析识别,这种字幕XML文件的实现不仅简单易行,并且可以支持实际应用中的大量对白唱词类字幕的分离制播;再者,由于使用XML作为数据描述手段,数据量很小,易于存储传输。并且,这种文件结构还支持多段存放,从而可以适应大量对白唱词内容的有效组织。因而,本发明有效保证了网络化制播系统中字幕制播的通用性,并且XML的应用还可以有效提高系统的可扩展性,从而无需过多人力、物力的耗费,有效降低了成本。
附图说明
图1是本发明的一种通用字幕的生成方法实施例1的步骤流程图;
图2是本发明的一种通用字幕的生成方法实施例2的步骤流程图;
图3是本发明的一种通用字幕的生成装置实施例的结构框图;
图4是应用本发明实施例生成字幕的效果示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:多处理器系统、服务器、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
参考图1,示出了本发明的一种通用字幕的生成方法实施例1的流程图,具体可以包括以下步骤:
步骤101、从源字幕文件中提取字幕的基本属性信息;
其中,所述字幕的基本属性信息包括字幕的文件描述信息、字幕段的内容和显示属性信息;
步骤102、将所述字幕的文件描述信息作为第一XML元数据,以及,将字幕段的内容和显示属性信息作为第二XML元数据,按照预置规则组织为字幕XML文件。
在具体实现中,所述源字幕文件可以为包括不同的节目制作公司采用不同的描述方式提交的原始字幕文件。从所述源字幕文件中提取的字幕的基本属性信息,则可以理解为描述字幕对象的通用信息。在具体实现中,所述字幕的文件描述信息可以进一步包括:字幕文件识别标识FileID、字幕文件格式版本号File Version、字幕文件所使用的字符集编号Code Page、字幕文件的标题名称Program、字幕文件支持的电视制式Video Standard、字幕段数量Section Count等信息。
本领域技术人员公知的是,字幕段(Section)包含一段字幕的内容和显示信息,一段中含多屏字幕。字幕是按照屏(Screen)为单位依次显示的,为同屏显示多语种字幕,每屏可以包含多个字幕块(Block),字幕块参数N为各屏中的字幕块,在字幕文件中,N被统一赋予字体、字号、颜色和位置等显示属性。故所述字幕段的内容和显示属性信息可以进一步包括:字幕段标识信息Text Section、字幕段结构信息SectionInfo、字幕屏内容信息Text Screen等信息。
为保证不同描述方式的源字幕文件在网络化制播系统中应用的通用性,本发明需要将从源字幕文件中提取出来的通用性数据(字幕基本属性信息)以XML方式组织为字幕XML文件。
所谓XML(Extensible Markup Language)即可扩展标记语言,它是一种简单的数据存储语言,使用一系列简单的标记描述数据。上述各个数据结构依照XML的术语被称作元数据(Element),元数据中可以嵌套包含多个子元数据。基于这种XML的描述规则,在具体实现中,优选可以将所述字幕文件描述信息作为第一XML元数据,将字幕段的内容和显示属性信息作为第二XML元数据,在这种情况下,所述步骤102可以进一步包括以下子步骤:
子步骤S21、在XML文件中写入第一XML元数据;
优选的是,所述第一XML元数据嵌套的子元数据可以包括:字幕文件识别标识File ID、字幕文件格式版本号File Version、字幕文件所使用的字符集编号Code Page、字幕文件的标题名称Program、字幕文件支持的电视制式Video Standard、字幕段数量Section Count;
当然,本领域技术人员依据实际情况在所述第一XML元数据中进一步嵌套其它子元数据也是可行的,例如,还可以嵌套的子元数据包括:字幕文件的作者Author、描述文字Description、创作日期Creathion Date、修改日期Revision Date、修改版本号Revision Number和/或字幕语种Language等。
为直观表示上述元数据,在本发明的一种示例中,所述第一XML元数据可以嵌套的子元数据如下表所示:
  字段名   意义
  File Info   文件信息开始结束标志
  File ID   文件标识
  File Version   文件格式版本号
  Code Page   文件使用的字符集编号
  Program   节目名称
  Author   作者(可选)
  Description   描述(可选)
  Creation Date   创作日期(可选)
  Revision Date   修改日期(可选)
  Revision Number   修改版本号(可选)
  Language   字幕的语种(可选)
  Video Standard   电视制式
  Section Count   字幕段落数目
  User Data   用户数据(可选)
对于上述子元数据字段名的释义如下所示:
File Info,文件信息数据块标志:标志数据块的开始和结束,其间包含整个File Info数据元素。
File ID,文件标识:特定的字符串“CCTV Subtitle Sequence File”,供应用程序识别确认该文件是对白字幕文件。
File Version,文件格式版本:表示对白字幕文件所使用的格式的版本。
Code Page,字符集编号:“UTF-8”或“UTF-16”表示Unicode,其余是附录1中的《传统字符集分类表》的Code Page Identifier。标明该字幕文件使用的字符集。由于文件载体为XML,这个标志应该与XML文件头Prolog中的Code Page一致。
Program,节目名称:定义该字幕文件标题的名称。
Author,作者:定义该字幕文件的作者。
Description,描述:定义该字幕文件的描述文字。
Creation Date,创作日期:该字幕文件的始创日期,YYYYMMDD格式。
Revision Date,修改日期:该字幕文件的最后修改日期,YYYYMMDD格式。
Revision Number,修改版本号:该字幕文件修改次数或者版本编号。Language,字幕语种:标明整个字幕数据中的信息文字的主要(Primary)和次要(Secondary)语言。
Video Standard,电视制式:该字幕文件支持的电视制式。
Section Count,命令组数目:该字幕文件中的字幕段落的数量。
基于上述示例组织的一种XML文件如以下代码所示:
<File Info>
  <File ID>CCTV Subtitle Sequence File</File ID>
  <File Version>1.0</Version>
  <Code Page>UTF-16</Code Page>
  <Program>实事访谈第22期</Program>
  <Author>第10演播室</Author>
  <Description>含所有对白字幕</Description>
  <Creation Date>20081021</Creation Date>
  <Revision Date>20081028</Revision Date>
  <Revision Number>4</Revision Number>
  <Language>
     <Primary>0x0804</Primary>
     <Secondary>0x0409</Secondary>
  </Language>
  <Video Standard>HD_1080_25i</Video Standard>
  <Section Count>2</Section Count>
</File Info>
子步骤S22、在XML文件中写入第二XML元数据;
其中,所述第二XML元数据嵌套的子元数据可以包括:字幕段标识信息Text Section、字幕段结构信息Section Info、字幕屏内容信息TextScreen。
优选的是,所述字幕段结构信息Section Info进一步嵌套的子元数据可以包括:字幕中包含字幕屏的数量Screen Count、每个字幕屏所包含的最大字幕块数Block Count、各字幕块的显示参数DisplayParameters、各字幕屏的时码模式Time Code Mode;
其中,所述各字幕块的显示参数Display Parameters进一步嵌套的子元数据可以包括:各字幕屏中所有字幕块的共有显示参数,包括:字幕块在屏幕上所占的位置Position、字幕块的字体Font、字幕块的排列方式Layout、字幕块的字符正面颜色Text Color;
所述字幕屏内容信息Text Screen进一步嵌套的子元数据可以包括:本屏字幕中各个字幕块的信息Text Block,其中,所述字幕块的信息TextBlock包括:本字幕块的字符串String。
更为优选的是,所述字幕段结构信息Section Info进一步嵌套的子元数据可以包括:字幕段开始播出的绝对时码Start Time Code;各字幕屏中所有字幕块的共有显示参数还包括:字幕块中文本的语言编号Language、字幕块中的字符涉及Unicode字符集中的语言分区UnicodeBit Field、字幕块中字母数字的字体FontLatin、字幕块中字符的加边方式Edge、加边颜色Edge Color、加阴影方式Shadow、阴影颜色ShadowColor、加衬底方式Background、衬底颜色Background Color和/或显示特技方式Effect。
所述组织为XML文件的方式可以参考上述示例,本发明对此就不赘述了。
当然,本领域技术人员依据实际情况定义所需的元数据,并相应组织XML文件都是可行的,本发明对此无需做出限制。
参考图2,示出了本发明的一种通用字幕的生成方法实施例2的流程图,具体可以包括以下步骤:
步骤201、从源字幕文件中提取字幕的基本属性信息;
其中,所述源字幕文件可以包括多个,分别具有对应的描述方式;所述字幕的基本属性信息包括字幕的文件描述信息、字幕段的内容和显示属性信息;
步骤202、判断所述字幕的基本属性信息是否匹配预设的描述方式,若是,则直接执行步骤204;否则,先执行步骤203,再执行步骤204;
步骤203、将所述字幕的基本属性信息转换为匹配的描述方式;
步骤204、将所述字幕的文件描述信息作为第一XML元数据,以及,将字幕段的内容和显示属性信息作为第二XML元数据,按照预置规则组织为字幕XML文件。
本实施例相较于图1所示的实施例而言,增加了对源字幕文件的描述方式与预设的描述方式不匹配时的处理步骤。例如,源字幕文件中对于字幕块中字符的位置描述方式采用的是相对坐标系的定义,而当前规定的字符位置描述方式是绝对坐标系的定义,在本实施例中,则先将该字符位置从相对坐标系的定义转换为绝对坐标系的定义之后,再写入XML文件。
需要说明的是,在本说明书中仅仅是以字符为例说明字幕文件的制播机制,在具体实现中,还可以针对动画字幕文件、滚动字幕文件采用本发明的制播机制,例如,针对滚动字幕文件,提取其滚动时间、滚动方式的基本属性,然后作为元数据或子元数据生成XML文件,在播出时通过解析该XML文件即可使得相关字幕依据滚动时间、滚动方式等属性进行输出。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
参考图3,示出了本发明的一种通用字幕的生成装置实施例的结构框图,具体可以包括以下模块:
通用属性提取模块31,从源字幕文件中提取字幕的基本属性信息;其中,所述字幕的基本属性信息包括字幕的文件描述信息、字幕段的内容和显示属性信息;
XML组织模块32,用于将所述字幕的文件描述信息作为第一XML元数据,以及,将字幕段的内容和显示属性信息作为第二XML元数据,按照预置规则组织为字幕XML文件。
在本发明的另一种优选实施例中,所述源字幕文件可以包括多个,分别具有对应的描述方式;在这种情况下,本发明实施例还可以包括以下模块:
判断模块33,用于判断所述字幕的基本属性信息是否匹配预设的描述方式,若是,则触发XML组织模块32:若否,则触发转换模块34;
转换模块34,用于将所述字幕的基本属性信息转换为匹配的描述方式后,触发XML组织模块32。
在具体应用中,所述字幕的文件描述信息进一步可以包括:字幕文件识别标识File ID、字幕文件格式版本号File Version、字幕文件所使用的字符集编号Code Page、字幕文件的标题名称Program、字幕文件支持的电视制式Video Standard、字幕段数量Section Count;所述字幕段的内容和显示属性信息进一步可以包括:字幕段标识信息Text Section、字幕段结构信息Section Info、字幕屏内容信息Text Screen。在这种情况下,所述XML组织模块可以包括以下子模块:
第一XML组织子模块,用于在XML文件中写入第一XML元数据,所述第一XML元数据嵌套的子元数据包括:字幕文件识别标识File ID、字幕文件格式版本号File Version、字幕文件所使用的字符集编号CodePage、字幕文件的标题名称Program、字幕文件支持的电视制式VideoStandard、字幕段数量Section Count;
第二XML组织子模块,用于在XML文件中写入第二XML元数据,所述第二XML元数据嵌套的子元数据包括:字幕段标识信息TextSection、字幕段结构信息Section Info、字幕屏内容信息Text Screen。
更为优选的是,所述字幕段结构信息Section Info可以进一步嵌套的子元数据包括:字幕中包含字幕屏的数量Screen Count、每个字幕屏所包含的最大字幕块数Block Count、各字幕块的显示参数DisplayParameters、各字幕屏的时码模式Time Code Mode;
其中,所述各字幕块的显示参数Display Parameters可以进一步嵌套的子元数据包括:各字幕屏中所有字幕块的共有显示参数,包括:字幕块在屏幕上所占的位置Position、字幕块的字体Font、字幕块的排列方式Layout、字幕块的字符正面颜色Text Color;
所述字幕屏内容信息Text Screen可以进一步嵌套的子元数据包括:本屏字幕中各个字幕块的信息Text Block,其中,所述字幕块的信息TextBlock包括:本字幕块的字符串String。
在本发明的另一优选实施例中,所述第一XML元数据嵌套的子元数据还可以包括:字幕文件的作者Author、描述文字Description、创作日期Creathion Date、修改日期Revision Date、修改版本号RevisionNumber和/或字幕语种Language;
所述字幕段结构信息Section Info进一步嵌套的子元数据还可以包括:字幕段开始播出的绝对时码Start Time Code;各字幕屏中所有字幕块的共有显示参数还包括:字幕块中文本的语言编号Language、字幕块中的字符涉及Unicode字符集中的语言分区Unicode Bit Field、字幕块中字母数字的字体FontLatin、字幕块中字符的加边方式Edge、加边颜色Edge Color、加阴影方式Shadow、阴影颜色Shadow Color、加衬底方式Background、衬底颜色Background Color和/或显示特技方式Effect。
应用本发明实施例产生的字幕效果的例子如图4所示。
由于本实施例基本相应于前述方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此就不赘述了。本说明书中的各个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种通用字幕的生成方法及一种通用字幕的生成系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种通用字幕的生成方法,其特征在于,包括:
从源字幕文件中提取字幕的基本属性信息;其中,所述字幕的基本属性信息包括字幕的文件描述信息、字幕段的内容和显示属性信息;
将所述字幕的文件描述信息作为第一XML元数据,以及,将字幕段的内容和显示属性信息作为第二XML元数据,按照预置规则组织为字幕XML文件;
所述字幕的文件描述信息进一步包括:字幕文件识别标识File ID、字幕文件格式版本号File Version、字幕文件所使用的字符集编号CodePage、字幕文件的标题名称Program、字幕文件支持的电视制式VideoStandard、字幕段数量Section Count;
所述字幕段的内容和显示属性信息进一步包括:字幕段标识信息Text Section、字幕段结构信息Section Info、字幕屏内容信息Text Screen;
所述按照预置规则组织为字幕XML文件的步骤包括:
在XML文件中写入第一XML元数据,所述第一XML元数据嵌套的子元数据包括:字幕文件识别标识File ID、字幕文件格式版本号FileVersion、字幕文件所使用的字符集编号Code Page、字幕文件的标题名称Program、字幕文件支持的电视制式Video Standard、字幕段数量Section Count;
在XML文件中写入第二XML元数据,所述第二XML元数据嵌套的子元数据包括:字幕段标识信息Text Section、字幕段结构信息SectionInfo、字幕屏内容信息Text Screen。
2.如权利要求1所述的方法,其特征在于,所述字幕段结构信息Section Info进一步嵌套的子元数据包括:字幕中包含字幕屏的数量Screen Count、每个字幕屏所包含的最大字幕块数Block Count、各字幕块的显示参数Display Parameters、各字幕屏的时码模式Time CodeMode;
其中,所述各字幕块的显示参数Display Parameters进一步嵌套的子元数据包括:各字幕屏中所有字幕块的共有显示参数,包括:字幕块在屏幕上所占的位置Position、字幕块的字体Font、字幕块的排列方式Layout、字幕块的字符正面颜色Text Color;
所述字幕屏内容信息Text Screen进一步嵌套的子元数据包括:本屏字幕中各个字幕块的信息Text Block,其中,所述字幕块的信息TextBlock包括:本字幕块的字符串String。
3.如权利要求2所述的方法,其特征在于,所述第一XML元数据嵌套的子元数据包括:字幕文件的作者Author、描述文字Description、创作日期Creathion Date、修改日期Revision Date、修改版本号RevisionNumber和/或字幕语种Language;
所述字幕段结构信息Section Info进一步嵌套的子元数据包括:字幕段开始播出的绝对时码Start Time Code;各字幕屏中所有字幕块的共有显示参数还包括:字幕块中文本的语言编号Language、字幕块中的字符涉及Unicode字符集中的语言分区Unicode Bit Field、字幕块中字母数字的字体FontLatin、字幕块中字符的加边方式Edge、加边颜色EdgeColor、加阴影方式Shadow、阴影颜色Shadow Color、加衬底方式Background、衬底颜色Background Color和/或显示特技方式Effect。
4.如权利要求1所述的方法,其特征在于,所述源字幕文件包括多个,分别具有对应的描述方式;所述的方法还包括:
判断所述字幕的基本属性信息是否匹配预设的描述方式,若是,则执行组织字幕XML文件的步骤:否则,将所述字幕的基本属性信息转换为匹配的描述方式后,再执行组织字幕XML文件的步骤。
5.一种通用字幕的生成装置,其特征在于,包括:
通用属性提取模块,从源字幕文件中提取字幕的基本属性信息;其中,所述字幕的基本属性信息包括字幕的文件描述信息、字幕段的内容和显示属性信息;
XML组织模块,用于将所述字幕的文件描述信息作为第一XML元数据,以及,将字幕段的内容和显示属性信息作为第二XML元数据,按照预置规则组织为字幕XML文件;
所述字幕的文件描述信息进一步包括:字幕文件识别标识File ID、字幕文件格式版本号File Version、字幕文件所使用的字符集编号CodePage、字幕文件的标题名称Program、字幕文件支持的电视制式VideoStandard、字幕段数量Section Count;
所述字幕段的内容和显示属性信息进一步包括:字幕段标识信息Text Section、字幕段结构信息Section Info、字幕屏内容信息Text Screen;
所述XML组织模块进一步包括:
第一XML组织子模块,用于在XML文件中写入第一XML元数据,所述第一XML元数据嵌套的子元数据包括:字幕文件识别标识File ID、字幕文件格式版本号File Version、字幕文件所使用的字符集编号CodePage、字幕文件的标题名称Program、字幕文件支持的电视制式VideoStandard、字幕段数量Section Count;
第二XML组织子模块,用于在XML文件中写入第二XML元数据,所述第二XML元数据嵌套的子元数据包括:字幕段标识信息TextSection、字幕段结构信息Section Info、字幕屏内容信息Text Screen。
6.如权利要求5所述的装置,其特征在于,所述源字幕文件包括多个,分别具有对应的描述方式;所述装置还包括:
判断模块,用于判断所述字幕的基本属性信息是否匹配预设的描述方式,若是,则触发XML组织模块:若否,则触发转换模块;
转换模块,用于将所述字幕的基本属性信息转换为匹配的描述方式后,触发XML组织模块。
CN200910237576.9A 2009-11-12 2009-11-12 一种通用字幕的生成方法及装置 Expired - Fee Related CN102065235B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910237576.9A CN102065235B (zh) 2009-11-12 2009-11-12 一种通用字幕的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910237576.9A CN102065235B (zh) 2009-11-12 2009-11-12 一种通用字幕的生成方法及装置

Publications (2)

Publication Number Publication Date
CN102065235A CN102065235A (zh) 2011-05-18
CN102065235B true CN102065235B (zh) 2015-06-24

Family

ID=44000316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910237576.9A Expired - Fee Related CN102065235B (zh) 2009-11-12 2009-11-12 一种通用字幕的生成方法及装置

Country Status (1)

Country Link
CN (1) CN102065235B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3349470A4 (en) * 2015-09-09 2019-01-16 LG Electronics Inc. BROADCAST SIGNAL TRANSMITTING DEVICE, BROADCAST SIGNAL RECEIVING DEVICE, BROADCASTING SIGNAL TRANSMITTING METHOD, AND BROADCAST SIGNAL RECEIVING METHOD

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102427512A (zh) * 2011-10-10 2012-04-25 中央电视台 一种通用的可交换字幕的生成和复用的方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101091382A (zh) * 2004-12-06 2007-12-19 汤姆逊许可公司 数字网络中的多个闭合字幕流和用户接入
CN101388969A (zh) * 2008-09-10 2009-03-18 新奥特(北京)视频技术有限公司 一种在线节目单驱动的多频道字幕编播方法
CN101483724A (zh) * 2008-01-11 2009-07-15 新奥特(北京)视频技术有限公司 一种无人值守的分布式多线程字幕渲染和播出方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101091382A (zh) * 2004-12-06 2007-12-19 汤姆逊许可公司 数字网络中的多个闭合字幕流和用户接入
CN101483724A (zh) * 2008-01-11 2009-07-15 新奥特(北京)视频技术有限公司 一种无人值守的分布式多线程字幕渲染和播出方法
CN101388969A (zh) * 2008-09-10 2009-03-18 新奥特(北京)视频技术有限公司 一种在线节目单驱动的多频道字幕编播方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3349470A4 (en) * 2015-09-09 2019-01-16 LG Electronics Inc. BROADCAST SIGNAL TRANSMITTING DEVICE, BROADCAST SIGNAL RECEIVING DEVICE, BROADCASTING SIGNAL TRANSMITTING METHOD, AND BROADCAST SIGNAL RECEIVING METHOD
US10237591B2 (en) 2015-09-09 2019-03-19 Lg Electronics Inc. Broadcast signal transmission device, broadcast signal reception device, broadcast signal transmission method, and broadcast signal reception method

Also Published As

Publication number Publication date
CN102065235A (zh) 2011-05-18

Similar Documents

Publication Publication Date Title
CN102065234B (zh) 基于分布式字幕处理系统的字幕制播方法及系统
US8407585B2 (en) Context-aware content conversion and interpretation-specific views
CN102141916B (zh) 嵌入式设备及其在osd界面显示语言文字的方法
US20060236228A1 (en) Extensible markup language schemas for bibliographies and citations
CN100584002C (zh) 根据用户规格过滤比特流的方法
WO2012067464A2 (en) Apparatus and method for mashup of multimedia content
CN103353878A (zh) 将多种格式的文档显示在网页中的方法
CN101013436A (zh) 将不同格式的文本数据转换为统一格式的方法及其系统
CN105007539A (zh) 一种基于html模板通过电视发布图文信息的方法、设备及系统
CN101908052A (zh) 一种多媒体节目的制作方法及装置
CN106021393A (zh) 面向移动设备的电网设备标准信息检索方法和系统
CN103970820A (zh) Web多媒体资源开放标注数据的可视化方法及装置
CN102065230B (zh) 一种网络化的字幕制播系统
CN104182531A (zh) 视频名称处理方法及系统
US20100169333A1 (en) Document processor
CN102118643B (zh) 一种网络字幕播放系统及其播放方法
CN102065235B (zh) 一种通用字幕的生成方法及装置
CN102065229B (zh) 一种通用字幕的制播方法及装置
CN110413765A (zh) 一种海量数据集分析和展示的交互式系统及其方法
CN101909047A (zh) 一种多媒体节目的获取方法及装置
KR102464634B1 (ko) 도면 작성 표준화를 위한 라이브러리 구축 및 그를 이용한 도면 작성 방법 및 장치
CN109582928B (zh) Pdf报表数据提取方法及装置
CN102065236B (zh) 一种字幕文件的制作方法及装置
CN102082934B (zh) 字幕对象的更新方法及装置
CN106445320A (zh) 一种制作和展示电子书内容的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150624

Termination date: 20161112