CN102427512A - 一种通用的可交换字幕的生成和复用的方法及系统 - Google Patents

一种通用的可交换字幕的生成和复用的方法及系统 Download PDF

Info

Publication number
CN102427512A
CN102427512A CN2011103046287A CN201110304628A CN102427512A CN 102427512 A CN102427512 A CN 102427512A CN 2011103046287 A CN2011103046287 A CN 2011103046287A CN 201110304628 A CN201110304628 A CN 201110304628A CN 102427512 A CN102427512 A CN 102427512A
Authority
CN
China
Prior art keywords
captions
information
attribute
subtitle
stunt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011103046287A
Other languages
English (en)
Inventor
丁文华
宋宜纯
崔建伟
王佩
石秀莲
高蓉莉
马悦
陈欣
张歆
郭小强
郑培枫
孙季川
史大义
张孜恒
郝晔明
李忠海
谢超平
罗天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING JETSEN TECHNOLOGY Co Ltd
China Digital Video Beijing Ltd
Chengdu Sobey Digital Technology Co Ltd
China Central TV Station
Beijing Dayang Technology Development Inc
Original Assignee
BEIJING JETSEN TECHNOLOGY Co Ltd
China Digital Video Beijing Ltd
Chengdu Sobey Digital Technology Co Ltd
China Central TV Station
Beijing Dayang Technology Development Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING JETSEN TECHNOLOGY Co Ltd, China Digital Video Beijing Ltd, Chengdu Sobey Digital Technology Co Ltd, China Central TV Station, Beijing Dayang Technology Development Inc filed Critical BEIJING JETSEN TECHNOLOGY Co Ltd
Priority to CN2011103046287A priority Critical patent/CN102427512A/zh
Publication of CN102427512A publication Critical patent/CN102427512A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种通用的可交换字幕的生成和复用方法及系统,包括:节目制作系统中导入多媒体工程文件,提取所述字幕信息,并根据字幕信息以上信息在XML可扩展标记语言结构中顺序生成根元素、一级子元素、二级子元素、三级子元素根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件;对所述生成分离字幕素材文件根据XML字幕素材结构进行解析,生成新字幕信息,通过以上方案本发明解决了多媒体字幕文件在不同厂家、不同字幕读取设备下的通用性问题,并可以提高字幕文件的互认性,提高了字幕文件的复用率,降低了字幕重复制作的工作,缩短了多媒体文件的周期,节约制作成本。

Description

一种通用的可交换字幕的生成和复用的方法及系统
技术领域
本发明涉及电视广播电视节目制作领域,尤其涉及一种通用的可交换字幕的生成和复用的方法及系统
背景技术
随着我国广播电视事业的发展,新影视合成技术的不断更新,电视节目在制作过程中被广泛得到应用,为了满足制作上的需要,电视节目制作各电视台针对节目制作的部门划分越来越细致,日常制作的节目素材日益丰富,通常需要经过采集、处理、存放的过程,一般媒资文件需要以电子文件方式保存媒资系统中进行归档,同时,为了保证多媒体文件的可、多复用性,如将字幕文件在多媒体文件制作中固定制作在文件中,会影响到多媒体文件在其他场合下的应用,因此在归档的节目素材时,通常节目素材文件包含三个部分:即节目视频文件、分离字幕文件和节目工程管理文件,分离字幕必须具有如下特征:首先,与节目内容相关,即字幕内容对节目画面可进行细致描述和内容补充,如果去除该字幕,节目画面也可较完整地传递信息。其次,具有节目分离、交换的意义,即符合一定业内公认标准,同时必须完整、准确地保存时码信息,以便于演播室播出或其他制作域复用。如上所述,在节目素材归档过程中,为了将来节目交换的需要(如不同语种环境),在制作域一般采用提取具有分离交换意义的字幕信息生成分离字幕文件,同时将去除该字幕的节目工程生成视频文件的方式,但同时会带来的问题是:各个节目制作域使用的制作设备很可能不一致,各厂家针对字幕的描述会有自身的文件结构,一般不会公开,即使公开,因为自身产品的特,也不易为其他厂家使用。
在实现本发明的过程中,发明人发现现有技术的缺点为:在多媒体节目制作过程中,由于不同厂家会使用不同格式的字幕编辑方式,因此基于制作后的同一多媒体文件的字幕文件,不能在不同字幕设备下通用,在不同厂家字幕文件不能互认的情况下,需要对字幕文件进行重复制作,增加了多媒体文件的制作时间与成本。
发明内容
针对现有技术多媒体节目制作过程中的问题和局限,本发明要解决的技术问题是:解决了多媒体字幕文件在不同厂家、不同字幕读取设备下的通用性问题,并可以提高字幕文件的互认性。
上述技术问题通过本发明提供的一种通用的可交换字幕的生成和复用方法解决:在节目制作系统中导入多媒体工程文件,所述节目制作系统包括用于实现对所述多媒体工程文件中的视频信息、音频信息及字幕信息给予规定多媒体格式的输出,包括提取所述字幕信息,所述字幕信息中包括,字幕文件说明信息、字幕段信息、字幕屏信息、字幕块信息,所述字幕块信息至少包括,字幕文字信息;所述字幕屏信息至少包括,单位字幕屏中所包括的字幕块数量信息及字幕屏时码信息;所述字幕段信息至少包括,所包括的字幕屏数量信息及字幕段时码信息;所述字幕文件说明信息中至少包括,节目名称、字幕输出文件名、字幕使用语言、字幕段数量信息;将所述字幕文件说明信息确定为XML可扩展标记语言结构中的根元素,根据所述节目名称、字幕使用语言、字幕输出文件名确定所述根元素属性;根据所述字幕段信息确定为所述根元素中的一级子元素信息,所述一级子元素信息的数量由所述字幕段数量信息确定,所述一级子元素属性包括,字幕段时码信息;根据所述字幕屏信息确定为所述一级子元素中的二级子元素,所述二级子元素的数量由所述字幕屏数量信息确定,所述二级子元素属性包括,字幕屏时码信息;根据所述字幕块信息确定为所述二级子元素中的三级子元素,所述三级子元素的数量由所述字幕块数量信息确定,所述三级子元素属性包括,所述字幕文字信息确定;组成XML字幕素材结构;根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件;对所述生成分离字幕素材文件根据XML字幕素材结构进行解析,确定字幕文件信息、字幕段信息、字幕屏信息、字幕块信息,并生成新字幕信息。
同时本发明还提供一种通用的可交换字幕的生产和复用系统,包括,多媒体信息输出单元,所述多媒体信息输出单元用于,在节目制作系统中导入多媒体工程文件,所述节目制作系统包括用于实现对所述多媒体工程文件中的视频信息、音频信息及字幕信息给予规定多媒体格式的输出,同时包括:提取字幕信息单元、XML字幕素材结构生产单元、生成分离字幕素材单元、新字幕生成单元,其中,
所述提取字幕信息单元,用于提取所述字幕信息,所述字幕信息中包括,字幕文件说明信息、字幕段信息、字幕屏信息、字幕块信息,所述字幕块信息至少包括,字幕文字信息;所述字幕屏信息至少包括,单位字幕屏中所包括的字幕块数量信息及字幕屏时码信息;所述字幕段信息至少包括,所包括的字幕屏数量信息及字幕段时码信息;所述字幕文件说明信息中至少包括,节目名称、字幕输出文件名、字幕使用语言、字幕段数量信息;
所述XML字幕素材结构生产单元,用于将所述字幕文件说明信息确定为XML可扩展标记语言结构中的根元素,根据所述节目名称、字幕使用语言、字幕输出文件名确定所述根元素属性;根据所述字幕段信息确定为所述根元素中的一级子元素信息,所述一级子元素信息的数量由所述字幕段数量信息确定,所述一级子元素属性包括,字幕段时码信息;根据所述字幕屏信息确定为所述一级子元素中的二级子元素,所述二级子元素的数量由所述字幕屏数量信息确定,所述二级子元素属性包括,字幕屏时码信息;根据所述字幕块信息确定为所述二级子元素中的三级子元素,所述三级子元素的数量由所述字幕块数量信息确定,所述三级子元素属性包括,所述字幕文字信息确定;组成XML字幕素材结构;
所述生成分离字幕素材单元,用于根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件;
所述新字幕生成单元,用于对所述生成分离字幕素材文件根据XML字幕素材结构进行解析,确定字幕文件信息、字幕段信息、字幕屏信息、字幕块信息,并生成新字幕信息。
同时,本发明还具有以下有益效果,本发明通过对多媒体字幕文件进行格式规范,使得不同厂家或使用者可识别并可有效使用的分离字幕格式,从而使在不同厂家、不同字幕读取系统中,可以进行字幕文件的互认,从而提高了字幕文件的复用率,降低了字幕重复制作的工作,缩短了多媒体文件的周期,节约了制作成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中一种通用的可交换字幕的生成和复用方法的流程图;
图2是本发明实施例中另一种通用的可交换字幕的生成和复用方法的流程图;
图3是本发明实施例中一种通用的可交换字幕的生产和复用系统结构图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例1中提供了一种通用的可交换字幕的生成和复用方法,如图1所示,包括以下步骤:
步骤S101,提取字幕信息;
在此步骤中,提取所述字幕信息,所述字幕信息中包括,字幕文件说明信息、字幕段信息、字幕屏信息、字幕块信息,所述字幕块信息至少包括,字幕文字信息;所述字幕屏信息至少包括,单位字幕屏中所包括的字幕块数量信息及字幕屏时码信息;所述字幕段信息至少包括,所包括的字幕屏数量信息及字幕段时码信息;所述字幕文件说明信息中至少包括,节目名称、字幕输出文件名、字幕使用语言、字幕段数量信息;
通常字幕文件中的对白字幕文件由下列数据结构顺序构成:
其中,文件信息(FileInfo)包含字幕文件头信息相当于本发明技术特征字幕文件说明信息,比如视频制式等等。字幕段(Section)包含一段字幕的内容和显示信息,一段中含多屏字幕,字幕是按照屏(Screen)为单位依次显示的,为同屏显示多语种字幕,每屏可以包含多个字幕块(Block),字幕块参数N为各屏中的字幕块N统一定义了字体、字号、颜色和位置等显示属性。
步骤S102,组成XML字幕素材结构;
在此步骤中,文件以XML方式组织,在步骤S101中的字幕文件数据结构依照XML的术语被称一次定义为数据元素(Element),数据元素中可以嵌套包含多个子数据元素。下面的各个数据元素的定义都给出其子数据元素的名称(字段名)和意义描述。
一、字幕文件说明信息的命名和定义:
进行字幕文件说明信息的结构定义,定义方式如下表所示:
  字段名   意义
  FileInfo   文件信息开始结束标志
  FileID   文件标识
  FileVersion   文件格式版本号
  CodePage   文件使用的字符集编号
  Program   节目名称
  Author   作者(可选)
  Description   描述(可选)
  CreationDate   创作日期(可选)
  RevisionDate   修改日期(可选)
  RevisionNumber   修改版本号(可选)
  Language   字幕的语种(可选)
  Video Standard   电视制式
  SectionCount   字幕段落数目
  UserData   用户数据(可选)
其中各字符段定义如下:
FileInfo,文件信息数据块标志
标志数据块的开始和结束,其间包含整个FileInfo数据元素。
FileID,文件标识
特定的字符串“CCTV Subtitle Sequence File”,供应用程序识别确认该文件是对白字幕文件。
FileVersion,文件格式版本
表示对白字幕文件所使用的格式的版本,目前为1.0。
CodePage,字符集编号
“UTF-8”或“UTF-16”表示Unicode,其余是附录1中的《传统字符集分类表》的CodePage Identifier。标明该字幕文件使用的字符集。由于文件载体为XML,这个标志应该与XML文件头Prolog中的CodePage一致。
Program,节目名称
定义该字幕文件标题的名称。
Author,作者
定义该字幕文件的作者。
Description,描述
定义该字幕文件的描述文字。
CreationDate,创作日期,
该字幕文件的始创日期,YYYYMMDD格式。
RevisionDate,修改日期,
该字幕文件的最后修改日期,YYYYMMDD格式。
RevisionNumber,修改版本号
该字幕文件修改次数或者版本编号。
Language,字幕语种
参见《语言分类表》语言编号。标明整个字幕数据中的信息文字的主要(Primary)和次要(Secondary)语言。
VideoStandard,电视制式,
该字幕文件支持的电视制式。根据《附录2》的表格,定义如下基本电视制式编号(表中其它制式可以根据需要添加定义):
PAL-720x576,4:3,25i
NTSC-720x486,4:3,29.97i
HD_1080_25i-1920x1080,16:9,25i
HD_1080_2997i-1920x1080,16:9,29.97i
HD_1080_30i-1920x1080,16:9,30i
HD_1080_25p-1920x1080,16:9,25p
HD_1080_2997p-1920x1080,16:9,29.97p
HD_1080_30p-1920x1080,16:9,30p
SectionC ount,命令组数目
该字幕文件中的字幕段落的数量。
UserData,用户定制区
应用程序附加的数据可以放置在这个元素中,这些数据完全由制作应用程序和播出应用程序按照互相之间的约定进行解释和使用。
如用XML可表示为以下形式:
Figure BDA0000097390970000081
二、字幕段命名和定义:
2.1、字幕段结构定义TextSection:
  字段名   意义
  TextSection   字幕段标志
  SectionInfo   字幕段信息
  TextScreen(多个)   各屏字幕内容
TextSection,字幕段标志
标志数据块的开始和结束,其间包含整TextSection数据元素。参阅后面具体定义。
SectionInfo,字幕段信息
内含多个子数据元素,包括一个或多个字幕块显示参数BlockParameters。参阅后面具体定义。
TextScreen,一屏字幕内容
其中包含一个或多个字幕块Text Block子数据元素。参阅后面具体定义。
2.2、字幕段信息结构定义SectionInfo
  字段名   意义
  SectionInfo   字幕段信息数据块标志
  ScreenCount   字幕屏数目
  BlockCount   每屏字幕块数目
  DisplayParameters   字幕显示参数
  Time Code Mode   时码模式
  StartTimeCode   开始时码(可选)
  EndTimeCode   结束时码(可选)
  TrimCodeIn   裁剪开始时码
  TrimCodeOut   裁剪结束时码
SectionInfo,字幕段信息数据块标志
标志数据块的开始和结束,其间包含整个TextSection Info数据元素。
ScreenCount,字幕屏数目
该段字幕中包含的字幕屏的数目。
BlockCount,每屏字幕块数目
定义每个字幕屏所包含的最大的字幕块数;某一屏的实际字幕块数可以少于此数目;特别是没有字幕块的屏作为空屏显示处理,以实现无内容的间隔显示。
DisplayParameters,字幕显示参数
其中包含多个字幕块显示参数Text B1ockParameters子数据元素,这些数据元素定义了一个字幕块的字体、字号、颜色和位置等显示参数。参阅后面具体定义。
Time Code Mode,时码模式
Invalid或0-各字幕屏时码无效,播出需要手工触发。
Absolute或1-各字幕屏时码为绝对时码,可以控制播出。
Relative或2-各字幕屏时码为参照StartTimeCode的相对时码,可以控制播出。
StartTimeCode,开始时码
定义本字幕段落开始播出的时码,SMPTE HHMMSSFF格式。这个字段的内容仅在Time Code Mode为Relative时有效。
EndTimeCode,结束时码
定义本字幕段落结束播出的时码,格式同StartTimeCode相同
TrimCodeIn  裁剪开始时码
定义本字幕段落实际有效的开始时码(相对本段首帧)。
TrimCodeOut裁剪结束时码
定义本字幕段落实际有效的结束时码(相对本段首帧)-。
2.3、字幕显示参数结构定义DisplayParameters
 字段名   意义
 DisplayParameters   字幕显示参数块数据标志
 BlockParameters(多个)   各个字幕块显示参数
DisplayParameters,字幕显示参数块数据标志
标志数据块的开始和结束,其间包含整个DisplayParameters数据元素;
BlockParameters,字幕块共有显示参数
定义各个字幕屏中所有对应字幕块的共有显示参数。如果字幕屏中没有特别定义字幕块的显示参数,则采用字幕块共有显示参数,参阅下面定义;
2.4、字幕块共有显示参数结构定义BlockParameters
 字段名   意义
 BlockParameters   数据元素标志
 Language   语言编号(可选)
 Unicode Bit Field   Unicode分区标示位(可选)
 Position   字幕块位置
 Font   字体
 FontLatin   字母数字字体(可选)
 Layout   排列
 TextColor   字色
 Edge   加边方式(可选)
 EdgeColor   边色(可选)
 Shadow   阴影方式(可选)
 ShadowColor   影色(可选)
 Background   加底方式(可选)
 BackgroundColor   底色(可选)
BlockParameters,数据元素标志
标志数据块的开始和结束,其间包含整个BlockParameters数据元素。这个数据元素包含下列属性:
Version-格式的版本号,为以后改变字幕参数内容准备。目前值为1.0。
Language,语言编号
定义《语言分类表》的语言编号,表明这个字幕参数对应的各个字幕块中文本的主要语言。
Unicode Bit Field,Unicode分区标示位
128位Unicode分区标示,标明这个字幕参数对应的各个字幕块中的字符涉及的Unicode字符集中的语言分区,帮助应用程序需要时确定字库,参阅附录1及其《Unicode分区表》。这个字段只有在文件信息FileInfo数据元素中定义本文件中所有字幕文本字符集的CodePage字段为Unicode时有效。
Position,字幕块位置
定义字幕块在屏幕上所占的位置。该数据元素包含下列属性:
X-字幕块的左上角在屏幕上的X坐标,单位为像素。
Y-字幕块的左上角在屏幕上的Y坐标,单位为像素。
Width-字幕块的宽度,单位为像素。
Height-字幕块的高度,单位为像素。
注:X、Y、Width、Height指不包含衬底等辅助图元,仅包含字幕文字的包围盒参数。
LineAlign,唱词行对齐方式
Align-对齐方式,0:左对齐1:中对齐2:右对齐
Font,字体
非拉丁语本地语言字符字体名称(参阅附录1)。与FontLatin字段合用,可以支持同一字幕块中本地语言(如中文)与字母数字分别使用效果较好的字体。该数据元素包含下列属性:
Name-字体名称。
Width-字体宽度;
为字符正常宽度的百分比值,如100表示100%。如果为0,即为默认值,与100%效果相同
Height-字体高度,单位为像素。
Bold-0/1粗体。
Italic-0/1斜体。
Underline-0/1下划线。
FontLatin,字母数字字体
拉丁语字符字体名称(参阅附录1)。属性定义同Font字段。当本数据元素空缺或者当Name为空时,表示字母数字使用Font字段定义的字体。
Layout,排列
控制字幕的排列、对齐方式。该数据元素包含下列属性:
CharSpace-字距,单位是像素。
LineSpace-行距,单位是像素。
Direction-0表示从左向右横排,1表示从右向左横排,2表示从左向右竖排,3表示从右向左竖排。
Alignment-0表示左对齐,1表示中对齐,2表示右对齐,3表示撑满对齐。
TextColor,字色,
定义字符正面颜色。该数据元素包含下列属性:
R,G,B,A-分别表示红、绿、蓝、透明度,0-255。
Side,全边方式
包含下列属性:
Width-全边宽度,单位为像素,为0表示不加边
SideColor,全边色
定义同EdgeColor
Edge,侧边方式
定义字符加边的方式。该数据元素包含下列属性:
Angle-侧边相对正面位置的方向角度,单位为角度值,360度旋转一周。0度时,位于正面的正右方。
Width-边宽,单位为像素。如果Width为0,表示不加边。
EdgeColor,侧边色
定义字符加边颜色。该数据元素包含下列属性:
R,G,B,A-分别表示红、绿、蓝、透明度,0-255。
Shadow,阴影方式
定义字符加阴影的方式。该数据元素包含下列属性:
OffsetX-偏移X,单位为像素。
OffsetY-偏移Y,单位为像素。X、Y如果全为0,不加阴影。
Blur-模糊程度。
ShadowColor,影色
定义字符阴影颜色。该数据元素包含下列属性:
R,G,B,A-分别表示红、绿、蓝、透明度,0-255。
2.5、字幕特技属性定义ActionIn、ActionStay、ActionOut
ActionIn、ActionStay、ActionOut分别表示入、停、出的特技描述,其结构是一样的。
  字段名   意义
  TCIn   特技入时码(相对本行唱词的首帧)
  TCOut   特技出时码(相对本行唱词的首帧)
  Type   特技类型
TCIn,特技入时码
TCOut,特技出时码
特技的入、出时码,是相对于本行唱词首帧的相对偏移值
Type,特技类型
0:快切;1:淡入淡出
注:目前分离格式交互特技仅支持快切和淡入淡出的结点类型,将来可扩充类型,并根据类型调用不同的特技结构的结点。
三、字幕段结构定义:
  字段名   意义
  TextScreen   字幕屏数据元素标志
  TimeCodeIn   当前句入时码(可选)
  TimeCodeOut   当前句出时码(可选)
  Block Pararameters(多个)   字模块显示参数(可选)
  Text Block(多个)   字幕块
TextScreen,字幕屏数据元素标志
标志数据块的开始和结束,其间包含整个TextScreen数据元素。
TimeCodeIn、TimeCodeOut播出入、出时码
本屏字幕的入、出播出时码。使用方式由字幕段落信息SectionInfo中的TimeCode Mode字段控制。
BlockParameters字幕块显示参数
定义本字幕屏中所有字幕块的显示参数,定义与前文提到的字幕块共有显示参数一样.该节点为可选状态,可以为多个。如果本字幕屏的显示属性与前文提到的字幕块共有显示参数无差别,则不需要填写,否则可以填写本屏字幕块特有的显示属性。
Text Block,字幕块
本屏字幕中的各个字幕块。参阅后面定义。各个字幕块可以使用不同语种、字体、位置等定义,同时显示。无字幕块时为空屏显示。
四、字幕块结构定义:
  字段名   意义
  Text Block   字幕块数据标志
  String   字幕文字
Text Block,字幕块数据标志
标志数据块的开始和结束,其间包含整个Text Block数据元素。
String,字幕文字
本字幕块的字符串。可以为单行或者多行,使用双字符组合“\n”表示行分隔。
五、针对以上命名,以下给出与之相对应的XML实例:
一个字幕段落的数据元素示例如下:
Figure BDA0000097390970000151
Figure BDA0000097390970000161
Figure BDA0000097390970000171
Figure BDA0000097390970000181
Figure BDA0000097390970000191
第1、4屏字幕无特技结点,使用根结点中的特技结点。如果根特技结点为空,则本行无唱词特技
</TextSection>
在此步骤中,将所述字幕文件说明信息确定为XML可扩展标记语言结构中的根元素,根据所述节目名称、字幕使用语言、字幕输出文件名确定所述根元素属性;根据所述字幕段信息确定为所述根元素中的一级子元素信息,所述一级子元素信息的数量由所述字幕段数量信息确定,所述一级子元素属性包括,字幕段时码信息;根据所述字幕屏信息确定为所述一级子元素中的二级子元素,所述二级子元素的数量由所述字幕屏数量信息确定,所述二级子元素属性包括,字幕屏时码信息;根据所述字幕块信息确定为所述二级子元素中的三级子元素,所述三级子元素的数量由所述字幕块数量信息确定,所述三级子元素属性包括,所述字幕文字信息确定;组成XML字幕素材结构;
步骤S103,生成分离字幕素材文件;
在此步骤中,根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件;
步骤S104,生成新字幕信息;
在此步骤中,对所述生成分离字幕素材文件根据XML字幕素材结构进行解析,确定字幕文件信息、字幕段信息、字幕屏信息、字幕块信息,并生成新字幕信息。
本发明实施例的技术方案带来的有益效果如下:
通过对多媒体字幕文件进行格式规范,使得不同厂家或使用者可识别并可有效使用的分离字幕格式,从而使在不同厂家、不同字幕读取系统中,可以进行字幕文件的互认,从而提高了字幕文件的复用率,降低了字幕重复制作的工作,缩短了多媒体文件的周期,节约了制作成本。
本发明实施例2中提供了另一种通用的可交换字幕的生成和复用方法,如图2所示,包括以下步骤:
步骤S201,提取字幕信息;
在此步骤中,提取所述字幕信息,所述字幕信息中包括,字幕文件说明信息、字幕段信息、字幕屏信息、字幕块信息,所述字幕块信息至少包括,字幕文字信息;所述字幕屏信息至少包括,单位字幕屏中所包括的字幕块数量信息及字幕屏时码信息;所述字幕段信息至少包括,所包括的字幕屏数量信息及字幕段时码信息;所述字幕文件说明信息中至少包括,节目名称、字幕输出文件名、字幕使用语言、字幕段数量信息;
所述字幕段信息中还包括:公共属性,所述公共属性至少包括,字幕渲染属性及字幕特技属性信息,所述字幕渲染属性中至少包括,字幕颜色、字幕面积及字幕字距;所述字幕特技属性中至少包括,特技入时码、特技出时码、特技类型,同时在字幕段信息中还包括:字幕渲染属性及特技属性信息,所述字幕渲染属性中至少包括,字幕颜色、字幕面积及字幕字距;所述字幕特技属性中至少包括,特技入时码、特技出时码、特技类型。
步骤S202,组成XML字幕素材结构;
在此步骤中,将所述字幕文件说明信息确定为XML可扩展标记语言结构中的根元素,根据所述节目名称、字幕使用语言、字幕输出文件名确定所述根元素属性;根据所述字幕段信息确定为所述根元素中的一级子元素信息,所述一级子元素信息的数量由所述字幕段数量信息确定,所述一级子元素属性包括,字幕段时码信息;根据所述字幕屏信息确定为所述一级子元素中的二级子元素,所述二级子元素的数量由所述字幕屏数量信息确定,所述二级子元素属性包括,字幕屏时码信息;根据所述字幕块信息确定为所述二级子元素中的三级子元素,所述三级子元素的数量由所述字幕块数量信息确定,所述三级子元素属性包括,所述字幕文字信息确定;组成XML字幕素材结构;
所述一级子元素属性还包括,字幕渲染属性及字幕特技属性信息。
所述二级子元素属性还包括,字幕渲染属性及字幕特技属性信息。
步骤S203,生成分离字幕素材文件;
在此步骤中,根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件;
判断字幕渲染属性S2031,具体步骤为,判断所述二级子元素属性中是否包括字幕渲染属性,若是,则读取所述二级子元素属性中的字幕渲染属性,否则,读取所述一级子元素属性中的字幕渲染属性。
判断字幕特技属性S2032,具体步骤为,判断所述二级子元素属性中是否包括字幕特技属性,若是,则读取所述二级子元素属性中的字幕特技属性,否则,读取所述一级子元素属性中的字幕特技属性。
将所述分离字幕素材文件发送到媒资服务器。
步骤S204,生成新字幕信息;
在此步骤中,对所述生成分离字幕素材文件根据XML字幕素材结构进行解析,确定字幕文件信息、字幕段信息、字幕屏信息、字幕块信息,并生成新字幕信息。
从媒资服务器中读取分离字幕素材文件。
本发明实施例的技术方案带来的有益效果如下:
在实施例一有益效果的基础上,本实施例的增加了对于在字幕段信息中可以描述“渲染属性”和“特技术性”,作为公共属性,在字幕屏中,如果没有描述“渲染属性”或“特技术性”,则直接使用公共属性,这也是最常见的做法,如果在字幕屏中,描述了“渲染属性”或“特技术性”,则使用该节点下的“渲染属性”或“特技术性”,通过以上方式,可以通过对字幕段“渲染属性”和“特技术性”,公共属性定义,默认定义字幕屏的“渲染属性”和“特技术性”属性,从而简化了公共属性的设置过程。
本发明实施例3中提供了一种通用的可交换字幕的生产和复用系统,如图3所示,包括:
多媒体信息输出单元301,所述多媒体信息输出单元用于,在节目制作系统中导入多媒体工程文件,所述节目制作系统包括用于实现对所述多媒体工程文件中的视频信息、音频信息及字幕信息给予规定多媒体格式的输出;
本发明进一步包括:提取字幕信息单元302、XML字幕素材结构生产单元303、生成分离字幕素材单元304、新字幕生成单元305,其中,
所述提取字幕信息单元302,用于提取所述字幕信息,所述字幕信息中包括,字幕文件说明信息、字幕段信息、字幕屏信息、字幕块信息,所述字幕块信息至少包括,字幕文字信息;所述字幕屏信息至少包括,单位字幕屏中所包括的字幕块数量信息及字幕屏时码信息;所述字幕段信息至少包括,所包括的字幕屏数量信息及字幕段时码信息;所述字幕文件说明信息中至少包括,节目名称、字幕输出文件名、字幕使用语言、字幕段数量信息;
所述提取字幕信息单元302中所述字幕段信息中还包括:公共属性,所述公共属性至少包括,字幕渲染属性及字幕特技属性信息,所述字幕渲染属性中至少包括,字幕颜色、字幕面积及字幕字距;所述字幕特技属性中至少包括,特技入时码、特技出时码、特技类型。
所述提取字幕信息单元302中所述字幕屏信息中还包括:字幕渲染属性及字幕特技属性信息,所述字幕渲染属性中至少包括,字幕颜色、字幕面积及字幕字距;所述字幕特技属性中至少包括,特技入时码、特技出时码、特技类型。
所述XML字幕素材结构生产单元303,用于将所述字幕文件说明信息确定为XML可扩展标记语言结构中的根元素,根据所述节目名称、字幕使用语言、字幕输出文件名确定所述根元素属性;根据所述字幕段信息确定为所述根元素中的一级子元素信息,所述一级子元素信息的数量由所述字幕段数量信息确定,所述一级子元素属性包括,字幕段时码信息;根据所述字幕屏信息确定为所述一级子元素中的二级子元素,所述二级子元素的数量由所述字幕屏数量信息确定,所述二级子元素属性包括,字幕屏时码信息;根据所述字幕块信息确定为所述二级子元素中的三级子元素,所述三级子元素的数量由所述字幕块数量信息确定,所述三级子元素属性包括,所述字幕文字信息确定;组成XML字幕素材结构;
所述XML字幕素材结构生产单元303中所述一级子元素属性还包括,字幕渲染属性及字幕特技属性信息。
所述XML字幕素材结构生产单元303中所述二级子元素属性还包括,字幕渲染属性及字幕特技属性信息。
所述生成分离字幕素材单元304,用于根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件;
所述生成分离字幕素材单元304中还包括,渲染属性判断单元3041,所述渲染属性判断单元用于,所述根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件步骤中还包括,判断所述二级子元素属性中是否包括字幕渲染属性,若是,则读取所述二级子元素属性中的字幕渲染属性,否则,读取所述一级子元素属性中的字幕渲染属性。
所述生成分离字幕素材单元304中还包括,字幕特技属性判断单元3042,用于所述根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件步骤中还包括,判断所述二级子元素属性中是否包括字幕特技属性,若是,则读取所述二级子元素属性中的字幕特技属性,否则,读取所述一级子元素属性中的字幕特技属性。
所述生成分离字幕素材单元304中还包括:推送单元;所述推送单元3043,用于将所述分离字幕素材文件发送到媒资服务器。
所述新字幕生成单元305,用于对所述生成分离字幕素材文件根据XML字幕素材结构进行解析,确定字幕文件信息、字幕段信息、字幕屏信息、字幕块信息,并生成新字幕信息。
所述新字幕生成单元305中还包括,接收单元3051;所述接收单元,用于从媒资服务器中读取分离字幕素材文件。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以可借助软件加必要的通用硬件平台的方式来实现,基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
总之,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (18)

1.一种通用的可交换字幕的生成和复用方法,在节目制作系统中导入多媒体工程文件,所述节目制作系统包括用于实现对所述多媒体工程文件中的视频信息、音频信息及字幕信息给予规定多媒体格式的输出,其特征在于,包括以下步骤:
提取所述字幕信息,所述字幕信息中包括,字幕文件说明信息、字幕段信息、字幕屏信息、字幕块信息,所述字幕块信息至少包括,字幕文字信息;所述字幕屏信息至少包括,单位字幕屏中所包括的字幕块数量信息及字幕屏时码信息;所述字幕段信息至少包括,所包括的字幕屏数量信息及字幕段时码信息;所述字幕文件说明信息中至少包括,节目名称、字幕输出文件名、字幕使用语言、字幕段数量信息;
将所述字幕文件说明信息确定为XML可扩展标记语言结构中的根元素,根据所述节目名称、字幕使用语言、字幕输出文件名确定所述根元素属性;根据所述字幕段信息确定为所述根元素中的一级子元素信息,所述一级子元素信息的数量由所述字幕段数量信息确定,所述一级子元素属性包括,字幕段时码信息;根据所述字幕屏信息确定为所述一级子元素中的二级子元素,所述二级子元素的数量由所述字幕屏数量信息确定,所述二级子元素属性包括,字幕屏时码信息;根据所述字幕块信息确定为所述二级子元素中的三级子元素,所述三级子元素的数量由所述字幕块数量信息确定,所述三级子元素属性包括,所述字幕文字信息确定;组成XML字幕素材结构;
根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件;
对所述生成分离字幕素材文件根据XML字幕素材结构进行解析,确定字幕文件信息、字幕段信息、字幕屏信息、字幕块信息,并生成新字幕信息。
2.如权利要求1中所述的方法,其特征在于,所述字幕段信息中还包括:公共属性,所述公共属性至少包括,字幕渲染属性及字幕特技属性信息,所述字幕渲染属性中至少包括,字幕颜色、字幕面积及字幕字距;所述字幕特技属性中至少包括,特技入时码、特技出时码、特技类型。
3.如权利要求1中所述的方法,其特征在于,所述字幕屏信息中还包括:字幕渲染属性及特技属性信息,所述字幕渲染属性中至少包括,字幕颜色、字幕面积及字幕字距;所述字幕特技属性中至少包括,特技入时码、特技出时码、特技类型。
4.如权利要求2中所述的方法,其特征在于,所述一级子元素属性还包括,字幕渲染属性及字幕特技属性信息。
5.如权利要求3中所述的方法,其特征在于,所述二级子元素属性还包括,字幕渲染属性及字幕特技属性信息。
6.如权利要求5中所述的方法,其特征在于,所述根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件步骤中还包括,判断所述二级子元素属性中是否包括字幕渲染属性,若是,则读取所述二级子元素属性中的字幕渲染属性,否则,读取所述一级子元素属性中的字幕渲染属性。
7.如权利要求5中所述的方法,其特征在于,所述根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件步骤中还包括,判断所述二级子元素属性中是否包括字幕特技属性,若是,则读取所述二级子元素属性中的字幕特技属性,否则,读取所述一级子元素属性中的字幕特技属性。
8.如权利要求1中所述的方法,其特征在于,所述根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件步骤后还包括;
将所述分离字幕素材文件发送到媒资服务器。
9.如权利要求1中所述的方法,其特征在于,所述对所述生成分离字幕素材文件根据XML字幕素材结构进行解析步骤之前还包括:
从媒资服务器中读取分离字幕素材文件。
10.一种通用的可交换字幕的生产和复用系统,包括,多媒体信息输出单元,所述多媒体信息输出单元用于,在节目制作系统中导入多媒体工程文件,所述节目制作系统包括用于实现对所述多媒体工程文件中的视频信息、音频信息及字幕信息给予规定多媒体格式的输出,其特征在于,包括提取字幕信息单元、XML字幕素材结构生产单元、生成分离字幕素材单元、新字幕生成单元,其中,
所述提取字幕信息单元,用于提取所述字幕信息,所述字幕信息中包括,字幕文件说明信息、字幕段信息、字幕屏信息、字幕块信息,所述字幕块信息至少包括,字幕文字信息;所述字幕屏信息至少包括,单位字幕屏中所包括的字幕块数量信息及字幕屏时码信息;所述字幕段信息至少包括,所包括的字幕屏数量信息及字幕段时码信息;所述字幕文件说明信息中至少包括,节目名称、字幕输出文件名、字幕使用语言、字幕段数量信息;
所述XML字幕素材结构生产单元,用于将所述字幕文件说明信息确定为XML可扩展标记语言结构中的根元素,根据所述节目名称、字幕使用语言、字幕输出文件名确定所述根元素属性;根据所述字幕段信息确定为所述根元素中的一级子元素信息,所述一级子元素信息的数量由所述字幕段数量信息确定,所述一级子元素属性包括,字幕段时码信息;根据所述字幕屏信息确定为所述一级子元素中的二级子元素,所述二级子元素的数量由所述字幕屏数量信息确定,所述二级子元素属性包括,字幕屏时码信息;根据所述字幕块信息确定为所述二级子元素中的三级子元素,所述三级子元素的数量由所述字幕块数量信息确定,所述三级子元素属性包括,所述字幕文字信息确定;组成XML字幕素材结构;
所述生成分离字幕素材单元,用于根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件;
所述新字幕生成单元,用于对所述生成分离字幕素材文件根据XML字幕素材结构进行解析,确定字幕文件信息、字幕段信息、字幕屏信息、字幕块信息,并生成新字幕信息。
11.如权利要求10中所述的系统,其特征在于,所述提取字幕信息单元中所述字幕段信息中还包括:公共属性,所述公共属性至少包括,字幕渲染属性及字幕特技属性信息,所述字幕渲染属性中至少包括,字幕颜色、字幕面积及字幕字距;所述字幕特技属性中至少包括,特技入时码、特技出时码、特技类型。
12.如权利要求10中所述的系统,其特征在于,所述提取字幕信息单元中所述字幕屏信息中还包括:字幕渲染属性及字幕特技属性信息,所述字幕渲染属性中至少包括,字幕颜色、字幕面积及字幕字距;所述字幕特技属性中至少包括,特技入时码、特技出时码、特技类型。
13.如权利要求11中所述的系统,其特征在于,所述XML字幕素材结构生产单元中所述一级子元素属性还包括,字幕渲染属性及字幕特技属性信息。
14.如权利要求12中所述的系统,其特征在于,所述XML字幕素材结构生产单元中所述二级子元素属性还包括,字幕渲染属性及字幕特技属性信息。
15.如权利要求14中所述的系统,其特征在于,所述生成分离字幕素材单元中还包括,渲染属性判断单元,所述渲染属性判断单元用于,所述根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件步骤中还包括,判断所述二级子元素属性中是否包括字幕渲染属性,若是,则读取所述二级子元素属性中的字幕渲染属性,否则,读取所述一级子元素属性中的字幕渲染属性。
16.如权利要求14中所述的系统,其特征在于,所述生成分离字幕素材单元中还包括,字幕特技属性判断单元,用于所述根据所述XML字幕结构按屏显示方式对元素进行层级调用并生成分离字幕素材文件步骤中还包括,判断所述二级子元素属性中是否包括字幕特技属性,若是,则读取所述二级子元素属性中的字幕特技属性,否则,读取所述一级子元素属性中的字幕特技属性。
17.如权利要求10中所述的系统,其特征在于,所述生成分离字幕素材单元中还包括:推送单元;
所述推送单元,用于将所述分离字幕素材文件发送到媒资服务器。
18.如权利要求10中所述的系统,其特征在于,所述新字幕生成单元中还包括,接收单元;
所述接收单元,用于从媒资服务器中读取分离字幕素材文件。
CN2011103046287A 2011-10-10 2011-10-10 一种通用的可交换字幕的生成和复用的方法及系统 Pending CN102427512A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011103046287A CN102427512A (zh) 2011-10-10 2011-10-10 一种通用的可交换字幕的生成和复用的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011103046287A CN102427512A (zh) 2011-10-10 2011-10-10 一种通用的可交换字幕的生成和复用的方法及系统

Publications (1)

Publication Number Publication Date
CN102427512A true CN102427512A (zh) 2012-04-25

Family

ID=45961450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011103046287A Pending CN102427512A (zh) 2011-10-10 2011-10-10 一种通用的可交换字幕的生成和复用的方法及系统

Country Status (1)

Country Link
CN (1) CN102427512A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102065229A (zh) * 2009-11-12 2011-05-18 新奥特(北京)视频技术有限公司 一种通用字幕的制播方法及装置
CN102065228A (zh) * 2009-11-12 2011-05-18 新奥特(北京)视频技术有限公司 一种用于对通用字幕文件进行播出的字幕机
CN102065235A (zh) * 2009-11-12 2011-05-18 新奥特(北京)视频技术有限公司 一种通用字幕的生成方法及装置
CN102065230A (zh) * 2009-11-12 2011-05-18 新奥特(北京)视频技术有限公司 一种网络化的字幕制播系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102065229A (zh) * 2009-11-12 2011-05-18 新奥特(北京)视频技术有限公司 一种通用字幕的制播方法及装置
CN102065228A (zh) * 2009-11-12 2011-05-18 新奥特(北京)视频技术有限公司 一种用于对通用字幕文件进行播出的字幕机
CN102065235A (zh) * 2009-11-12 2011-05-18 新奥特(北京)视频技术有限公司 一种通用字幕的生成方法及装置
CN102065230A (zh) * 2009-11-12 2011-05-18 新奥特(北京)视频技术有限公司 一种网络化的字幕制播系统

Similar Documents

Publication Publication Date Title
CN102065234B (zh) 基于分布式字幕处理系统的字幕制播方法及系统
US8819535B2 (en) Editing time-based media with enhanced content
CN103905744B (zh) 一种渲染合成方法及系统
CN104007967B (zh) 一种基于可扩展标记语言的用户界面生成方法和装置
CN105843787B (zh) 一种富文本编辑方法及系统
CN102141985A (zh) 一种文稿在线编辑器
CN104298721A (zh) 一种基于Web的在线课件制作任意个对象分屏布局编辑方法
CN101188697A (zh) 一种非编中导入文稿中字幕的方法
US20030088874A1 (en) Interactive digital television network
KR101709186B1 (ko) 인터랙티브 멀티미디어 전자책 저작 장치 및 방법
CN101968739A (zh) 一种基于flash技术机顶盒体系框架的实现方法
CN102082926B (zh) 一种场景字幕的制作方法和制作装置
CN102427512A (zh) 一种通用的可交换字幕的生成和复用的方法及系统
CN102065230B (zh) 一种网络化的字幕制播系统
CN102065236B (zh) 一种字幕文件的制作方法及装置
CN102082934B (zh) 字幕对象的更新方法及装置
CN102104741B (zh) 多语种字幕的编排方法及装置
CN101944081A (zh) 一种古琴减字谱的计算机生成、编辑方法与系统
KR101307790B1 (ko) 연결번역 기반의 디지털 만화콘텐츠 저작 방법 및 이를 위한 컴퓨터로 판독가능한 기록매체
CN114518876A (zh) 一种html网页源码的可视化编辑和生成方法
CN102065235B (zh) 一种通用字幕的生成方法及装置
CN113988039A (zh) 无代码自动排版生成网页方法及装置
CN102065229B (zh) 一种通用字幕的制播方法及装置
CN102104742B (zh) 多语种字幕的混合编排方法及装置
CN102104743B (zh) 多语种混排字幕的编辑方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120425