CN102104741B - 多语种字幕的编排方法及装置 - Google Patents

多语种字幕的编排方法及装置 Download PDF

Info

Publication number
CN102104741B
CN102104741B CN200910241962.5A CN200910241962A CN102104741B CN 102104741 B CN102104741 B CN 102104741B CN 200910241962 A CN200910241962 A CN 200910241962A CN 102104741 B CN102104741 B CN 102104741B
Authority
CN
China
Prior art keywords
text
text unit
layout
adjacent
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200910241962.5A
Other languages
English (en)
Other versions
CN102104741A (zh
Inventor
袁慧晶
郑培枫
吕精华
郭红艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Digital Video Beijing Ltd
Original Assignee
China Digital Video Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Digital Video Beijing Ltd filed Critical China Digital Video Beijing Ltd
Priority to CN200910241962.5A priority Critical patent/CN102104741B/zh
Publication of CN102104741A publication Critical patent/CN102104741A/zh
Application granted granted Critical
Publication of CN102104741B publication Critical patent/CN102104741B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Controls And Circuits For Display Device (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种多语种字幕的编排方法,包括:将一行内的字幕文本分割为多个文本单元,所述文本单元由一组连续的同语种字符组成;将所述文本单元内的字符按其语种的排列规则进行编排;若相邻文本单元的语种具有一致的排列规则,则按照所述排列规则顺序编排所述文本单元。

Description

多语种字幕的编排方法及装置
技术领域
本发明涉及字幕制作的技术领域,特别是涉及一种多语种字幕的编排方法及一种多语种字幕的编排装置。
背景技术
随着世界经济的发展,国际交流与合作的扩大,作为最重要的信息载体的文字必然受到影响。过去几乎都是单一语种的文档,而今的文档往往以某一语种文字为主同时或多或少混排了其他的语种文字,最常见的莫过于中英文混排,当然还有俄、法、日、阿等其他语种的混排。在广播、电视、电影的国际节目制作中,实现多语种混排字幕的需求也越来越多。
在视频节目中的多语种混排字幕,不仅要求内容正确,而且要求视觉效果,同时要求制作的快捷简便。由于各语种的语言结构、文字符号的复杂多样性,多语种的混排问题仍有很多。尤其是从右至左书写的维、哈、阿等文字与从左至右书写的中、英等文字的混排。以往的阿、中文等混排字幕的制作,甚至单一小语种字幕(如阿拉伯语、希伯来语、波斯语或乌尔都语),制作人员往往需要在不同的文本编辑框内编辑单一语种文字,然后进行拼接;或者,需要采用不同的文本图像编辑软件制作存成图片使用。因此工作量很大,效率很低,无法满足实际中国际节目的增多、直播节目的需求。
发明内容
本发明所要解决的技术问题是提供一种多语种字幕的编排方法及一种多语种字幕的编排装置,用以简化多语种字幕的编排,提高多语种字幕的编排效率。
为了解决上述技术问题,本发明实施例公开了一种多语种字幕的编排方法,包括:
将一行内的字幕文本分割为多个文本单元,所述文本单元由一组连续的同语种字符组成;
将所述文本单元内的字符按其语种的排列规则进行编排;
若相邻文本单元的语种具有一致的排列规则,则按照所述排列规则顺序编排所述文本单元。
优选的,所述相邻文本单元分别为中文、英文、数字和/或通用符号,所述编排相邻文本单元的步骤包括:
将当前文本单元排于相邻前一文本单元的右侧。
优选的,所述相邻文本单元分别为阿拉伯文、希伯来文、波斯文或乌尔都文,所述编排相邻文本单元的步骤包括:
将当前文本单元排于相邻前一文本单元的左侧。
优选的,所述字幕文本采用Unicode编码。
本发明实施例还公开了一种多语种字幕的编排装置,包括:
文本单元分割模块,用于将一行内的字幕文本分割为多个文本单元,所述文本单元由一组连续的同语种字符组成;
字符内单元编排模块,用于将所述文本单元内的字符按其语种的排列规则进行编排;
相邻单元编排模块,用于在相邻文本单元的语种具有一致的排列规则时,按照所述排列规则顺序编排所述文本单元。
优选的,所述相邻文本单元分别为中文、英文、数字和/或通用符号,所述相邻单元编排模块包括:
从左向右编排子模块,用于将当前文本单元排于相邻前一文本单元的右侧。
优选的,所述相邻文本单元分别为阿拉伯文、希伯来文、波斯文或乌尔都文,所述相邻单元编排模块包括:
从右向左编排子模块,用于将当前文本单元排于相邻前一文本单元的左侧。
优选的,所述字幕文本采用Unicode编码。
优选的,所述装置位于字幕机中。
与现有技术相比,本发明具有以下优点:
本发明以行为单位,并把一行内的字幕文本按照其连续、同语种的特性分割为多个文本单元,如一行内的字幕文本为一组中文字符、一组英文字符和一组数字组成,并且,文本单元内的字符按其语种的排列规则进行编排,在编排相邻的两个文本单元时,若二者的语种具有一致的排列规则,如同为从左向右,或同为从右向左,则按照相应的排列规则顺序编排这两个相邻文本单元。
应用本发明在对多语种的文本进行处理时,无需针对各个语种分别编辑后再进行拼接,也无需处理成图片,用户只需要按照其输入习惯输入文本,就会依据该文本语种的排列规则对文本进行编排,从而有效简化多语种字幕的编排,提高多语种字幕的编排效率。充分满足了当前国际节目的增多、直播节目的需求。
附图说明
图1是本发明的一种多语种字幕的编排方法实施例的流程图;
图2是本发明的一种多语种字幕的编排装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:多处理器系统、服务器、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
字幕一般指以文字形式显示电视、电影、舞台作品里面的对话等非影像内容,也泛指影视作品后期加工的文字。例如,影视作品的对话字幕,一般出现在屏幕下方;而戏剧作品的字幕,则可能显示于舞台两旁或上方。另外,还可以将节目的语音内容以字幕方式显示,可以帮助听力较弱的观众理解节目内容。随着电视事业的发展,字幕在电视中的作用越来越大,日均播出次数增多,字幕播出的形式多样,字幕制作也更加精美。
参考图1,示出了本发明的一种多语种字幕的编排方法实施例的流程图,具体可以包括以下步骤:
步骤101、将一行内的字幕文本分割为多个文本单元,所述文本单元由一组连续的同语种字符组成;
步骤102、将所述文本单元内的字符按其语种的排列规则进行编排;
步骤103、若相邻文本单元的语种具有一致的排列规则,则按照所述排列规则顺序编排所述文本单元。
在一种具体应用中,若当前行内,所述相邻文本单元分别为中文、英文、数字和/或通用符号,由于中文、英文、数字和通用符号都是采用从左至右的排列规则,则可以依据从左至右的方向顺序编排所述相邻文本单元,即在当前行内将当前文本单元排于相邻前一文本单元的右侧。
例如,假设某一行内的字幕文本包括:
中文字符为:c1 c2,英文字符:e1 e2,数字字符:n1 n2,
则其编排结果可以为:
c1 c2 e1 e2 n1 n2
上述下划线指示的一组字符即对应一个文本单元,在本例中,文本单元内部的字符是按其语种从左向右进行排序,对于相邻两个文本单元而言,在编辑后一文本单元时,会自动将其排入前一文本单元的右侧。
在又一种具体应用中,若当前行内,所述相邻文本单元分别为阿拉伯文、希伯来文、波斯文或乌尔都文,由于阿拉伯文、希伯来文、波斯文或乌尔都文都是采用从右向左的排列规则,则可以依据从右至左的方向顺序编排所述相邻文本单元,即在当前行内将当前文本单元排于相邻前一文本单元的左侧。
例如,假设另一行内的字幕文本包括:
阿拉伯文字符:a1 a2,波斯文字符:b1 b2,乌尔都文w1 w2。
则其编排结果可以为:
w2 w1 b2 b1 a2 a1
同样地,上述下划线指示的一组字符即对应一个文本单元,在本例中,文本单元内部的字符是按其语种从右向左进行排序,对于相邻两个文本单元而言,在编辑后一文本单元时,会自动将其排入前一文本单元的左侧。
本发明可以应用在文本编辑的场景中,即用户在输入字幕文本时,就会自动按照连续的同语种字符组成的文本单元,以及相邻文本单元的排列规则写入文本编辑器中。
在实际中,字幕的制作一般是在字幕机、非编机或PC上通过相应的字幕制作系统完成,字幕制作系统通过人机交互的方式,对每个字幕文本分配相应的文本对象属性(文本属性、渲染属性、动态效果属性等),即字幕机、非编机或PC会在其内存中,针对每个字幕文本会相应保存其对应属性,以便在播出时,依据该属性播出该字幕。在字幕制作系统中,用户通过选取当前所需的字幕模板,并导入相应的新文本,触发替换操作后,即可快速地将字幕模板中原有的旧字幕替换为新字幕,即新字幕将与字幕模板中的相应属性进行关联,在播出时,即会分别依据各属性与字幕的关联,播出该新字幕。
本发明还可以应用在上述字幕替换的场景中,即在采用新的文本数据替换字幕模板中旧的文本数据时,可以依据文本编辑器的编排结果,对应地将字幕文本与模板中定义的相关属性关联起来。
例如,一种“中文+数字+英文”的时钟字幕模板为:
北京时间10:10am
假设当前导入的一行经过文本编辑器编排的新文本为:伦敦时间 08:10pm(下划线仅用于指示文本单元,并非文本的实际内容),则系统会自动识别出连续中文字符组成的文本单元“伦敦时间”,将其映射至字幕模板中对应类别的字符“北京时间”的位置,从而生成该新字符关联的文本对象属性为“字体:楷体;字号:14;颜色:红色”;以及,继续识别出连续数字字符组成的文本单元“08:10”,将其映射至字幕模板中对应类别的字符“10:10”的位置,从而生成该新字符关联的文本对象属性为“字体:Times New Roman;字号:14;颜色:蓝色”;以及,继续识别出连续英文字符组成的文本单元“pm”,将其映射至对应类别的字符“am”的位置,从而生成该新字符关联的文本对象属性为“字体:Times New Roman;字号:14;颜色:黑色”;即完成替换后该行字幕文本的播出显示示意为:
伦敦时间08:10pm
在具体实现中,所述字幕文本可以采用Unicode编码。Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。阿拉伯文包含32个字母,每个字母因其在词中的首中尾位置具有不同书写形式,但其Unicode编码是不变的。再者,在实际中,每种语言都提供有缺省的默认字体,例如,中文字体包含中文字符集,缺省黑体。英文缺省字体Arial。阿拉伯文字符也是字母,缺省也是Arial。
当然,上述应用仅仅用作示例,本领域技术人员依据实际情况将本发明方案应用至任一种具体情形中都是可行的,本发明对此无需加以限制。
参考图2,示出了本发明的一种多语种字幕的编排装置实施例的结构框图,具体可以包括以下模块:
文本单元分割模块201,用于将一行内的字幕文本分割为多个文本单元,所述文本单元由一组连续的同语种字符组成;
字符内单元编排模块202,用于将所述文本单元内的字符按其语种的排列规则进行编排;
相邻单元编排模块203,用于在相邻文本单元的语种具有一致的排列规则时,按照所述排列规则顺序编排所述文本单元。
在本发明的一种具体应用中,所述相邻文本单元分别为中文、英文、数字和/或通用符号,所述相邻单元编排模块具体可以包括以下子模块:
从左向右编排子模块,用于将当前文本单元排于相邻前一文本单元的右侧。
在本发明的又一种具体应用中,所述相邻文本单元分别为阿拉伯文、希伯来文、波斯文或乌尔都文,所述相邻单元编排模块具体可以包括以下子模块:
从右向左编排子模块,用于将当前文本单元排于相邻前一文本单元的左侧。
在具体实现中,所述字幕文本采用Unicode编码。
作为一种优选应用,所述装置可以位于字幕机中。公知的是,字幕机是一种电视节目制作的专用设备,随着计算机技术的迅猛发展,字幕机在电视机制作领域越来越得以普及,技术制作指标也越来越高,功能也不断增强。一般而言,字幕机是由PC加上专业的字幕叠加卡和相应的字幕制作软件组成,用来在视频信号上叠加图文字幕。字幕制作软件就是控制字幕以何种方式叠加到背景画面上,与使用者交互的工具;有了计算机和字幕软件后,需要有一个能够允许背景画面输入,并且在叠加字幕以后,最终输出带有字幕视频的设备。要想接收视频进入,而后把视频输出,是另外需要其他附加设备的,字幕叠加卡就是这样的设备。
应用本发明在字幕机中制作字幕时,通过与用户交互,选定当前所需的字幕模板,并导入相应的文本编排结果后,即可快速地将字幕模板中原有的旧字幕替换为新字幕,即新字幕将与字幕模板中的相应属性进行关联,在播出时,即会分别依据各属性与字幕的关联,播出该新字幕。
由于本实施例基本相应于前述方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此就不赘述了。本说明书中的各个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本发明所提供的一种多语种字幕的编排方法及一种多语种字幕的编排装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种多语种字幕的编排方法,其特征在于,所述编排方法应用在文本编辑的场景中,或者,所述编排方法应用在字幕替换的场景中,所述方法包括:
将一行内的字幕文本分割为多个文本单元,所述文本单元由一组连续的同语种字符组成;
将所述文本单元写入文本编辑器中;
在文本编辑器中,将所述文本单元内的字符按其语种的排列规则进行编排;
在文本编辑器中,若相邻文本单元的语种具有一致的排列规则,则按照所述排列规则顺序编排所述文本单元;
在采用新的文本数据替换字幕模板中旧的文本数据时,依据所述文本编辑器的编排结果,对应地将字幕文本与模板中定义的相关属性关联起来。
2.如权利要求1所述的方法,其特征在于,所述相邻文本单元分别为中文、英文、数字和/或通用符号,所述编排相邻文本单元的步骤包括:
将当前文本单元排于相邻前一文本单元的右侧。
3.如权利要求1所述的方法,其特征在于,所述相邻文本单元分别为阿拉伯文、希伯来文、波斯文或乌尔都文,所述编排相邻文本单元的步骤包括:
将当前文本单元排于相邻前一文本单元的左侧。
4.如权利要求1、2或3所述的方法,其特征在于,所述字幕文本采用Unicode编码。
5.一种多语种字幕的编排装置,其特征在于,包括:
文本单元分割模块,用于将一行内的字幕文本分割为多个文本单元,将所述文本单元写入文本编辑器中,所述文本单元由一组连续的同语种字符组成;
字符内单元编排模块,用于在文本编辑器中,将所述文本单元内的字符按其语种的排列规则进行编排;
相邻单元编排模块,用于在文本编辑器中,在相邻文本单元的语种具有一致的排列规则时,按照所述排列规则顺序编排所述文本单元;
所述编排装置还用于执行如下操作:
在采用新的文本数据替换字幕模板中旧的文本数据时,依据所述文本编辑器的编排结果,对应地将字幕文本与模板中定义的相关属性关联起来。
6.如权利要求5所述的装置,其特征在于,所述相邻文本单元分别为中文、英文、数字和/或通用符号,所述相邻单元编排模块包括:
从左向右编排子模块,用于将当前文本单元排于相邻前一文本单元的右侧。
7.如权利要求5所述的装置,其特征在于,所述相邻文本单元分别为阿拉伯文、希伯来文、波斯文或乌尔都文,所述相邻单元编排模块包括:
从右向左编排子模块,用于将当前文本单元排于相邻前一文本单元的左侧。
8.如权利要求5、6或7所述的装置,其特征在于,所述字幕文本采用Unicode编码。
9.如权利要求5所述的装置,其特征在于,所述装置位于字幕机中。
CN200910241962.5A 2009-12-16 2009-12-16 多语种字幕的编排方法及装置 Expired - Fee Related CN102104741B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910241962.5A CN102104741B (zh) 2009-12-16 2009-12-16 多语种字幕的编排方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910241962.5A CN102104741B (zh) 2009-12-16 2009-12-16 多语种字幕的编排方法及装置

Publications (2)

Publication Number Publication Date
CN102104741A CN102104741A (zh) 2011-06-22
CN102104741B true CN102104741B (zh) 2014-12-24

Family

ID=44157221

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910241962.5A Expired - Fee Related CN102104741B (zh) 2009-12-16 2009-12-16 多语种字幕的编排方法及装置

Country Status (1)

Country Link
CN (1) CN102104741B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106686408B (zh) * 2016-12-06 2022-04-29 海信视像科技股份有限公司 一种Teletext信息的传输方法和装置
CN110287147B (zh) * 2019-06-27 2022-08-19 北京奇艺世纪科技有限公司 一种字符串排序方法及装置
CN110516266A (zh) * 2019-09-20 2019-11-29 张启 视频字幕自动翻译方法、装置、存储介质及计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4205310A (en) * 1978-05-22 1980-05-27 Thomson-Csf Laboratories, Inc. Television titling apparatus and method
CN1575452A (zh) * 2000-10-24 2005-02-02 雷声公司 具有动态语言选择的多语言系统
CN101140565A (zh) * 2007-10-08 2008-03-12 北大方正集团有限公司 一种显示维文的方法及装置
CN101571851A (zh) * 2009-06-11 2009-11-04 无敌科技(西安)有限公司 可混排显示泰文及阿拉伯文的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4205310A (en) * 1978-05-22 1980-05-27 Thomson-Csf Laboratories, Inc. Television titling apparatus and method
CN1575452A (zh) * 2000-10-24 2005-02-02 雷声公司 具有动态语言选择的多语言系统
CN101140565A (zh) * 2007-10-08 2008-03-12 北大方正集团有限公司 一种显示维文的方法及装置
CN101571851A (zh) * 2009-06-11 2009-11-04 无敌科技(西安)有限公司 可混排显示泰文及阿拉伯文的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
永中Office办公套件维文版的设计――多语言混合排版的设计;董军等;《计算机应用研究》;20060310(第03期);202-204 *

Also Published As

Publication number Publication date
CN102104741A (zh) 2011-06-22

Similar Documents

Publication Publication Date Title
CN104298725B (zh) 在线课件开发系统一次性编辑输入多版本输出的方法
CN105843787B (zh) 一种富文本编辑方法及系统
CN104317563A (zh) 一种在线课件协作开发系统
CN102103586B (zh) 一种多语种双向混排字幕的编辑系统
CN104298721A (zh) 一种基于Web的在线课件制作任意个对象分屏布局编辑方法
CN107066440A (zh) 竖排文本的输入控制方法及系统
CN102104741B (zh) 多语种字幕的编排方法及装置
CN101436307A (zh) 一种公式的交互式排版方法及系统
CN102508822A (zh) 泰语显示方法、装置和系统
CN102104742B (zh) 多语种字幕的混合编排方法及装置
CN102082934B (zh) 字幕对象的更新方法及装置
CN102104743B (zh) 多语种混排字幕的编辑方法及装置
CN105148519A (zh) 一种游戏程序中的文字渲染方法及系统
JP2006048695A (ja) スクリプト特性によるテキストデータ処理装置及び方法
CN102104740B (zh) 一种多语种字幕的混排方法及装置
CN102103585B (zh) 一种多语种字幕的制作方法及装置
CN102841890A (zh) 一种用于文档构建的数据加工方法和装置
CN102082933B (zh) 一种字幕制作系统
CN102082922B (zh) 在字幕模板中更新字幕的方法及装置
CN113988039A (zh) 无代码自动排版生成网页方法及装置
US9922011B2 (en) Masking an object in hypertext markup language
CN102082929B (zh) 一种字幕模板的套用方法及装置
Kyrnin Sams Teach Yourself HTML5 Mobile Application Development in 24 Hours
CN102082928B (zh) 字幕属性的关联方法及装置
CN103037248A (zh) 一种基于数字机顶盒的信息平台体系

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20141224

Termination date: 20161216

CF01 Termination of patent right due to non-payment of annual fee