CN102104743B - 多语种混排字幕的编辑方法及装置 - Google Patents

多语种混排字幕的编辑方法及装置 Download PDF

Info

Publication number
CN102104743B
CN102104743B CN200910241966.3A CN200910241966A CN102104743B CN 102104743 B CN102104743 B CN 102104743B CN 200910241966 A CN200910241966 A CN 200910241966A CN 102104743 B CN102104743 B CN 102104743B
Authority
CN
China
Prior art keywords
text unit
general symbol
captions
queueing discipline
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200910241966.3A
Other languages
English (en)
Other versions
CN102104743A (zh
Inventor
袁慧晶
冯永
沈季
陈丽爱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Digital Video Beijing Ltd
Original Assignee
China Digital Video Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Digital Video Beijing Ltd filed Critical China Digital Video Beijing Ltd
Priority to CN200910241966.3A priority Critical patent/CN102104743B/zh
Publication of CN102104743A publication Critical patent/CN102104743A/zh
Application granted granted Critical
Publication of CN102104743B publication Critical patent/CN102104743B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种多语种混排字幕的编辑方法,包括:将一行内连续且属于同一语种的字幕文本字符分割为文本单元,并在文本单元内将所述字符按其语种的排列规则进行排版;若字幕文本中出现的通用符号,则通过关联与其衔接的前后文本单元确定其排版方向。本发明可以简化多语种混排字幕的编辑,提高多语种混排字幕的编辑效率。

Description

多语种混排字幕的编辑方法及装置
技术领域
本发明涉及字幕制作的技术领域,特别是涉及一种多语种混排字幕的编辑方法及一种多语种混排字幕的编辑装置。
背景技术
目前,随着世界经济的发展,国际交流与合作的扩大,作为最重要的信息载体的文字必然受到影响。过去几乎都是单一语种的文档,而今的文档往往以某一语种文字为主,同时混排了其他的语种文字,最常见的莫过于中英文混排,当然还有俄文、法文、日文、阿拉伯文等其他语种的混排。在广播、电视、电影等领域的国际节目制作中,对多语种混排字幕的需求也越来越迫切。
字幕一般指以文字形式显示电视、电影、舞台作品里面的对话等非影像内容,也泛指影视作品后期加工的文字。例如,影视作品的对话字幕,一般出现在屏幕下方;而戏剧作品的字幕,则可能显示于舞台两旁或上方。另外,还可以将节目的语音内容以字幕方式显示,可以帮助听力较弱的观众理解节目内容。随着电视事业的发展,字幕在电视中的作用越来越大,日均播出次数增多,字幕播出的形式多样,字幕制作也更加精美。
在视频节目中多语种混排的字幕,不仅要求内容正确,而且要求视觉效果,同时要求制作的快捷简便。然而,由于各语种的语言结构、文字符号的复杂多样性,多语种的混排问题仍有很多。尤其是从右至左排列的阿拉伯语、希伯来语、波斯语等文字,与从左至右排列的中、英等文字的混排中,操作极为复杂。
现有技术中,对于既含阿拉伯文等从右至左排列的文本、又含中英文等从左至右排列的文本的混编字幕的制作,或者是单一小语种字幕(如阿拉伯语、希伯来语、波斯语或乌尔都语)的制作,制作人员往往需要在不同的文本编辑框内编辑单一语种文字,然后进行拼接;或者,需要采用不同的文本图像编辑软件制作存成图片使用;并且一旦涉及在两种排列规则中通用的符号,还需要进一步针对该通用符号进行处理,因此工作量很大,效率很低,无法满足实际中国际节目的增多、直播节目的需求。
发明内容
本发明所要解决的技术问题是提供一种多语种混排字幕的编辑方法及一种多语种混排字幕的编辑装置,用以简化多语种混排字幕的编辑,提高多语种混排字幕的编辑效率。
为了解决上述技术问题,本发明实施例公开了一种多语种混排字幕的编辑方法,包括:
将一行内连续且属于同一语种的字幕文本字符分割为文本单元,并在文本单元内将所述字符按其语种的排列规则进行排版;
若字幕文本中出现的通用符号,则通过关联与其衔接的前后文本单元确定其排版方向。
优选的,所述确定通用符号排版方向的步骤包括:
若当前通用符号衔接的前后文本单元对应同样的排列规则,则按照所述排列规则将该通用符号排于相应的前后文本单元之间。
优选的,所述确定通用符号排版方向的步骤包括:
若当前通用符号衔接的前后文本单元对应不同的排列规则,则在本行内将该符号向左排于前一文本单元最远端的左侧。
优选的,所述最远端通过以下规则确定,在所述前一文本单元的前向相邻文本单元同为从左向右排列的文本单元时,继续向前判定,直到获得前向相邻文本单元为从右向左排列的文本单元为止,则当前从左向右排列的文本单元为最远端。
优选的,所述确定通用符号排版方向的步骤包括:
若所述通用符号为成对出现的符号,则采用该组符号内文本单元的排列规则进行排版。
本发明实施例还公开了一种多语种混排字幕的编辑装置,包括:
文本单元排版模块,用于将一行内连续且属于同一语种的字幕文本字符分割为文本单元,并在文本单元内将所述字符按其语种的排列规则进行排版;
通用字符排版模块,用于在字幕文本中出现的通用符号时,通过关联与其衔接的前后文本单元确定其排版方向。
优选的,所述通用字符排版模块包括:
单向编排子模块,用于在当前通用符号衔接的前后文本单元对应同样的排列规则时,按照所述排列规则将该通用符号排于相应的前后文本单元之间。
优选的,所述通用字符排版模块包括:
双向混排子模块,用于在当前通用符号衔接的前后文本单元对应不同的排列规则时,在本行内将该符号向左排于前一文本单元最远端的左侧。
优选的,所述最远端通过以下规则确定,在所述前一文本单元的前向相邻文本单元同为从左向右排列的文本单元时,继续向前判定,直到获得前向相邻文本单元为从右向左排列的文本单元为止,则当前从左向右排列的文本单元为最远端。
优选的,所述通用字符排版模块包括:
成组字符编排子模块,用于在所述通用符号为成对出现的符号时,采用该组符号内文本单元的排列规则进行排版。)
与现有技术相比,本发明具有以下优点:
本发明以行为单位,并把一行内的字幕文本按照其连续、同语种的特性分割为多个文本单元,如一行内的字幕文本为一组中文字符、一组英文字符和一组数字组成,并且,文本单元内的字符按其语种的排列规则进行编排,在字幕文本中出现的通用符号时,则通过关联与其衔接的前后文本单元确定其排版方向。
应用本发明在对多语种的文本进行处理时,无需针对各个语种分别编辑后再进行拼接,也无需处理成图片,用户只需要按照其输入习惯输入文本,就会依据该文本语种的排列规则对文本进行编排,从而有效简化多语种混排字幕的编辑,提高多语种混排字幕的编辑效率。充分满足了当前国际节目的增多、直播节目的需求。
附图说明
图1是本发明的一种多语种混排字幕的编辑方法实施例的流程图;
图2是本发明的一种多语种混排字幕的编辑装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:多处理器系统、服务器、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
参考图1,示出了本发明的一种多语种混排字幕的编辑方法实施例的流程图,具体可以包括以下步骤:
步骤101、将一行内连续且属于同一语种的字幕文本字符分割为文本单元,并在文本单元内将所述字符按其语种的排列规则进行排版;
步骤102、若字幕文本中出现的通用符号,则通过关联与其衔接的前后文本单元确定其排版方向。
需要说明的是,所述字幕文本可以采用Unicode编码。Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。阿拉伯文包含32个字母,每个字母因其在词中的首中尾位置具有不同排列形式,但其Unicode编码是不变的。再者,在实际中,每种语言都提供有缺省的默认字体,例如,中文字体包含中文字符集,缺省黑体。英文缺省字体Arial。阿拉伯文字符也是字母,缺省也是Arial。
在本发明的一种优选实施例中,所述步骤102包括可以包括如下子步骤:
子步骤s1、若当前通用符号衔接的前后文本单元对应同样的排列规则,则按照所述排列规则将该通用符号排于相应的前后文本单元之间。
以中英文混排字幕为例,因为中文和英文均采用从左向右的排列规则,通用符号如:“.”,“’”,“(”,“)”等直接按英文字符处理即可。
例如,假设某一行内的字幕文本包括:
中文字符:c1 c2,通用符号:-,英文字符:e1 e2,
则其编排结果可以为:
c1 c2-e1 e2
上述下划线指示的一组字符即对应一个文本单元,在本例中,文本单元内部的字符是按其语种从左向右进行排序,对于通用符号而言,其前后文本单元则分别为其左文本单元及右文本单元,此时,该符号将自动将其排入这两个文本单元之间。
以阿拉伯文为例,公知的是,阿拉伯文在Unicode中有基本阿拉伯语(U+0060 to U+006FF)和扩充阿拉伯语(U+FE70 to U+FEFF)两种格式,包含所有阿拉伯语字符和符号。在此Unicode范围内的阿拉伯文符号直接按阿拉伯文处理,如“”,“‘”。
但阿拉伯文中也使用通用符号,如:
在本发明的另一种优选实施例中,所述步骤102包括可以包括如下子步骤:
子步骤s2、若当前通用符号衔接的前后文本单元对应不同的排列规则,则在本行内将该符号向左排于前一文本单元最远端的左侧。
在实际中,所述最远端可以通过以下规则确定,在所述前一文本单元的前向相邻文本单元同为从左向右排列的文本单元时,继续向前判定,直到获得前向相邻文本单元为从右向左排列的文本单元为止,则当前从左向右排列的文本单元为最远端。所述前向相邻文本单元即对应上一次编排的文本单元。
例如,假设第一次编辑的文本单元为:阿拉伯文单词:A1 A2,
期间写入的通用字符:!
第二次编辑的文本单元为:英文单词:E1 E2,
期间写入的通用字符:,
第三次编辑的文本单元为:中文字符:c1,
第四次编辑的文本单元为:阿拉伯文单词:A3。
则上述文本单元的编排结果为:
A3 E1 E2c1A2 A1
上述下划线指示的一组字符即对应一个文本单元,在本例中,文本单元内部的字符是按其语种进行排序,对于通用符号在双向混排时,自成关联单元,即根据前后单元确定方向。单个出现的符号缺省按向左排方向处理,除非其前后相邻单元都是向右排方向(其后单元必须存在)。
在本发明的又一种优选实施例中,所述步骤102包括可以包括如下子步骤:
子步骤s3、若所述通用符号为成对出现的符号,则采用该组符号内文本单元的排列规则进行排版。
即成对出现的通用符号,如“(”,“)”,“{”,“}”,“””,“””等,与该组符号内的文本单元的排版方向一致,如“(”与其后相邻单元方向一致,“)”与其前相邻单元方向一致。如两种具体示例为:
″一点!″″duo le″
″zhan qi lai″
本发明可以应用在文本编辑的场景中,即用户在输入字幕文本时,就会自动按照连续的同语种字符组成的文本单元,以及相邻文本单元的排列规则写入文本编辑器中。
在实际中,字幕的制作一般是在字幕机、非编机或PC上通过相应的字幕制作系统完成,字幕制作系统通过人机交互的方式,对每个字幕文本分配相应的文本对象属性(文本属性、渲染属性、动态效果属性等),即字幕机、非编机或PC会在其内存中,针对每个字幕文本会相应保存其对应属性,以便在播出时,依据该属性播出该字幕。在字幕制作系统中,用户通过选取当前所需的字幕模板,并导入相应的新文本,触发替换操作后,即可快速地将字幕模板中原有的旧字幕替换为新字幕,即新字幕将与字幕模板中的相应属性进行关联,在播出时,即会分别依据各属性与字幕的关联,播出该新字幕。
本发明还可以应用在上述字幕替换的场景中,即在采用新的文本数据替换字幕模板中旧的文本数据时,可以依据文本编辑器的编排结果,对应地将字幕文本与模板中定义的相关属性关联起来。
当然,上述应用仅仅用作示例,本领域技术人员依据实际情况将本发明方案应用至任一种具体情形中都是可行的,本发明对此无需加以限制。
需要说明的是,对于前述的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
参考图2,示出了本发明的一种多语种混排字幕的编辑装置实施例的结构框图,具体可以包括以下模块:
文本单元排版模块201,用于将一行内连续且属于同一语种的字幕文本字符分割为文本单元,并在文本单元内将所述字符按其语种的排列规则进行排版;
通用字符排版模块202,用于在字幕文本中出现的通用符号时,通过关联与其衔接的前后文本单元确定其排版方向。
在本发明的一种优选实施例中,所述通用字符排版模块202可以包括如下子模块:
单向编排子模块,用于在当前通用符号衔接的前后文本单元对应同样的排列规则时,按照所述排列规则将该通用符号排于相应的前后文本单元之间。
在本发明的另一种优选实施例中,所述通用字符排版模块202可以包括如下子模块:
所述通用字符排版模块包括:
双向混排子模块,用于在当前通用符号衔接的前后文本单元对应不同的排列规则时,在本行内将该符号向左排于前一文本单元最远端的左侧。
在实际中,所述最远端通过以下规则确定,在所述前一文本单元的前向相邻文本单元同为从左向右排列的文本单元时,继续向前判定,直到获得前向相邻文本单元为从右向左排列的文本单元为止,则当前从左向右排列的文本单元为最远端。
在本发明的又一种优选实施例中,所述通用字符排版模块202可以包括如下子模块:
成组字符编排子模块,用于在所述通用符号为成对出现的符号时,采用该组符号内文本单元的排列规则进行排版。
在具体实现中,所述字幕文本可以采用Unicode编码。
作为一种优选应用,所述装置可以位于字幕机中。公知的是,字幕机是一种电视节目制作的专用设备,随着计算机技术的迅猛发展,字幕机在电视机制作领域越来越得以普及,技术制作指标也越来越高,功能也不断增强。一般而言,字幕机是由PC加上专业的字幕叠加卡和相应的字幕制作软件组成,用来在视频信号上叠加图文字幕。字幕制作软件就是控制字幕以何种方式叠加到背景画面上,与使用者交互的工具;有了计算机和字幕软件后,需要有一个能够允许背景画面输入,并且在叠加字幕以后,最终输出带有字幕视频的设备。要想接收视频进入,而后把视频输出,是另外需要其他附加设备的,字幕叠加卡就是这样的设备。
应用本发明在字幕机中制作字幕时,通过与用户交互,选定当前所需的字幕模板,并导入相应的文本编排结果后,即可快速地将字幕模板中原有的旧字幕替换为新字幕,即新字幕将与字幕模板中的相应属性进行关联,在播出时,即会分别依据各属性与字幕的关联,播出该新字幕。
由于本实施例基本相应于前述方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此就不赘述了。本说明书中的各个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本发明所提供的一种多语种混排字幕的编辑方法及一种多语种混排字幕的编辑装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (2)

1.一种多语种混排字幕的编辑方法,其特征在于,包括:
将一行内连续且属于同一语种的字幕文本字符分割为文本单元,并在文本单元内将所述字符按其语种的排列规则进行排版;
若字幕文本中出现的通用符号,则通过关联与其衔接的前后文本单元确定其排版方向;
其中,所述确定通用符号排版方向的步骤包括:
若当前通用符号衔接的前后文本单元对应同样的排列规则,则按照所述排列规则将该通用符号排于相应的前后文本单元之间;
若当前通用符号衔接的前后文本单元对应不同的排列规则,则在本行内将该符号向左排于前一文本单元最远端的左侧;
若所述通用符号为成对出现的符号,则采用该组符号内文本单元的排列规则进行排版;
其中,所述最远端通过以下规则确定,在所述前一文本单元的前向相邻文本单元同为从左向右排列的文本单元时,继续向前判定,直到获得前向相邻文本单元为从右向左排列的文本单元为止,则当前从左向右排列的文本单元为最远端。
2.一种多语种混排字幕的编辑装置,其特征在于,包括:
文本单元排版模块,用于将一行内连续且属于同一语种的字幕文本字符分割为文本单元,并在文本单元内将所述字符按其语种的排列规则进行排版;
通用字符排版模块,用于在字幕文本中出现的通用符号时,通过关联与其衔接的前后文本单元确定其排版方向;
所述通用字符排版模块包括:
单向编排子模块,用于在当前通用符号衔接的前后文本单元对应同样的排列规则时,按照所述排列规则将该通用符号排于相应的前后文本单元之间;
双向混排子模块,用于在当前通用符号衔接的前后文本单元对应不同的排列规则时,在本行内将该符号向左排于前一文本单元最远端的左侧;
成组字符编排子模块,用于在所述通用符号为成对出现的符号时,采用该组符号内文本单元的排列规则进行排版;
其中,所述最远端通过以下规则确定,在所述前一文本单元的前向相邻文本单元同为从左向右排列的文本单元时,继续向前判定,直到获得前向相邻文本单元为从右向左排列的文本单元为止,则当前从左向右排列的文本单元为最远端。
CN200910241966.3A 2009-12-16 2009-12-16 多语种混排字幕的编辑方法及装置 Expired - Fee Related CN102104743B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910241966.3A CN102104743B (zh) 2009-12-16 2009-12-16 多语种混排字幕的编辑方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910241966.3A CN102104743B (zh) 2009-12-16 2009-12-16 多语种混排字幕的编辑方法及装置

Publications (2)

Publication Number Publication Date
CN102104743A CN102104743A (zh) 2011-06-22
CN102104743B true CN102104743B (zh) 2015-02-18

Family

ID=44157223

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910241966.3A Expired - Fee Related CN102104743B (zh) 2009-12-16 2009-12-16 多语种混排字幕的编辑方法及装置

Country Status (1)

Country Link
CN (1) CN102104743B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188762B (zh) * 2019-04-23 2021-02-05 山东大学 中英文混合商户门店名称识别方法、系统、设备及介质
CN112906347B (zh) * 2021-03-22 2021-10-15 掌阅科技股份有限公司 文字排版方法、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4205310A (en) * 1978-05-22 1980-05-27 Thomson-Csf Laboratories, Inc. Television titling apparatus and method
CN101571851A (zh) * 2009-06-11 2009-11-04 无敌科技(西安)有限公司 可混排显示泰文及阿拉伯文的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4205310A (en) * 1978-05-22 1980-05-27 Thomson-Csf Laboratories, Inc. Television titling apparatus and method
CN101571851A (zh) * 2009-06-11 2009-11-04 无敌科技(西安)有限公司 可混排显示泰文及阿拉伯文的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
永中Office办公套件维文版的设计——多语言混合排版的设计;董军等;《计算机应用研究》;20061231(第3期);第202页至第204页 *

Also Published As

Publication number Publication date
CN102104743A (zh) 2011-06-22

Similar Documents

Publication Publication Date Title
CN102662926B (zh) 字库的存储与访问方法
CN104298725B (zh) 在线课件开发系统一次性编辑输入多版本输出的方法
CN102103586B (zh) 一种多语种双向混排字幕的编辑系统
CN102141985A (zh) 一种文稿在线编辑器
CN106326194A (zh) 一种应用于文件格式转换场景下的目录生成方法和装置
CN104298721A (zh) 一种基于Web的在线课件制作任意个对象分屏布局编辑方法
CN105589842A (zh) 数字出版物的排版方法及装置
CN102104743B (zh) 多语种混排字幕的编辑方法及装置
CN102104741B (zh) 多语种字幕的编排方法及装置
CN102104742B (zh) 多语种字幕的混合编排方法及装置
CN102082934B (zh) 字幕对象的更新方法及装置
CN104572593A (zh) 一种文字的处理方法、系统及电子装置
CN102104740B (zh) 一种多语种字幕的混排方法及装置
JP2006048695A (ja) スクリプト特性によるテキストデータ処理装置及び方法
CN111143749A (zh) 一种网页展示方法、装置、设备及存储介质
CN102082933B (zh) 一种字幕制作系统
CN109800547A (zh) 一种用于word文档保护和分发跟踪的信息快速嵌入和提取的方法
CN102082922B (zh) 在字幕模板中更新字幕的方法及装置
CN101587470A (zh) 文档的编辑方法及装置
CN102103585B (zh) 一种多语种字幕的制作方法及装置
CN102082929B (zh) 一种字幕模板的套用方法及装置
CN101089813A (zh) 一种基于共享库资源的Flash嵌入字体方法
CN102082928A (zh) 字幕属性的关联方法及装置
CN110457659B (zh) 条款文档生成方法及终端设备
CN103037248A (zh) 一种基于数字机顶盒的信息平台体系

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150218

Termination date: 20161216