CN104599693B - 台词同步字幕的制作方法 - Google Patents

台词同步字幕的制作方法 Download PDF

Info

Publication number
CN104599693B
CN104599693B CN201510046064.XA CN201510046064A CN104599693B CN 104599693 B CN104599693 B CN 104599693B CN 201510046064 A CN201510046064 A CN 201510046064A CN 104599693 B CN104599693 B CN 104599693B
Authority
CN
China
Prior art keywords
lines
subtitle
correspondence
drama
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510046064.XA
Other languages
English (en)
Other versions
CN104599693A (zh
Inventor
杜南山
江潮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Transn Information Technology Co., Ltd.
Original Assignee
Language Network (wuhan) Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Language Network (wuhan) Information Technology Co Ltd filed Critical Language Network (wuhan) Information Technology Co Ltd
Priority to CN201510046064.XA priority Critical patent/CN104599693B/zh
Publication of CN104599693A publication Critical patent/CN104599693A/zh
Application granted granted Critical
Publication of CN104599693B publication Critical patent/CN104599693B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Studio Circuits (AREA)

Abstract

本发明涉及自然语言处理技术领域,公开了一种台词同步字幕的制作方法,包括步骤:I、截取台词的音频信息,通过自动语音识别产生初始字幕文件,所述初始字幕文件包括若干字幕段,以及字幕段的开始和结束时间;Ⅱ、将台词剧本与所述初始字幕文件进行对照,建立台词剧本中每句台词与初始字幕文件中字幕段的对应关系;Ⅲ、用台词剧本中的台词句生成新的字幕段,并在所述新字幕段上添加该字幕段的开始和结束时间,生成中间字幕文件。本发明能自动确定绝大部分台词字幕段的开始和结束时间,减少了人力资源代价,台词字母的准确度高,极大提高了视频字幕制作的效率。

Description

台词同步字幕的制作方法
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种台词同步字幕的制作方法。
背景技术
台词同步字幕的制作过程中,主要存在两种情况:一是只有音视频文件,没有既定的台词剧本,需要通过人工听记音视频中的人物对话或背景台词得到台词剧本;二是有音视频文件和台词剧本。在这两种情况下,都需要在制作同步字幕。制作同步字幕的关键环节是为台词剧本中的每句台词字幕播放确定准确的开始和结束时间。目前,确定字幕播放的开始和结束时间需要通过人工逐一标记的方式,处理效率低,特别是浪费时间和人力资源。因此,希望能够设计一种自动的方法和环境,产生比较准确的字幕文件,以尽可能的减少人工干预和审校的工作量。
发明内容
本发明所要解决的技术问题是提供一种台词同步字幕的制作方法,快速地生成台词同步字幕文件,克服现有技术的效率低缺陷。
为解决上述技术问题,本发明提供一种台词同步字幕的制作方法,包括如下步骤:
Ⅰ、截取台词的音频信息,通过自动语音识别产生初始字幕文件,所述初始字幕文件包括若干字幕段,以及字幕段的开始和结束时间;所述字幕段对应一句台词音频,所述字幕段的开始和结束时间即为对应台词句音频的起始和结束时间;
Ⅱ、将台词剧本与所述初始字幕文件进行对照,建立台词剧本中每句台词与初始字幕文件中字幕段的对应关系;
Ⅲ、根据台词剧本中的台词句与初始字幕文件中字幕段的对应关系,用台词剧本中的台词句生成新的字幕段,并在所述新字幕段上添加该字幕段的开始和结束时间,生成中间字幕文件。
更进一步的,对中间字幕文件中不准确或没有的对应关系的台词,进行标记。以便后续有针对性的进行人工处理和审校,得到最终字幕文件。
更优化的方案是,在所述步骤ⅰ之前,包括以下步骤:
将台词剧本中的词进行规范化表示,规则包括如下:
对数字用发音词替换原词;
对复数词增加原词作为候选;
具有形态的词增加原词作为候选;
具有连接关系的词增加各种合并或分离词作为候选;
得到规范化台词剧本。
用规范化台词剧本替代步骤ⅰ中的台词剧本与所述初始字幕文件进行对照。
对于大多数音视频来说,语音识别的结果错误率相对而言比较高,因此很难有相同的句子出现。句子之间的对应关系,主要根据两个句子中包含的相同词和连续相同词来确定。所述将台词剧本与所述初始字幕文件进行对照,建立台词剧本中每句台词与初始字幕文件中字幕段的对应关系;包括以下步骤:
ⅰ、逐句读取台词剧本中的台词句,在所述初始字幕文件中查找与该台词句包含词汇相同的相同词,每个所述相同词标记有字幕段的序号;建立每个台词句与所述相同词及其字幕段序号的映射表;
ⅱ、根据连续相同词的数量大小进行第一次排序;得到具有先后顺序的相同词与台词句的对应关系表;
ⅲ、设置所述相同词与台词句的初始的对应关系集合为空,即:Q,从对应关系表的第一个对应关系开始,取第一个对应关系放入对应关系集合中,然后,循环进行下列操作:
①顺序取一个对应关系,判断该对应关系是否与对应关系集合中的已有的确认对应关系冲突,判断方法为:
对应关系(a)与已有的确认对应关系冲突,是指、满足如下条件:
或者,
其中表示台词剧本的台词句序号,表示初始字幕文件的字幕段序号;
②如果不存在冲突,则确认该对应关系,将该对应关系加入对应关系集合中;并在所述对应关系表中删除包含该台词句序号的其它对应关系;
③如果存在冲突,则直接删除该对应关系。
更优化的,在步骤ⅱ中,如果连续相同部分单词数量相同,则按长度进行二次排序。
所述根据用台词剧本中的台词句与初始字幕文件中字幕段的对应关系,用台词剧本中的台词句生成新的字幕段,并在所述新字幕段上添加该字幕段的开始和结束时间,生成中间字幕文件,包括以下步骤:
根据得到的对应关系集合,检查台词剧本中的相邻序号的台词句是否对应到同一个初始字幕段序号,如果相同,则将该相邻序号的台词句合并,然后将该初始字幕段的起止时间设置合并后的字幕段的起止时间;否则,直接取该初始字幕段序号的开始和结束时间作为新字幕段的开始和结束时间;
对每个设置开始和结束时间的新字幕段进行序号设置,得到中间字幕文件。
本发明能自动确定绝大部分台词字幕段的开始和结束时间,减少了人力资源代价,台词字母的准确度高,极大提高了视频字幕制作的效率。
附图说明
下面结合附图和具体实施方式对本发明的技术方案作进一步具体说明。
图1为本发明的技术流程及结构示意图。
具体实施方式
结合图1所示,本发明提供一种台词同步字幕的制作方法,包括如下步骤:
Ⅰ、截取台词的音频信息,通过自动语音识别产生初始字幕文件,所述初始字幕文件包括若干字幕段,以及字幕段的开始和结束时间;所述字幕段对应一句台词音频,所述字幕段的开始和结束时间即为对应台词句音频的起止时间;
Ⅱ、将台词剧本与所述初始字幕文件进行对照,建立台词剧本中每句台词与初始字幕文件中字幕段的对应关系;
Ⅲ、根据用台词剧本中的台词句与初始字幕文件中字幕段的对应关系,用台词剧本中的台词句生成新的字幕段,并在所述新字幕段上添加该字幕段的开始和结束时间,生成中间字幕文件。
为充分说明本发明,下面结合英语字幕为例,进一步详细描述本发明的技术方案。
通过语音识别产生的初始字幕文件如表格1所示。第一列为序号,第二列为时间轴,表明开始时间和结束时间,第三列为语音识别得到的文本内容。
表格1初始字幕文件示例
台词剧本内容如表格2所示。
将初始字幕文件和台词剧本进行融合处理。融合处理的具体实现方法和步骤主要有:
1.将台词剧本中的词进行规范化表示,特别是对数字、复数、形态和连接等形式,并提供可能的候选词;一般规则如下:
表格1规范化规则
将台词剧本示例进行规范化表示后,得到的结果如表格3所示。其中第一列为序号,形式包含括号,第二列中一行为原始台词剧本,其下一行为规范化处理并添加候选词后的结果。原始台词剧本后是涉及到的处理形式标记,分别用①、②、③、④表示对应的数字、复数、形态和连接的规范化处理。
表格2台词剧本规范化处理
2.将台词剧本中的每个句子,对应到初始字幕文件中的字幕段;
句子之间的对应关系,主要根据句子中包含的相同词确定。对于大多数视频来说,语音识别的结果错误率相对而言比较高,因此很难有相同的句子出现。通过相同词和连续相同词来确定这种对应关系。逐句处理台词剧本中的句子和初始字幕文件中文本使用的相同词,可得到如表格5所示结果,其中“/”表示这些词是分离的,并非连续相同词。
表格3句子对应关系及相同数据
根据连续相同部分单词多少进行第一次排序;如果连续相同部分单词数量相同,则按长度进行二次排序。可得如表格6所示结果:
表格4台词剧本与初始字幕文件句子中相同信息排序
设置初始的对应关系集合为空,即:
循环步骤[1]、[2]、[3]进行下列操作:
[1]顺序取一个对应关系,判断该对应关系是否会与集合Q中的已有的确认对应关系冲突。
对应关系(a)与已有的确认对应关系冲突,是指满足如下条件:
或者
其中表示台词剧本序号,表示初始字幕文件序号。
[2]如果不存在冲突,则确认该对应关系,并将其加入集合中。
对于相同信息排序中的第一个对应关系,确认该对应关系后,结果如表格7所示。
表格5确认对应关系和对应关系集合
对于该确认的对应关系“2people from other times(2)”,其中包含台词句序号(2)。如果在对应关系表剩余的对应关系中还存在包含台词句序号(2)的对应关系,则删除这些对应关系。不过,由于对应关系表剩余的对应关系中没有包含台词句序号(2)的对应关系,所以没有这一步操作。
表格6确认对应关系和对应关系集合
确认表格8中的对应关系时,需要在对应关系表剩余的对应关系中删除包含台词句序号(1)的对应关系,如表格9所示。表格9中带有横线标识的对应关系表示被删除的对应关系。下面其它表格中有同样带有横线标识的对应关系也表示同样的含义。
表格7删除的对应关系和对应关系集合
[3]如果存在冲突,则直接删除该对应关系。
该循环过程逐步操作的数据如表格10到表格28所示,直接演示,循环相同操作不再赘述。
表格8逐步操作数据
表格9逐步操作数据
表格10逐步操作数据
表格11逐步操作数据
表格12逐步操作数据
表格13逐步操作数据
表格14逐步操作数据
表格15逐步操作数据
表格16逐步操作数据
直接删除对应关系8what is(15),因为根据公式(2)评估,其与
集合中已存在的(13)-这个对应关系冲突。
表格17逐步操作数据
表格18逐步操作数据
表格19逐步操作数据
表格20逐步操作数据
表格21逐步操作数据
表格22逐步操作数据
直接删除对应关系12level(11),因为其与(12)-这个对应关系冲突。
表格23逐步操作数据
直接删除对应关系6what(15),因为根据公式(2),其与集合中已存在的(8)这个对应关系冲突。
表格24逐步操作数据
表格25逐步操作数据
直接删除对应关系7six(11),因为根据公式(2),其与集合中已存在的(9)这个对应关系冲突。
表格26逐步操作数据
3.找到确定的对应句子,检查相邻的台词剧本中的句子是否对应到相同的初始字幕句子,如果相同,标记为合并,然后一起设置初始字幕句子时间;否则,直接取初始字幕句子的开始和结束时间作为台词剧本中句子的开始和结束时间。无法找到对应关系的设置检查标记。对每个设置开始和结束时间的进行序号设置,得到中间字幕文件。
通过这些处理后,得到的中间字幕文件以及相关标记如表格29所示。
表格27中间字幕文件以及相关标记
最后所应说明的是,以上具体实施方式仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (5)

1.一种台词同步字幕的制作方法,其特征在于,包括如下步骤:
Ⅰ、截取台词的音频信息,通过自动语音识别产生初始字幕文件,所述初始字幕文件包括若干字幕段,以及字幕段的开始和结束时间;所述字幕段对应一句台词音频,所述字幕段的开始和结束时间即为对应台词句音频的起始和结束时间;
Ⅱ、将台词剧本与所述初始字幕文件进行对照,建立台词剧本中每句台词与初始字幕文件中字幕段的对应关系;
Ⅲ、根据台词剧本中的台词句与初始字幕文件中字幕段的对应关系,用台词剧本中的台词句生成新的字幕段,并在所述新字幕段上添加该字幕段的开始和结束时间,生成中间字幕文件;
所述将台词剧本与所述初始字幕文件进行对照,建立台词剧本中每句台词与初始字幕文件中字幕段的对应关系,包括以下步骤:
ⅰ、逐句读取台词剧本中的台词句,在所述初始字幕文件中查找与该台词句包含词汇相同的相同词,每个所述相同词标记有字幕段的序号;建立每个台词句与所述相同词及其字幕段序号的映射表;
ⅱ、根据连续相同词的数量大小进行第一次排序,得到具有先后顺序的相同词与台词句的对应关系表;
ⅲ、设置所述相同词与台词句的初始的对应关系集合Q为空,即:从对应关系表的第一个对应关系开始,取第一个对应关系放入对应关系集合Q中,然后,循环进行下列操作:
①顺序取一个对应关系,判断该对应关系是否与对应关系集合Q中的已有的确认对应关系冲突,判断方法为:
对应关系(a)-b与已有的确认对应关系冲突,是指(a)、b满足如下条件:
或者,
其中(a)表示台词剧本的台词句序号,b表示初始字幕文件的字幕段序号;
②如果不存在冲突,则确认该对应关系,将该对应关系加入对应关系集合Q中;并在所述对应关系表中删除包含该台词句序号的其它对应关系;
③如果存在冲突,则直接删除该对应关系。
2.根据权利要求1所述的台词同步字幕的制作方法,其特征在于,在所述步骤ⅰ之前,包括以下步骤:
将台词剧本中的词汇进行规范化表示,规则包括如下:
对数字用发音词替换原词;
对复数词增加原词作为候选;
具有形态的词增加原词作为候选;
具有连接关系的词增加各种合并或分离词作为候选;
得到规范化台词剧本;
用规范化台词剧本替代步骤ⅰ中的台词剧本。
3.根据权利要求1所述的台词同步字幕的制作方法,其特征在于,在步骤ⅱ中,如果连续相同部分单词数量相同,则按长度进行二次排序。
4.根据权利要求1所述的台词同步字幕的制作方法,其特征在于,所述生成中间字幕文件,包括以下步骤:
根据得到的对应关系集合Q,检查台词剧本中的相邻序号的台词句是否对应到同一个初始字幕段序号,如果相同,则将该相邻序号的台词句合并,然后将该初始字幕段的起止时间设置合并后的字幕段的起止时间;否则,直接取该初始字幕段序号的开始和结束时间作为新字幕段的开始和结束时间;
对每个设置开始和结束时间的新字幕段进行序号设置,得到中间字幕文件。
5.根据权利要求1至4之一所述的台词同步字幕的制作方法,其特征在于,所述对中间字幕文件中不准确或没有的对应关系的台词,进行标记;经后续有针对性的人工处理和审校,得到最终字幕文件。
CN201510046064.XA 2015-01-29 2015-01-29 台词同步字幕的制作方法 Active CN104599693B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510046064.XA CN104599693B (zh) 2015-01-29 2015-01-29 台词同步字幕的制作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510046064.XA CN104599693B (zh) 2015-01-29 2015-01-29 台词同步字幕的制作方法

Publications (2)

Publication Number Publication Date
CN104599693A CN104599693A (zh) 2015-05-06
CN104599693B true CN104599693B (zh) 2018-07-13

Family

ID=53125423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510046064.XA Active CN104599693B (zh) 2015-01-29 2015-01-29 台词同步字幕的制作方法

Country Status (1)

Country Link
CN (1) CN104599693B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228658B (zh) * 2016-12-22 2022-06-03 阿里巴巴集团控股有限公司 一种自动生成配音文字的方法、装置以及电子设备
CN109089172B (zh) * 2018-04-11 2021-01-15 北京奇艺世纪科技有限公司 一种弹幕显示方法、装置及电子设备
CN108959163B (zh) * 2018-06-28 2020-01-21 掌阅科技股份有限公司 有声电子书的字幕显示方法、电子设备及计算机存储介质
CN113571061A (zh) * 2020-04-28 2021-10-29 阿里巴巴集团控股有限公司 语音转写文本编辑系统、方法、装置及设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100297206B1 (ko) * 1999-01-08 2001-09-26 노영훈 자막 엠피 3 정보 구조 및 이를 재생하는 플레이어
CN103559214B (zh) * 2013-10-11 2017-02-08 中国农业大学 视频自动生成方法及装置

Also Published As

Publication number Publication date
CN104599693A (zh) 2015-05-06

Similar Documents

Publication Publication Date Title
CN104599693B (zh) 台词同步字幕的制作方法
US20170242847A1 (en) Apparatus and method for translating a meeting speech
CN103593363B (zh) 视频内容索引结构的建立方法、视频检索方法及装置
CN104679815B (zh) 一种筛选问答对并实时更新问答库的方法及系统
US8149330B2 (en) Methods, systems, and products for automated correction of closed captioning data
CN102937972B (zh) 一种视听字幕制作系统及方法
CN110881115B (zh) 会议视频的拆条方法及系统
CN103544140A (zh) 一种数据处理方法、展示方法和相应的装置
CN112632326B (zh) 一种基于视频脚本语义识别的视频生产方法及装置
CN105069412A (zh) 一种数字化阅卷方法
CN109740159B (zh) 用于命名实体识别的处理方法及装置
CN109817210A (zh) 语音写作方法、装置、终端和存储介质
CN113766314B (zh) 视频切分方法、装置、设备、系统及存储介质
KR101478918B1 (ko) 캡션 자막 보정 장치 및 캡션 자막 보정 방법
CN105898556A (zh) 一种外挂字幕的自动同步方法及装置
CN103336788A (zh) 一种仿人机器人辅助的互联网信息获取方法及系统
CN101326533A (zh) 基于语音的文档的历史跟踪方法和系统
CN115460459B (zh) 基于ai的视频生成方法、装置和电子设备
CN112541095A (zh) 视频标题生成方法、装置、电子设备及存储介质
CN110853627B (zh) 用于语音标注的方法及系统
JP6358744B2 (ja) 音声認識誤り修正装置
Bunt et al. Issues in the addition of ISO standard annotations to the Switchboard corpus
US11418821B1 (en) Classifying segments of media content using closed captioning
CN109753657B (zh) 用于人名识别的数据处理方法以及装置、客户端、服务器
CN105284121A (zh) 多媒体流和社交网络线程之间的同步

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: WUHAN TRANSN INFORMATION TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: YULIANWANG (WUHAN) INFORMATION TECHNOLOGY CO., LTD.

Effective date: 20150731

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150731

Address after: 430074, Optics Valley Software Park, East Lake Development Zone, Wuhan, south of Hubei, South Lake Road, Optics Valley Software Park, 2, six, 5, No. 205

Applicant after: Wuhan Transn Information Technology Co., Ltd.

Address before: 430074, Optics Valley Software Park, East Lake Development Zone, Wuhan, south of Hubei, South Lake Road, Optics Valley Software Park, 2, six, 6, No. 206

Applicant before: Language network (Wuhan) Information Technology Co., Ltd.

CB02 Change of applicant information

Address after: 430074, Optics Valley Software Park, East Lake Development Zone, Wuhan, south of Hubei, South Lake Road, Optics Valley Software Park, 2, six, 5, No. 205

Applicant after: Language network (Wuhan) Information Technology Co., Ltd.

Address before: 430074, Optics Valley Software Park, East Lake Development Zone, Wuhan, south of Hubei, South Lake Road, Optics Valley Software Park, 2, six, 5, No. 205

Applicant before: Wuhan Transn Information Technology Co., Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant