CN103327397A - 一种媒体文件的字幕同步显示方法及系统 - Google Patents

一种媒体文件的字幕同步显示方法及系统 Download PDF

Info

Publication number
CN103327397A
CN103327397A CN2012100785525A CN201210078552A CN103327397A CN 103327397 A CN103327397 A CN 103327397A CN 2012100785525 A CN2012100785525 A CN 2012100785525A CN 201210078552 A CN201210078552 A CN 201210078552A CN 103327397 A CN103327397 A CN 103327397A
Authority
CN
China
Prior art keywords
literal
captions
file
media file
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100785525A
Other languages
English (en)
Inventor
洪雷
张雪元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN2012100785525A priority Critical patent/CN103327397A/zh
Publication of CN103327397A publication Critical patent/CN103327397A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明提供了一种媒体文件的字幕同步显示方法,该方法首先获取所述媒体文件的音频流和时间戳,然后将所述音频流中的音频内容识别成相应的文字,接着将所述识别后的文字依据所述时间戳生成字幕显示文件,最后将所述字幕显示文件导入所述播放的媒体文件中,同步显示所述字幕显示文件中的文字。本发明还提供了一种媒体文件的字幕同步显示系统,该系统包括:获取模块、语音识别模块、字幕生成模块和字幕显示模块。当媒体文件没有字幕时,用户可通过本发明提供的方法和系统生成字幕显示文件,即本发明提供的媒体文件的字幕同步方法和系统可以有效地为用户提供本地化的字幕语言参考,从而让用户可以更有效地获取期望的信息。

Description

一种媒体文件的字幕同步显示方法及系统
技术领域
本发明涉及字幕显示技术领域,尤其涉及一种媒体文件的字幕同步显示方法及系统。
背景技术
目前,随着互联网的迅速发展及人们对物质、文化需求的日益提高,人们不得不经常接触纯外文的媒体文件,例如外国影片的宣传视频、学习资料、外国新产品的发布视频等,以获取必要的信息。
众所周知,字幕的出现极大地改变了媒体文件的音频和视频文件的面貌,极大方便了人们对于媒体文件内容的了解,比单纯的视频、音频内容更容易被接收,也更加直观可靠。
然而,在某些时候,人们接触到的媒体文件并没有提供字幕,因此,人们仅通过音频和/或视频无法获取更多的信息。
发明内容
有鉴于此,本发明提供了一种媒体文件的字幕同步显示方法及系统,用以解决人们因接触的媒体文件没有提供字幕而无法获取更多信息的问题。其技术方案如下:
一种媒体文件的字幕同步显示方法,该方法包括:
获取所述媒体文件的音频流和时间戳;
将所述音频流中的音频内容识别成相应的文字;
将所述识别后的文字依据所述时间戳生成字幕显示文件;
将所述字幕显示文件导入所述播放的媒体文件中,同步显示所述字幕显示文件中的文字。
在开始播放所述媒体文件之前,将要播放的媒体文件的全部音频流识别成相应的文字,并将所述识别后的文字依据所述时间戳生成字幕显示文件。
在播放媒体文件的同时,将该媒体文件尚未播放的音频流段落识别成的相应文字,将所述识别后的文字依据所述时间戳生成字幕显示文件,并将生成的字幕显示文件的内容追加到当前播放媒体文件所导入的字幕显示文件中。
所述将音频流中的音频内容识别成相应的文字具体为:直接将所述音频流识别成原声对应的语言的文字。
所述将音频流中的音频内容识别成相应的文字具体为:
接收用户的语言选择触发命令;
将所述音频流识别成原声对应的语言的文字,然后将所述原声对应的语言的文字翻译成用户所选择的语言的文字。
所述将识别后的文字依据所述时间戳生成字幕显示文件具体为:
将所述翻译后的文字依据所述时间戳生成字幕显示文件。
将音频流中的音频内容识别成相应的文字具体为:
采用逐句识别的方式将所述音频流识别成相应的文字。
将所述识别后的文字依据所述时间戳生成字幕显示文件具体为:
将识别的文字添加至文本文件中,所述文本文件中存储着每一个句子的识别文本结果;
根据所述文本文件的内容和所述时间戳生成字幕显示文件。
一种媒体文件的字幕同步显示系统,包括:获取模块、语音识别模块、字幕生成模块和字幕显示模块;
所述获取模块,用于获取所述媒体文件的音频流和时间戳;
所述语音识别模块,用于将所述获取模块获取的音频流识别成相应的文字;
所述字幕生成模块,用于将所述语音识别模块识别后的文字依据所述时间戳生成字幕显示文件;
所述字幕显示模块,用于将所述字幕生成模块生成的字幕显示文件导入播放的媒体文件中,同步显示所述导入的字幕显示文件的文字。
在开始播放所述媒体文件之前,所述语音识别模块将要播放的媒体文件的全部音频流识别成相应的文字,所述字幕生成模块将所述语音识别模块识别的文字依据所述时间戳生成字幕显示文件。
在播放媒体文件的同时,所述语音识别模块将所述媒体文件尚未播放的音频流段落识别成的相应文字,所述字幕生成模块将所述语音识别模块识别的文字依据所述时间戳生成字幕显示文件,所述字幕显示模块将字幕生成模块生成的字幕显示文件的内容追加到当前播放媒体文件所导入的字幕显示文件中。
所述语音识别模块,具体用于将所述获取模块获取的音频流识别成原声对应的语言的文字。
所述语音识别模块,具体用于将所述获取模块获取的音频流识别成原声对应的语言的文字,然后将所述原声对应的语言的文字翻译成用户所选择的语言的文字。
所述字幕生成模块,具体用于将翻译后的文字依据所述时间戳生成字幕显示文件。
所述语音识别模块采用逐句识别的方式将所述获取模块获取的音频流识别成相应的文字。
所述字幕生成模块将所述语音识别模块识别的文字添加至文本文件中,所述文本文件中存储着每一个句子的识别文本结果,所述字幕生成模块根据所述文本文件的内容和所述时间戳生成字幕显示文件。
本发明提供了一种媒体文件的字幕同步方法,该方法首先获取媒体文件的音频流和时间戳,然后将音频流中的音频内容识别成相应的文字,并将识别后的文字依据时间戳生成字幕显示文件,当播放媒体文件时,将字幕显示文件导入播放的媒体文件中并同步显示导入的字幕显示文件中的文字。本发明还提供了一种媒体文件的字幕同步系统。当媒体文件没有字幕时,用户通过本发明提供的方法和系统可生成字幕显示文件,该字幕显示文件为用户提供本地化的字幕语言参考,同时,生成的字幕显示文件的文字在播放媒体文件时可以同步显示,用户通过字幕可以更有效地获取期望的信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的媒体文件的字幕同步显示方法的流程图;
图2为本发明实施例提供的媒体文件的字幕同步显示系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种媒体文件的字幕同步显示方法,图1为该方法的流程图,本发明实施例提供的媒体文件的字幕同步显示方法包括:
S11:获取媒体文件的音频流和时间戳。
S12:将音频流中的音频内容识别成相应的文字。
S13:将识别后的文字依据时间戳生成字幕显示文件。
在本实施例中,将音频流中的音频内容识别成相应的文字、将识别后的文字依据时间戳生成字幕显示文件可通过语音识别软件实现,当然也可通过其它的方式实现,只要所采用的实现方式可以将将音频流中的音频内容识别成相应的文字并将将识别后的文字依据时间戳生成字幕显示文件都是本发明保护的范围。
在本实施例中,将音频流中的音频内容识别成相应的文字具体为:将音频流中的音频内容直接识别成原声对应的语言的文字,当然,也可将音频流中的音频内容识别成其它语言的文字。
其中,将音频流中的音频内容识别成其它语言的文字的具体过程为:接收用户的语言选择触发命令,将音频流识别成原声对应的语言的文字,然后将识别出的原声对应的文字翻译成用户所选择的语言的文字。此时,将识别后的文字依据时间戳生成字幕显示文件具体为:将翻译后的文字依据时间戳生成字幕显示文件。
此外,本实施例采用逐句识别的方式将音频流识别成相应的文字。
当采用逐句识别的方式时,将识别后的文字依据时间戳生成字幕显示文件具体为:将识别的文字添加至文本文件中,其中,文本文件中存储着每一个句子的识别文本结果,然后根据文本文件的内容和时间戳,按照一句时间代码加一句字幕的格式生成字幕显示文件,即按照一句时间代码加一句字幕的格式向字幕显示文件中写入文本。
S14:将字幕显示文件导入播放的媒体文件中,同步显示字幕显示文件中的文字。
在本实施例中,字幕显示文件存储在媒体文件所在的文件夹内,当播放媒体文件时,该字幕显示文件可自动导入并同步显示。
字幕的种类有多种,现在比较常用的字幕格式有图形格式和文本格式两类,相对于图形格式字幕而言,文本格式字幕有尺寸小、格式简单、便于制作和修改的特点,其中srt格式的文本字幕使用最为广泛,它能兼容各种常见的媒体播放器,暴风影音、QQ影音等均可自动加载该类型的字幕。因此,在本实施例中,字幕显示文件采用srt格式,当然本实施例并不限定字幕显示文件的格式,只要字幕显示文件的格式更够支持所使用的媒体播放器即可。
此外,为了优化字幕的显示效果,可以将字幕显示文件中较长的句子分行显示。
在本实施例中,采用异步方式将音频流中的音频内容识别成文字,并将识别后的文字依据时间戳生成字幕显示文件,其具体过程为:在开始播放媒体文件之前,将要播放的媒体文件的全部音频流识别成相应的文字,并将识别后的文字依据时间戳生成字幕显示文件。
当然,本实施例并不限定采用异步方式将音频流中的音频内容识别成文字,并将识别后的文字依据时间戳生成字幕显示文件,还可采用同步方式,其具体过程为:在播放媒体文件的同时,将该媒体文件尚未播放的音频流段落识别成相应的文字,将识别成的相应文字依据时间戳生成字幕显示文件,并将生成的字幕显示文件的内容追加到当前播放媒体文件所导入的字幕显示文件中。
本发明实施例还提供了一种媒体文件的字幕同步显示系统,图2为该系统的结构示意图,本发明实施例提供的媒体文件的字幕同步显示系统包括:获取模块11、语音识别模块12、字幕生成模块13和字幕显示模块14。
其中,获取模块11,用于获取媒体文件的音频流和时间戳;语音识别模块12,用于将获取模块11获取的音频流识别成相应的文字;字幕生成模块13,用于将语音识别模块12识别出的文字依据时间戳生成字幕显示文件;字幕显示模块14,用于将字幕生成模块13生成的字幕显示文件导入播放的媒体文件中,并同步显示导入的字幕显示文件的文字。
在本实施例中,在开始播放媒体文件之前,语音识别模块12将要播放的媒体文件的全部音频流识别成相应的文字,字幕生成模块13将语音识别模块12识别的文字依据时间戳生成字幕显示文件。
除了上述的识别与播放异步进行的方式外,还可采用识别与播放同步进行的方式,此时,语音识别模块12将媒体文件尚未播放的音频流段落识别成相应文字,字幕生成模块13将语音识别模块12识别的文字依据时间戳生成字幕显示文件,字幕显示模块14将字幕生成模块生成的字幕显示文件的内容追加到当前播放媒体文件所导入的字幕显示文件中。
在本实施例中,语音识别模块12,具体用于将所述获取模块获取的音频流识别成原声对应的语言的文字。当然,语音识别模块12,还可将获取模块11获取的音频流识别成原声对应的语言的文字,然后将原声对应的语言的文字翻译成用户所选择的语言的文字,此时,字幕生成模块13,具体用于将翻译后的文字依据时间戳生成字幕显示文件。
语音识别模块12采用逐句识别的方式将获取模块11获取的音频流识别成相应的文字,字幕生成模块13将语音识别模块12识别的文字添加至文本文件中,文本文件中存储着每一个句子的识别文本结果,字幕生成模块13根据文本文件的内容和时间戳生成字幕显示文件。
用户通过本发明提供的方法和系统可生成字幕显示文件,该字幕显示文件为用户提供本地化的字幕语言参考,同时,生成的字幕显示文件的文字在播放媒体文件时可以同步显示,用户通过字幕可以更有效地获取期望的信息。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (16)

1.一种媒体文件的字幕同步显示方法,其特征在于,该方法包括:
获取所述媒体文件的音频流和时间戳;
将所述音频流中的音频内容识别成相应的文字;
将所述识别后的文字依据所述时间戳生成字幕显示文件;
将所述字幕显示文件导入所述播放的媒体文件中,同步显示所述字幕显示文件中的文字。
2.根据权利要求1所述的方法,其特征在于,在开始播放所述媒体文件之前,将要播放的媒体文件的全部音频流识别成相应的文字,并将所述识别后的文字依据所述时间戳生成字幕显示文件。
3.根据权利要求1所述的方法,其特征在于,在播放媒体文件的同时,将该媒体文件尚未播放的音频流段落识别成的相应文字,将所述识别后的文字依据所述时间戳生成字幕显示文件,并将生成的字幕显示文件的内容追加到当前播放媒体文件所导入的字幕显示文件中。
4.根据权利要求1、2或3所述的方法,其特征在于,所述将音频流中的音频内容识别成相应的文字具体为:直接将所述音频流识别成原声对应的语言的文字。
5.根据权利要求1、2或3所述的方法,其特征在于,所述将音频流中的音频内容识别成相应的文字具体为:
接收用户的语言选择触发命令;
将所述音频流识别成原声对应的语言的文字,然后将所述原声对应的语言的文字翻译成用户所选择的语言的文字。
6.根据权利要求5所述的方法,其特征在于,所述将识别后的文字依据所述时间戳生成字幕显示文件具体为:
将所述翻译后的文字依据所述时间戳生成字幕显示文件。
7.根据权利要求1所述的方法,其特征在于,将音频流中的音频内容识别成相应的文字具体为:
采用逐句识别的方式将所述音频流识别成相应的文字。
8.根据权利要求7所述的方法,其特征在于,将所述识别后的文字依据所述时间戳生成字幕显示文件具体为:
将识别的文字添加至文本文件中,所述文本文件中存储着每一个句子的识别文本结果;
根据所述文本文件的内容和所述时间戳生成字幕显示文件。
9.一种媒体文件的字幕同步显示系统,其特征在于,包括:获取模块、语音识别模块、字幕生成模块和字幕显示模块;
所述获取模块,用于获取所述媒体文件的音频流和时间戳;
所述语音识别模块,用于将所述获取模块获取的音频流识别成相应的文字;
所述字幕生成模块,用于将所述语音识别模块识别后的文字依据所述时间戳生成字幕显示文件;
所述字幕显示模块,用于将所述字幕生成模块生成的字幕显示文件导入播放的媒体文件中,同步显示所述导入的字幕显示文件中的文字。
10.根据权利要求9所述的系统,其特征在于,在开始播放所述媒体文件之前,所述语音识别模块将要播放的媒体文件的全部音频流识别成相应的文字,所述字幕生成模块将所述语音识别模块识别的文字依据所述时间戳生成字幕显示文件。
11.根据权利要求9所述的系统,其特征在于,在播放媒体文件的同时,所述语音识别模块将所述媒体文件尚未播放的音频流段落识别成的相应文字,所述字幕生成模块将所述语音识别模块识别的文字依据所述时间戳生成字幕显示文件,所述字幕显示模块将字幕生成模块生成的字幕显示文件的内容追加到当前播放媒体文件所导入的字幕显示文件中。
12.根据权利要求9、10或11所述的系统,其特征在于,所述语音识别模块,具体用于将所述获取模块获取的音频流识别成原声对应的语言的文字。
13.根据权利要求9、10或11所述的系统,其特征在于,所述语音识别模块,具体用于将所述获取模块获取的音频流识别成原声对应的语言的文字,然后将所述原声对应的语言的文字翻译成用户所选择的语言的文字。
14.根据权利要求13所述的系统,其特征在于,所述字幕生成模块,具体用于将翻译后的文字依据所述时间戳生成字幕显示文件。
15.根据权利要求9所述的系统,其特征在于,所述语音识别模块采用逐句识别的方式将所述获取模块获取的音频流识别成相应的文字。
16.根据权利要求15所述的系统,其特征在于,所述字幕生成模块将所述语音识别模块识别的文字添加至文本文件中,所述文本文件中存储着每一个句子的识别文本结果,所述字幕生成模块根据所述文本文件的内容和所述时间戳生成字幕显示文件。
CN2012100785525A 2012-03-22 2012-03-22 一种媒体文件的字幕同步显示方法及系统 Pending CN103327397A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100785525A CN103327397A (zh) 2012-03-22 2012-03-22 一种媒体文件的字幕同步显示方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100785525A CN103327397A (zh) 2012-03-22 2012-03-22 一种媒体文件的字幕同步显示方法及系统

Publications (1)

Publication Number Publication Date
CN103327397A true CN103327397A (zh) 2013-09-25

Family

ID=49195884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100785525A Pending CN103327397A (zh) 2012-03-22 2012-03-22 一种媒体文件的字幕同步显示方法及系统

Country Status (1)

Country Link
CN (1) CN103327397A (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559214A (zh) * 2013-10-11 2014-02-05 中国农业大学 视频自动生成方法及装置
CN103561217A (zh) * 2013-10-14 2014-02-05 深圳创维数字技术股份有限公司 一种生成字幕的方法及终端
CN103647909A (zh) * 2013-12-16 2014-03-19 宇龙计算机通信科技(深圳)有限公司 字幕调节方法及装置
CN103680499A (zh) * 2013-11-29 2014-03-26 北京中科模识科技有限公司 基于语音和字幕同步的高精度识别方法及系统
CN103716655A (zh) * 2013-12-16 2014-04-09 乐视致新电子科技(天津)有限公司 一种字幕转换的方法和设备
CN104683873A (zh) * 2013-11-27 2015-06-03 英业达科技有限公司 多媒体播放系统及其方法
CN105047203A (zh) * 2015-05-25 2015-11-11 腾讯科技(深圳)有限公司 一种音频处理方法、装置及终端
CN105635782A (zh) * 2015-12-28 2016-06-01 魅族科技(中国)有限公司 一种字幕输出方法及装置
CN105635784A (zh) * 2015-12-31 2016-06-01 新维畅想数字科技(北京)有限公司 一种音像同步显示方法及系统
CN105681890A (zh) * 2016-01-26 2016-06-15 广东欧珀移动通信有限公司 一种视频播放终端的字幕显示方法及装置
CN105704538A (zh) * 2016-03-17 2016-06-22 广东小天才科技有限公司 一种音视频字幕生成方法及系统
CN105791713A (zh) * 2016-03-21 2016-07-20 安徽声讯信息技术有限公司 一种智能语音文字字幕同步播音的装置
CN106303303A (zh) * 2016-08-17 2017-01-04 北京金山安全软件有限公司 一种媒体文件字幕的翻译方法、装置及电子设备
CN106331844A (zh) * 2016-08-17 2017-01-11 北京金山安全软件有限公司 一种媒体文件字幕的生成方法、装置及电子设备
CN106340291A (zh) * 2016-09-27 2017-01-18 广东小天才科技有限公司 一种双语字幕制作方法及系统
CN106412678A (zh) * 2016-09-14 2017-02-15 安徽声讯信息技术有限公司 一种视频新闻实时转写存储方法及系统
CN106792071A (zh) * 2016-12-19 2017-05-31 北京小米移动软件有限公司 字幕处理方法及装置
CN106792097A (zh) * 2016-12-27 2017-05-31 深圳Tcl数字技术有限公司 音频信号字幕匹配方法及装置
CN107180055A (zh) * 2016-03-11 2017-09-19 阿里巴巴集团控股有限公司 业务对象的展示方法及装置
CN107222792A (zh) * 2017-07-11 2017-09-29 成都德芯数字科技股份有限公司 一种字幕叠加方法及装置
CN107733876A (zh) * 2017-09-26 2018-02-23 惠州Tcl移动通信有限公司 一种流媒体字幕显示方法、移动终端及存储装置
CN108063970A (zh) * 2017-11-22 2018-05-22 北京奇艺世纪科技有限公司 一种处理直播流的方法和装置
CN108156480A (zh) * 2017-12-27 2018-06-12 腾讯科技(深圳)有限公司 一种视频字幕生成的方法、相关装置及系统
CN108289244A (zh) * 2017-12-28 2018-07-17 努比亚技术有限公司 视频字幕处理方法、移动终端及计算机可读存储介质
CN108366305A (zh) * 2018-02-07 2018-08-03 深圳佳力拓科技有限公司 一种不带字幕的码流通过语音识别显示字幕的方法及系统
CN110335610A (zh) * 2019-07-19 2019-10-15 北京硬壳科技有限公司 多媒体翻译的控制方法及显示器
WO2020024353A1 (zh) * 2018-08-01 2020-02-06 平安科技(深圳)有限公司 视频播放方法、装置、终端设备及存储介质
CN110769265A (zh) * 2019-10-08 2020-02-07 深圳创维-Rgb电子有限公司 一种同声字幕翻译方法、智能电视及存储介质
TWI698109B (zh) * 2018-12-29 2020-07-01 大陸商北京金山安全軟件有限公司 一種基於可穿戴裝置的監聽方法、裝置及電子裝置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102209227A (zh) * 2010-03-30 2011-10-05 宝利通公司 在视频会议中增加翻译的方法和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102209227A (zh) * 2010-03-30 2011-10-05 宝利通公司 在视频会议中增加翻译的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郑李磊: "全自动中文新闻字幕生成系统的设计与实现", 《电子学报》 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559214A (zh) * 2013-10-11 2014-02-05 中国农业大学 视频自动生成方法及装置
CN103561217A (zh) * 2013-10-14 2014-02-05 深圳创维数字技术股份有限公司 一种生成字幕的方法及终端
CN104683873A (zh) * 2013-11-27 2015-06-03 英业达科技有限公司 多媒体播放系统及其方法
CN103680499A (zh) * 2013-11-29 2014-03-26 北京中科模识科技有限公司 基于语音和字幕同步的高精度识别方法及系统
CN103680499B (zh) * 2013-11-29 2016-05-18 北京中科模识科技有限公司 基于语音和字幕同步的高精度识别方法及系统
CN103647909A (zh) * 2013-12-16 2014-03-19 宇龙计算机通信科技(深圳)有限公司 字幕调节方法及装置
CN103716655A (zh) * 2013-12-16 2014-04-09 乐视致新电子科技(天津)有限公司 一种字幕转换的方法和设备
CN103647909B (zh) * 2013-12-16 2017-05-17 宇龙计算机通信科技(深圳)有限公司 字幕调节方法及装置
CN105047203A (zh) * 2015-05-25 2015-11-11 腾讯科技(深圳)有限公司 一种音频处理方法、装置及终端
CN105635782A (zh) * 2015-12-28 2016-06-01 魅族科技(中国)有限公司 一种字幕输出方法及装置
CN105635784B (zh) * 2015-12-31 2018-08-24 新维畅想数字科技(北京)有限公司 一种音像同步显示方法及系统
CN105635784A (zh) * 2015-12-31 2016-06-01 新维畅想数字科技(北京)有限公司 一种音像同步显示方法及系统
CN105681890A (zh) * 2016-01-26 2016-06-15 广东欧珀移动通信有限公司 一种视频播放终端的字幕显示方法及装置
CN107180055A (zh) * 2016-03-11 2017-09-19 阿里巴巴集团控股有限公司 业务对象的展示方法及装置
CN105704538A (zh) * 2016-03-17 2016-06-22 广东小天才科技有限公司 一种音视频字幕生成方法及系统
CN105791713A (zh) * 2016-03-21 2016-07-20 安徽声讯信息技术有限公司 一种智能语音文字字幕同步播音的装置
CN106303303A (zh) * 2016-08-17 2017-01-04 北京金山安全软件有限公司 一种媒体文件字幕的翻译方法、装置及电子设备
CN106331844A (zh) * 2016-08-17 2017-01-11 北京金山安全软件有限公司 一种媒体文件字幕的生成方法、装置及电子设备
CN106412678A (zh) * 2016-09-14 2017-02-15 安徽声讯信息技术有限公司 一种视频新闻实时转写存储方法及系统
CN106340291A (zh) * 2016-09-27 2017-01-18 广东小天才科技有限公司 一种双语字幕制作方法及系统
CN106792071A (zh) * 2016-12-19 2017-05-31 北京小米移动软件有限公司 字幕处理方法及装置
CN106792097A (zh) * 2016-12-27 2017-05-31 深圳Tcl数字技术有限公司 音频信号字幕匹配方法及装置
CN107222792A (zh) * 2017-07-11 2017-09-29 成都德芯数字科技股份有限公司 一种字幕叠加方法及装置
CN107733876A (zh) * 2017-09-26 2018-02-23 惠州Tcl移动通信有限公司 一种流媒体字幕显示方法、移动终端及存储装置
CN108063970A (zh) * 2017-11-22 2018-05-22 北京奇艺世纪科技有限公司 一种处理直播流的方法和装置
CN108156480A (zh) * 2017-12-27 2018-06-12 腾讯科技(深圳)有限公司 一种视频字幕生成的方法、相关装置及系统
CN108289244A (zh) * 2017-12-28 2018-07-17 努比亚技术有限公司 视频字幕处理方法、移动终端及计算机可读存储介质
CN108289244B (zh) * 2017-12-28 2021-05-25 努比亚技术有限公司 视频字幕处理方法、移动终端及计算机可读存储介质
CN108366305A (zh) * 2018-02-07 2018-08-03 深圳佳力拓科技有限公司 一种不带字幕的码流通过语音识别显示字幕的方法及系统
WO2020024353A1 (zh) * 2018-08-01 2020-02-06 平安科技(深圳)有限公司 视频播放方法、装置、终端设备及存储介质
TWI698109B (zh) * 2018-12-29 2020-07-01 大陸商北京金山安全軟件有限公司 一種基於可穿戴裝置的監聽方法、裝置及電子裝置
CN110335610A (zh) * 2019-07-19 2019-10-15 北京硬壳科技有限公司 多媒体翻译的控制方法及显示器
CN110769265A (zh) * 2019-10-08 2020-02-07 深圳创维-Rgb电子有限公司 一种同声字幕翻译方法、智能电视及存储介质

Similar Documents

Publication Publication Date Title
CN103327397A (zh) 一种媒体文件的字幕同步显示方法及系统
CN104252861B (zh) 视频语音转换方法、装置和服务器
CN107437413B (zh) 语音播报方法及装置
CN103226947B (zh) 一种基于移动终端的音频处理方法及装置
US20140250219A1 (en) Synchronizing translated digital content
AU2012359080B2 (en) Managing playback of supplemental information
CN105704538A (zh) 一种音视频字幕生成方法及系统
CN108536414B (zh) 语音处理方法、装置和系统、移动终端
CN104657074A (zh) 一种实现录音的方法、装置和移动终端
US9317486B1 (en) Synchronizing playback of digital content with captured physical content
CN106792145A (zh) 一种音视频自动叠加字幕的方法和装置
CN103491429A (zh) 一种音频处理方法和音频处理设备
CN104078038B (zh) 一种页面内容朗读方法和装置
US10339955B2 (en) Information processing device and method for displaying subtitle information
CN105721796A (zh) 一种视频字幕自动生成装置和方法
CN105681890A (zh) 一种视频播放终端的字幕显示方法及装置
CN104349173A (zh) 视频复读方法及装置
CN103544978A (zh) 一种多媒体文件制作、播放方法及智能终端
KR101326275B1 (ko) 문자 및 음성 동기화 출력 장치
KR102396263B1 (ko) 스크립트를 이용한 스마트 어학학습서비스를 제공하는 시스템
CN104768083A (zh) 一种章节内容展示的视频播放方法及装置
CN101714140A (zh) 具多媒体显示的即时翻译系统及其方法
CN103617151A (zh) 一种flash课件的制作方法
CN103680261A (zh) 词汇学习系统及其方法
KR101425381B1 (ko) 자막 학습 시스템 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20130925

RJ01 Rejection of invention patent application after publication