CN104795082A

CN104795082A - 音频字幕显示方法、装置及播放器

Info

Publication number: CN104795082A
Application number: CN201510138341.XA
Authority: CN
Inventors: 谢元烨; 杨一鸣; 李华东; 林康明; 温杰; 谭健文
Original assignee: Guangzhou Kugou Computer Technology Co Ltd
Current assignee: Guangzhou Kugou Computer Technology Co Ltd
Priority date: 2015-03-26
Filing date: 2015-03-26
Publication date: 2015-07-22
Anticipated expiration: 2035-03-26
Also published as: CN104795082B

Abstract

本发明公开了一种音频字幕显示方法、装置及播放器，属于计算机技术领域。所述方法包括：获取音频字幕文件，音频字幕文件包括原语种字幕和以扩展形式存储的翻译字幕，翻译字幕包括其它语种的意译字幕和/或音译字幕；解析音频字幕文件，得到原语种字幕和翻译字幕；在多媒体文件的播放过程中，同步显示原语种字幕和翻译字幕。本发明达到了在不影响旧版本的播放器对音频字幕文件的正常显示的前提下，新版本的播放器可以同时显示原语种字幕和翻译字幕，意译字幕可以帮助用户更好地理解和识别多媒体文件中的音频内容，音译字幕可以帮助用户更好地学习和识别多媒体文件中的发音的效果。

Description

音频字幕显示方法、装置及播放器

技术领域

本发明涉及计算机技术领域，特别涉及一种音频字幕显示方法、装置及播放器。

背景技术

用户在播放歌曲时，通常需要显示歌曲所对应的歌词。用户在播放电影时，通常需要显示电影所对应的字幕。这些歌词和字幕都是为了辅助用户识别和学习多媒体文件中的音频，本文中将歌词和字幕统称为音频字幕。

音乐播放器在需要显示歌词时，通常会加载一个歌词文件，该歌词文件中包含有与演唱语言属于相同语种的歌词。然后，音乐播放器解析该歌词文件，对歌词文件中的歌词进行逐句显示或逐字显示。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：音乐播放器只能加载单一语种的歌词并进行显示，该歌词能对用户提供的信息有限。比如，用户是中文为母语且英文较差的用户，而歌曲是英文歌曲，即便音乐播放器能够显示英文歌词，但该歌曲对用户所能够提供的信息有限。

发明内容

为了解决现有技术的问题，本发明实施例提供了一种音频字幕显示方法、装置及播放器。所述技术方案如下：

根据本发明的第一方面，提供了一种音频字幕显示方法，所述方法包括：

获取音频字幕文件，所述音频字幕文件包括原语种字幕和以扩展形式存储的翻译字幕，所述翻译字幕包括其它语种的意译字幕和/或音译字幕；

解析所述音频字幕文件，得到所述原语种字幕和所述翻译字幕；

在多媒体文件的播放过程中，同步显示所述原语种字幕和所述翻译字幕。

可选地，所述解析所述音频字幕文件，得到所述原语种字幕和所述翻译字幕，包括：

解析所述音频字幕文件的原始内容，得到所述原语种字幕，所述原语种字幕包括至少一行原文字幕，每行原文字幕或者每行原文字幕中的每个字还标注有播放时间戳；

解析所述音频字幕文件中以扩展形式存储的扩展内容，得到至少一个所述翻译字幕，每个翻译字幕包括有与每行原文字幕对应的译文字幕。

可选地，所述解析所述音频字幕文件中以扩展形式存储的扩展内容，得到所述翻译字幕，包括：

检测所述音频字幕文件中是否存在以扩展形式存储的翻译字幕字段域；

若存在所述翻译字幕字段域，则从所述翻译字幕字段域中读取按照预设编码格式编码后的翻译字幕内容；

按照所述预设编码格式对所述编码后的翻译字幕内容进行解码，得到解码后的翻译字幕内容；

从所述解码后的翻译字幕内容中读取字幕类型信息，所述字幕类型信息包括所述翻译字幕所对应的语种类型和翻译类型，所述翻译类型包括意译类型和音译类型；

从所述解码后的翻译字幕内容中读取字幕内容，所述字幕内容包括对应于至少一个所述翻译字幕的译文字幕。

可选地，所述在多媒体文件的播放过程中，同步显示所述原语种字幕和所述翻译字幕，包括：

根据所述原语种字幕中的播放时间戳，逐行或逐字显示所述原语种字幕中的每行原文字幕；

当所述翻译字幕是意译字幕时，跟随所述原文字幕的播放宽度百分比，以相同宽度百分比的方式显示与所述原文字幕对应的所述译文字幕。

根据所述原语种字幕中的播放时间戳，逐字显示所述原语种字幕中的每行原文字幕；

当所述翻译字幕是音译字幕时，跟随所述原文字幕中的每个字的播放进度，以逐字对准的方式显示与所述原文字幕对应的所述译文字幕中的每个字。

可选地，所述方法还包括：

接收字幕选择信号；

根据所述字幕选择信号仅显示所述原文字幕；或，根据所述字幕选择信号仅显示所述翻译字幕；或，根据所述字幕选择信号同时显示所述原文字幕和所述翻译字幕；或，在所述翻译字幕为两种或者两种以上时，根据所述字幕选择信号仅显示部分翻译字幕；或，在所述翻译字幕为两种或者两种以上时，根据所述字幕选择信号同时所述原文字幕和部分翻译字幕。

根据本发明的第二方面，提供了一种音频字幕显示装置，所述装置包括：

获取模块，用于获取音频字幕文件，所述音频字幕文件包括原语种字幕和以扩展形式存储的翻译字幕，所述翻译字幕包括其它语种的意译字幕和/或音译字幕；

解析模块，用于解析所述音频字幕文件，得到所述原语种字幕和所述翻译字幕；

显示模块，用于在多媒体文件的播放过程中，同步显示所述原语种字幕和所述翻译字幕。

可选地，所述解析模块，包括：

原文解析单元，用于解析所述音频字幕文件的原始内容，得到所述原语种字幕，所述原语种字幕包括至少一行原文字幕，每行原文字幕或者每行原文字幕中的每个字还标注有播放时间戳；

翻译解析单元，用于解析所述音频字幕文件中以扩展形式存储的扩展内容，得到至少一个所述翻译字幕，每个翻译字幕包括有与每行原文字幕对应的译文字幕。

可选地，所述翻译解析单元，用于：

可选地，所述显示模块，包括：

原文显示单元，用于根据所述原语种字幕中的播放时间戳，逐行或逐字显示所述原语种字幕中的每行原文字幕；

意译显示单元，用于当所述翻译字幕是意译字幕时，跟随所述原文字幕的播放宽度百分比，以相同宽度百分比的方式显示与所述原文字幕对应的所述译文字幕。

可选地，所述显示模块，包括：

原文显示单元，用于根据所述原语种字幕中的播放时间戳，逐字显示所述原语种字幕中的每行原文字幕；

音译显示单元，用于当所述翻译字幕是音译字幕时，跟随所述原文字幕中的每个字的播放进度，以逐字对准的方式显示与所述原文字幕对应的所述译文字幕中的每个字。

可选地，所述装置还包括：

选择模块，用于接收字幕选择信号；

选择显示模块，用于根据所述字幕选择信号仅显示所述原文字幕；或，根据所述字幕选择信号仅显示所述翻译字幕；或，根据所述字幕选择信号同时显示所述原文字幕和所述翻译字幕；或，在所述翻译字幕为两种或者两种以上时，根据所述字幕选择信号仅显示部分翻译字幕；或，在所述翻译字幕为两种或者两种以上时，根据所述字幕选择信号同时所述原文字幕和部分翻译字幕。

根据本发明的第三方面，提供了一种播放器，所述播放器包括如第二方面所述的装置。

本发明实施例提供的技术方案带来的有益效果是：

通过在原语种字幕的基础上以可扩展形式提供翻译字幕，该翻译字幕可以是意译字幕和/或音译字幕；解决了音乐播放器只能加载单一语种的歌词并进行显示，该歌词能对用户提供的信息有限的问题；达到了在不影响旧版本的播放器对音频字幕文件的正常显示的前提下，新版本的播放器可以同时显示原语种字幕和翻译字幕，意译字幕可以帮助用户更好地理解和识别多媒体文件中的音频内容，音译字幕可以帮助用户更好地学习和识别多媒体文件中的发音的效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例提供的音频字幕显示方法的方法流程图；

图2是本发明一个实施例提供的音频字幕文件的结构示意图；

图3是本发明另一个实施例提供的音频字幕文件的结构示意图；

图4A是本发明另一个实施例提供的音频字幕显示方法的方法流程图；

图4B是图4A实施例提供的步骤403的方法流程图；

图5A至图5E是本发明实施例提供的音频字幕显示方法在实施时的界面示意图；

图6是本发明一个实施例提供的音频字幕显示装置的结构方框图；

图7是本发明一个实施例提供的音频字幕显示装置的结构方框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

本文中提及的播放器可以是手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。本发明实施例中的播放器需要具有多媒体文件的播放能力和显示能力。

多媒体文件是指歌曲、电视剧、电影等，分为音频和视频两种。

在多媒体文件是音频时，本文中的音频媒体文件主要是指歌词文件；在多媒体文件是视频时，本文中的音频媒体文件主要是指字幕文件。为了简化本发明的描述，下文中采用音频媒体文件是歌词文件来进行举例。对于音频媒体文件是字幕文件的实施例，是本领域技术人员所易于思及的。

目前的歌词文件通常是单一语种的歌词文件，每个歌词文件包括至少一行歌词，每行歌词或者每行歌词中的每个字都标注有播放时间戳，从而能够实现逐行或逐字的精准播放。

一、对于每行歌词都标注有播放时间戳的歌词文件，示意如下：

[01:14:00]送你离开[01:18:00]

[01:20:00]千里之外[01:24:00]

也即，每行歌词都有起始时间和结束时间。

二、对于每行歌词的每个字都标注有播放时间戳的歌词文件，一种示意如下：

[01:14:00]送[01:15:00]你[01:16:00]离[01:17:00]开[01:18:00]

[01:20:00]千[01:21:00]里[01:22:00]之[01:23:00]外[01:24:00]

也即，每行歌词中的每个字都有起始时间和结束时间，同一行歌词中前一个字的结束时间是后一个字的起始时间。

三、对于每行歌词的每个字都标注有播放时间戳的歌词文件，另一种示意如下：

[01:14:00]送[01:14:00][01:14:00]你[01:16:00][01:16:02]离[01:17:00][01:17:20]开[01:18:00]

[01:20:00]千[01:21:00][01:21:12]里[01:21:59][01:22:00]之[01:23:00][01:23:02]外[01:24:00]

也即，每行歌词中的每个字都有起始时间和结束时间，同一行歌词中前一个字的结束时间不一定是后一个字的起始时间。

需要说明的是，上述歌词文件仅为示意说明，本发明实施例并不限定歌词文件的格式。

但是上述歌词，只能实现单一语种的歌词文件，无法实现多种语种的歌词文件。为此，请参考如下实施例：

请参考图1，其示出了本发明一个实施例提供的音频字幕显示方法的方法流程图。本实施例以该音频字幕显示方法应用于图1来举例说明。该方法包括：

步骤102，获取音频字幕文件，音频字幕文件包括原语种字幕和以扩展形式存储的翻译字幕，翻译字幕包括其它语种的意译字幕和/或音译字幕；

本实施例在原语种字幕的基础上，增加了可扩展的翻译字幕。原语种字幕是与多媒体文件中的语言属于相同语种的字幕。

该音频字幕文件的格式可以如图2所示。音频字幕文件200包括原语种字幕220和以扩展形式存储的翻译字幕240。

步骤104，解析音频字幕文件，得到原语种字幕和翻译字幕；

解析该音频字幕文件，可以得到原语种字幕和至少一个翻译字幕。也即，同一个音频字幕文件中可以包括不止一个翻译字幕。

比如，原语种字幕是中文歌词，翻译字幕同时包括：英文意译歌词、日文音译歌词、日文意译歌词等。

步骤106，在多媒体文件的播放过程中，同步显示原语种字幕和翻译字幕。

综上所述，本实施例提供的音频字幕显示方法，通过在原语种字幕的基础上以可扩展形式提供翻译字幕，该翻译字幕可以是意译字幕和/或音译字幕；解决了音乐播放器只能加载单一语种的歌词并进行显示，该歌词能对用户提供的信息有限的问题；达到了在不影响旧版本的播放器对音频字幕文件的正常显示的前提下，新版本的播放器可以同时显示原语种字幕和翻译字幕，意译字幕可以帮助用户更好地理解和识别多媒体文件中的音频内容，音译字幕可以帮助用户更好地学习和识别多媒体文件中的发音的效果。

图3示出了本发明实施例提供的一种包括原语种字幕和以扩展形式存储的翻译字幕的歌词文件的示意图。该歌词文件包括原语种字幕320和翻译字幕340。

原语种字幕320包括至少一行原文字幕，每行原文字幕中的每个字都标注有播放时间戳。原语种字幕320也可以称之为原始内容。

翻译字幕340是一个以扩展形式存储的翻译字幕字段域。该翻译字幕字段域中包括字段标识language和字段内容342，该字段内容342为经过Base64编码得到的16进制字符串。经过该预设编码规则的编码，该字段内容342在旧版本播放器中不被识别，也即不会与原语种字幕320发生冲突。

该字段内容342可以是采用JSON(JavaScript Object Notation，一种轻量级的数据交换格式)格式的字符串。JSON格式是一种可扩展的格式，所以该字段内容342也是可扩展的。

该字段内容342的一种示例性格式如下：

其中：

Version：翻译字幕的格式版本，

Content：装有n个翻译字幕的数组，每个数组里的每个元素是一行译文字幕。

Type：翻译字幕的类型，比如，取值0---音译，1---意译。

Language：翻译字幕的语种类型文字，0---中文，1---英文，2---日文

LyricContent：译文字幕的二维数组，第一个维度为一行译文字幕，每个元素为一个字。其中，当译文字幕为音译字幕时，行数和每行的元素数必须与相对应的原语种字幕一致；当译文字幕为意译字幕时，行数必须与相对应的原语种字幕一致，每行的元素数与原语种字幕中对应的行中的元素数可以不一致。

需要说明的一点是，当翻译字幕的格式发生更新时，Version的版本号也会发生更新。不同版本的翻译字幕通常对应不同的解析程序，播放器能够根据版本号选择与当前版本的翻译字幕对应的解析程序来解析出翻译字母的内容。

需要说明的另一点是，上述Version、Type和Language的取值仅为示意说明。在不同的实施例中，Version、Type和Language的取值可以进行不同的定义，本发明实施例并不对此进行限定。比如，在另一个实施例中，Language的取值为008时，代表意大利语；Language的取值为136时，代表韩语。

请参考图4A，其示出了本发明另一个实施例提供的音频字幕显示方法的方法流程图。本实施例以该方法应用于播放器中来举例说明。该方法包括：

步骤401，获取音频字幕文件，音频字幕文件包括原语种字幕和以扩展形式存储的翻译字幕，翻译字幕包括其它语种的意译字幕和/或音译字幕。

播放器在播放多媒体文件的过程中，可以通过本地查找或者网络匹配下载来获取与该多媒体文件对应的音频字幕文件。

该音频字幕文件在一个文件中同时存储有原语种字幕和以扩展形式存储的翻译字幕。该音频字幕文件可以是图3所示出的文件。

以扩展形式存储的翻译字幕可以是一个翻译字幕，也可以是多个翻译字幕。比如，翻译字幕中同时包括了英文意译歌词、日文音译歌词、日文意译歌词等。

翻译字幕可以仅包括意译字幕，也可以仅包括音译字幕，还可以同时包括意译字幕和音译字幕。其中，音译字幕是本实施例的一个亮点。音译字幕可以让不擅长外语的用户学习和识别多媒体文件中的发音，而目前还没有出现过类似的字幕文件。

以扩展形式存储的翻译字幕的字段内容可以是采用Base64编码后的JSON格式的字符串。

比如，多媒体文件是英文歌曲，音频字幕文件是krc格式(中国酷狗公司提供的一种逐字对准的歌词格式)的歌词，该歌词中同时包括有英文歌词、中文音译歌词和中文意译歌词。其中，英文歌词作为原语种字幕，继续采用krc格式来存储；中文音译歌词和中文意译歌词采用扩展形式的翻译字幕字段域来存储，该翻译字幕字段域还是采用了Base64编码的JSON格式的字符串，也即表现形式为16进制字符串。由于旧版本的播放器仅支持krc格式，而无法识别16进制字符串，所以该扩展形式的翻译字幕字段域不会被旧版本的播放器识别，实现了对旧版本的播放器的兼容。而新版本的播放器能够识别16进制字符串，但也需要解码后才能得到翻译字幕，该翻译字幕也不会与原语种字幕发生冲突。

步骤402，解析音频字幕文件的原始内容，得到原语种字幕，原语种字幕包括至少一行原文字幕，每行原文字幕或者每行原文字幕中的每个字还标注有播放时间戳。

比如，原语种字幕是英文歌词，示意如下：

[01:14:00]Trying[01:15:00]to[01:16:00]forget[01:17:00]but[01:18:00]I[01:19:00]won’t[01:20:00]let[01:21:00]go[01:22:00]

[01:24:00]Looking[01:25:00]at[01:26:00]a[01:27:00]crowded[01:28:00]street[01:29:00]。

也即：

第一行英文歌词是：Trying to forget but I won’t let go。

第二行英文歌词是：looking at a crowded street。

步骤403，解析音频字幕文件中以扩展形式存储的扩展内容，得到至少一个翻译字幕，每个翻译字幕包括有与每行原文字幕对应的译文字幕。

本步骤可以具体包括如下子步骤，如图4B所示：

403a、检测音频字幕文件中是否存在以扩展形式存储的翻译字幕字段域。

播放器通过检测歌词文件中是否存在[language：16进制字符串]形式的翻译字幕字段域。

403b、若存在翻译字幕字段域，则从翻译字幕字段域中读取按照预设编码格式编码后的翻译字幕内容。

若歌词文件中存在[language：16进制字符串]形式的翻译字幕字段域，则播放器从从翻译字幕字段域中读取16进制字符串，该16进制字符串是按照预设编码格式编码后的翻译字幕内容。

403c，按照预设编码格式对编码后的翻译字幕内容进行解码，得到解码后的翻译字幕内容。

播放器按照Base64编码格式对16进制字符串进行解码，得到解码后的翻译字幕内容。该翻译字幕内容示例如下：

403d，从解码后的翻译字幕内容中读取字幕类型信息，字幕类型信息包括翻译字幕所对应的语种类型和翻译类型，翻译类型包括意译类型和音译类型。

字幕类型信息包括：type字段和language字段。

播放器读取type＝1且language＝0，可知第一个翻译字幕是中文意译类型的翻译歌词。

播放器读取type＝0且language＝0，可知第二个翻译字幕是中文音译类型的翻译歌词。

403e，从解码后的翻译字幕内容中读取字幕内容，字幕内容包括对应于至少一个翻译字幕的译文字幕。

字幕内容包括lyricContent字段。

播放器读取第一个翻译字幕的字幕内容，第一个翻译字幕的字幕内容包括两行意译的译文字幕，示例如下：

第一行：尝试着忘记过去可是我却无法做到。

第二行：凝视着拥挤的街道。

播放器读取第二个翻译字幕的字幕内容，第二个翻译字幕的字幕内容包括两行音译的译文字幕，示例如下：

第一行：揣因吐佛干特吧特哎旺特兰次够。

第二行：路刻印安特饿可儒而得死吹特。

步骤404，根据原语种字幕中的播放时间戳，逐行或逐字显示原语种字幕中的每行原文字幕。

播放器能够同时显示原语种字幕和翻译字幕。

由于原语种字幕中携带有播放时间戳，播放器可以在播放多媒体文件的过程中，根据播放时间戳将原语种字幕跟随多媒体文件的播放进行同步显示。

同步显示过程可以采用双色显示方式，也即，对于已经播放的元素显示为第一颜色，未播放的元素显示为第二颜色，播放过程中第一颜色向前滚动的方式。

步骤405，当翻译字幕是意译字幕时，跟随原文字幕的播放宽度百分比，以相同宽度百分比的方式显示与原文字幕对应的译文字幕。

在执行步骤404的同时，播放器还同步显示翻译字幕。

当翻译字幕是意译字幕时，由于意译字幕的行数和原语种字幕的行数是相同的，但是对应行中的元素数不一定是相同的，所以播放器跟随原文字幕的播放宽度百分比，以相同宽度百分比的方式显示与原文字幕对应的译文字幕。这里的宽度是指一行字幕的宽度，示意性地如图5A所示。也即，第一行英文歌词“Trying to forget but I won’t let go”的播放宽度百分比是48％，则意译的中文歌词的播放宽度百分比也是48％。

步骤406，当翻译字幕是音译字幕时，跟随原文字幕中的每个元素的播放进度，以逐字对准的方式显示与原文字幕对应的译文字幕中的每个元素。

当翻译字幕是音译字幕时，由于音译字幕的行数和原语种字幕的行数是相同的，且对应行中的元素数也是相同的，所以播放器跟随原文字幕中的每个元素的播放进度，以逐字对准的方式显示与原文字幕对应的译文字幕中的每个元素，示意性地如图5A所示。也即，第一行英文歌词“Trying to forget but I won’t letgo”的当前播放进度所在的元素是“forget”，则音译的中文歌词的当前播放进度所在的元素是对应元素“佛干特”。

其中，翻译字幕前的“[译]”字样是可选显示的内容。

步骤407，接收字幕选择信号。

在字幕显示之前或显示过程中，用户随时都可以触发字幕选择信号，来选择需要显示的字幕。

播放器接收用户触发的字幕选择信号。

步骤408，根据字幕选择信号仅显示原文字幕；或，根据字幕选择信号仅显示翻译字幕；或，根据字幕选择信号同时显示原文字幕和翻译字幕；或，在翻译字幕为两种或者两种以上时，根据字幕选择信号仅显示部分翻译字幕；或，在翻译字幕为两种或者两种以上时，根据字幕选择信号同时原文字幕和部分翻译字幕。

然后，播放器根据用户触发的字幕选择信号，将全部字幕或者一部分字幕进行显示。其中：

仅显示原文字幕的界面示意图，示意性地如图5B所示。

仅显示音译的译文字幕的界面示意图，示意性地如图5C所示。

仅显示意译的译文字幕的界面示意图，示意性地如图5D所示。

仅显示译文字幕的界面示意图，示意性地如图5E所示。

本实施例提供的音频字幕显示方法，还通过将翻译字幕以可扩展形式存储在原始格式的音频字幕文件中，并采用预定编码格式进行编码，使得该扩展形式的翻译字幕字段域不会被旧版本的播放器识别，实现了对旧版本的播放器的兼容。而新版本的播放器能够识别16进制字符串，但也需要解码后才能得到翻译字幕，该翻译字幕也不会与原语种字幕发生冲突的效果。

作为另一种可能的实现方式，翻译字幕中的每行译文字幕或者每行译文字幕中的元素也可以自带播放时间戳，虽然这样会增加翻译字幕的数据量，但是可以实现更加精准和更加多样化的播放效果。

请参考图6，其示出了本发明一个实施例提供的音频字幕显示装置的结构方框图。该音频字幕显示装置可以通过软件、硬件或者两者的结合实现成为播放器的全部或部分。该装置包括：获取模块620、解析模块640和显示模块660。

获取模块620，用于获取音频字幕文件，所述音频字幕文件包括原语种字幕和以扩展形式存储的翻译字幕，所述翻译字幕包括其它语种的意译字幕和/或音译字幕。

解析模块640，用于解析所述音频字幕文件，得到所述原语种字幕和所述翻译字幕。

显示模块660，用于在多媒体文件的播放过程中，同步显示所述原语种字幕和所述翻译字幕。

综上所述，本实施例提供的音频字幕显示装置，通过在原语种字幕的基础上以可扩展形式提供翻译字幕，该翻译字幕可以是意译字幕和/或音译字幕；解决了音乐播放器只能加载单一语种的歌词并进行显示，该歌词能对用户提供的信息有限的问题；达到了在不影响旧版本的播放器对音频字幕文件的正常显示的前提下，新版本的播放器可以同时显示原语种字幕和翻译字幕，意译字幕可以帮助用户更好地理解和识别多媒体文件中的音频内容，音译字幕可以帮助用户更好地学习和识别多媒体文件中的发音的效果。

请参考图7，其示出了本发明一个实施例提供的一种音频字幕显示装置的结构方框图。该音频字幕显示装置可以通过软件、硬件或者两者的结合实现成为播放器的全部或部分。该装置包括：获取模块620、解析模块640和显示模块660。

可选地，所述解析模块640，包括：

原文解析单元642，用于解析所述音频字幕文件的原始内容，得到所述原语种字幕，所述原语种字幕包括至少一行原文字幕，每行原文字幕或者每行原文字幕中的每个字还标注有播放时间戳。

翻译解析单元644，用于解析所述音频字幕文件中以扩展形式存储的扩展内容，得到至少一个所述翻译字幕，每个翻译字幕包括有与每行原文字幕对应的译文字幕。

可选地，所述翻译解析单元644，用于：

可选地，所述显示模块660，包括：

原文显示单元662，用于根据所述原语种字幕中的播放时间戳，逐行或逐字显示所述原语种字幕中的每行原文字幕。

意译显示单元664，用于当所述翻译字幕是意译字幕时，跟随所述原文字幕的播放宽度百分比，以相同宽度百分比的方式显示与所述原文字幕对应的所述译文字幕。

可选地，所述显示模块660，包括：

原文显示单元662，用于根据所述原语种字幕中的播放时间戳，逐字显示所述原语种字幕中的每行原文字幕。

音译显示单元666，用于当所述翻译字幕是音译字幕时，跟随所述原文字幕中的每个元素的播放进度，以逐字对准的方式显示与所述原文字幕对应的所述译文字幕中的每个元素。

可选地，所述装置还包括：

选择模块682，用于接收字幕选择信号。

选择显示模块684，用于根据所述字幕选择信号仅显示所述原文字幕；或，根据所述字幕选择信号仅显示所述翻译字幕；或，根据所述字幕选择信号同时显示所述原文字幕和所述翻译字幕；或，在所述翻译字幕为两种或者两种以上时，根据所述字幕选择信号仅显示部分翻译字幕；或，在所述翻译字幕为两种或者两种以上时，根据所述字幕选择信号同时所述原文字幕和部分翻译字幕。

需要说明的是：上述实施例提供的音频字幕显示装置在显示音频字幕时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的音频字幕显示装置与音频字幕显示方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种音频字幕显示方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述解析所述音频字幕文件，得到所述原语种字幕和所述翻译字幕，包括：

3.根据权利要求2所述的方法，其特征在于，所述解析所述音频字幕文件中以扩展形式存储的扩展内容，得到所述翻译字幕，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述在多媒体文件的播放过程中，同步显示所述原语种字幕和所述翻译字幕，包括：

5.根据权利要求2或3所述的方法，其特征在于，所述在多媒体文件的播放过程中，同步显示所述原语种字幕和所述翻译字幕，包括：

当所述翻译字幕是音译字幕时，跟随所述原文字幕中的每个元素的播放进度，以逐字对准的方式显示与所述原文字幕对应的所述译文字幕中的每个元素。

6.根据权利要求1至3任一所述的方法，其特征在于，所述方法还包括：

接收字幕选择信号；

7.一种音频字幕显示装置，其特征在于，所述装置包括：

8.根据权利要求7所述的装置，其特征在于，所述解析模块，包括：

9.根据权利要求8所述的装置，其特征在于，所述翻译解析单元，用于：

10.根据权利要求8或9所述的装置，其特征在于，所述显示模块，包括：

11.根据权利要求8或9所述的装置，其特征在于，所述显示模块，包括：

音译显示单元，用于当所述翻译字幕是音译字幕时，跟随所述原文字幕中的每个元素的播放进度，以逐字对准的方式显示与所述原文字幕对应的所述译文字幕中的每个元素。

12.根据权利要求7至9任一所述的装置，其特征在于，所述装置还包括：

选择模块，用于接收字幕选择信号；

13.一种播放器，其特征在于，所述播放器包括如权利要求7至权利要求12任一所述的装置。