CN110990623B - 音频字幕的显示方法及装置、计算机设备及存储介质 - Google Patents

音频字幕的显示方法及装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110990623B
CN110990623B CN201911229075.6A CN201911229075A CN110990623B CN 110990623 B CN110990623 B CN 110990623B CN 201911229075 A CN201911229075 A CN 201911229075A CN 110990623 B CN110990623 B CN 110990623B
Authority
CN
China
Prior art keywords
audio
character
target
audio character
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911229075.6A
Other languages
English (en)
Other versions
CN110990623A (zh
Inventor
刘春宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kugou Computer Technology Co Ltd
Original Assignee
Guangzhou Kugou Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Kugou Computer Technology Co Ltd filed Critical Guangzhou Kugou Computer Technology Co Ltd
Priority to CN201911229075.6A priority Critical patent/CN110990623B/zh
Publication of CN110990623A publication Critical patent/CN110990623A/zh
Application granted granted Critical
Publication of CN110990623B publication Critical patent/CN110990623B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/64Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Controls And Circuits For Display Device (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开公开了一种音频字幕的显示方法及装置、计算机设备及存储介质,属于音视频播放技术技术领域。该方法包括:确定音频文件播放过程中显示屏待显示的目标音频字符;获取所述目标音频字符被显示时的变化幅度,所述目标音频字符的变化幅度基于所述目标音频字符在所述音频文件中的音调确定;在播放所述目标音频字符的音频的时段内,基于所述目标音频字符的变化幅度,在所述显示屏中动态显示所述目标音频字符。本公开能够通过音频字符被显示时的变化幅度体现音频字符的音调,提高了显示音频字幕的灵活性。

Description

音频字幕的显示方法及装置、计算机设备及存储介质
技术领域
本公开涉及音视频播放技术领域,特别涉及一种音频字幕的显示方法及装置、计算机设备及存储介质。
背景技术
随着科学技术的发展,应用程序的功能越来越多。例如,为了提高用户的视听体验,在终端中使用音频播放应用程序播放音频文件时,该音频播放应用程序能够在终端的显示屏中同步显示该音频文件的音频字幕。
相关技术中,在显示屏中显示音频字幕时,通常以音频字幕中的语句为单位,每次在显示屏中的显示一条或两条语句的字幕,并在当前语句对应的音频播放完成后,不再在显示屏中显示该语句的字幕。
但是,该相关技术显示音频字幕的灵活性较差。
发明内容
本公开实施例提供了一种音频字幕的显示方法及装置、计算机设备及存储介质,可以提高显示音频字幕的灵活性。所述技术方案如下:
第一方面,提供了一种音频字幕的显示方法,应用于终端,该显示方法包括:
确定音频文件播放过程中显示屏待显示的目标音频字符;
获取所述目标音频字符被显示时的变化幅度,所述目标音频字符的变化幅度基于所述目标音频字符在所述音频文件中的音调确定;
在播放所述目标音频字符的音频的时段内,基于所述目标音频字符的变化幅度,在所述显示屏中动态显示所述目标音频字符。
可选地,在所述获取所述目标音频字符被显示时的变化幅度之前,所述方法还包括:
获取所述音频文件的配置文件,所述配置文件携带有所述音频文件的音频字幕及所述音频字幕中每个音频字符被显示时的变化幅度;
所述获取所述目标音频字符被显示时的变化幅度,包括:
基于所述目标音频字符查询所述配置文件,确定所述目标音频字符被显示时的变化幅度。
可选地,所述配置文件还携带有每个音频字符的播放时间相对于所述音频字幕的起始播放时间的相对时间戳,所述基于所述目标音频字符查询所述配置文件,确定所述目标音频字符被显示时的变化幅度,包括:
基于所述目标音频字符的播放时间相对于所述音频字幕的起始播放时间的目标相对时间戳,查询所述配置文件,得到所述目标音频字符被显示时的变化幅度。
可选地,所述获取所述目标音频字符被显示时的变化幅度,包括:
基于指定的变化幅度确定规则,确定所述目标音频字符被显示时的变化幅度。
可选地,所述目标音频字符的变化幅度与所述目标音频字符的音调正相关。
可选地,在所述显示屏中动态显示所述目标音频字符包括以下一种或多种方式:在所述显示屏中闪烁显示所述目标音频字符、在所述显示屏中沿第一方向跳跃显示所述目标音频字符、在所述显示屏中沿第二方向平移显示所述目标音频字符、在所述显示屏中按照渐变方式显示所述目标音频字符;
在所述显示屏中闪烁显示所述目标音频字符时,所述目标音频字符的变化幅度包括:所述目标音频字符的闪烁频率;
在所述显示屏中沿第一方向跳跃显示所述目标音频字符时,所述目标音频字符的变化幅度包括以下一项或多项:所述目标音频字符的跳跃速率、所述目标音频字符在所述第一方向上的跳动跨度;
在所述显示屏中沿第二方向平移显示所述目标音频字符时,所述目标音频字符的变化幅度包括以下一项或多项:所述目标音频字符在所述第二方向上的平移距离、所述目标音频字符的平移速率;
在所述显示屏中按照渐变方式显示所述目标音频字符时,所述目标音频字符的变化幅度包括以下一项或多项:所述目标音频字符的渐变颜色中最深颜色与最浅颜色的颜色差距、所述目标音频字符的字体的最大字体宽度与最小字体宽度的差距、所述目标音频字符的笔划的最大笔划宽度与最小笔划宽度的差距。
第二方面,提供了一种音频字幕的显示方法,应用于服务器,该显示方法包括:
基于音频文件的音频字幕中每个音频字符的音调,确定每个音频字符被显示时的变化幅度,得到携带有所述音频字幕及每个音频字符被显示时的变化幅度的配置文件;
接收终端发送的请求播放所述音频文件的播放请求;
基于所述播放请求,将所述配置文件发送至所述终端,以供所述终端基于所述配置文件在显示屏中动态显示音频字符。
可选地,所述音频字符的变化幅度与所述音频字符的音调正相关。
可选地,所述终端在所述显示屏中动态显示音频字符包括以下一种或多种方式:在所述显示屏中闪烁显示所述音频字符、在所述显示屏中沿第一方向跳跃显示所述音频字符、在所述显示屏中沿第二方向平移显示所述音频字符、在所述显示屏中按照渐变方式显示所述音频字符;
在所述显示屏中闪烁显示所述音频字符时,所述音频字符的变化幅度包括:所述音频字符的闪烁频率;
在所述显示屏中沿第一方向跳跃显示所述音频字符时,所述音频字符的变化幅度包括以下一项或多项:所述音频字符的跳跃速率、所述音频字符在所述第一方向上的跳动跨度;
在所述显示屏中沿第二方向平移显示所述音频字符时,所述音频字符的变化幅度包括以下一项或多项:所述音频字符在所述第二方向上的平移距离、所述音频字符的平移速率;
在所述显示屏中按照渐变方式显示所述音频字符时,所述音频字符的变化幅度包括以下一项或多项:所述音频字符的渐变颜色中最深颜色与最浅颜色的颜色差距、所述音频字符的字体的最大字体宽度与最小字体宽度的差距、所述音频字符的笔划的最大笔划宽度与最小笔划宽度的差距。
第三方面,提供了一种音频字幕的显示装置,应用于终端,该显示装置包括:
确定模块,用于确定音频文件播放过程中显示屏待显示的目标音频字符;
获取模块,用于获取所述目标音频字符被显示时的变化幅度,所述目标音频字符的变化幅度基于所述目标音频字符在所述音频文件中的音调确定;
显示模块,用于在播放所述目标音频字符的音频的时段内,基于所述目标音频字符的变化幅度,在所述显示屏中动态显示所述目标音频字符。
可选地,所述获取模块具体用于:
获取所述音频文件的配置文件,所述配置文件携带有所述音频文件的音频字幕及所述音频字幕中每个音频字符被显示时的变化幅度;
基于所述目标音频字符查询所述配置文件,确定所述目标音频字符被显示时的变化幅度。
可选地,所述配置文件还携带有每个音频字符的播放时间相对于所述音频字幕的起始播放时间的相对时间戳,所述获取模块具体用于:
基于所述目标音频字符的播放时间相对于所述音频字幕的起始播放时间的目标相对时间戳,查询所述配置文件,得到所述目标音频字符被显示时的变化幅度。
可选地,所述获取模块具体用于:
基于指定的变化幅度确定规则,确定所述目标音频字符被显示时的变化幅度。
可选地,所述目标音频字符的变化幅度与所述目标音频字符的音调正相关。
可选地,在所述显示屏中闪烁显示所述目标音频字符时,所述目标音频字符的变化幅度包括:所述目标音频字符的闪烁频率;
在所述显示屏中沿第一方向跳跃显示所述目标音频字符时,所述目标音频字符的变化幅度包括以下一项或多项:所述目标音频字符的跳跃速率,所述目标音频字符在所述第一方向上的跳动跨度;
在所述显示屏中沿第二方向平移显示所述目标音频字符时,所述目标音频字符的变化幅度包括以下一项或多项:所述目标音频字符在所述第二方向上的平移距离,所述目标音频字符的平移速率;
在所述显示屏中按照渐变方式显示所述目标音频字符时,所述目标音频字符的变化幅度包括以下一项或多项:所述目标音频字符的渐变颜色中最深颜色与最浅颜色的颜色差距,所述目标音频字符的字体的最大字体宽度与最小字体宽度的差距,所述目标音频字符的笔划的最大笔划宽度与最小笔划宽度的差距。
第四方面,提供了一种音频字幕的显示装置,应用于服务器,该显示装置包括:
确定模块,用于基于音频文件的音频字幕中每个音频字符的音调,确定每个音频字符被显示时的变化幅度,得到携带有所述音频字幕及每个音频字符被显示时的变化幅度的配置文件;
接收模块,用于接收终端发送的请求播放所述音频文件的播放请求;
发送模块,用于基于所述播放请求,将所述配置文件发送至所述终端,以供所述终端基于所述配置文件在显示屏中动态显示音频字符。
可选地,所述音频字符的变化幅度与所述音频字符的音调正相关。
可选地,所述终端在所述显示屏中动态显示音频字符包括以下一种或多种方式:在所述显示屏中闪烁显示所述音频字符、在所述显示屏中沿第一方向跳跃显示所述音频字符、在所述显示屏中沿第二方向平移显示所述音频字符、在所述显示屏中按照渐变方式显示所述音频字符;
在所述显示屏中闪烁显示所述音频字符时,所述音频字符的变化幅度包括:所述音频字符的闪烁频率;
在所述显示屏中沿第一方向跳跃显示所述音频字符时,所述音频字符的变化幅度包括以下一项或多项:所述音频字符的跳跃速率、所述音频字符在所述第一方向上的跳动跨度;
在所述显示屏中沿第二方向平移显示所述音频字符时,所述音频字符的变化幅度包括以下一项或多项:所述音频字符在所述第二方向上的平移距离、所述音频字符的平移速率;
在所述显示屏中按照渐变方式显示所述音频字符时,所述音频字符的变化幅度包括以下一项或多项:所述音频字符的渐变颜色中最深颜色与最浅颜色的颜色差距、所述音频字符的字体的最大字体宽度与最小字体宽度的差距、所述音频字符的笔划的最大笔划宽度与最小笔划宽度的差距。
第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得所述计算机执行第一方面任一所述的音频字幕的显示方法。
第六方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得所述计算机执行第二方面任一所述的音频字幕的显示方法。
第七方面,提供了一种计算机设备,包括存储器和处理器,所述存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现第一方面任一所述的音频字幕的显示方法。
第八方面,提供了一种计算机设备,包括存储器和处理器,所述存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现第二方面任一所述的音频字幕的显示方法。
本公开实施例提供的技术方案带来的有益效果是:
本公开实施例提供的音频字幕的显示方法及装置、计算机设备及存储介质,通过确定音频文件播放过程中显示屏待显示的目标音频字符,获取该目标音频字符在被显示时的变化幅度,并在播放该目标音频字符的音频的时段内,基于该目标音频字符的变化幅度,在显示屏中动态显示该目标音频字符,由于该目标音频字符的变化幅度基于目标音频字符在音频文件中的音调确定,使得能够通过该变化幅度体现目标音频字符的音调,提高了显示音频字幕的灵活性。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的一种音频字幕的显示方法所涉及的实施环境的示意图;
图2是本公开实施例提供的一种音频字幕的显示方法的流程图;
图3是本公开实施例提供的另一种音频字幕的显示方法的流程图;
图4是本公开实施例提供的一种显示屏显示音频字符的示意图;
图5是本公开实施例提供的另一种显示屏显示音频字符的示意图;
图6是本公开实施例提供的又一种显示屏显示音频字符的示意图;
图7是本公开实施例提供的一种音频字幕的显示装置的结构示意图;
图8是本公开实施例提供的另一种音频字幕的显示装置的结构示意图;
图9是本公开实施例提供的一种终端的结构示意图;
图10是本公开实施例提供的一种服务器的结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
图1是本公开实施例提供的音频字幕的显示方法所涉及的实施环境的示意图。该实施环境可以包括:服务器01和终端02。
服务器01可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。终端02具有音频播放功能,且终端02配置有显示屏。可选地,终端02可以安装有音频播放应用程序或视频播放应用程序,终端02可以使用该音频播放应用程序或视频播放应用程序播放音频。在一种可实现方式中,终端02可以为智能手机、电脑、具有显示屏的多媒体播放器、具有显示屏的可穿戴式设备等多种终端。
服务器01和终端02之间可以通过有线网络或无线网络建立连接。服务器01可以根据音频文件的音频字幕中每个音频字符在该音频文件中的音调,根据指定的变化幅度确定规则,确定对应音频字符在被显示时的变化幅度,并以配置文件的形式存储音频字幕和该音频字幕中每个音频字符在被显示时的变化幅度。终端02在需要播放音频文件时,可以向该服务器01发送请求播放该音频文件的播放请求。服务器01在接收到该播放请求后,可以向该终端02发送该音频文件和该音频文件的配置文件,以便于终端01播放该音频文件,并在播放该音频文件的过程中,根据该配置文件动态显示音频字符。
需要说明的是,本公开实施例提供的音频字幕的显示方法所涉及的实施环境也可以不包括服务器01,本公开实施例对其不做具体限定。示例地,当实施环境不包括服务器01时,终端02可以根据终端02中存储的音频文件和音频字幕,按照本公开实施例提供的音频字幕的显示方法,在终端02播放该音频文件时,在该终端02的显示屏上显示该音频字幕中的音频字符。其中,终端02中存储的音频文件可以为终端02预先获取的音频文件。例如,可以为终端02通过音频录制方式获得的音频文件,或者,可以为该终端02从其他终端中接收的音频文件。
本公开实施例提供了一种音频字幕的显示方法。图2是本公开实施例提供的一种音频字幕的显示方法的流程图,如图2所示,该方法应用于终端,该方法可以包括:
步骤201、确定音频文件播放过程中显示屏待显示的目标音频字符。
其中,音频文件指存储有声音信息的文件。例如,该音频文件可以为视频文件、歌曲文件或录音文件等。
步骤202、获取目标音频字符被显示时的变化幅度。
其中,目标音频字符的变化幅度基于目标音频字符在音频文件中的音调确定。
步骤203、在播放目标音频字符的音频的时段内,基于目标音频字符的变化幅度,在显示屏中动态显示目标音频字符。
综上所述,本公开实施例提供的音频字幕的显示方法,通过确定音频文件播放过程中显示屏待显示的目标音频字符,获取该目标音频字符在被显示时的变化幅度,并在播放该目标音频字符的音频的时段内,基于该目标音频字符的变化幅度,在显示屏中动态显示该目标音频字符。由于该目标音频字符的变化幅度基于目标音频字符在音频文件中的音调确定,使得能够通过该变化幅度体现目标音频字符的音调,提高了显示音频字幕的灵活性。
下面以本公开实施例提供的音频字幕的显示方法涉及的应用场景包括服务器和终端为例,对该音频字幕的显示方法进行说明。如图3所示,该方法可以包括以下步骤:
步骤301、服务器基于音频文件的音频字幕中每个音频字符的音调,确定每个音频字符被显示时的变化幅度,得到携带有音频字幕及每个音频字符被显示时的变化幅度的配置文件。
其中,音调用于表示声音的高低。音调由频率决定。配置文件可以携带有该音频文件的音频字幕及该音频字幕中每个音频字符被显示时的变化幅度。或者,配置文件还可以携带有每个音频字符的播放时间相对于音频字幕的起始播放时间的相对时间戳。
音频字符被显示时的变化幅度是指在:在显示屏中从开始显示音频字符到结束显示音频字符的过程中,音频字符发生变化的变化幅度。相应的,动态显示音频字符是指:在终端中播放该音频字符的音频的时段内,在指定的显示方式的基础上,按照该音频字符的变化幅度显示该音频字符。例如,当指定显示方式为在显示屏中沿垂直方向跳跃显示音频字符时,假设音频字符的变化幅度为该音频字符在垂直方向上的跳动跨度为5厘米(cm),且显示屏中所有音频字符的底部位于距离该显示屏显示区域底部边界的2厘米处,如图4所示,动态显示该音频字符指:在终端中播放该音频字符音频的时段内,在距离该显示屏显示区域底部边界的2厘米至7厘米的范围内跳跃显示该音频字符。
可选地,当使用音频字符在动态显示过程中的变化幅度来体现音频字符在音频文件中的音调时,该音频字符的变化幅度可以与该音频字符的音调正相关。此时,音频字符的音调越高,该音频字符在动态显示过程中的变化幅度越大。这样一来,当用户在显示屏上看到按照较大的变化幅度动态显示的音频字符时,可以确定该音频字符的音调较高。因此,通过该方式显示音频字符,不仅能够使用可视化的方式让用户知晓音频字符的音调,还能够通过动态显示该音频字符的方式提高显示音频字符时的画面感,有效地提高了用户体验。
当显示音频字符时使用的动态显示方式不同时,该变化幅度的呈现方式不同。下面以以下几种实现方式为例对其进行示例性的说明:
在第一种可实现方式中,在显示屏中闪烁显示音频字符时,音频字符的变化幅度包括:音频字符的闪烁频率。
当显示屏以较高的闪烁频率显示音频字符时,可以确定该音频字符的音调较高。当显示屏以较低的闪烁频率显示音频字符时,可以确定该音频字符的音调较低。
在第二种可实现方式中,在显示屏中沿第一方向跳跃显示音频字符时,音频字符的变化幅度包括以下一项或多项:音频字符的跳跃速率,音频字符在第一方向上的跳动跨度。
当采用音频字符的跳跃速率表现音频字符的音调时,若显示屏沿第一方向以较大的跳跃速率显示音频字符,可以确定该音频字符的音调较高。若显示屏沿第一方向以较小的跳跃速率显示音频字符,可以确定该音频字符的音调较低。
当采用音频字符的跳动跨度表现音频字符的音调时,若显示屏沿第一方向以较大的跳动跨度显示音频字符,可以确定该音频字符的音调较高。若显示屏沿第一方向以较小的跳动跨度显示音频字符,可以确定该音频字符的音调较低。
当采用音频字符的跳跃速率和跳动跨度共同表现音频字符的音调时,跳跃速率和跳动跨度对音频字符音调的表现力可以根据应用需求确定。例如,若在显示屏中显示的音频字符的跳跃速率和跳动跨度均较大,可以确定该音频字符的音调较高,若在显示屏中显示的音频字符的跳跃速率和跳动跨度均较小,可以确定该音频字符的音调较低。
其中,在显示屏中显示音频字符时的第一方向可以根据应用需求进行调整。例如,该第一方向可以为在显示屏中按照由下向上的方式跳跃,或者,可以为按照由上向下的方式跳跃,或者,可以为按照由左向右的方式跳跃,或者,可以为由右向左的方式跳跃,本公开实施例对其不做具体限定。
示例地,图4和图5分别为显示屏显示音频字符的示意图。图4中虚线表示音频字符“高”在显示屏中的跳动路径,该图4中虚线的起点标记音频字符“高”跳动的最低位置,该图4中虚线的终端标记音频字符“高”跳动的最高位置。图5中虚线表示音频字符“原”在显示屏中的跳动路径,该图5中虚线的起点标记音频字符“原”跳动的最低位置,该图5中虚线的终端标记音频字符“原”跳动的最高位置。该图4和图5中的跳动路径示出了音频字符在显示屏中的跳动方向和跳动跨度。根据图4和图5可知,“高”在显示屏中的跳动跨度较大,“原”在显示屏中的跳动跨度较小,因此,可知“高”的音调较高、“原”的音调较低。
在第三种可实现方式中,在显示屏中沿第二方向平移显示音频字符时,音频字符的变化幅度包括以下一项或多项:音频字符在第二方向上的平移距离,音频字符的平移速率。
当显示屏沿第二方向以较大的平移距离显示音频字符时,可以确定该音频字符的音调较高。当显示屏沿第二方向以较小的平移距离显示音频字符时,可以确定该音频字符的音调较低。
其中,在显示屏中显示音频字符时的第二方向可以根据应用需求进行调整。例如,第二方向可以为在显示屏中按照由下向上的方式平移,或者,可以为按照由上向下的方式平移,或者,可以为按照由左向右的方式平移,或者,可以为由右向左的方式平移,本公开实施例对其不做具体限定。
在第四种可实现方式中,在显示屏中渐变显示音频字符时,音频字符的变化幅度包括以下一项或多项:音频字符的渐变颜色中最深颜色与最浅颜色的颜色差距,音频字符的字体的最大字体宽度与最小字体宽度的差距,音频字符的笔划的最大笔划宽度与最小笔划宽度的差距。
当采用渐变颜色显示音频字符时,若该渐变颜色的颜色差距较大,可以确定该音频字符的音调较高。若该渐变颜色的颜色差距较小,可以确定该音频字符的音调较低。
或者,当采用渐变字体宽度显示音频字符时,若该音频字符的字体的最大字体宽度与最小字体宽度的差距较大,可以确定该音频字符的音调较高。若该音频字符的字体的最大字体宽度与最小字体宽度的差距较小,可以确定该音频字符的音调较低。
或者,当采用渐变笔划宽度显示音频字符时,若该音频字符的笔划的最大笔划宽度与最小笔划宽度的差距较大,可以确定该音频字符的音调较高。若该音频字符的笔划的最大笔划宽度与最小笔划宽度的差距较小,可以确定该音频字符的音调较低。
当采用渐变颜色、渐变字体宽度和渐变笔划宽度共同表现音频字符的音调时,该渐变颜色、渐变字体宽度和渐变笔划宽度对音频字符音调的表现力可以根据应用需求确定。例如,若在显示屏中显示的音频字符的渐变颜色的颜色差距、渐变字体宽度的宽度差距和渐变笔划宽度的宽度差距均较大,可以确定该音频字符的音调较高。若在显示屏中显示的音频字符的渐变颜色的颜色差距、渐变字体宽度的宽度差距和渐变笔划宽度的宽度差距均较小,可以确定该音频字符的音调较低。
其中,采用渐变颜色显示音频字符时,该音频字符的具体颜色可以根据应用需求进行调整。采用渐变字体宽度和渐变笔划宽度显示音频字符时,对应宽度大小可以根据应用需求进行调整。并且,在显示音频字符时采用的字体也可以根据应用需求进行调整,本公开实施例对其不做具体限定。
步骤302、终端向服务器发送的请求播放音频文件的播放请求。
用户需要在终端中播放音频文件时,用户可以在终端中执行指定操作,以触发生成请求播放音频文件的播放请求,并向服务器发送该播放请求,以便于服务器根据该播放请求向终端发送播放该音频文件所需的资源。
步骤303、服务器基于播放请求,将配置文件发送至终端。
服务器接收到终端发送的播放请求后,服务器可以根据该播放请求向终端发送播放该音频文件所需的资源。例如,服务器可以向终端发送音频文件的配置文件,或者,发送该音频文件本身以及该音频文件的配置文件。
其中,终端发送的播放请求可以指定需要服务器向其提供的文件,相应的,服务器可以根据该播放请求向终端发送该播放请求中指定的文件。例如,当终端中存储有音频文件时,终端发送的播放请求可以指定服务器向其提供该音频文件的配置文件,相应的,服务器可以根据该播放请求,向终端发送该音频文件的配置文件。
通过服务器获取音频文件中音频字符的变化幅度,在服务器中生成配置文件后,并由服务器向终端提供该配置文件,能够便利于对配置文件的管理,简化该音频字幕的显示方法的开发过程。
步骤304、终端确定音频文件播放过程中显示屏待显示的目标音频字符。
目标音频字符可以是终端播放音频文件的过程中,需要在显示屏中显示的任一音频字符。例如,目标音频字符可以为该音频字幕中的所有音频字符中的任一个。
或者,当每次在显示屏中以语句为单位显示音频字幕时,例如每次在显示屏中一次性显示一句或两句音频字幕时,该目标音频字符可以为显示屏中下一次需要显示的语句中的任一个音频字符。此时,可以识别显示屏中当前显示的语句,然后根据该当前显示的语句查询配置文件中的音频字幕,将音频字幕中位于该当前显示的语句后的指定数量个语句中的字符确定为目标音频字符。其中,该指定数量为显示屏中每次显示的语句的数量。
或者,当显示屏逐字显示音频字幕时,该目标音频字幕可以为显示屏完成当前音频字符的显示后,下一个需要显示的音频字符。此时,可以识别显示屏中当前显示的音频字符,然后根据该当前显示的音频字符查询配置文件中的音频字幕,将音频字幕中位于该当前显示的音频字符后的音频字符确定为目标音频字符。
步骤305、终端基于目标音频字符查询配置文件,确定目标音频字符被显示时的变化幅度。
如前所述,配置文件可以携带有该音频文件的音频字幕及该音频字幕中每个音频字符被显示时的变化幅度。因此,在该步骤305中,可以根据目标音频字符查询该配置文件,以确定该目标音频字符被显示时的变化幅度。
在一种可实现方式中,由于配置文件还可以携带有每个音频字符的播放时间相对于音频字幕的起始播放时间的相对时间戳,因此,可以先根据目标音频字符的播放时间相对于音频文件的起始播放时间的时间差,然后根据该目标音频字符的时间差,查询配置文件中各个音频字符的相对时间戳,并将相对时间戳等于该时间差的音频字符的变化幅度确定为该目标音频字符的变化幅度。
示例地,假设音频文件《青藏高原》的配置文件中携带有《青藏高原》的音频字幕,及该音频字幕中每个音频字符的播放时间相对于该音频字幕的起始播放时间的相对时间戳。表1示出了音频字幕的起始播放时间为0时,音频字幕“……,那就是青藏高原,……”中各个音频字符的相对时间戳,该相对时间戳的单位为秒(S)。当目标音频字符为“青”时,根据该目标音频字符“青”的播放时间,可以确定该目标音频字符“青”相对于音频文件的起始播放时间的时间差为18.1S,根据该时间差18.1S,查询配置文件中各个音频字符的相对时间戳,可知配置文件中相对时间戳18.1S等于该时间差18.1S,则可将该相对时间戳18.1S对应的音频字符“青”的变化幅度确定为该目标音频字符“青”的变化幅度。
表1
音频字符 “那” “就” “是” “青” “藏” “高” “原”
相对时间戳 15.6S 16.7S 17.3S 18.1S 19.5S 20.3S 22.3S
在另一种可实现方式中,终端可以对配置文件进行解析得到链表。该链表包括多个节点,每个节点记载有一句或多句音频字幕、每句音频字幕的开始时间戳、结束时间戳、及该一句或多句音频字幕中音频字符的变化幅度列表。该变化幅度列表包括多个子节点,每个子节点记载有该一句或多句音频字幕中一个音频字符的变化幅度。在需要确定目标音频字符的被显示时的变化幅度时,可以根据该目标音频字符所在的语句及该语句的时间戳,确定记载有该语句音频字幕的节点,并在该节点记载的变化幅度列表中查找该目标音频字符对应的子节点,然后将该子节点记载的音频字符的变化幅度确定为该目标音频字符的变化幅度。
步骤306、终端在播放目标音频字符的音频的时段内,基于目标音频字符的变化幅度,在显示屏中动态显示目标音频字符。
确定目标音频字符中每个音频字符的变化幅度后,就可以在播放该目标音频字符的音频的时段内,按照该目标音频字符的变化幅度在显示屏中动态显示该目标音频字符,以便于用户能够根据该目标音频字符的变化幅度知晓音频字符的音调。
并且,在本公开实施例中,可以逐字显示音频字符,并在显示每个音频字符的过程中,按照该音频字符的变化幅度动态显示该音频字符。示例地,如图6所示,当播放到音频字符“高”时,才在显示屏中显示该音频字符“高”,且在显示该音频字符“高”时,按照该音频字符“高”的变化幅度在显示屏中进行动态显示。
或者,每次在显示屏中显示一句或多句音频字幕,并在播放到音频字符的音频时,按照该音频字符的变化幅度动态显示该音频字符,在未播放该音频字符的音频时,静态显示该音频字符。示例地,如图4所示,假设当前播放到音频字符“高”的音频,且在显示屏的本次显示过程中,显示屏中显示了两句音频字幕,分别为“……”和“那就是青藏高原”,此时,图4为按照音频字符“高”的变化幅度在显示屏中该音频字符“高”的示例。
需要说明的是,在显示屏中显示音频字符时,除了根据音频字符的音调动态显示音频字符,还可以在根据音调动态显示音频字符的基础上,叠加其他动态显示效果,此时需要保证该其他动态显示效果与该音调对应的动态效果不同,以便于用户能够从音调对应的动态效果知晓音频字符音调的高低。例如,音调对应的动态效果可以为在垂直方向上跳动显示音频字符,该其他动态显示效果可以为在水平方向上按照贝塞尔曲线显示音频字符。
需要说的是,上述方法实施例中,对终端获取音频字符变化幅度的实现方式进行说明时,是以采用服务器获取音频文件中音频字符的变化幅度,并向终端提供音频文件中音频字符的变化幅度为例进行说明的,其不用于限定本公开实施例的实现方式。终端还可以使用其他方式获取音频字符的变化幅度。例如,终端也可以根据音频字符的音调,按照指定的变化幅度确定规则,确定音频字符被显示时的变化幅度。
综上所述,本公开实施例提供的音频字幕的显示方法,通过确定音频文件播放过程中显示屏待显示的目标音频字符,获取该目标音频字符在被显示时的变化幅度,并在播放该目标音频字符的音频的时段内,基于该目标音频字符的变化幅度,在显示屏中动态显示该目标音频字符。由于该目标音频字符的变化幅度基于目标音频字符在音频文件中的音调确定,使得能够通过该变化幅度体现目标音频字符的音调,提高了显示音频字幕的灵活性。
需要说明的是,本公开实施例提供的音频字幕的显示方法步骤的先后顺序可以进行适当调整,步骤也可以根据情况进行相应增减。任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本公开的保护范围之内,因此不再赘述。
本公开实施例提供了一种音频字幕的显示装置,应用于终端,如图7所示,该音频字幕的显示装置70可以包括:
确定模块701,用于确定音频文件播放过程中显示屏待显示的目标音频字符。
获取模块702,用于获取目标音频字符被显示时的变化幅度,目标音频字符的变化幅度基于目标音频字符在音频文件中的音调确定。
显示模块703,用于在播放目标音频字符的音频的时段内,基于目标音频字符的变化幅度,在显示屏中动态显示目标音频字符。
综上所述,本公开实施例提供的音频字幕的显示装置,通过确定模块确定音频文件播放过程中显示屏待显示的目标音频字符,获取模块获取该目标音频字符在被显示时的变化幅度,显示模块在播放该目标音频字符的音频的时段内,基于该目标音频字符的变化幅度,在显示屏中动态显示该目标音频字符。由于该目标音频字符的变化幅度基于目标音频字符在音频文件中的音调确定,使得能够通过该变化幅度体现目标音频字符的音调,提高了显示音频字幕的灵活性。
可选地,获取模块702具体用于:
获取音频文件的配置文件,配置文件携带有音频文件的音频字幕及音频字幕中每个音频字符被显示时的变化幅度。
基于目标音频字符查询配置文件,确定目标音频字符被显示时的变化幅度。
可选地,配置文件还携带有每个音频字符的播放时间相对于音频字幕的起始播放时间的相对时间戳,获取模块702具体用于:
基于目标音频字符的播放时间相对于音频字幕的起始播放时间的目标相对时间戳,查询配置文件,得到目标音频字符被显示时的变化幅度。
可选地,获取模块702具体用于:
基于指定的变化幅度确定规则,确定目标音频字符被显示时的变化幅度。
可选地,目标音频字符的变化幅度与目标音频字符的音调正相关。
可选地,在显示屏中动态显示目标音频字符包括以下一种或多种方式:在显示屏中闪烁显示目标音频字符、在显示屏中沿第一方向跳跃显示目标音频字符、在显示屏中沿第二方向平移显示目标音频字符、在显示屏中按照渐变方式显示目标音频字符。
相应的,在显示屏中闪烁显示目标音频字符时,目标音频字符的变化幅度包括:目标音频字符的闪烁频率。
在显示屏中沿第一方向跳跃显示目标音频字符时,目标音频字符的变化幅度包括以下一项或多项:目标音频字符的跳跃速率、目标音频字符在第一方向上的跳动跨度。
在显示屏中沿第二方向平移显示目标音频字符时,目标音频字符的变化幅度包括以下一项或多项:目标音频字符在第二方向上的平移距离、目标音频字符的平移速率。
在显示屏中按照渐变方式显示目标音频字符时,目标音频字符的变化幅度包括以下一项或多项:目标音频字符的渐变颜色中最深颜色与最浅颜色的颜色差距、目标音频字符的字体的最大字体宽度与最小字体宽度的差距、目标音频字符的笔划的最大笔划宽度与最小笔划宽度的差距。
综上所述,本公开实施例提供的音频字幕的显示装置,通过确定模块确定音频文件播放过程中显示屏待显示的目标音频字符,获取模块获取该目标音频字符在被显示时的变化幅度,显示模块在播放该目标音频字符的音频的时段内,基于该目标音频字符的变化幅度,在显示屏中动态显示该目标音频字符。由于该目标音频字符的变化幅度基于目标音频字符在音频文件中的音调确定,使得能够通过该变化幅度体现目标音频字符的音调,提高了显示音频字幕的灵活性。
本公开实施例提供了一种音频字幕的显示装置,应用于服务器,如图8所示,该音频字幕的显示装置80可以包括:
确定模块801,用于基于音频文件的音频字幕中每个音频字符的音调,确定每个音频字符被显示时的变化幅度,得到携带有音频字幕及每个音频字符被显示时的变化幅度的配置文件。
接收模块802,用于接收终端发送的请求播放音频文件的播放请求。
发送模块803,用于基于播放请求,将配置文件发送至终端,以供终端基于配置文件在显示屏中动态显示音频字符。
可选地,音频字符的变化幅度与音频字符的音调正相关。
可选地,终端在显示屏中动态显示音频字符包括以下一种或多种方式:在显示屏中闪烁显示音频字符、在显示屏中沿第一方向跳跃显示音频字符、在显示屏中沿第二方向平移显示音频字符、在显示屏中按照渐变方式显示音频字符。
相应的,在显示屏中闪烁显示音频字符时,音频字符的变化幅度包括:音频字符的闪烁频率。
在显示屏中沿第一方向跳跃显示音频字符时,音频字符的变化幅度包括以下一项或多项:音频字符的跳跃速率、音频字符在第一方向上的跳动跨度。
在显示屏中沿第二方向平移显示音频字符时,音频字符的变化幅度包括以下一项或多项:音频字符在第二方向上的平移距离、音频字符的平移速率。
在显示屏中按照渐变方式显示音频字符时,音频字符的变化幅度包括以下一项或多项:音频字符的渐变颜色中最深颜色与最浅颜色的颜色差距、音频字符的字体的最大字体宽度与最小字体宽度的差距、音频字符的笔划的最大笔划宽度与最小笔划宽度的差距。
综上所述,本公开实施例提供的音频字幕的显示装置,通过确定模块确定每个音频字符被显示时的变化幅度,得到携带有音频字幕及每个音频字符被显示时的变化幅度的配置文件,发送模块向终端提供该配置文件。本公开实施提供的显示装置能够便于终端根据该配置文件按照对应的变化幅度动态显示音频字幕,使得能够通过该变化幅度体现目标音频字符的音调,提高了显示音频字幕的灵活性。
并且,在服务器中生成配置文件后,并由服务器向终端提供该配置文件,能够便利于对配置文件的管理,简化该音频字幕的显示方法的开发过程。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置、模块和子模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以为非易失性存储介质。该存计算机可读储介质中存储有指令,当该指令在终端上运行时,使得终端执行上述方法实施例提供的音频字幕的显示方法。
本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以为非易失性存储介质。该存储介质中存储有指令,当该指令在服务器上运行时,使得服务器执行上述方法实施例提供的音频字幕的显示方法。
本公开实施例还提供了一种计算机设备,包括存储器和处理器,存储器上存储有可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述方法实施例提供的音频字幕的显示方法。
可选地,该计算机设备可以为终端。图9示出了本发明一个示例性实施例提供的终端900的结构框图。该终端900可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端900还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端900包括有:处理器901和存储器902。
处理器901可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器901可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器901也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器)。协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器901可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器901还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器902可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器902还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器902中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器901所执行以实现本公开中方法实施例提供的音频字幕的显示方法。
在一些实施例中,终端900还可选包括有:外围设备接口903和至少一个外围设备。处理器901、存储器902和外围设备接口903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口903相连。具体地,外围设备包括:射频电路904、显示屏905、摄像头组件906、音频电路907、定位组件908和电源909中的至少一种。
外围设备接口903可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器901和存储器902。在一些实施例中,处理器901、存储器902和外围设备接口903被集成在同一芯片或电路板上。在一些其他实施例中,处理器901、存储器902和外围设备接口903中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路904用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路904通过电磁信号与通信网络以及其他通信设备进行通信。射频电路904将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路904包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路904可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路904还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本公开对此不加以限定。
显示屏905用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏905是触摸显示屏时,显示屏905还具有采集在显示屏905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器901进行处理。此时,显示屏905还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏905可以为一个,设置终端900的前面板。在另一些实施例中,显示屏905可以为至少两个,分别设置在终端900的不同表面或呈折叠设计。在再一些实施例中,显示屏905可以是柔性显示屏,设置在终端900的弯曲表面上或折叠面上。甚至,显示屏905还可以设置成非矩形的不规则图形,也即异形屏。显示屏905可以为LCD(LiquidCrystal Display,液晶显示阵列)显示屏或OLED(Organic Light-Emitting Diode,有机发光二极管)显示屏。
摄像头组件906用于采集图像或视频。可选地,摄像头组件906包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件906还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路907可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器901进行处理,或者输入至射频电路904以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端900的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器901或射频电路904的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路907还可以包括耳机插孔。
定位组件908用于定位终端900的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件908可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源909用于为终端900中的各个组件进行供电。电源909可以是交流电、直流电、一次性电池或可充电电池。当电源909包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端900还包括有一个或多个传感器910。该一个或多个传感器910包括但不限于:加速度传感器911、陀螺仪传感器912、压力传感器913、指纹传感器914、光学传感器915以及接近传感器916。
加速度传感器911可以检测以终端900建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器911可以用于检测重力加速度在三个坐标轴上的分量。处理器901可以根据加速度传感器911采集的重力加速度信号,控制触摸显示屏905以横向视图或纵向视图进行用户界面的显示。加速度传感器911还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器912可以检测终端900的机体方向及转动角度,陀螺仪传感器912可以与加速度传感器911协同采集用户对终端900的3D动作。处理器901根据陀螺仪传感器912采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器913可以设置在终端900的侧边框和/或触摸显示屏905的下层。当压力传感器913设置在终端900的侧边框时,可以检测用户对终端900的握持信号,由处理器901根据压力传感器913采集的握持信号进行左右手识别或快捷操作。当压力传感器913设置在触摸显示屏905的下层时,由处理器901根据用户对触摸显示屏905的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器914用于采集用户的指纹,由处理器901根据指纹传感器914采集到的指纹识别用户的身份,或者,由指纹传感器914根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器901授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器914可以被设置终端900的正面、背面或侧面。当终端900上设置有物理按键或厂商Logo时,指纹传感器914可以与物理按键或厂商Logo集成在一起。
光学传感器915用于采集环境光强度。在一个实施例中,处理器901可以根据光学传感器915采集的环境光强度,控制触摸显示屏905的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏905的显示亮度。当环境光强度较低时,调低触摸显示屏905的显示亮度。在另一个实施例中,处理器901还可以根据光学传感器915采集的环境光强度,动态调整摄像头组件906的拍摄参数。
接近传感器916,也称距离传感器,通常设置在终端900的前面板。接近传感器916用于采集用户与终端900的正面之间的距离。在一个实施例中,当接近传感器916检测到用户与终端900的正面之间的距离逐渐变小时,由处理器901控制触摸显示屏905从亮屏状态切换为息屏状态。当接近传感器916检测到用户与终端900的正面之间的距离逐渐变大时,由处理器901控制触摸显示屏905从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图9中示出的结构并不构成对终端900的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本公开实施例还提供了一种计算机设备,包括存储器和处理器,存储器上存储有可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述方法实施例提供的音频字幕的显示方法。
可选地,该计算机设备可以为服务器。图10是根据一示例性实施例示出的一种服务器的结构示意图。服务器1000包括中央处理单元(CPU)1001、包括随机存取存储器(RAM)1002和只读存储器(ROM)1003的系统存储器1004,以及连接系统存储器1004和中央处理单元1001的系统总线1005。服务器1000还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)1006,和用于存储操作系统1013、应用程序1014和其他程序模块1015的大容量存储设备1007。
基本输入/输出系统1006包括有用于显示信息的显示器1008和用于用户输入信息的诸如鼠标、键盘之类的输入设备1009。其中显示器1008和输入设备1009都通过连接到系统总线1005的输入输出控制器1010连接到中央处理单元1001。基本输入/输出系统1006还可以包括输入输出控制器1010以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1010还提供输出到显示屏、打印机或其他类型的输出设备。
大容量存储设备1007通过连接到系统总线1005的大容量存储控制器(未示出)连接到中央处理单元1001。大容量存储设备1007及其相关联的计算机可读介质为服务器1000提供非易失性存储。也就是说,大容量存储设备1007可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器1004和大容量存储设备1007可以统称为存储器。
根据本发明的各种实施例,服务器1000还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1000可以通过连接在系统总线1005上的网络接口单元1011连接到网络1012,或者说,也可以使用网络接口单元1011来连接到其他类型的网络或远程计算机系统(未示出)。
存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,中央处理器1001通过执行该一个或一个以上程序来实现上述方法实施例提供的音频字幕的显示方法。
本公开实施例还提供了一种包含指令的计算机程序产品,当其在终端上运行时,使得终端执行上述方法实施例提供的音频字幕的显示方法。
本公开实施例还提供了一种包含指令的计算机程序产品,当其在服务器上运行时,使得服务器执行上述方法实施例提供的音频字幕的显示方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本公开的较佳实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (11)

1.一种音频字幕的显示方法,应用于终端,其特征在于,包括:
确定音频文件播放过程中显示屏待显示的目标音频字符;
获取所述音频文件的配置文件,所述配置文件携带有所述音频文件的音频字幕、所述音频字幕中每个音频字符被显示时的变化幅度及每个音频字符的播放时间相对于所述音频字幕的起始播放时间的相对时间戳;
解析所述配置文件得到链表,所述链表包括多个节点,每个节点记载有一句或多句音频字幕、每句音频字幕的开始时间戳、结束时间戳、及所述一句或多句音频字幕中音频字符的变化幅度列表,所述变化幅度列表包括多个子节点,每个子节点记载有所述一句或多句音频字幕中一个音频字符的变化幅度;
基于所述目标音频字符的播放时间相对于所述音频字幕的起始播放时间的目标相对时间戳,以及所述目标音频字符所在的语句,确定记载有所述语句的音频字幕的节点,并在所述节点记载的变化幅度列表中查找所述目标音频字符对应的子节点,将所述子节点记载的音频字符的变化幅度确定为所述目标音频字符的被显示时的变化幅度,所述目标音频字符的变化幅度基于所述目标音频字符在所述音频文件中的音调确定;
在播放所述目标音频字符的音频的时段内,基于所述目标音频字符的变化幅度,在所述显示屏中动态显示所述目标音频字符。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于指定的变化幅度确定规则,确定所述目标音频字符被显示时的变化幅度。
3.根据权利要求1或2所述的方法,其特征在于,所述目标音频字符的变化幅度与所述目标音频字符的音调正相关。
4.根据权利要求1或2所述的方法,其特征在于,在所述显示屏中动态显示所述目标音频字符包括以下一种或多种方式:在所述显示屏中闪烁显示所述目标音频字符、在所述显示屏中沿第一方向跳跃显示所述目标音频字符、在所述显示屏中沿第二方向平移显示所述目标音频字符、在所述显示屏中按照渐变方式显示所述目标音频字符;
在所述显示屏中闪烁显示所述目标音频字符时,所述目标音频字符的变化幅度包括:所述目标音频字符的闪烁频率;
在所述显示屏中沿第一方向跳跃显示所述目标音频字符时,所述目标音频字符的变化幅度包括以下一项或多项:所述目标音频字符的跳跃速率、所述目标音频字符在所述第一方向上的跳动跨度;
在所述显示屏中沿第二方向平移显示所述目标音频字符时,所述目标音频字符的变化幅度包括以下一项或多项:所述目标音频字符在所述第二方向上的平移距离、所述目标音频字符的平移速率;
在所述显示屏中按照渐变方式显示所述目标音频字符时,所述目标音频字符的变化幅度包括以下一项或多项:所述目标音频字符的渐变颜色中最深颜色与最浅颜色的颜色差距、所述目标音频字符的字体的最大字体宽度与最小字体宽度的差距、所述目标音频字符的笔划的最大笔划宽度与最小笔划宽度的差距。
5.一种音频字幕的显示方法,应用于服务器,其特征在于,包括:
基于音频文件的音频字幕中每个音频字符的音调,确定每个音频字符被显示时的变化幅度,得到携带有所述音频字幕及每个音频字符被显示时的变化幅度的配置文件;
接收终端发送的请求播放所述音频文件的播放请求;
基于所述播放请求,将所述配置文件发送至所述终端,以供所述终端基于所述配置文件在显示屏中动态显示音频字符,所述配置文件还携带有所述每个音频字符的播放时间相对于所述音频字幕的起始播放时间的相对时间戳;
其中,所述终端基于所述配置文件在显示屏中动态显示音频字符包括:所述终端解析所述配置文件得到链表,所述链表包括多个节点,每个节点记载有一句或多句音频字幕、每句音频字幕的开始时间戳、结束时间戳、及所述一句或多句音频字幕中音频字符的变化幅度列表,所述变化幅度列表包括多个子节点,每个子节点记载有所述一句或多句音频字幕中一个音频字符的变化幅度;终端基于目标音频字符的播放时间相对于所述音频字幕的起始播放时间的目标相对时间戳,以及所述目标音频字符所在的语句,确定记载有所述语句的音频字幕的节点,并在所述节点记载的变化幅度列表中查找所述目标音频字符对应的子节点,将所述子节点记载的音频字符的变化幅度确定为所述目标音频字符的被显示时的变化幅度;在播放所述目标音频字符的音频的时段内,基于所述目标音频字符的变化幅度,在所述显示屏中动态显示所述目标音频字符。
6.根据权利要求5所述的方法,其特征在于,所述音频字符的变化幅度与所述音频字符的音调正相关。
7.根据权利要求5或6所述的方法,其特征在于,所述终端在所述显示屏中动态显示音频字符包括以下一种或多种方式:在所述显示屏中闪烁显示所述音频字符、在所述显示屏中沿第一方向跳跃显示所述音频字符、在所述显示屏中沿第二方向平移显示所述音频字符、在所述显示屏中按照渐变方式显示所述音频字符;
在所述显示屏中闪烁显示所述音频字符时,所述音频字符的变化幅度包括:所述音频字符的闪烁频率;
在所述显示屏中沿第一方向跳跃显示所述音频字符时,所述音频字符的变化幅度包括以下一项或多项:所述音频字符的跳跃速率、所述音频字符在所述第一方向上的跳动跨度;
在所述显示屏中沿第二方向平移显示所述音频字符时,所述音频字符的变化幅度包括以下一项或多项:所述音频字符在所述第二方向上的平移距离、所述音频字符的平移速率;
在所述显示屏中按照渐变方式显示所述音频字符时,所述音频字符的变化幅度包括以下一项或多项:所述音频字符的渐变颜色中最深颜色与最浅颜色的颜色差距、所述音频字符的字体的最大字体宽度与最小字体宽度的差距、所述音频字符的笔划的最大笔划宽度与最小笔划宽度的差距。
8.一种音频字幕的显示装置,应用于终端,其特征在于,包括:
确定模块,用于确定音频文件播放过程中显示屏待显示的目标音频字符;
获取模块,用于获取所述音频文件的配置文件,所述配置文件携带有所述音频文件的音频字幕、所述音频字幕中每个音频字符被显示时的变化幅度及每个音频字符的播放时间相对于所述音频字幕的起始播放时间的相对时间戳;解析所述配置文件得到链表,所述链表包括多个节点,每个节点记载有一句或多句音频字幕、每句音频字幕的开始时间戳、结束时间戳、及所述一句或多句音频字幕中音频字符的变化幅度列表,所述变化幅度列表包括多个子节点,每个子节点记载有所述一句或多句音频字幕中一个音频字符的变化幅度;基于所述目标音频字符的播放时间相对于所述音频字幕的起始播放时间的目标相对时间戳,以及所述目标音频字符所在的语句,确定记载有所述语句的音频字幕的节点,并在所述节点记载的变化幅度列表中查找所述目标音频字符对应的子节点,将所述子节点记载的音频字符的变化幅度确定为所述目标音频字符的被显示时的变化幅度,所述目标音频字符的变化幅度基于所述目标音频字符在所述音频文件中的音调确定;
显示模块,用于在播放所述目标音频字符的音频的时段内,基于所述目标音频字符的变化幅度,在所述显示屏中动态显示所述目标音频字符。
9.一种音频字幕的显示装置,应用于服务器,其特征在于,包括:
确定模块,用于基于音频文件的音频字幕中每个音频字符的音调,确定每个音频字符被显示时的变化幅度,得到携带有所述音频字幕及每个音频字符被显示时的变化幅度的配置文件;
接收模块,用于接收终端发送的请求播放所述音频文件的播放请求;
发送模块,用于基于所述播放请求,将所述配置文件发送至所述终端,以供所述终端基于所述配置文件在显示屏中动态显示音频字符,所述配置文件还携带有所述每个音频字符的播放时间相对于所述音频字幕的起始播放时间的相对时间戳;
其中,所述终端基于所述配置文件在显示屏中动态显示音频字符包括:所述终端解析所述配置文件得到链表,所述链表包括多个节点,每个节点记载有一句或多句音频字幕、每句音频字幕的开始时间戳、结束时间戳、及所述一句或多句音频字幕中音频字符的变化幅度列表,所述变化幅度列表包括多个子节点,每个子节点记载有所述一句或多句音频字幕中一个音频字符的变化幅度;终端基于目标音频字符的播放时间相对于所述音频字幕的起始播放时间的目标相对时间戳,以及所述目标音频字符所在的语句,确定记载有所述语句的音频字幕的节点,并在所述节点记载的变化幅度列表中查找所述目标音频字符对应的子节点,将所述子节点记载的音频字符的变化幅度确定为所述目标音频字符的被显示时的变化幅度;在播放所述目标音频字符的音频的时段内,基于所述目标音频字符的变化幅度,在所述显示屏中动态显示所述目标音频字符。
10.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令在计算机上运行时,使得所述计算机执行权利要求1至4中任一所述的音频字幕的显示方法,或者,执行权利要求5至7中任一所述的音频字幕的显示方法。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1至4中任一所述的音频字幕的显示方法,或者,执行权利要求5至7中任一所述的音频字幕的显示方法。
CN201911229075.6A 2019-12-04 2019-12-04 音频字幕的显示方法及装置、计算机设备及存储介质 Active CN110990623B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911229075.6A CN110990623B (zh) 2019-12-04 2019-12-04 音频字幕的显示方法及装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911229075.6A CN110990623B (zh) 2019-12-04 2019-12-04 音频字幕的显示方法及装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110990623A CN110990623A (zh) 2020-04-10
CN110990623B true CN110990623B (zh) 2024-03-01

Family

ID=70090121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911229075.6A Active CN110990623B (zh) 2019-12-04 2019-12-04 音频字幕的显示方法及装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110990623B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113345439B (zh) * 2021-05-28 2024-04-30 北京达佳互联信息技术有限公司 字幕生成方法、装置、电子设备和存储介质
CN114745585A (zh) * 2022-04-06 2022-07-12 Oppo广东移动通信有限公司 字幕显示方法、装置、终端和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105182A (ja) * 1996-09-27 1998-04-24 Teruyoshi Fukami カラオケ装置
CN101751914A (zh) * 2008-12-04 2010-06-23 江亮都 一种歌词显示系统与方法
CN103945140A (zh) * 2013-01-17 2014-07-23 联想(北京)有限公司 视频字幕的生成方法及系统
CN106463104A (zh) * 2014-03-17 2017-02-22 新贡公司 为用户提供关于卡拉ok歌曲表演的反馈的方法
CN109257499A (zh) * 2018-09-30 2019-01-22 腾讯音乐娱乐科技(深圳)有限公司 一种歌词的动态展示方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070166683A1 (en) * 2006-01-05 2007-07-19 Apple Computer, Inc. Dynamic lyrics display for portable media devices

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105182A (ja) * 1996-09-27 1998-04-24 Teruyoshi Fukami カラオケ装置
CN101751914A (zh) * 2008-12-04 2010-06-23 江亮都 一种歌词显示系统与方法
CN103945140A (zh) * 2013-01-17 2014-07-23 联想(北京)有限公司 视频字幕的生成方法及系统
CN106463104A (zh) * 2014-03-17 2017-02-22 新贡公司 为用户提供关于卡拉ok歌曲表演的反馈的方法
CN109257499A (zh) * 2018-09-30 2019-01-22 腾讯音乐娱乐科技(深圳)有限公司 一种歌词的动态展示方法及装置

Also Published As

Publication number Publication date
CN110990623A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN111079012B (zh) 直播间推荐方法、装置、存储介质及终端
CN108683927B (zh) 主播推荐方法、装置及存储介质
CN112118477B (zh) 虚拟礼物展示方法、装置、设备以及存储介质
CN109688461B (zh) 视频播放方法及装置
CN113127130B (zh) 页面跳转方法、装置及存储介质
CN111142838B (zh) 音频播放方法、装置、计算机设备及存储介质
CN113411680B (zh) 多媒体资源播放方法、装置、终端及存储介质
CN109922356B (zh) 视频推荐方法、装置和计算机可读存储介质
CN110248236B (zh) 视频播放方法、装置、终端及存储介质
CN109144346B (zh) 歌曲分享方法、装置及存储介质
EP3842106A1 (en) Method and device for processing control information, electronic equipment, and storage medium
CN111083526B (zh) 视频转场方法、装置、计算机设备及存储介质
WO2020249025A1 (zh) 身份信息的确定方法、装置及存储介质
CN110572716A (zh) 多媒体数据播放方法、装置及存储介质
CN110990623B (zh) 音频字幕的显示方法及装置、计算机设备及存储介质
CN111565338A (zh) 播放视频的方法、装置、系统、设备以及存储介质
CN113204672B (zh) 资源展示方法、装置、计算机设备及介质
CN113556481B (zh) 视频特效的生成方法、装置、电子设备及存储介质
CN113032590B (zh) 特效展示方法、装置、计算机设备及计算机可读存储介质
CN111312207B (zh) 文本转音频方法、装置、计算机设备及存储介质
CN110971840B (zh) 视频贴图方法及装置、计算机设备及存储介质
CN110248202B (zh) 直播间的切换方法、装置及存储介质
CN111428080B (zh) 录像文件的存储方法、搜索方法及装置
CN113709524B (zh) 选择音视频流的比特率的方法及其装置
CN113485596B (zh) 虚拟模型的处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant