CN111818367A

CN111818367A - 音频文件的播放方法、装置、终端、服务器及存储介质

Info

Publication number: CN111818367A
Application number: CN202010791447.0A
Authority: CN
Inventors: 吴晗; 欧阳小平
Original assignee: Guangzhou Kugou Computer Technology Co Ltd
Current assignee: Guangzhou Kugou Computer Technology Co Ltd
Priority date: 2020-08-07
Filing date: 2020-08-07
Publication date: 2020-10-23

Abstract

本公开提供了一种音频文件的播放方法、装置、终端、服务器及存储介质，属于互联网技术领域。所述方法包括：当检测对任一第一目标视频文件的点击操作时，播放指定音频文件，并显示第一目标视频文件的视频画面。本公开通过在指定音频文件的音频播放界面上显示至少一个第一目标视频文件，丰富了音频播放界面的显示内容。基于所显示的内容，用户可选择自己喜欢或感兴趣的视频文件进行播放，由于所播放的视频文件与音频文件的主题内容相匹配，因而能够增加用户的情景代入感，提高了用户的体验效果及满意度。另外，由于第一目标视频文件中的音频片段并不是与一个音频文件相匹配，而可以与主题内容相同的多个音频文件均能匹配，提高了音频片段的利用率。

Description

音频文件的播放方法、装置、终端、服务器及存储介质

技术领域

本公开涉及互联网技术领域，特别涉及一种音频文件的播放方法、装置、终端、服务器及存储介质。

背景技术

在现代生活中，为了缓解工作压力，很多用户会在终端中安装音频播放应用。为了吸引更多用户使用，音频播放应用提供了视频上传功能，允许用户上传所录制的视频片段，每个视频片段的长度为几十秒至几分钟不等，且每个视频片段都具有确定的主题内容，例如，舞蹈、风景、恋爱等等。

对于每个视频片段，可将其与音频播放应用中的一个音频文件进行匹配，从而在播放音频文件时，通过显示匹配的视频片段的视频画面，更好地营造音频文件所塑造的氛围。

然而，在音频播放界面上只能显示与音频文件相匹配的一个视频片段，音频播放界面显示内容比较单一。

发明内容

本公开实施例提供了一种音频文件的播放方法、装置、终端、服务器及存储介质，能够丰富音频播放界面上的显示内容。所述技术方案如下：

一方面，提供了一种音频文件的播放方法，所述方法包括：

当在指定音频文件的音频播放界面上检测到对指定选项的点击操作时，向服务器发送第一获取请求，所述第一获取请求用于所述服务器返回至少一个第一目标视频文件，所述第一目标视频文件包括至少一个视频片段，每个视频片段与所述指定音频文件的主题内容相匹配；

显示所述至少一个第一目标视频文件；

当检测对任一第一目标视频文件的点击操作时，播放所述指定音频文件，并显示所述第一目标视频文件的视频画面。

在本公开的另一个实施例中，所述显示所述至少一个第一目标视频文件，包括：

获取所述至少一个第一目标视频文件的视频封面；

显示所述至少一个第一目标视频文件的视频封面。

在本公开的另一个实施例中，所述显示所述第一目标视频文件的视频画面，包括：

在所述音频播放界面上全屏显示所述第一目标视频文件的视频画面。

在本公开的另一个实施例中，所述方法还包括：

如果在预设时长内未检测到对任一第一目标视频的点击操作，播放所述指定音频文件，并显示预设的第一目标视频文件的视频画面。

在本公开的另一个实施例中，所述方法还包括：

在所述第一目标视频文件的视频画面的显示过程中，当检测到对其他第一目标视频文件的点击操作时，重新播放所述音频文件，并显示所述其他第一目标视频文件的视频画面。

在本公开的另一个实施例中，所述显示所述第一目标视频文件的视频画面之后，还包括：

当再次检测到对所述指定选项的点击操作时，向所述服务器发送第二获取请求，所述第二获取请求用于所述服务器返回至少一个第二目标视频文件，所述第二目标视频文件与所述指定音频文件的主题内容相匹配，所述第二目标视频文件与所述第一目标视频文件包括的视频片段不同；

显示所述至少一个第二目标视频文件；

当检测对任一第二目标视频文件的点击操作时，播放所述指定音频文件，并显示所述第二目标视频文件的视频画面。

另一方面，提供了一种音频文件的播放方法，所述方法包括：

当接收到终端发送的第一获取请求时，获取指定音频文件的指定音频标签；

根据所述指定音频标签，获取主题内容与所述指定音频标签相匹配的视频标签；

获取相匹配的视频标签对应的至少一个视频片段；

根据所述至少一个视频片段，生成至少一个第一目标视频文件；

将所述至少一个第一目标视频文件发送至所述终端，所述至少一个第一目标视频文件用于所述终端进行显示。

在本公开的另一个实施例中，所述获取指定音频文件的指定音频标签，包括：

从音视频数据库中，获取所述指定音频文件的指定音频标签，所述音视频数据库包括至少一个音频文件，每个音频文件对应一个音频标签，所述音频标签用于指示音频文件的主题内容。

在本公开的另一个实施例中，所述根据所述指定音频标签，获取主题内容与所述指定音频标签相匹配的视频标签，包括：

根据所述指定音频标签，从音视频数据库中，获取主题内容与所述指定音频标签相匹配的视频标签，所述音视频数据库包括至少一个视频片段，每个视频片段对应一个视频标签，所述视频标签用于指示视频片段的主题内容。

在本公开的另一个实施例中，所述方法还包括：

对至少一个音频文件的音频内容进行识别，得到每个音频文件的音频识别标签；

获取对每个音频文件的音频识别标签的校正结果，得到每个音频文件的音频标签；

对所述至少一个视频片段的视频画面进行识别，得到每个视频片段的视频识别标签；

获取对每个视频片段的视频识别标签的校正结果，得到每个视频片段的视频标签；

根据所述至少一个音频文件及对应的音频标签、所述至少一个视频片段及对应的视频标签，构建所述音视频数据库。

在本公开的另一个实施例中，所述根据所述至少一个视频片段，生成所述至少一个第一目标视频文件，包括：

根据所述指定音频文件的音频时长，获取视频总时长与所述音频时长相同的至少一个目标视频片段；

将所述至少一个目标视频片段组合成一个第一目标视频文件。

在本公开的另一个实施例中，所述将所述至少一个目标视频文件发送至所述终端之后，还包括：

当接收到所述终端发送的第二获取请求时，生成至少一个第二目标视频文件，所述第二目标视频文件与所述指定音频文件的主题内容相匹配，所述第二目标视频文件与所述第一目标视频文件包括的视频片段不同；

将所述至少一个第二目标视频文件发送至所述终端，所述至少一个第二目标视频文件用于所述终端进行显示。

另一方面，提供了一种音频文件的播放装置，所述装置包括：

发送模块，用于当在指定音频文件的音频播放界面上检测到对指定选项的点击操作时，向服务器发送第一获取请求，所述第一获取请求用于所述服务器返回至少一个第一目标视频文件，所述第一目标视频文件包括至少一个视频片段，每个视频片段与所述指定音频文件的主题内容相匹配；

显示模块，用于显示所述至少一个第一目标视频文件；

播放模块，用于当检测对任一第一目标视频文件的点击操作时，播放所述指定音频文件；

所述显示模块，还用于显示所述第一目标视频文件的视频画面。

在本公开的另一个实施例中，所述显示模块，用于获取所述至少一个第一目标视频文件的视频封面；显示所述至少一个第一目标视频文件的视频封面。

在本公开的另一个实施例中，

所述显示模块，还用于在所述音频播放界面上全屏显示所述第一目标视频文件的视频画面。

在本公开的另一个实施例中，

所述播放模块，还用于如果在预设时长内未检测到对任一第一目标视频的点击操作，播放所述指定音频文件；

所述显示模块，还用于显示预设的第一目标视频文件的视频画面。

在本公开的另一个实施例中，

所述播放模块，还用于在所述第一目标视频文件的视频画面的显示过程中，当检测到对其他第一目标视频文件的点击操作时，重新播放所述音频文件；

所述显示模块，还用于显示所述其他第一目标视频文件的视频画面。

在本公开的另一个实施例中，

所述发送模块，还用于当再次检测到对所述指定选项的点击操作时，向所述服务器发送第二获取请求，所述第二获取请求用于所述服务器返回至少一个第二目标视频文件，所述第二目标视频文件与所述指定音频文件的主题内容相匹配，所述第二目标视频文件与所述第一目标视频文件包括的视频片段不同；

所述显示模块，还用于显示所述至少一个第二目标视频文件；

所述播放模块，还用于当检测对任一第二目标视频文件的点击操作时，播放所述指定音频文件；

所述显示模块，还用于显示所述第二目标视频文件的视频画面。

获取模块，用于当接收到终端发送的第一获取请求时，获取指定音频文件的指定音频标签；

所述获取模块，还用于根据所述指定音频标签，获取主题内容与所述指定音频标签相匹配的视频标签；

所述获取模块，还用于获取相匹配的视频标签对应的至少一个视频片段；

生成模块，用于根据所述至少一个视频片段，生成至少一个第一目标视频文件；

发送模块，用于将所述至少一个第一目标视频文件发送至所述终端，所述至少一个第一目标视频文件用于所述终端进行显示。

在本公开的另一个实施例中，所述获取模块，还用于从音视频数据库中，获取所述指定音频文件的指定音频标签，所述音视频数据库包括至少一个音频文件，每个音频文件对应一个音频标签，所述音频标签用于指示音频文件的主题内容。

在本公开的另一个实施例中，所述获取模块，还用于根据所述指定音频标签，从音视频数据库中，获取主题内容与所述指定音频标签相匹配的视频标签，所述音视频数据库包括至少一个视频片段，每个视频片段对应一个视频标签，所述视频标签用于指示视频片段的主题内容。

在本公开的另一个实施例中，所述装置还包括：

识别模块，用于对至少一个音频文件的音频内容进行识别，得到每个音频文件的音频识别标签；

所述获取模块，还用于获取对每个音频文件的音频识别标签的校正结果，得到每个音频文件的音频标签；

所述识别模块，还用于对所述至少一个视频片段的视频画面进行识别，得到每个视频片段的视频识别标签；

所述获取模块，还用于获取对每个视频片段的视频识别标签的校正结果，得到每个视频片段的视频标签；

构建模块，用于根据所述至少一个音频文件及对应的音频标签、所述至少一个视频片段及对应的视频标签，构建所述音视频数据库。

在本公开的另一个实施例中，所述生成模块，还用于根据所述指定音频文件的音频时长，获取视频总时长与所述音频时长相同的至少一个目标视频片段；将所述至少一个目标视频片段组合成一个第一目标视频文件。

在本公开的另一个实施例中，

所述生成模块，还用于当接收到所述终端发送的第二获取请求时，生成至少一个第二目标视频文件，所述第二目标视频文件与所述指定音频文件的主题内容相匹配，所述第二目标视频文件与所述第一目标视频文件包括的视频片段不同；

所述发送模块，还用于将所述至少一个第二目标视频文件发送至所述终端，所述至少一个第二目标视频文件用于所述终端进行显示。

另一方面，提供了一种终端，所述终端包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现一方面所述的音频文件的播放方法。

另一方面，提供了一种服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现一方面所述的音频文件的播放方法。

另一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现一方面所述的音频文件的播放方法。

本公开实施例提供的技术方案带来的有益效果是：

通过在指定音频文件的音频播放界面上显示至少一个第一目标视频文件，丰富了音频播放界面的显示内容。基于所显示的内容，用户可选择自己喜欢或感兴趣的视频文件进行播放，由于所播放的视频文件与音频文件的主题内容相匹配，因而能够增加用户的情景代入感，提高了用户的体验效果及满意度。另外，由于第一目标视频文件中的音频片段并不是与一个音频文件相匹配，而可以与主题内容相同的多个音频文件均能匹配，提高了音频片段的利用率。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本公开实施例提供的一种音频文件的播放方法所涉及的实施环境；

图2是本公开实施例提供的一种音频文件的播放方法流程图；

图3是本公开实施例提供的另一种音频文件的播放方法流程图；

图4是本公开实施例提供的另一种音频文件的播放方法流程图；

图5是本公开实施例提供的一种音频播放界面的示意图；

图6是本公开实施例提供的一种音频文件播放的装置结构示意图；

图7是本公开实施例提供的另一种音频文件播放的装置的结构示意图；

图8示出了本公开一个示例性实施例提供的终端的结构框图；

图9是根据一示例性实施例示出的一种用于音频文件的播放的服务器。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开实施方式作进一步地详细描述。

可以理解，本公开实施例所使用的术语“每个”、“多个”及“任一”等，多个包括两个或两个以上，每个是指对应的多个中的每一个，任一是指对应的多个中的任意一个。举例来说，多个词语包括10个词语，而每个词语是指这10个词语中的每一个词语，任一词语是指10个词语中的任意一个词语。

请参考图1，示出了本公开实施例提供的音频文件的播放方法所涉及的实施环境，参见图1，该实施环境包括：终端101和服务器102。

其中，终端101中安装有音频播放应用，基于所安装的音频播放应用，能够播放音频文件，并显示与音频文件匹配的视频文件的视频画面，从而为用户提供音视频播放服务。终端101可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，本公开实施例对终端的类型不作具体的限定。

服务器102为音频播放应用的后台服务器，该服务器102可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统。服务器102维护一个音视频数据库，该音视频数据库中存储至少一个音频文件，每个音频文件对应至少一个音频标签，该音视频数据库中还存储至少一个视频片段，每个视频片段对应至少一个视频标签，基于每个音频文件的音频标签和每个视频文件的视频标签，能够建立音频文件与视频片段之间的映射关系。服务器102具有较强的计算能力，能够为音频文件生成匹配的视频文件，并将所生成的视频文件发送至终端101，由终端101进行播放及显示。

上述终端101以及服务器102可以通过有线或无线通信方式进行直接或间接地连接，本公开实施例在此不做限制。

基于图1所示的实施环境，本公开实施例提供了一种音频文件的播放方法，参见图2，本公开实施例提供的方法流程包括：

201、当在指定音频文件的音频播放界面上检测到对指定选项的点击操作时，向服务器发送第一获取请求。

其中，第一获取请求用于服务器返回至少一个第一目标视频文件，第一目标视频文件包括至少一个视频片段，每个视频片段与指定音频文件的主题内容相匹配。

202、显示至少一个第一目标视频文件。

203、当检测对任一第一目标视频文件的点击操作时，播放指定音频文件，并显示第一目标视频文件的视频画面。

本公开实施例提供的方法，通过在指定音频文件的音频播放界面上显示至少一个第一目标视频文件，丰富了音频播放界面的显示内容。基于所显示的内容，用户可选择自己喜欢或感兴趣的视频文件进行播放，由于所播放的视频文件与音频文件的主题内容相匹配，因而能够增加用户的情景代入感，提高了用户的体验效果及满意度。另外，由于第一目标视频文件中的音频片段并不是与一个音频文件相匹配，而可以与主题内容相同的多个音频文件均能匹配，提高了音频片段的利用率。

在本公开的另一个实施例中，显示至少一个第一目标视频文件，包括：

获取至少一个第一目标视频文件的视频封面；

显示至少一个第一目标视频文件的视频封面。

在本公开的另一个实施例中，显示第一目标视频文件的视频画面，包括：

在音频播放界面上全屏显示第一目标视频文件的视频画面。

在本公开的另一个实施例中，方法还包括：

如果在预设时长内未检测到对任一第一目标视频的点击操作，播放指定音频文件，并显示预设的第一目标视频文件的视频画面。

在本公开的另一个实施例中，该方法还包括：

在第一目标视频文件的视频画面的显示过程中，当检测到对其他第一目标视频文件的点击操作时，重新播放音频文件，并显示其他第一目标视频文件的视频画面。

在本公开的另一个实施例中，显示第一目标视频文件的视频画面之后，还包括：

当再次检测到对指定选项的点击操作时，向服务器发送第二获取请求，第二获取请求用于服务器返回至少一个第二目标视频文件，第二目标视频文件与指定音频文件的主题内容相匹配，第二目标视频文件与第一目标视频文件包括的视频片段不同；

显示至少一个第二目标视频文件；

当检测对任一第二目标视频文件的点击操作时，播放指定音频文件，并显示第二目标视频文件的视频画面。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

基于图1所示的实施环境，本公开实施例提供了一种音频文件的播放方法，参见图3，本公开实施例提供的方法流程包括：

301、当接收到终端发送的第一获取请求时，获取指定音频文件的指定音频标签。

302、根据指定音频标签，获取主题内容与指定音频标签相匹配的视频标签。

303、获取相匹配的视频标签对应的至少一个视频片段。

304、根据至少一个视频片段，生成至少一个第一目标视频文件。

305、将至少一个第一目标视频文件发送至终端。

其中，至少一个第一目标视频文件用于终端进行显示。

本公开实施例提供的方法，为指定音频文件生成至少一个第一目标视频文件，使得终端能够显示至少一个第一目标视频文件，丰富了音频播放界面所显示的内容。基于所显示的内容，用户可选择自己喜欢或感兴趣的视频文件进行播放，由于所播放的视频文件与音频文件的主题内容相匹配，因而能够增加用户的情景代入感，提高了用户的体验效果及满意度。另外，由于第一目标视频文件中的音频片段并不是与一个音频文件相匹配，而可以与主题内容相同的多个音频文件均能匹配，提高了音频片段的利用率。

在本公开的另一个实施例中，获取指定音频文件的指定音频标签，包括：

从音视频数据库中，获取指定音频文件的指定音频标签，音视频数据库包括至少一个音频文件，每个音频文件对应一个音频标签，音频标签用于指示音频文件的主题内容。

在本公开的另一个实施例中，根据指定音频标签，获取主题内容与指定音频标签相匹配的视频标签，包括：

根据指定音频标签，从音视频数据库中，获取主题内容与指定音频标签相匹配的视频标签，音视频数据库包括至少一个视频片段，每个视频片段对应一个视频标签，视频标签用于指示视频片段的主题内容。

在本公开的另一个实施例中，该方法还包括：

对至少一个视频片段的视频画面进行识别，得到每个视频片段的视频识别标签；

根据至少一个音频文件及对应的音频标签、至少一个视频片段及对应的视频标签，构建音视频数据库。

在本公开的另一个实施例中，根据至少一个视频片段，生成至少一个第一目标视频文件，包括：

根据指定音频文件的音频时长，获取视频总时长与音频时长相同的至少一个目标视频片段；

将至少一个目标视频片段组合成一个第一目标视频文件。

在本公开的另一个实施例中，将至少一个目标视频文件发送至终端之后，还包括：

当接收到终端发送的第二获取请求时，生成至少一个第二目标视频文件，第二目标视频文件与指定音频文件的主题内容相匹配，第二目标视频文件与第一目标视频文件包括的视频片段不同；

将至少一个第二目标视频文件发送至终端，至少一个第二目标视频文件用于终端进行显示。

基于图1所示的实施环境，本公开实施例提供了一种音频文件的播放方法，以终端101和服务器102执行本公开实施例为例，参见图4，本公开实施例提供的方法流程包括：

401、当在指定音频文件的音频播放界面上检测到对指定选项的点击操作时，终端向服务器发送第一获取请求。

其中，指定音频文件为当前待播放的音频文件。该指定音频文件的获取方式至少包括以下几种：可通过用户在音频播放界面的搜索框中输入指定音频文件的歌曲名称获取，也可以在本地音频播放列表中获取，还可以在音频推荐界面上获取等等。

其中，音频播放界面为对指定音频文件进行播放的界面，该音频播放界面上显示着指定选项，该指定选项用于触发终端生成第一获取请求，该指定选项可以为竖屏MV选项等，该第一获取请求用于服务器返回至少一个第一目标视频文件，该第一目标视频文件包括至少一个视频片段，每个视频片段与指定音频文件的主题内容相匹配。

当检测到对音频播放界面上指定选项的点击操作时，终端生成第一获取请求，并将第一获取请求发送至服务器，使得服务器能够基于第一获取请求生成至少一个第一目标视频文件，并将所生成的至少一个第一目标视频文件发送至终端，由终端进行显示，以丰富音频播放界面的显示内容。其中，第一获取请求包括指定音频文件的音频标识、登录音频播放应用的用户账号等等，该指定音频文件的音频标识可以为指定音频文件的歌曲名称等。

402、当接收到终端发送的第一获取请求时，服务器获取指定音频文件的指定音频标签。

其中，指定音频标签用于指示指定音频文件的主题内容。服务器在获取指定音频文件的指定音频标签时，可根据指定音频文件的音频标识，从音视频数据库中，获取指定音频文件的指定音频标签。其中，音视频数据库包括至少一个音频文件，每个音频文件对应一个音频标签，音频标签用于指示音频文件的主题内容，该音频标签可以为失恋、抒情伤怀、极限运动等。

403、服务器根据指定音频标签，获取主题内容与指定音频标签相匹配的视频标签。

服务器根据指定音频标签，获取主题内容与指定音频标签相匹配的视频标签时，可根据指定音频标签，从音视频数据库中，获取主题内容与指定音频标签相匹配的视频标签。其中，音视频数据库包括至少一个视频片段，每个视频片段对应一个视频标签，视频标签用于指示视频片段的主题内容，该视频标签可以为二次元、旅游、女神等。

指定音频标签与视频标签的主题内容相匹配可以是指定音频标签与视频标签之间的文本相似度满足阈值条件，也可以为指定音频标签与视频标签之间的语义相似度满足阈值条件，该阈值条件可以为文本相似度或语义相似度大于指定阈值，该指定阈值可以为0.8、0.9等等。例如，如果指定音频标签为“失恋”，视频标签为“伤心分手”，则指定音频标签“失恋”与视频标签“伤心分手”的主题内容相匹配；如果指定音频标签为“DJ”，视频标签为“单人热舞”，则指定音频标签“DJ”与视频标签“单人热舞”的主题内容相匹配。

另外，由于本公开实施例中每个音频文件对应至少一个音频标签，每个视频文件也对应至少一个视频标签，因而当音频文件对应的任一个音频标签与视频文件对应的任一个视频标签的主题内容相匹配，则确定该音频文件与该视频文件的主题内容相匹配。

上述步骤402和步骤403中的音视频数据库在构建时，可采用如下方法：

4031、服务器对至少一个音频文件的音频内容进行识别，得到每个音频文件的音频识别标签。

服务器可采用音频识别算法，对至少一个音频文件的音频内容进行识别。通过对每个音频文件的音频内容进行识别，可得到每个音频文件的音频识别标签。

4032、服务器获取对每个音频文件的音频识别标签的校正结果，得到每个音频文件的音频标签。

为了提高每个音频文件的音频标签的准确性，当采用音频识别算法对每个音频文件的音频内容进行识别后，可采用人工方式对每个音频文件的音频识别标签进行校正，得到每个音频文件的音频识别标签的校正结果，进而将每个音频文件的音频识别标签的校正结果，作为每个音频文件的音频标签。

4033、服务器对至少一个视频片段的视频画面进行识别，得到每个视频文件的视频识别标签。

服务器可采用视频画面识别算法，对至少一个视频片段的视频画面进行识别。通过对每个视频片段的视频画面进行识别，可得到每个视频片段的视频识别标签。

4034、服务器获取对每个视频片段的视频识别标签的校正结果，得到每个视频片段的视频标签。

为了提高每个视频片段的视频标签的准确性，当采用视频画面识别算法对每个视频片段的视频画面进行识别后，可采用人工方式对每个视频片段的视频识别标签进行校正，得到每个视频片段的视频识别标签的校正结果，进而将每个视频片段的视频识别标签的校正结果，作为每个视频片段的视频标签。

4035、服务器根据至少一个音频文件及对应的音频标签、至少一个视频片段及对应的视频标签，构建音视频数据库。

音视频数据库中的音频文件及对应的音频标签并不是固定的，当有新的歌曲发布时，或者新的流派音乐产生时，或者新的音频标签生成时，服务器可根据新的音频文件及新的音频标签中至少一项，对所构建的音视频数据库进行更新。同理，音视频数据库中的视频片段及对应的视频标签也并不是固定的，当新的视频片段上传时，或者新的视频标签生成时，服务器可根据新的视频片段及新的视频标签中至少一项，对所构建的音视频数据库进行更新。

在本公开的另一个实施例中，为了便于对音频文件和视频片段进行管理，服务器可以建立一个专门用于存储音频文件及音频标签的音频数据库，以及一个专门用于存储视频文件及视频标签的视频数据库，从而在接收到第一获取请求时，可从音频数据库中获取到指定音频文件的指定音频标签，并根据指定音频标签，获取主题内容与指定音频标签相匹配的视频标签。

404、服务器获取相匹配的视频标签对应的至少一个视频片段。

在本公开的一个实施例中，由于音视频数据库中存储视频片段及其对应的视频标签，因此，当服务器从音视频数据库中获取与指定音频标签相匹配的视频标签时，基于所获取到的相匹配的视频标签，服务器可从音视频数据库中，获取相匹配的视频标签对应的至少一个视频片段。

在本公开的另一个实施例中，由于音视频数据库中存储视频片段及其对应的视频标签，当服务器从音视频数据库中获取与指定音频标签相匹配的视频标签，基于所获取到的相匹配的视频标签，服务器可从音视频数据库中，获取相匹配的视频标签对应的至少一个视频片段。

405、服务器根据至少一个视频片段，生成至少一个第一目标视频文件。

服务器根据至少一个视频片段，生成至少一个第一目标视频文件时，可采用如下方法：

4051、服务器根据指定音频文件的音频时长，获取视频总时长与音频时长相同的至少一个目标视频片段。

服务器根据指定音频文件的音频时长，从相匹配的视频标签对应的至少一个视频片段中，获取视频总时长与音频时长相同的至少一个目标视频片段。如果获取到的至少一个目标视频片段的总时长超过音频时长，则将获取到的至少一个目标视频片段进行裁剪，使得裁剪后的至少一个目标视频片段的视频总时长与音频时长相同；如果相匹配的视频标签对应的至少一个视频片段的视频总时长小于音频时长，则不对至少一个视频片段进行处理，本次在播放指定音频文件时，也不会显示至少一个视频片段。

4052、服务器将至少一个目标视频片段组合成一个第一目标视频文件。

服务器可以将至少一个目标视频片段随机组合成一个第一目标视频文件，也可以按照预设顺序，将至少一个目标视频片段组合成一个第一目标视频文件，例如，按照至少一个目标视频片段的时长由长到短或由短到长的顺序，将至少一个目标视频片段组合成一个第一目标视频文件。

406、服务器将至少一个第一目标视频文件发送至终端。

基于所建立的连接，服务器可通过有线连接或无线连接将至少一个第一目标视频文件发送至终端。

407、终端显示至少一个第一目标视频文件。

当接收到服务器发送的至少一个第一目标视频文件，服务器将在音频播放界面上显示该至少一个第一目标视频文件。

在显示至少一个第一目标视频文件时，服务器可以获取至少一个第一目标视频文件的视频封面，进而显示至少一个第一目标视频文件的视频封面。服务器在获取至少一个第一目标视频文件的视频封面时，可从组合成每个第一目标视频文件的第一个目标视频片段中随机获取一帧视频画面，并将该帧视频画面作为视频封面；还可以从组合成每个第一目标视频文件的任一目标视频片段中随机获取一帧视频画面，并将该帧视频画面作为视频封面。参见图5，图5中所示的音频播放界面的右侧区域上显示三个与当前待播放的歌曲的主题内容相匹配的第一目标视频文件。

408、当检测对任一第一目标视频文件的点击操作时，终端播放指定音频文件，并显示第一目标视频文件的视频画面。

为了满足用户的个性化播放需求，本公开实施例允许用户通过点击感兴趣的第一目标视频文件，触发显示所点击的第一目标视频文件。当检测到用户对所显示的任一第一目标视频文件的点击操作时，终端播放指定音频文件，同时显示第一目标视频文件的视频画面。

终端在显示第一目标视频文件的视频画面时，可以在音频播放界面上全屏显示第一目标视频文件的视频画面，通过对第一目标视频文件的视频画面进行全屏显示，可便于用户观看第一目标视频文件的视频画面，提高了用户的视频观看体验。终端在显示第一目标视频文件的视频画面时，还可以在音频播放界面的指定区域上显示第一目标视频文件的视频画面，该指定区域为音频播放界面的部分区域，通过在指定区域上显示第一目标视频文件的视频画面，可以使得用户在观看视频画面的同时，能够在音频播放界面上除指定区域以外的其他区域上进行其他操作，例如，发表对指定音频文件、第一目标视频文件的评论、查看指定音频文件的相关详情信息等等。终端在显示第一目标视频文件的视频画面时，还可以在音频播放界面上弹出浮窗，并在浮窗上显示该第一目标视频文件的视频画面，该浮窗位于音频播放界面的之上，且该浮窗的大小及位置可由用户根据自身的观看习惯进行调整，从而满足用户在视频观看过程中的个性化需求。

在本公开的另一个实施例中，如果在预设时长内未检测到对任一第一目标视频的点击操作，为避免用户等待时间过长，降低用户的体验效果，终端将播放指定音频文件，并显示预设的第一目标视频文件的视频画面，该预设的第一目标视频文件可以为所显示的第一个目标视频文件，也可以为随机选择的一个第一目标视频文件，当然还可以为其他的第一视频文件。

在本公开的另一个实施例中，在第一目标视频文件的视频画面的显示过程中，为避免视频封面遮挡视频画面，可对所显示的视频封面进行隐藏，当光标移动到视频封面的位置，或者用户手指触控到视频封面的位置，则显示所隐藏的视频封面。

在本公开的另一个实施例中，考虑到用户对音频播放界面上所显示的至少一个第一目标视频文件缺乏了解，当基于用户的点击操作，终端显示第一目标视频文件的视频画面之后，如果用户想要查看其他第一目标视频文件，则用户可点击其他第一目标视频文件，当检测到对其他第一目标视频文件的点击操作时，终端将重新开始播放该指定音频文件，并显示其他第一目标视频文件的视频画面。

在本公开的另一个实施例中，指定音频文件播放之后，当再次检测到对指定选项的点击操作时，终端将向服务器发送第二获取请求，当接收到终端发送的第二获取请求时，生成至少一个第二目标视频文件，该第二目标视频文件与指定音频文件的主题内容相匹配，但第二目标视频文件与第一目标视频文件包括的视频片段不同。对于至少一个第二目标视频文件的生成方式与至少一个第一目标视频文件的生成方式相同，此处不再赘述。之后，服务器将至少一个第二目标视频文件发送至终端，当接收到至少一个第二目标视频文件之后，终端显示至少一个第二目标视频文件。当检测对任一第二目标视频文件的点击操作时，播放指定音频文件，并显示第二目标视频文件的视频画面。

参见图6，本公开实施例提供了一种音频文件的播放装置，该装置包括：

发送模块601，用于当在指定音频文件的音频播放界面上检测到对指定选项的点击操作时，向服务器发送第一获取请求，第一获取请求用于服务器返回至少一个第一目标视频文件，第一目标视频文件包括至少一个视频片段，每个视频片段与指定音频文件的主题内容相匹配；

显示模块602，用于显示至少一个第一目标视频文件；

播放模块603，用于当检测对任一第一目标视频文件的点击操作时，播放指定音频文件；

显示模块602，还用于显示第一目标视频文件的视频画面。

在本公开的另一个实施例中，显示模块602，用于获取至少一个第一目标视频文件的视频封面；显示至少一个第一目标视频文件的视频封面。

在本公开的另一个实施例中，

显示模块602，还用于在音频播放界面上全屏显示第一目标视频文件的视频画面。

在本公开的另一个实施例中，

播放模块603，还用于如果在预设时长内未检测到对任一第一目标视频的点击操作，播放指定音频文件；

显示模块602，还用于显示预设的第一目标视频文件的视频画面。

在本公开的另一个实施例中，

播放模块603，还用于在第一目标视频文件的视频画面的显示过程中，当检测到对其他第一目标视频文件的点击操作时，重新播放音频文件；

显示模块602，还用于显示其他第一目标视频文件的视频画面。

在本公开的另一个实施例中，

发送模块601，还用于当再次检测到对指定选项的点击操作时，向服务器发送第二获取请求，第二获取请求用于服务器返回至少一个第二目标视频文件，第二目标视频文件与指定音频文件的主题内容相匹配，第二目标视频文件与第一目标视频文件包括的视频片段不同；

显示模块602，还用于显示至少一个第二目标视频文件；

播放模块603，还用于当检测对任一第二目标视频文件的点击操作时，播放指定音频文件；

显示模块602，还用于显示第二目标视频文件的视频画面。

本公开实施例提供的装置，通过在指定音频文件的音频播放界面上显示至少一个第一目标视频文件，丰富了音频播放界面的显示内容。基于所显示的内容，用户可选择自己喜欢或感兴趣的视频文件进行播放，由于所播放的视频文件与音频文件的主题内容相匹配，因而能够增加用户的情景代入感，提高了用户的体验效果及满意度。另外，由于第一目标视频文件中的音频片段并不是与一个音频文件相匹配，而可以与主题内容相同的多个音频文件均能匹配，提高了音频片段的利用率。

参见图7，本公开实施例提供了一种音频文件的播放装置，该装置包括：

获取模块701，用于当接收到终端发送的第一获取请求时，获取指定音频文件的指定音频标签；

获取模块701，还用于根据指定音频标签，获取主题内容与指定音频标签相匹配的视频标签；

获取模块701，还用于获取相匹配的视频标签对应的至少一个视频片段；

生成模块702，用于根据至少一个视频片段，生成至少一个第一目标视频文件；

发送模块703，用于将至少一个第一目标视频文件发送至终端，至少一个第一目标视频文件用于终端进行显示。

在本公开的另一个实施例中，获取模块701，还用于从音视频数据库中，获取指定音频文件的指定音频标签，音视频数据库包括至少一个音频文件，每个音频文件对应一个音频标签，音频标签用于指示音频文件的主题内容。

在本公开的另一个实施例中，获取模块701，还用于根据指定音频标签，从音视频数据库中，获取主题内容与指定音频标签相匹配的视频标签，音视频数据库包括至少一个视频片段，每个视频片段对应一个视频标签，视频标签用于指示视频片段的主题内容。

在本公开的另一个实施例中，该装置还包括：

获取模块，还用于获取对每个音频文件的音频识别标签的校正结果，得到每个音频文件的音频标签；

识别模块，还用于对至少一个视频文件的视频画面进行识别，得到每个视频文件的视频识别标签；

获取模块，还用于获取对每个视频文件的视频识别标签的校正结果，得到每个视频文件的视频标签；

构建模块，用于根据至少一个音频文件及对应的音频标签、至少一个视频文件及对应的视频标签，构建音视频数据库。

在本公开的另一个实施例中，生成模块702，还用于根据指定音频文件的音频时长，获取视频总时长与音频时长相同的至少一个目标视频片段；将至少一个目标视频片段组合成一个第一目标视频文件。

在本公开的另一个实施例中，

生成模块702，还用于当接收到终端发送的第二获取请求时，生成至少一个第二目标视频文件，第二目标视频文件与指定音频文件的主题内容相匹配，第二目标视频文件与第一目标视频文件包括的视频片段不同；

发送模块703，还用于将至少一个第二目标视频文件发送至终端，至少一个第二目标视频文件用于终端进行显示。

综上，本公开实施例提供的装置，为指定音频文件生成至少一个第一目标视频文件，使得终端能够显示至少一个第一目标视频文件，丰富了音频播放界面所显示的内容。基于所显示的内容，用户可选择自己喜欢或感兴趣的视频文件进行播放，由于所播放的视频文件与音频文件的主题内容相匹配，因而能够增加用户的情景代入感，提高了用户的体验效果及满意度。另外，由于第一目标视频文件中的音频片段并不是与一个音频文件相匹配，而可以与主题内容相同的多个音频文件均能匹配，提高了音频片段的利用率。

图8示出了本公开一个示例性实施例提供的终端800的结构框图。该终端800可以是：智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio LayerIV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端800包括有：处理器801和存储器802。

处理器801可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器801可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器801还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器802可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器801所执行以实现本申请中方法实施例提供的音频文件的播放方法。

在一些实施例中，终端800还可选包括有：外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地，外围设备包括：射频电路804、显示屏805、摄像头组件806、音频电路807、定位组件808和电源809中的至少一种。

外围设备接口803可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中，处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上；在一些其他实施例中，处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路804用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路804包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路804还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏805用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时，显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时，显示屏805还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏805可以为一个，设置终端800的前面板；在另一些实施例中，显示屏805可以为至少两个，分别设置在终端800的不同表面或呈折叠设计；在再一些实施例中，显示屏805可以是柔性显示屏，设置在终端800的弯曲表面上或折叠面上。甚至，显示屏805还可以设置成非矩形的不规则图形，也即异形屏。显示屏805可以采用LCD(LiquidCrystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件806用于采集图像或视频。可选地，摄像头组件806包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器801进行处理，或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路807还可以包括耳机插孔。

定位组件808用于定位终端800的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件808可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。

电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于：加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。

加速度传感器811可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号，控制显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器812可以检测终端800的机体方向及转动角度，陀螺仪传感器812可以与加速度传感器811协同采集用户对终端800的3D动作。处理器801根据陀螺仪传感器812采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器813可以设置在终端800的侧边框和/或显示屏805的下层。当压力传感器813设置在终端800的侧边框时，可以检测用户对终端800的握持信号，由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在显示屏805的下层时，由处理器801根据用户对显示屏805的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器814用于采集用户的指纹，由处理器801根据指纹传感器814采集到的指纹识别用户的身份，或者，由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器801授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置终端800的正面、背面或侧面。当终端800上设置有物理按键或厂商Logo时，指纹传感器814可以与物理按键或厂商Logo集成在一起。

光学传感器815用于采集环境光强度。在一个实施例中，处理器801可以根据光学传感器815采集的环境光强度，控制显示屏805的显示亮度。具体地，当环境光强度较高时，调高显示屏805的显示亮度；当环境光强度较低时，调低显示屏805的显示亮度。在另一个实施例中，处理器801还可以根据光学传感器815采集的环境光强度，动态调整摄像头组件806的拍摄参数。

接近传感器816，也称距离传感器，通常设置在终端800的前面板。接近传感器816用于采集用户与终端800的正面之间的距离。在一个实施例中，当接近传感器816检测到用户与终端800的正面之间的距离逐渐变小时，由处理器801控制显示屏805从亮屏状态切换为息屏状态；当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时，由处理器801控制显示屏805从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图8中示出的结构并不构成对终端800的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

本公开实施例提供的终端，通过在指定音频文件的音频播放界面上显示至少一个第一目标视频文件，丰富了音频播放界面的显示内容。基于所显示的内容，用户可选择自己喜欢或感兴趣的视频文件进行播放，由于所播放的视频文件与音频文件的主题内容相匹配，因而能够增加用户的情景代入感，提高了用户的体验效果及满意度。另外，由于第一目标视频文件中的音频片段并不是与一个音频文件相匹配，而可以与主题内容相同的多个音频文件均能匹配，提高了音频片段的利用率。

图9是根据一示例性实施例示出的一种用于音频文件的播放的服务器。参照图9，服务器900包括处理组件922，其进一步包括一个或多个处理器，以及由存储器932所代表的存储器资源，用于存储可由处理组件922的执行的指令，例如应用程序。存储器932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件922被配置为执行指令，以执行上述音频文件的播放中服务器所执行的功能。

服务器900还可以包括一个电源组件926被配置为执行服务器900的电源管理，一个有线或无线网络接口950被配置为将服务器900连接到网络，和一个输入输出(I/O)接口958。服务器900可以操作基于存储在存储器932的操作系统，例如Windows Server^TM，Mac OSX^TM，Unix^TM,Linux^TM，FreeBSD^TM或类似。

本公开实施例提供的服务器，为指定音频文件生成至少一个第一目标视频文件，使得终端能够显示至少一个第一目标视频文件，丰富了音频播放界面所显示的内容。基于所显示的内容，用户可选择自己喜欢或感兴趣的视频文件进行播放，由于所播放的视频文件与音频文件的主题内容相匹配，因而能够增加用户的情景代入感，提高了用户的体验效果及满意度。另外，由于第一目标视频文件中的音频片段并不是与一个音频文件相匹配，而可以与主题内容相同的多个音频文件均能匹配，提高了音频片段的利用率。

本公开实施例提供了一种计算机可读存储介质，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现图2或图3或图4所示的音频文件的播放方法。该计算机可读存储介质可以是非暂态的。例如，该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本公开实施例提供的计算机可读存储介质，通过在指定音频文件的音频播放界面上显示至少一个第一目标视频文件，丰富了音频播放界面的显示内容。基于所显示的内容，用户可选择自己喜欢或感兴趣的视频文件进行播放，由于所播放的视频文件与音频文件的主题内容相匹配，因而能够增加用户的情景代入感，提高了用户的体验效果及满意度。另外，由于第一目标视频文件中的音频片段并不是与一个音频文件相匹配，而可以与主题内容相同的多个音频文件均能匹配，提高了音频片段的利用率。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本公开的可选实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种音频文件的播放方法，其特征在于，所述方法包括：

显示所述至少一个第一目标视频文件；

2.根据权利要求1所述的方法，其特征在于，所述显示所述至少一个第一目标视频文件，包括：

获取所述至少一个第一目标视频文件的视频封面；

显示所述至少一个第一目标视频文件的视频封面。

3.根据权利要求1所述的方法，其特征在于，所述显示所述第一目标视频文件的视频画面，包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述第一目标视频文件的视频画面的显示过程中，当检测到对其他第一目标视频文件的点击操作时，重新播放所述指定音频文件，并显示所述其他第一目标视频文件的视频画面。

6.根据权利要求1至5中任一项所述的方法，其特征在于，所述显示所述第一目标视频文件的视频画面之后，还包括：

显示所述至少一个第二目标视频文件；

7.一种音频文件的播放方法，其特征在于，所述方法包括：

获取相匹配的视频标签对应的至少一个视频片段；

8.根据权利要求7所述的方法，其特征在于，所述获取指定音频文件的指定音频标签，包括：

9.根据权利要求7所述的方法，其特征在于，所述根据所述指定音频标签，获取主题内容与所述指定音频标签相匹配的视频标签，包括：

10.根据权利要求8或9所述的方法，其特征在于，所述方法还包括：

对所述至少一个视频文件的视频画面进行识别，得到每个视频文件的视频识别标签；

11.根据权利要求7至9中任一项所述的方法，其特征在于，所述根据所述至少一个视频片段，生成所述至少一个第一目标视频文件，包括：

12.根据权利要求7至9中任一项所述的方法，其特征在于，所述将所述至少一个目标视频文件发送至所述终端之后，还包括：

13.一种音频文件的播放装置，其特征在于，所述装置包括：

显示模块，用于显示所述至少一个第一目标视频文件；

14.一种音频文件的播放装置，其特征在于，所述装置包括：

15.一种终端，其特征在于，所述终端包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如权利要求1至6中任一项所述的音频文件的播放方法。

16.一种服务器，其特征在于，所述服务器包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如权利要求7至12中任一项所述的音频文件的播放方法。

17.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如权利要求1至6中任一项所述的音频文件的播放方法。

18.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如权利要求7至12中任一项所述的音频文件的播放方法。