CN111639199A

CN111639199A - 多媒体文件推荐方法、装置、服务器及存储介质

Info

Publication number: CN111639199A
Application number: CN202010500729.0A
Authority: CN
Inventors: 游程; 周思丞; 陈孝良; 苏少炜; 常乐
Original assignee: Beijing SoundAI Technology Co Ltd
Current assignee: Beijing SoundAI Technology Co Ltd
Priority date: 2020-06-04
Filing date: 2020-06-04
Publication date: 2020-09-08

Abstract

本公开提供了一种多媒体文件推荐方法、装置、服务器及存储介质，属于互联网技术领域。方法包括：接收第一终端的推荐请求，推荐请求携带第一终端的第一终端标识；根据第一终端标识，获取第一终端历史对第一多媒体文件的第一行为；获取第一终端历史对第一多媒体文件的第一播放时长，以及获取第一多媒体文件的第一文件时长，根据第一播放时长和第一文件时长，确定第一多媒体文件的偏好权重；根据第一多媒体文件的偏好权重和第一行为对应的分数，确定第一多媒体文件的偏好得分；根据第一多媒体文件的偏好得分，获取待推荐的第二多媒体文件，向第一终端发送第二多媒体文件。上述方法可以提高多媒体文件的推荐准确率。

Description

多媒体文件推荐方法、装置、服务器及存储介质

技术领域

本公开涉及互联网技术领域，特别涉及一种多媒体文件推荐方法、装置、服务器及存储介质。

背景技术

随着互联网技术的发展，信息数量快速增长，在信息过载的情况下，用户很难快速找到用户感兴趣的信息；为了提高用户的体验，服务器可以主动为用户推荐用户可能感兴趣的信息。例如，音频播放应用对应的服务器可以为用户推荐歌曲；再如，短视频应用对应的服务器可以为用户推荐短视频。

以音频播放应用对应的服务器为用户推荐歌曲为例；相关技术中，服务器在为用户推荐歌曲时，获取用户在使用音频播放应用时产生的历史行为数据，该历史行为数据包括用户对歌曲的行为；例如，切歌、收藏等。服务器根据该用户对歌曲的行为，对该歌曲进行评分，根据该歌曲的分数，挖掘用户的兴趣特征，根据该兴趣特征为用户推荐歌曲。

这种做法存在的问题是，根据用户的历史行为数据推荐歌曲不够准确。例如，当用户不喜欢某一首歌曲，用户可能在该歌曲播放的过程中进行切歌；当用户喜欢该首歌曲，用户也可能在该歌曲快要播放结束的时候切歌。因此，用户对歌曲的行为并不能完全体现出用户对该歌曲的喜好，从而导致服务器根据用户的历史行为数据为用户推荐歌曲的准确率低。

发明内容

本公开实施例提供了一种多媒体文件推荐方法、装置、服务器及存储介质，能够提高多媒体文件的推荐准确率。所述技术方案如下：

第一方面，提供了多媒体文件推荐方法，所述方法包括：

接收第一终端的推荐请求，所述推荐请求携带所述第一终端的第一终端标识；

根据所述第一终端标识，获取所述第一终端历史对第一多媒体文件的第一行为；

获取所述第一终端历史对所述第一多媒体文件的第一播放时长，以及获取所述第一多媒体文件的第一文件时长，根据所述第一播放时长和所述第一文件时长，确定所述第一多媒体文件的偏好权重；

根据所述第一多媒体文件的偏好权重和所述第一行为对应的分数，确定所述第一多媒体文件的偏好得分；

根据所述第一多媒体文件的偏好得分，获取待推荐的第二多媒体文件，向所述第一终端发送所述第二多媒体文件。

在一种可能的实现方式中，所述根据所述第一终端标识，获取所述第一终端历史对第一多媒体文件的第一行为，包括：

响应于根据所述第一终端标识从历史行为数据库中获取不到所述第一行为，根据所述第一终端标识，获取所述第一终端的身份信息，所述历史行为数据库用于存储终端对多媒体文件的历史行为；

根据所述身份信息，从至少两个分类簇中，确定所述第一终端对应的目标分类簇，每个所述分类簇为根据多个终端的身份信息划分的；

获取所述目标分类簇中第二终端历史对所述第一多媒体文件的第二行为；

将所述第二行为作为所述第一行为。

在另一种可能的实现方式中，所述根据所述第一终端标识，获取所述第一终端历史对第一多媒体文件的第一行为，包括：

根据所述第一终端标识，从历史行为数据库中获取所述第一终端历史对所述第一多媒体文件的第一行为，所述历史行为数据库用于存储终端对多媒体文件的历史行为。

在另一种可能的实现方式中，所述根据所述第一多媒体文件的偏好得分，获取待推荐的第二多媒体文件，包括：

将所述偏好得分和所述第一多媒体文件输入到多媒体推荐模型，根据所述多媒体推荐模型的输出，确定所述第二多媒体文件。

在另一种可能的实现方式中，所述多媒体推荐模型的训练方法包括：

获取训练样本，所述训练样本包括第三终端对第三多媒体文件的第三行为以及所述第三多媒体文件的第二播放时长和第二文件时长；

根据所述第三多媒体文件的第二播放时长和第二文件时长，确定所述第三多媒体文件的偏好权重；

根据所述第三多媒体文件的偏好权重和所述第三行为对应的分数，确定所述第三多媒体文件的偏好得分；

根据所述第三多媒体文件的偏好得分，确定所述第三多媒体文件的标签；

通过所述第三多媒体文件和所述第三多媒体文件的标签，进行模型训练，得到所述多媒体推荐模型。

在另一种可能的实现方式中，所述根据所述第三多媒体文件的偏好得分，确定所述第三多媒体文件的标签，包括：

对所述偏好得分做归一化处理，得到所述第三多媒体文件的标签。

在另一种可能的实现方式中，所述根据所述第一多媒体文件的偏好权重和所述第一行为对应的分数，确定所述第一多媒体文件的偏好得分，包括：

根据所述第一多媒体文件的偏好权重，对所述第一行为对应的分数进行加权，得到所述第一多媒体文件的偏好得分。

在另一种可能的实现方式中，所述获取所述第一终端历史对所述第一多媒体文件的第一播放时长，包括：

获取所述第一终端在第一目标时间段内，对所述第一多媒体文件播放的累计播放时长，将所述累计播放时长作为所述第一播放时长；或者，

获取所述第一终端在第二目标时间段内，最后一次对所述第一多媒体文件连续播放的第一总时长，将所述第一总时长作为所述第一播放时长；或者，

获取所述第一终端在第三目标时间段内，每次对所述第一多媒体文件连续播放的第二总时长，从所述第二总时长中选择最长的第二总时长作为所述第一播放时长。

第二方面，提供了一种多媒体推荐装置，所述装置包括：

推荐请求接收模块，被配置为接收第一终端的推荐请求，所述推荐请求携带所述第一终端的第一终端标识；

第一行为获取模块，被配置为根据所述第一终端标识，获取所述第一终端历史对第一多媒体文件的第一行为；

第一偏好权重确定模块，被配置为获取所述第一终端历史对所述第一多媒体文件的第一播放时长，以及获取所述第一多媒体文件的第一文件时长，根据所述第一播放时长和所述第一文件时长，确定所述第一多媒体文件的偏好权重；

第一偏好得分确定模块，被配置为根据所述第一多媒体文件的偏好权重和所述第一行为对应的分数，确定所述第一多媒体文件的偏好得分；

多媒体推荐模块，被配置为根据所述第一多媒体文件的偏好得分，获取待推荐的第二多媒体文件，向所述第一终端发送所述第二多媒体文件。

在一种可能的实现方式中，所述第一行为获取模块，还被配置为响应于根据所述第一终端标识从历史行为数据库中获取不到所述第一行为，根据所述第一终端标识，获取所述第一终端的身份信息，所述历史行为数据库用于存储终端对多媒体文件的历史行为；根据所述身份信息，从至少两个分类簇中，确定所述第一终端对应的目标分类簇，每个所述分类簇为根据多个终端的身份信息划分的；获取所述目标分类簇中第二终端历史对所述第一多媒体文件的第二行为；将所述第二行为作为所述第一行为。

在另一种可能的实现方式中，所述第一行为获取模块，还被配置为根据所述第一终端标识，从历史行为数据库中获取所述第一终端历史对所述第一多媒体文件的第一行为，所述历史行为数据库用于存储终端对多媒体文件的历史行为。

在另一种可能的实现方式中，所述多媒体推荐模块，还被配置为将所述偏好得分和所述第一多媒体文件输入到多媒体推荐模型，根据所述多媒体推荐模型的输出，确定所述第二多媒体文件。

在另一种可能的实现方式中，所述多媒体推荐模型的训练装置包括：

样本获取模块，被配置为获取训练样本，所述训练样本包括第三终端对第三多媒体文件的第三行为以及所述第三多媒体文件的第二播放时长和第二文件时长；

第二偏好权重确定模块，被配置为根据所述第三多媒体文件的第二播放时长和第二文件时长，确定所述第三多媒体文件的偏好权重；

第二偏好得分确定模块，被配置为根据所述第三多媒体文件的偏好权重和所述第三行为对应的分数，确定所述第三多媒体文件的偏好得分；

标签确定模块，被配置为根据所述第三多媒体文件的偏好得分，确定所述第三多媒体文件的标签；

模型训练模块，被配置为通过所述第三多媒体文件和所述第三多媒体文件的标签，进行模型训练，得到所述多媒体推荐模型。

在另一种可能的实现方式中，所述标签确定模块，被配置为对所述偏好得分做归一化处理，得到所述第三多媒体文件的标签。

在另一种可能的实现方式中，第一偏好得分确定模块，还被配置为根据所述第一多媒体文件的偏好权重，对所述第一行为对应的分数进行加权，得到所述第一多媒体文件的偏好得分。

在另一种可能的实现方式中，所述第一偏好权重确定模块，被配置为获取所述第一终端在第一目标时间段内，对所述第一多媒体文件播放的累计播放时长，将所述累计播放时长作为所述第一播放时长；或者，获取所述第一终端在第二目标时间段内，最后一次对所述第一多媒体文件连续播放的第一总时长，将所述第一总时长作为所述第一播放时长；或者，获取所述第一终端在第三目标时间段内，每次对所述第一多媒体文件连续播放的第二总时长，从所述第二总时长中选择最长的第二总时长作为所述第一播放时长。

第三方面，提供了一种服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现上述任一种可能实现方式中的多媒体文件推荐方法中所执行的操作。

第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现上述任一种可能实现方式中的多媒体文件推荐方法中服务器执行的操作。

本公开实施例提供的技术方案带来的有益效果是：

在本公开实施例中，在接收到第一终端的推荐请求后，根据推荐请求携带的第一终端标识，获取第一终端历史对第一多媒体文件的第一播放时长，以及获取第一多媒体文件的第一文件时长，根据第一播放时长和第一文件时长，确定第一多媒体文件的偏好权重，由于播放时长可以很好的体现用户对多媒体文件的喜爱程度，通过结合对多媒体文件的播放时长确定多媒体文件的偏好权重，该偏好权重可以客观并且准确的提现用户对多媒体文件的喜爱程度，并且，由于对多媒体文件的不同行为也可以提现用户对多媒体文件的喜爱程度，通过获取第一终端历史对第一多媒体文件的第一行为，根据第一多媒体文件的偏好权重和第一行为对应的分数，确定第一多媒体文件的偏好得分，得到的偏好得分可以更加客观的体现用户对多媒体文件的喜爱程度，然后根据第一多媒体文件的偏好得分，获取待推荐的第二多媒体文件，该第二多媒体文件极大可能是用户喜欢的多媒体文件，向第一终端发送该第二多媒体文件，可以提高多媒体文件的推荐准确率。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本公开实施例提供的一种实施环境的示意图；

图2是本公开实施例提供的一种多媒体文件推荐方法流程图；

图3是本公开实施例提供的一种多媒体文件推荐方法流程图；

图4是本公开实施例提供的一种多媒体文件推荐装置的框图；

图5是本公开实施例提供的一种服务器的结构示意图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开实施方式作进一步地详细描述。

图1是本公开实施例提供的一种实施环境的示意图。参见图1，该实施环境包括第一终端101和服务器102。第一终端101和服务器102之间通过无线或者有线网络连接。并且，第一终端101上可以安装由服务器102提供服务的目标应用，第一终端101对应的用户可以通过该目标应用实现例如数据传输、消息交互等功能。

第一终端101可以为电脑、手机、平板电脑或者其他终端。目标应用可以为第一终端101上安装的任一能够播放多媒体文件的应用；并且，目标应用可以为第一终端101操作系统中的应用，还可以为第三方提供的应用。例如，目标应用可以为音乐应用、视频应用、社交应用、短视频应用、游戏应用等。服务器102可以为该目标应用对应的后台服务器。相应的，服务器102可以为音乐应用服务器、视频应用服务器、社交应用服务器、短视频应用服务器或者游戏应用服务器等。本公开实施例以目标应用为音乐应用，服务器102为音乐应用服务器为例进行说明。

当第一终端101通过目标应用登录服务器102时，服务器102可以为第一终端101推荐多媒体文件。相应的，第一终端101可以向服务器102发送推荐请求，推荐请求携带第一终端101的第一终端标识。服务器102可以接收第一终端101发送的推荐请求，根据第一终端标识，获取第一终端101历史对第一多媒体文件的第一行为，获取第一终端101历史对第一多媒体文件的第一播放时长，以及获取第一多媒体文件的第一文件时长，根据第一播放时长和第一文件时长，确定第一多媒体文件的偏好权重。服务器102可以根据第一多媒体文件的偏好权重和第一行为对应的分数，确定第一多媒体文件的偏好得分，根据第一多媒体文件的偏好得分，获取待推荐的第二多媒体文件。然后，服务器102向第一终端101发送该第二多媒体文件。

其中，多媒体文件可以包括视频文件和音频文件中的至少一项。视频文件可以包括视频或者短视频。音频文件可以包括歌曲、有声小说、评书、相声等中的至少一项，在本公开实施例中，以多媒体文件为歌曲为例进行说明。

进一步的，服务器102根据第一多媒体文件的偏好得分，为第一终端101推荐第二多媒体文件的方式可以为：服务器102将偏好得分和第一多媒体文件输入到多媒体推荐模型，根据多媒体推荐模型的输出，从待推荐的多媒体文件中确定第二多媒体文件。其中，多媒体推荐模型可以存储在服务器102中，且多媒体推荐模型中存储了大量待推荐的多媒体文件。

图2是本公开实施例提供的一种多媒体文件推荐方法的流程图。参见图2，该实施例包括：

步骤201：接收第一终端的推荐请求，推荐请求携带第一终端的第一终端标识。

步骤202：根据第一终端标识，获取第一终端历史对第一多媒体文件的第一行为。

步骤203：获取第一终端历史对第一多媒体文件的第一播放时长，以及获取第一多媒体文件的第一文件时长，根据第一播放时长和第一文件时长，确定第一多媒体文件的偏好权重。

步骤204：根据第一多媒体文件的偏好权重和第一行为对应的分数，确定第一多媒体文件的偏好得分。

步骤205：根据第一多媒体文件的偏好得分，获取待推荐的第二多媒体文件，向第一终端发送第二多媒体文件。

在一种可能的实现方式中，根据第一终端标识，获取第一终端历史对第一多媒体文件的第一行为，包括：

响应于根据第一终端标识从历史行为数据库中获取不到第一行为，根据第一终端标识，获取第一终端的身份信息，历史行为数据库用于存储终端对多媒体文件的历史行为；

根据身份信息，从至少两个分类簇中，确定第一终端对应的目标分类簇，每个分类簇为根据多个终端的身份信息划分的；

获取目标分类簇中第二终端历史对第一多媒体文件的第二行为；

将第二行为作为第一行为。

在另一种可能的实现方式中，根据第一终端标识，获取第一终端历史对第一多媒体文件的第一行为，包括：

根据第一终端标识，从历史行为数据库中获取第一终端历史对第一多媒体文件的第一行为，历史行为数据库用于存储终端对多媒体文件的历史行为。

在另一种可能的实现方式中，根据第一多媒体文件的偏好得分，获取待推荐的第二多媒体文件，包括：

将偏好得分和第一多媒体文件输入到多媒体推荐模型，根据多媒体推荐模型的输出，确定第二多媒体文件。

在另一种可能的实现方式中，多媒体推荐模型的训练方法包括：

获取训练样本，训练样本包括第三终端对第三多媒体文件的第三行为以及第三多媒体文件的第二播放时长和第二文件时长；

根据第三多媒体文件的第二播放时长和第二文件时长，确定第三多媒体文件的偏好权重；

根据第三多媒体文件的偏好权重和第三行为对应的分数，确定第三多媒体文件的偏好得分；

根据第三多媒体文件的偏好得分，确定第三多媒体文件的标签；

通过第三多媒体文件和第三多媒体文件的标签，进行模型训练，得到多媒体推荐模型。

在另一种可能的实现方式中，根据第三多媒体文件的偏好得分，确定第三多媒体文件的标签，包括：

对偏好得分做归一化处理，得到第三多媒体文件的标签。

在另一种可能的实现方式中，根据第一多媒体文件的偏好权重和第一行为对应的分数，确定第一多媒体文件的偏好得分，包括：

根据第一多媒体文件的偏好权重，对第一行为对应的分数进行加权，得到第一多媒体文件的偏好得分。

在另一种可能的实现方式中，获取第一终端历史对第一多媒体文件的第一播放时长，包括：

获取第一终端在第一目标时间段内，对第一多媒体文件播放的累计播放时长，将累计播放时长作为第一播放时长；或者，

获取第一终端在第二目标时间段内，最后一次对第一多媒体文件连续播放的第一总时长，将第一总时长作为第一播放时长；或者，

获取第一终端在第三目标时间段内，每次对第一多媒体文件连续播放的第二总时长，从第二总时长中选择最长的第二总时长作为第一播放时长。

图3是本公开实施例提供的一种多媒体文件推荐方法的流程图。参见图3，该实施例包括：

步骤301：服务器接收第一终端的推荐请求，推荐请求携带第一终端的第一终端标识。

推荐请求可以为音频文件推荐请求或者视频文件推荐请求，其中，音频文件可以包括歌曲、有声小说、评书、相声等中的任一项，相应的，该推荐请求可以为歌曲推荐请求、有声小说推荐请求、评书推荐请求、相声推荐请求等中的任一项。视频文件可以包括短视频，相应的，推荐请求可以为短视频推荐请求。在本公开实施例中，以歌曲推荐请求为例进行说明。

其中，第一终端标识可以为第一终端的终端标识，例如，第一终端标识可以为终端的IMEI(International Mobile Equipment Identity，国际移动设备识别码)、硬件标识、通信号码中的至少一个。其中，硬件标识可以为对硬件信息进行编码得到的标识，硬件信息可以包括主板标识、系统定制商标识、指令集标识、设备参数、显示屏参数、硬件制造商标识、设备型号、设备名称、设备标签、设备版本类型中的至少一项。

第一终端标识还可以为通过第一终端中的目标应用登录服务器的用户标识，例如，第一终端标识可以为用户的手机号码、用户的头像、用户的身份证号、用户的名称、用户的编号、用户的二维码或者其他用户标识。

需要说明的一点是，在该步骤之间，第一终端会先向服务器发送推荐请求，第一终端向服务器发送推荐请求的时机可以为以下两种：

第一种，第一终端响应于接收到用户触发多媒体推荐请求的操作，向服务器发送推荐请求。例如，第一终端可以在目标应用的多媒体播放界面上显示推荐按钮，相应的，第一终端可以响应于接收到用户对推荐按钮的触发操作，向服务器发送推荐请求。又如，第一终端可以响应于接收到用于获取更多多媒体文件的目标操作，向服务器发送推荐请求。其中，目标操作可以在多媒体播放界面上进行上滑操作。

第二种，第一终端可以根据预设的推荐周期向服务器发送推荐请求，其中，推荐周期可以根据需要设定，例如，推荐周期可以为一天、一周等，本公开对此不做限制。

步骤302：服务器根据第一终端标识，获取第一终端历史对第一多媒体文件的第一行为。

在本公开实施例中，以多媒体文件为歌曲为例，则第一多媒体文件可以为第一终端对应的用户收听过的歌曲，第一多媒体文件可以为任意歌曲，例如，第一多媒体文件为歌曲“爱你一万年”。第一多媒体文件的数量可以为多个，例如，为2个，第一个第一多媒体文件为歌曲“爱你一万年”、第二个第一多媒体文件为歌曲“青花瓷”。本公开对此不做限制。

其中，第一行为包括播放、收藏、切换、分享中的至少一个，第一行为还可以为其他行为，本公开对此不做限制。

在一种可能的实现方式中，第一终端对应的用户可能是目标应用的老用户，以目标应用为歌曲应用为例，老用户通过该歌曲应用已经收听过较多歌曲，从而服务器可以从历史行为数据库中直接获取第一行为，相应的，服务器根据第一终端标识，获取第一终端历史对第一多媒体文件的第一行为的实现方式为：服务器根据第一终端标识，从历史行为数据库中获取第一终端历史对第一多媒体文件的第一行为。

其中，历史行为数据库用于存储终端对多媒体文件的历史行为。服务器可以预先创建该历史行为数据库，将终端对多媒体文件的历史行为存储在其中。示例性的，历史行为数据库的数据存储形式可以为“终端标识-多媒体文件-历史行为”。

在本公开实施例中，服务器根据第一终端标识，从历史行为数据库中获取第一终端历史对第一多媒体文件的第一行为的方法简单，高效。

在另一种可能的实现方式中，第一终端对应的用户可能是目标应用的新用户，以目标应用为歌曲应用为例，新用户还未通过该歌曲应用收听过歌曲，这种情况下，服务器可以将与第一终端属于一个分类簇中的第二终端对第一多媒体文件的第二行为作为第一行为。

其中，第二终端可以是目标应用的老用户使用的终端，而老用户使用第二终端通过目标应用播放过多媒体文件，相应的，服务器中存储有第二终端对至少一个多媒体文件的行为。并且，第二终端是与第一终端属于同一个分类簇的终端。

相应的，服务器根据第一终端标识，获取第一终端历史对第一多媒体文件的第一行为的实现方式包括下述步骤(1)-(3)：

(1)服务器响应于根据第一终端标识从历史行为数据库中获取不到第一行为，根据第一终端标识，获取第一终端的身份信息。

身份信息为第一终端对应的用户的身份信息，身份信息可以是用户在目标应用中注册账号时所登记的身份信息。该身份信息可以包括用户的性别、年龄、职业、地区、民族、风格标签、兴趣标签中的任意一个或多个。

其中，风格标签和兴趣标签可以是用户在账号注册界面中预设的风格标签和兴趣标签中选择的。风格标签和兴趣标签可以根据需要设定，例如，风格标签可以为“安静”、“可爱”、“成熟”、“怀旧”、“孤单”、“嘻哈”、“高冷”、“浪漫”或者其他风格标签，兴趣标签可以为“摇滚”、“纯音乐”、“华语经典”、“华语流行”、“粤语经典”、“古典乐曲”、“爵士乐”、“电音”、“交响乐”、“民谣”、“乡村音乐”、“欧美流行”、“日系清新”、“动漫插曲”、“电影插曲”、“魔性搞怪”、“儿童乐曲”、“周杰伦”、“王菲”、“乐队”或者其他兴趣标签。需要说明的一点是，上述风格标签和兴趣标签只是示例性说明，本公开对此不做限制。

(2)服务器根据身份信息，从至少两个分类簇中，确定第一终端对应的目标分类簇。

需要说明的是，每个分类簇是根据多个终端的身份信息划分的，同一个分类簇内部的终端的身份信息相似度高，不同分类簇之间终端的身份信息差异性高。服务器在执行该步骤前，已经根据多个终端的身份信息划分好多个分类簇。

服务器根据多个终端的身份信息划分多个分类簇的实现方式可以为：服务器通过k-means(一种聚类算法)算法将多个终端的身份信息划分为多个分类簇，进一步，服务器通过k-means算法将多个终端的身份信息划分为多个分类簇的实现方式可以为：服务器从多个终端的身份信息中选择K个终端的身份信息作为第一轮迭代过程的K个分类簇的质心，计算K个质心向量以及除质心外其余每个终端的身份信息的向量，对于上述其余每个终端中的任意一个终端的身份信息的向量，比较该向量与K个质心向量的距离，将该终端的身份信息划分到距离最小的质心所在的分类簇，得到K个分类簇，然后对于K个分类簇中的每个分类簇，计算该分类簇中的终端的身份信息的向量的均值向量，将该均值向量作为第二轮迭代过程的该分类簇的质心，得到第二轮迭代过程的K个质心，以此类推，经过多轮迭代过程，则可得到满足要求的K个分类簇。

需要说明的一点是，K为大于1的整数且K小于多个终端的个数，K的数值可以根据需要设定。第一轮迭代过程的K个分类簇的质心可以在多个终端的身份信息中随机选择或者通过其他方式选择。迭代的终止条件可以为新一轮迭代过程的质心向量与前一轮迭代过程的质心向量的距离小于预设阈值，迭代的终止条件也可以为迭代的次数达到预设阈值，本公开对此不做限制。

在本公开实施例中，服务器通过k-means算法将多个终端的身份信息划分为多个分类簇，方法简单且高效。

需要说明的另一点是，服务器也可以通过其他聚类算法将多个终端的身份信息划分为多个分类簇，例如，均值偏移聚类算法、DBSCAN(Density-Based Spatial Clusteringof Applications with Noise，带噪声的基于密度的空间聚类算法)聚类算法、使用高斯混合模型的期望最大化聚类算法、层次聚类算法、图团体检测或者其他聚类算法，本公开对此不做限制。

服务器根据身份信息，从至少两个分类簇中，确定第一终端对应的目标分类簇的实现方式为：服务器获取第一终端的身份信息的向量和每个分类簇中的终端的身份信息的均值向量，比较第一终端的身份信息的向量与每个分类簇的均值向量的距离，将距离最小的分类簇作为目标分类簇。

(3)服务器获取目标分类簇中第二终端历史对第一多媒体文件的第二行为，将该第二行为作为第一终端历史对第一多媒体文件的第一行为。

其中，服务器获取目标分类簇中第二终端历史对第一多媒体文件的第二行为的实现方式为：服务器获取目标分类簇中第二终端的第二终端标识，根据第二终端标识从历史行为数据库中获取第二终端历史对第一多媒体文件的第二行为。

需要说明的一点是，第二终端的个数可以为一个也可以为多个，也即是，服务器可以从目标分类簇中获取一个第二终端的第二行为，也可以从目标分类簇中获取多个第二终端的第二行为。进一步的，服务器可以从目标分类簇中随机选择一个第二终端，获取该第二终端的第二行为。此方法获取的数据量小，效率高。或者，服务器从目标分类簇中随机选择预设数目个第二终端，获取该预设数目个第二终端的第二行为。此方法获取的数据量较大，后续基于该历史行为数据推荐的多媒体文件比较准确。或者，从目标分类簇获取所有第二终端的第二行为。此方法获取的数据量更大，数据更全，后续基于该历史行为数据推荐的多媒体文件更加准确。

上述获取第二终端的第二行为的方式仅是示例性说明，服务器还可以通过其他方式获取第二终端的第二行为，例如，服务器还可以从目标分类簇中获取与第一终端的身份信息最相似的第二终端的第二行为，实现方式可以为：服务器获取第一终端的身份信息的向量和目标分类簇中每个第二终端的身份信息的向量，比较第一终端的身份信息的向量与该每个第二终端的身份信息的向量的距离，获取距离最小的第二终端的第二行为。此方法获取的第二行为和第一终端的用户的喜好更加匹配，后续基于该历史行为数据推荐的多媒体文件更加准确。

又如，服务器可以从目标分类簇中获取与第一终端为好友关系的第二终端的第二行为。由于第一终端对应的用户可能对好友喜欢的多媒体文件感兴趣，通过此方法获取第二行为，后续基于该第二行为推荐的多媒体文件很有可能是用户感兴趣的，从而推荐的准确性高。

再如，服务器还可以从目标分类簇中选择在历史行为数据库中，对应的多媒体文件的热度值最高的第二终端的第二行为，实现方式可以为：服务器获取目标分类簇中每个第二终端的第二行为，计算在历史行为数据库中，每个第二终端对应的所有多媒体文件的总热度值，将热度值最高的第二终端的第二行为作为最终的第二行为。根据此方法获取的第二行为推荐的多媒体文件，不仅符合用户的喜好，在当下的热度也高，用户可能更感兴趣，从而推荐的准确度高。

在本公开实施例中，在第一终端对应的用户为新用户，缺乏历史行为数据的情况下，服务器根据第一终端的身份信息，从至少两个分类簇中，确定第一终端对应的目标分类簇，获取目标分类簇中第二终端历史对第一多媒体文件的第二行为，将该第二行为作为第一终端历史对第一多媒体文件的第一行为。由于目标分类簇中第二终端的身份信息与第一终端的身份信息相似，则第二终端对应的用户喜欢的多媒体文件与第一终端对应的用户喜欢的多媒体文件会相似，通过将第二终端历史对第一多媒体文件的第二行为作为第一终端历史对第一多媒体文件的第一行为，后续通过该第一行为为第一终端推荐的多媒体文件很大可能是用户喜欢的，推荐的准确率较高。并且，解决了多媒体推荐模型的冷启动问题，即避免了多媒体推荐模型由于缺乏历史行为数据无法推荐用户喜欢的多媒体文件，从而只能推荐热门多媒体文件的问题。

步骤303：服务器获取第一终端历史对第一多媒体文件的第一播放时长，以及获取第一多媒体文件的第一文件时长，根据第一播放时长和第一文件时长，确定第一多媒体文件的偏好权重。

服务器获取第一多媒体文件的第一播放时长的实现方式可以包括以下三种：

第一种，服务器获取第一终端在第一目标时间段内，对第一多媒体文件播放的累计播放时长，将累计播放时长作为第一播放时长。

其中，第一目标时间段可以根据需要设定，例如，第一目标时间段可以为距离当前时间一周、距离当前时间一天或者其他时间段，本公开对此不做限制。由于累计播放时长可以很好的体现用户对第一多媒体文件的喜爱程度，将第一目标时间段内第一多媒体文件的累计播放时长作为第一播放时长，根据该第一播放时长确定的第一多媒体文件的偏好权重可以很好的体现出用户的偏好。

第二种，服务器获取第一终端在第二目标时间段内，最后一次对第一多媒体文件连续播放的第一总时长，将第一总时长作为第一播放时长。

其中，第二目标时间段可以根据需要设定，例如，第二目标时间段可以为距离当前时间一周、距离当前时间一天或者其他时间段，本公开对此不做限制。由于连续播放时长可以很好的体现用户对第一多媒体文件的喜爱程度，且第二目标时间段内最后一次对第一多媒体文件连续播放的第一总时长，相较于第二目标时间段内其他连续播放的总时长来讲，数据更新，更能代表用户当前的偏好，从而将该第一总时长作为第一播放时长，根据该第一播放时长确定的第一多媒体文件的偏好权重可以很好的体现出用户的偏好。

第三种，服务器获取第一终端在第三目标时间段内，每次对第一多媒体文件连续播放的第二总时长，从第二总时长中选择最长的第二总时长作为第一播放时长。

其中，第三目标时间段可以根据需要设定，例如，第三目标时间段可以为距离当前时间一周、距离当前时间一天或者其他时间段，本公开对此不做限制。由于对第一多媒体文件连续播放的最长时长可以很好的体现用户对第一多媒体文件的喜爱程度，从而服务器获取第一终端在第三目标时间段内，每次对第一多媒体文件连续播放的第二总时长，从第二总时长中选择最长的第二总时长作为第一播放时长，根据该第一播放时长确定的第一多媒体文件的偏好权重可以很好的体现出用户的偏好。

需要说明的一点是，也可以将上述三种方法以任意方式结合使用来获取第一播放时长，例如，可以给上述三种方式对应的三个第一播放时长分别设置权重，服务器将三个第一播放时长乘以各自的权重后相加，得到最终的第一播放时长。此种方式得到的第一播放时长充分利用了第一多媒体文件的累计播放时长、最新一次连续播放的总时长和连续播放的最长时长三个参数，从而得到的第一播放时长更加客观，根据该第一播放时长确定的第一多媒体文件的偏好权重更能体现出用户的偏好。上述结合方式，只是示例性说明，还可以通过其他方式结合来获取第一播放时长，本公开对此不做限制。

需要说明的另一点是，若第一终端对应的用户为老用户，则服务器可以根据历史行为数据库或者第一终端的历史播放记录，获取第一终端历史对第一多媒体文件的第一播放时长，若第一终端对应的用户为新用户，则服务器可以获取上述从目标分类簇中选择的第二终端历史对第一多媒体文件的第一播放时长，将该第一播放时长作为第一终端历史对第一多媒体文件的第一播放时长。

服务器根据第一播放时长和第一文件时长，确定第一多媒体文件的偏好权重的实现方式为：服务器将第一播放时长和第一文件时长的比值作为第一多媒体文件的偏好权重。

步骤304：服务器根据第一多媒体文件的偏好权重和第一行为对应的分数，确定第一多媒体文件的偏好得分。

在一种可能的实现方式中，该步骤的实现方式为：服务器根据第一多媒体文件的偏好权重，对第一行为对应的分数进行加权，得到第一多媒体文件的偏好得分。

其中，第一行为可以为1个，相应的，该步骤的实现方式为：服务器将第一多媒体文件的偏好权重与该第一行为对应的分数的乘积作为第一多媒体文件的偏好得分。

第一行为也可以为多个，相应的，该步骤的实现方式为：服务器将多个第一行为对应的分数相加，得到分数的和，将该和与第一多媒体文件的偏好权重的乘积作为第一多媒体文件的偏好得分。

在执行该步骤前，服务器先要获取第一行为对应的分数，第一行为对应的分数可以预设在服务器中，相应的，服务器可以从本地获取第一行为对应的分数。

在本公开实施例中，以第一多媒体文件的偏好权重3，多个第一行为分别为播放、收藏、切换和分享，播放对应分数1、收藏对应分数2、切换对应分数1、分享对应分数3为例，服务器根据第一多媒体文件的偏好权重和第一行为对应的分数，确定第一多媒体文件的偏好得分的实现方式为：服务器将播放对应分数1、收藏对应分数2、切换对应分数1、分享对应分数3相加，得到和7，将该和与偏好权重3的乘积21作为第一多媒体文件的偏好得分。

需要说明的一点是，上述多个第一行为以及对应的分数均为示例性说明，本公开对此不做限制。另外，在本公开实施例中，可以对切换和播放不做区分，原因是当用户不喜欢该第一多媒体文件，用户可能在该第一多媒体文件播放的过程中进行切换，当用户喜欢该第一多媒体文件，用户也可能在该第一多媒体文件快要播放结束的时候进行切换，并且经过观察统计，用户在喜欢的第一多媒体文件快要播放结束的时候进行切换是普遍行为，因此，对切换和播放不做区分，通过结合根据播放时长确定的第一多媒体文件的偏好权重来确定第一多媒体文件的偏好得分，该偏好得分更加客观、准确。并且，这种方法也可以避免仅根据第一行为对应的分数获取偏好得分时，即通过离散的方法获取偏好得分时，数据过于稀疏且极性过强的问题，实现将离线的极性值变为连续计算值。

步骤305：服务器将偏好得分和第一多媒体文件输入到多媒体推荐模型，根据多媒体推荐模型的输出，确定第二多媒体文件。

其中，多媒体推荐模型为已经训练好的多媒体推荐模型，且该多媒体推荐模型中可以存储多个待推荐的多媒体文件。

第二多媒体文件是从多个待推荐的多媒体文件中选择的为第一终端推荐的多媒体文件。第二多媒体文件的数量可以为一个，也可以为多个。并且，第二多媒体文件可以是第一终端播放过的多媒体文件，也可以是第一终端没有播放过的多媒体文件。并且，第二多媒体文件可以和第一多媒体文件相同，也可以与第一多媒体文件不同，本公开对此不做限制。

该步骤的实现方式为：服务器将偏好得分和第一多媒体文件输入到多媒体推荐模型，通过多媒体推荐模型从第一多媒体文件中提取用户的兴趣特征，生成兴趣特征向量以及多媒体推荐模型中存储的每个待推荐的多媒体文件的特征向量，计算每个待推荐的多媒体文件的特征向量与兴趣特征向量的向量相似度，输出每个待推荐的多媒体文件的特征向量与兴趣特征向量的向量相似度。服务器从多个待推荐的多媒体文件中选择向量相似度大于预设阈值的第二多媒体文件。

在本公开实施例中，通过将偏好得分和第一多媒体文件输入到多媒体推荐模型，根据多媒体推荐模型的输出，确定第二多媒体文件，方法简单，推荐的效率高。

需要说明的一点是，该多媒体推荐模型可以是基于CNN(Convolutional NeuralNetworks，卷积神经网络)，也可以是基于其他模型的，本公开对此不做限制。多媒体推荐模型的训练方法包括以下步骤(1)-(5)：

(1)服务器获取训练样本，训练样本包括第三终端对第三多媒体文件的第三行为以及第三多媒体文件的第二播放时长和第二文件时长。

服务器可以从历史行为数据库中获取训练样本，训练样本的数量可以根据需要设定，本公开对此不做限制。

(2)服务器根据第三多媒体文件的第二播放时长和第二文件时长，确定第三多媒体文件的偏好权重。

该步骤的实现方式和上述服务器根据第一播放时长和第一文件时长，确定第一多媒体文件的偏好权重的实现方式同理，此处不再赘述。

(3)服务器根据第三多媒体文件的偏好权重和第三行为对应的分数，确定第三多媒体文件的偏好得分。

该步骤的实现方式和上述服务器根据第一多媒体文件的偏好权重和第一行为对应的分数，确定第一多媒体文件的偏好得分的实现方式同理，此处不再赘述。

(4)服务器根据第三多媒体文件的偏好得分，确定第三多媒体文件的标签。

该步骤的实现方式为：服务器对偏好得分做归一化处理，得到第三多媒体文件的标签。可以提高模型训练的速度和精度。

(5)服务器通过第三多媒体文件和第三多媒体文件的标签，进行模型训练，得到多媒体推荐模型。

该步骤的实现方式为：服务器将多个第三多媒体文件和第三多媒体文件的偏好得分输入该多媒体推荐模型，通过该多媒体推荐模型从多个第三多媒体文件中提取用户的兴趣特征，生成兴趣特征向量，以及生成每个第三多媒体文件的特征向量，计算兴趣特征向量与每个第三多媒体文件的特征向量的向量相似度，对于任一个第三多媒体文件对应的向量相似度，计算该向量相似度与该第三多媒体文件的标签的误差，通过梯度下降算法对该多媒体推荐模型的特征提取参数进行优化，然后重新提取特征来计算上述误差，多次迭代直至模型收敛即误差小于预设阈值。

其中，上述通过梯度下降算法对该多媒体推荐模型的特征提取参数进行优化仅是示例性说明，也可以采用其他模型优化算法，例如，指数加权平均算法、带有动量的梯度下降算法等，本公开对此不做限制。

需要说明的另一点是，上述计算兴趣特征向量与每个第三多媒体文件的特征向量的向量相似度的步骤可以通过下述公式(1)实现：

predict＝cos(item，user) (1)

其中，predict为向量相似度，item为第三多媒体文件的特征向量，user为用户的兴趣特征向量。

上述计算向量相似度与第三多媒体文件的标签的误差的步骤可以通过下述公式(2)实现：

其中，loss为误差，predict为向量相似度，label为标签。

当然，上述计算向量相似度的公式(1)及计算误差的公式(2)仅为示例性说明，也可以采用其他公式或者算法来计算向量相似度和误差，本公开对此不做限制。

步骤306：服务器向第一终端发送第二多媒体文件。

图4是本公开实施例提供的一种多媒体文件推荐装置的框图。参见图4，该实施例包括：

推荐请求接收模块401，被配置为接收第一终端的推荐请求，推荐请求携带第一终端的第一终端标识。

第一行为获取模块402，被配置为根据第一终端标识，获取第一终端历史对第一多媒体文件的第一行为。

第一偏好权重确定模块403，被配置为获取第一终端历史对第一多媒体文件的第一播放时长，以及获取第一多媒体文件的第一文件时长，根据第一播放时长和第一文件时长，确定第一多媒体文件的偏好权重。

第一偏好得分确定模块404，被配置为根据第一多媒体文件的偏好权重和第一行为对应的分数，确定第一多媒体文件的偏好得分。

多媒体推荐模块405，被配置为根据第一多媒体文件的偏好得分，获取待推荐的第二多媒体文件，向第一终端发送第二多媒体文件。

在一种可能的实现方式中，第一行为获取模块402，还被配置为响应于根据第一终端标识从历史行为数据库中获取不到第一行为，根据第一终端标识，获取第一终端的身份信息，历史行为数据库用于存储终端对多媒体文件的历史行为；根据身份信息，从至少两个分类簇中，确定第一终端对应的目标分类簇，每个分类簇为根据多个终端的身份信息划分的；获取目标分类簇中第二终端历史对第一多媒体文件的第二行为；将第二行为作为第一行为。

在另一种可能的实现方式中，第一行为获取模块402，还被配置为根据第一终端标识，从历史行为数据库中获取第一终端历史对第一多媒体文件的第一行为，历史行为数据库用于存储终端对多媒体文件的历史行为。

在另一种可能的实现方式中，多媒体推荐模块405，还被配置为将偏好得分和第一多媒体文件输入到多媒体推荐模型，根据多媒体推荐模型的输出，确定第二多媒体文件。

在另一种可能的实现方式中，多媒体推荐模型的训练装置包括：

样本获取模块，被配置为获取训练样本，训练样本包括第三终端对第三多媒体文件的第三行为以及第三多媒体文件的第二播放时长和第二文件时长；

第二偏好权重确定模块，被配置为根据第三多媒体文件的第二播放时长和第二文件时长，确定第三多媒体文件的偏好权重；

第二偏好得分确定模块，被配置为根据第三多媒体文件的偏好权重和第三行为对应的分数，确定第三多媒体文件的偏好得分；

标签确定模块，被配置为根据第三多媒体文件的偏好得分，确定第三多媒体文件的标签；

模型训练模块，被配置为通过第三多媒体文件和第三多媒体文件的标签，进行模型训练，得到多媒体推荐模型。

在另一种可能的实现方式中，标签确定模块，被配置为对偏好得分做归一化处理，得到第三多媒体文件的标签。

在另一种可能的实现方式中，第一偏好得分确定模块404，还被配置为根据第一多媒体文件的偏好权重，对第一行为对应的分数进行加权，得到第一多媒体文件的偏好得分。

在另一种可能的实现方式中，第一偏好权重确定模块403，被配置为获取第一终端在第一目标时间段内，对第一多媒体文件播放的累计播放时长，将累计播放时长作为第一播放时长；或者，获取第一终端在第二目标时间段内，最后一次对第一多媒体文件连续播放的第一总时长，将第一总时长作为第一播放时长；或者，获取第一终端在第三目标时间段内，每次对第一多媒体文件连续播放的第二总时长，从第二总时长中选择最长的第二总时长作为第一播放时长。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

需要说明的是：上述实施例提供的多媒体文件推荐装置在进行多媒体文件推荐时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的多媒体文件推荐装置与多媒体文件推荐方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图5是本公开实施例提供的一种服务器的结构示意图，该服务器500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processingunits，CPU)501和一个或一个以上的存储器502，其中，所述存储器502中存储有至少一条指令，所述至少一条指令由所述处理器501加载并执行以实现上述各个方法实施例提供的多媒体文件推荐方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括指令的存储器，上述指令可由服务器中的处理器执行以完成下述实施例中多媒体文件推荐方法。例如，所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本公开的可选实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种多媒体文件推荐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一终端标识，获取所述第一终端历史对第一多媒体文件的第一行为，包括：

将所述第二行为作为所述第一行为。

3.根据权利要求1所述的方法，其特征在于，所述根据所述第一终端标识，获取所述第一终端历史对第一多媒体文件的第一行为，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述第一多媒体文件的偏好得分，获取待推荐的第二多媒体文件，包括：

5.根据权利要求4所述的方法，其特征在于，所述多媒体推荐模型的训练方法包括：

6.根据权利要求5所述的方法，其特征在于，所述根据所述第三多媒体文件的偏好得分，确定所述第三多媒体文件的标签，包括：

7.根据权利要求1所述的方法，其特征在于，所述根据所述第一多媒体文件的偏好权重和所述第一行为对应的分数，确定所述第一多媒体文件的偏好得分，包括：

8.根据权利要求1所述的方法，其特征在于，所述获取所述第一终端历史对所述第一多媒体文件的第一播放时长，包括：

9.一种多媒体文件推荐装置，其特征在于，所述装置包括：

10.一种服务器，其特征在于，所述服务器包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现如权利要求1至权利要求8任一项所述的多媒体文件推荐方法所执行的操作。

11.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现如权利要求1至权利要求8任一项所述的多媒体文件推荐方法所执行的操作。