CN112925924A

CN112925924A - 多媒体文件的推荐方法、装置、电子设备及存储介质

Info

Publication number: CN112925924A
Application number: CN201911235598.1A
Authority: CN
Inventors: 李强
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2019-12-05
Filing date: 2019-12-05
Publication date: 2021-06-08
Anticipated expiration: 2039-12-05
Also published as: CN112925924B

Abstract

本申请涉及互联网技术领域，尤其涉及一种多媒体文件的推荐方法、装置、电子设备及存储介质，用于推荐多媒体文件，其方法为：响应于账户发送的多媒体文件推荐请求，获取候选多媒体文件集合，针对所述多媒体文件集合中的各个多媒体文件生成各个待测试特征，调用采用深度神经网络训练获得的推荐模型对获得的各个待测试特征进行处理，获得相应的各个多媒体文件的目标评估信息，基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐。这样，通过使用推荐模型，提高了输出的准确性，而且得到的目标评估信息能够有效的表征所述账户对于相应的多媒体文件的真实评估信息，可以向账户推荐能够获取所述账户最多操作的多媒体文件。

Description

多媒体文件的推荐方法、装置、电子设备及存储介质

技术领域

本申请涉及互联网技术领域，尤其涉及一种多媒体文件的推荐方法、装置、电子设备及存储介质。

背景技术

多媒体文件的推荐过程，主要包括有四个阶段：分别为召回阶段、粗排阶段、精排阶段以及策略阶段。对海量多媒体文件进行前三个阶段的处理后，得到候选多媒体文件集合，为保证不同用户得到的推荐结果的多样性，在策略阶段对所述候选多媒体文件集合中的多媒体文件排序结果进行调整，通过预估用户对被推荐的各个多媒体文件的操作行为，得到目标评估信息，并基于所述目标评估信息进行排序，推荐未超过排序阈值的多媒体文件给用户。

现有技术下，通常以精排模型得到的预估结果为基础，采用排序公式计算所述候选多媒体文件集合中各个多媒体文件的目标评估信息。

但这样，计算得到的目标评估信息与实际得到的真实评估信息相差较大，难以通过由排序公式从推荐的多媒体文件中得到预期的用户的操作行为，而且对于特定的推荐需求，需要人工对所述排序公式中的权重参数进行调整，且调整的过程依赖于人工经验，人工调整的难度较大，耗费大量人力和时间成本，而且人工调节参数后计算得到的目标评估信息无法兼顾对用户的各个操作行为的预估，这也导致现有技术下的排序公式无法兼顾用户的个性化需求。

发明内容

本发明实施例提供一种多媒体文件的推荐方法，用以解决现有技术中存在的目标评估信息与实际评估信息相差较大，无法推荐能够获取用户最多操作的多媒体文件的问题。

本发明实施例提供的具体技术方案如下：

一种多媒体文件的推荐方法，包括：

响应于账户发送的多媒体文件推荐请求，获取候选多媒体文件集合，所述多媒体文件推荐请求中携带有所述账户的账户信息；

确定所述账户对所述候选多媒体文件集合中各个多媒体文件的预估操作概率，并至少基于获得的各个预估操作概率，生成所述各个多媒体文件的待测试特征，其中，每条待测试特征中包含有所述账户以及相应的一个多媒体文件的特征描述信息；

调用预设的推荐模型对获得的各个待测试特征进行处理，获得相应的各个多媒体文件的目标评估信息，所述推荐模型是基于样本多媒体文件，采用深度神经网络进行训练获得的，其中，在训练过程中，采用加权对数损失函数，对基于样本多媒体文件获得的样本待测试特征中的，各个参量的权重进行调整，所述目标评估信息用于表征向所述账户推荐相应的多媒体文件时，所述账户对所述多媒体文件的预估操作行为；

基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐。

可选的，所述确定所述账户对所述候选多媒体文件集合中各个多媒体文件的预估操作概率，并至少基于获得的各个预估操作概率，生成所述各个多媒体文件的待测试特征，包括：

基于所述各个多媒体文件的预估操作概率，以及所述账户信息，生成所述各个多媒体文件的待测试特征；或者，

确定其他账户对于所述候选多媒体文件集合中各个多媒体文件的历史操作概率，并基于所述各个多媒体文件的历史操作概率，所述账户信息，所述各个多媒体文件的归属信息，以及所述预估操作概率，生成所述各个多媒体文件的待测试特征。

可选的，响应于账户发送的多媒体文件推荐请求之前，进一步包括：采用深度神经网络对推荐模型进行训练；具体包括：

获取指定数量的样本多媒体文件，其中，一个样本多媒体文件关联有一个账户针对所述一个样本多媒体文件的操作行为；

至少根据各个样本多媒体文件的预估操作概率，以及所关联的账户的账户信息，确定所述各个样本多媒体文件的样本待测试特征；

采用深度神经网络架构，搭建初始的推荐模型；

采用获得的各个样本待测试特征，对所述推荐模型进行训练，其中，在训练过程中，每读取一条样本待测试特征，采用所述推荐模型，对所述一条样本待测试特征进行处理，输出相应的样本多媒体文件的目标评估信息，确定所述目标评估信息与所述样本多媒体文件的真实评估信息的差值达到预设门限值时，采用加权对数损失函数，分别调整所述推荐模型中，对应所述一条样本待测试特征包含的各个参量设置的权重。

可选的，所述基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐，包括：

将获得的各个目标评估信息按照取值从大到小的顺序进行排序，筛选出取值最大的N个目标评估信息，以及对所述N个目标评估信息对应的N个多媒体文件进行推荐，其中，N为预设自然数；或者，

分别将各个目标评估信息的取值与设定阈值进行比较，筛选出取值达到设定阈值的目标评估信息，以及对筛选出的目标评估信息对应的多媒体文件进行推荐。

可选的，所述筛选出符合预设条件的多媒体文件进行推荐之后，进一步包括：

确定被推荐的各个多媒体文件对应的真实评估信息，其中，一个被推荐的多媒体文件对应的真实评估信息，是基于所述账户对所述一个被推荐的多媒体文件执行的实际操作产生的；

分别将各个被推荐的多媒体文件对应的真实评估信息，与相应的目标评估信息进行对比，其中，每比对一次，确定一条真实评估信息与相应的一条目标评估信息的差值达到预设门限值时，确定所述一条目标评估信息对应的一条待测试特征，采用加权对数损失函数，分别调整所述推荐模型中对应所述一条待测试特征包含的各个参量设置的权重。

一种多媒体文件的推荐装置，包括：

获取单元，响应于账户发送的多媒体文件推荐请求，获取候选多媒体文件集合；

生成单元，确定所述账户对所述候选多媒体文件集合中各个多媒体文件的预估操作概率，并至少基于获得的各个预估操作概率，生成所述各个多媒体文件的待测试特征，其中，每条待测试特征中包含有所述账户以及相应的一个多媒体文件的特征描述信息；

处理单元，调用预设的推荐模型对获得的各个待测试特征进行处理，获得相应的各个多媒体文件的目标评估信息，所述推荐模型是基于样本多媒体文件，采用深度神经网络进行训练获得的，其中，在训练过程中，采用加权对数损失函数，对基于样本多媒体文件获得的样本待测试特征中的，各个参量的权重进行调整，所述目标评估信息用于表征向所述账户推荐相应的多媒体文件时，所述账户对所述多媒体文件的预估操作行为；

推荐单元，基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐。

可选的，所述确定所述账户对所述候选多媒体文件集合中各个多媒体文件的预估操作概率，并至少基于获得的各个预估操作概率，生成所述各个多媒体文件的待测试特征时，所述生成单元用于：

可选的，响应于账户发送的多媒体文件推荐请求之前，所述装置进一步包括训练单元：采用深度神经网络对推荐模型进行训练；所述训练单元具体用于：

采用深度神经网络架构，搭建初始的推荐模型；

可选的，所述基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐时，所述推荐单元用于：

可选的，所述筛选出符合预设条件的多媒体文件进行推荐之后，所述推荐单元进一步用于：

一种电子设备，包括：

存储器，用于存储可执行指令；

处理器，用于读取并执行存储器中存储的可执行指令，以实现上述任一项所述的多媒体文件的推荐方法。

一种存储介质，当所述存储介质中的指令由处理器执行时，使得能够执行上述任一项所述的多媒体文件推荐方法。

本发明有益效果如下：

本申请提供一种多媒体文件推荐方法、装置、电子设备及存储介质。响应于账户发送的多媒体文件推荐请求，获取候选多媒体文件集合，针对所述多媒体文件集合中的各个多媒体文件生成各个待测试特征，调用采用深度神经网络训练获得的推荐模型对获得的各个待测试特征进行处理，获得相应的各个多媒体文件的目标评估信息，基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐。这样，通过使用推荐模型，提高了输出的准确性，而且得到的目标评估信息能够有效的表征所述账户对于相应的多媒体文件的真实评估信息，可以向账户推荐获取所述账户最多操作的多媒体文件。

附图说明

图1为本申请实施例中训练推荐模型的流程示意图；

图2为本申请实施例中推荐多媒体文件流程示意图；

图3为本申请实施例中多媒体文件推荐装置逻辑结构示意图；

图4为本申请实施例中电子设备实体结构示意图。

具体实施方式

为了解决现有技术中存在的目标评估信息与实际评估信息相差较大，无法推荐能够获取用户最多操作的多媒体文件的问题，本申请中，响应于账户发送的多媒体文件推荐请求，获取候选多媒体文件集合，确定所述账户对所述候选多媒体文件集合中各个多媒体文件的预估操作概率，并至少基于获得的各个预估操作概率以及所述账户信息，生成所述各个多媒体文件的待测试特征，然后，调用预设的推荐模型对获得的各个待测试特征进行处理，获得相应的各个多媒体文件的目标评估信息，所述推荐模型是基于样本多媒体文件，采用深度神经网络进行训练获得的，再基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐。本申请中承载推荐模型的处理装置可以是服务器，或者，客户端，或者，服务器和客户端的组合。

下面结合附图，对本申请优选的实施例进行详细说明。

首先，本申请实施例中，需要使用到基于深度神经网络搭建的推荐模型，因此，在预处理阶段，需要基于海量的样本多媒体文件，对推荐模型进行训练，参阅图1所示，所述推荐模型的训练过程如下：

步骤101：获取指定数量的样本多媒体文件，其中，一个样本多媒体文件关联有一个账户针对所述一个样本多媒体文件的操作行为。

根据实际训练需要，从海量的样本多媒体文件中获取指定数量的样本多媒体文件，其中，每个样本多媒体文件都关联有一个账户针对所述一个样本多媒体文件的操作行为，而且每个样本多媒体文件都因所关联的一个账户的操作行为而具有真实评估信息。

例如，以4个样本多媒体文件为例，样本多媒体文件1关联有账户A的操作行为：浏览+点赞，样本多媒体文件2关联有账户B的操作行为：浏览+点赞+关注，样本多媒体文件3关联有账户A的操作行为：浏览，样本多媒体文件4关联有账户C的操作行为：浏览+关注，将账户的操作行为量化的话，可视为浏览1分，点赞20分，关注60分，那么基于所述样本多媒体文件所关联的账户的操作行为，可得到基于所述账户A的操作行为，所述样本多媒体文件1的真实评估信息为21分；基于所述账户B的操作行为，所述样本多媒体文件2的真实评估信息为81分；基于所述账户A的操作行为，所述样本多媒体文件3的真实评估信息为1分；基于所述账户C的操作行为，所述样本多媒体文件4的真实评估信息为61分。

步骤102：至少根据各个样本多媒体文件的预估操作概率，以及所关联的账户的账户信息，确定所述各个样本多媒体文件的样本待测试特征。

以样本多媒体文件X为例，在执行此步骤时，可以基于所述样本多媒体文件X的预估操作概率，以及与所述样本多媒体文件X关联的账户的账户信息，确定所述样本多媒体文件X的样本待测试特征，其中，所述预估操作概率表征所述样本多媒体文件X关联的账户对所述样本多媒体文件X执行特定操作的概率，具体可包括有预估点击概率、预估点赞概率、预估关注概率等等，所述账户信息为与所述样本多媒体文件X关联的账户的账户信息，所述账户信息包括有所述账户的ID信息,所述账户所在的设备型号信息，所述账户所处网络信息以及所述账户的地域信息。

可选的，还可以确定其他账户对于所述样本多媒体文件X的历史操作概率，并基于所述历史操作概率，所述账户信息，所述样本多媒体文件X的归属信息，以及所述预估操作概率，生成所述样本多媒体文件X的样本待测试特征。其中，所述历史操作概率为基于其他账户对所述样本多媒体文件X执行的实际操作所获得的概率，所述样本多媒体文件X的归属信息具体可包括所述样本多媒体文件X的ID信息，以及所述样本多媒体文件X的作者ID信息。

例如，例如，对于样本多媒体文件X的历史操作概率，可以通过记录与当前账户满足一定相似度的其他账户对所述样本多媒体文件X执行指定操作的次数，计算历史操作概率，所述满足一定相似度的其他账户可以是与所述当前账户的年龄和性别信息相同的其他账户，或者，与所述当前账户属于同一区域的其他账户，假设获取到10000个被推荐所述样本多媒体文件X的其他账户，通过记录的信息可知有5000个账户进行了点击操作，则所述多媒体文件的历史点击概率为0.5。

步骤103：采用深度神经网络架构，搭建初始的推荐模型。

具体的，初始的推荐模型是采用深度神经网络架构搭建的，为多层感知机制(multi-layer perceptron，MLP)神经网络，每一层都是全链接层，神经网络顶层使用S型函数(Sigmoid)进行处理，神经网络的底层通过自动学习对读取的样本待测试特征进行预处理，得到所述推荐模型可以识别的数据信息，所述推荐模型选用的激活函数为线性整流函数(Rectified Linear Unit，ReLU)，选用的损失函数为交叉熵损失(cross-entropy Loss)函数，所述推荐模型实现的任务为0-1二分类任务，最终输出目标评估信息。

所述神经网络的底层对读取的样本待测试特征进行分域离散化处理，具体的，将所述样本待测试特征分别进行独热编码(onehot)处理，分别映射为长度为1000的向量，然后对得到的所述向量分别进行特征嵌入化(embedding)处理，实现对onehot编码映射的向量的降维，得到后续推荐模型可以处理的32维稠密的连续值向量，最终生成所述推荐模型可以识别解析的M×32维的向量，其中，M表示每条样本待测试特征包含的全部参量的总数。

步骤104：读取一条样本待测试特征。

具体的，指定数量的样本多媒体文件，生成指定数量的样本待测试特征，分别读取每一条样本待测试特征以进行后续的操作，其中，每一条样本待测试特征都是至少基于对应的样本多媒体文件的预估操作概率，以及所关联的帐户的账户信息确定的。

以样本多媒体文件Y对应生成的样本待测试特征为例，所述预估操作概率表征样本多媒体文件Y关联的账户对所述样本多媒体文件Y执行特定操作的概率，具体可包括有预估点击概率、预估点赞概率、预估关注概率等等，所述账户信息为与所述样本多媒体文件Y关联的账户的账户信息，所述账户信息包括有所述账户的ID信息,所述账户所在的设备型号信息，所述账户所处网络信息以及所述账户的地域信息。

可选的，还可以基于所述样本多媒体文件Y的历史操作概率，所述账户信息，所述样本多媒体文件Y的归属信息，以及所述预估操作概率，生成所述样本多媒体文件Y的样本待测试特征。其中，所述历史操作概率为基于其他账户对所述样本多媒体文件Y执行的实际操作所获得的概率，所述样本多媒体文件Y的归属信息具体可包括所述样本多媒体文件Y的ID信息，以及所述样本多媒体文件Y的作者ID信息。

步骤105：采用所述推荐模型对所述一条样本待测试特征进行处理，输出相应的样本多媒体文件的目标评估信息。

具体的，一条样本待测试特征对应一个样本多媒体文件，将读取的样本待测试特征作为推荐模型的输入，输入到所述推荐模型中，所述推荐模型首先对所述样本待测试特征进行分域离散化处理，即，对所述样本待测试特征进行独热编码处理和特征嵌入化处理操作，得到所述推荐模型后续可以解析使用的向量形式的数据信息，然后基于所述向量形式的数据信息，输出得到与读取的样本待测试特征相对应的样本多媒体文件的目标评估信息。

步骤106：判断所述目标评估信息与所述样本多媒体文件的真实评估信息的差值是否达到预设门限值？若是，执行步骤107，否则，执行步骤108。

具体的，按照实际的设置需求，设置相应的预设门限，推荐模型通过处理样本待测试特征，得到与所述样本待测试特征相对应的样本多媒体文件的目标评估信息后，将所述目标评估信息与所述样本多媒体文件的真实评估信息进行比较，所述真实评估信息是基于所述样本多媒体文件所关联的账户的操作行为确定的。确定所述真实评估信息与所述目标评估信息的差值达到预设门限值时，判定需要对所述推荐模型进行调整，并执行具体操作，确定所述真实评估信息与所述目标评估信息的差值未达到所述预设门限值时，判定所述推荐模型暂时不需要调整，并继续后续操作。

例如，对于样本多媒体文件M，对应生成了样本待测试特征m，所述样本多媒体文件的真实评估信息为85，预设门限值为10，推荐模型对所述样本待测试特征m进行处理后，得到所述样本多媒体文件M的目标评估信息为70，可知所述真实评估信息与所述目标评估信息的差值为15，达到预设门限值，故判定需要对所述推荐模型进行调整。

步骤107：采用加权对数损失函数，分别调整所述推荐模型中，对应所述一条样本待测试特征包含的各个参量设置的权重。

推荐模型对一条样本待测试特征进行处理后，得到与所述一条样本待测试特征对应的，一个样本多媒体文件的目标评估信息，确定所述目标评估信息与所述一个样本多媒体文件的真实评估信息之间的差值达到预设门限值时，对所述推荐模型进行调整，具体的，采用加权对数损失函数，分别调整所述推荐模型中，对应所述一条样本待测试特征包含的各个参量设置的权重。

假设某条样本待测试特征中包含的参量为：预估点击概率，预估点赞概率，预估关注概率，对应所述参量设置的权重为1，10，20，推荐模型对所述某条样本待测试特征进行处理后，确定得到的目标评估信息与真实评估信息之间的差值达到预设门限值，则基于加权对数损失函数，调整对应所述参量设置的权重，如可根据实际需要将所述参量对应的权重调整为1.5，12，20。

这样，通过调整推荐模型中，对应所述一条待测试特征包含的各个参量设置的权重，能够实现对所述推荐模型的调整，以得到输出的目标评估信息与真实评估信息之间的差值小于预设门限值，保证输出的准确性，极大的降低输出的目标评估信息与真实评估信息之间的差值。

步骤108：判断样本待测试特征是否全部读取完毕？若是，执行步骤109，否则，执行步骤104。

具体的，推荐模型处理完成一条样本待测试特征之后，且基于输出的目标评估信息，确定不需要对所述推荐模型进行调整时，或者，基于输出的目标评估信息，确定需要对所述推荐模型进行调整，并且采用加权对数损失函数，完成调整所述一条样本待测试特征包含的各个参量设置的权重时。进一步的，判断样本待测试特征是否全部读取完毕，若是，继续读取样本待测试特征，否则，判定此次训练结束，并进行后续的操作。

步骤109：输出训练完成的推荐模型。

具体的，采用推荐模型处理完成指定数量的样本待测试特征后，判定所述推荐模型此次训练完成，由于在应用层面的操作中，会实时根据所述推荐模型输出的目标评估信息与真实评估信息之间的差值，与预设门限值的关系，继续调整所述推荐模型，故在当前的训练过程中不对所述推荐模型的结束状态进行过多限定。

下面结合附图2，对采用推荐模型进行处理，最终推荐多媒体文件的过程进行说明。

步骤201：响应于账户发送的多媒体文件推荐请求，获取候选多媒体文件集合。

接收账户发送的多媒体文件推荐请求之后，获取所述多媒体文件推荐请求中携带的所述账户的账户信息，所述账户信息具体包括有所述账户的ID信息,所述账户所在的设备型号信息，所述账户所处的网络信息以及所述账户的地域信息。

进一步的，获得候选多媒体文件集合，具体的，可以从包括海量多媒体文件的多媒体文件库中，挑选出所述账户可能感兴趣的指定数量的多媒体文件，生成候选多媒体文件集合，或者，可以从海量的多媒体文件中筛选出所述账户可能感兴趣的多媒体文件后，按照常规推荐过程中粗排阶段的排序规则，获取指定数量的多媒体文件生成候选多媒体文件集合，或者，可以从海量的多媒体文件中筛选出所述账户可能感兴趣的多媒体文件后，按照常规推荐过程中粗排阶段的排序规则，以及精排阶段处理多媒体文件的方式，生成包含指定数量的多媒体文件的候选多媒体文件集合。各种方式生成的候选多媒体文件集合中的各个多媒体文件都需要进行精排阶段的处理以得到所述各个多媒体文件的预估操作概率，所述预估操作概率表征所述账户对多媒体文件执行指定操作的概率，所述预估操作概率具体可以包括有预估点击概率、预估点赞概率、预估关注概率等等。本申请中，以经过常规推荐过程中精排阶段处理后生成的候选多媒体集合为例进行后续说明。

步骤202：确定所述账户对所述候选多媒体文件集合中各个多媒体文件的预估操作概率，并至少基于获得的各个预估操作概率以及所述账户信息，生成所述各个多媒体文件的待测试特征。

具体的，可以基于所述各个多媒体文件的预估操作概率，以及所述账户信息，生成所述各个多媒体文件的待测试特征。其中，所述账户信息是从所述账户发送的多媒体文件推荐请求中获取的，所述预估操作概率表征预估的所述账户对所述多媒体文件执行特定操作的概率，具体可包括预估点击概率，预估点赞概率，预估关注概率等等。

可选的，还可以确定其他账户对于所述候选多媒体文件集合中各个多媒体文件的历史操作概率，并基于所述各个多媒体文件的历史操作概率，所述账户信息，所述各个多媒体文件的归属信息，以及所述预估操作概率，生成所述各个多媒体文件的待测试特征。其中，所述历史操作概率表征其他账户对于所述候选多媒体文件集合中各个多媒体文件实际执行指定操作的概率，所述各个多媒体文件的归属信息，具体包括各个多媒体文件的ID信息，以及所述各个多媒体文件的作者ID信息。

这样，可以灵活的获取待测试特征，根据实际需要设置所述待测试特征中的参量，最大可能的减少了需要处理的数据量，降低了后续推荐模型对待测试特征进行处理的复杂度，提高了处理效率。

步骤203：调用预设的推荐模型对获得的各个待测试特征进行处理，获得相应的各个多媒体文件的目标评估信息，所述推荐模型是基于样本多媒体文件，采用深度神经网络进行训练获得的。

具体的，所述推荐模型在训练过程中，采用加权对数损失函数，对基于样本多媒体文件获得的样本待测试特征中的，各个参量的权重进行调整，调用训练后的推荐模型依次对各个待测试特征进行处理，获得所述推荐模型输出的，与所述各个待测试特征对应的，各个多媒体文件的目标评估信息，所述目标评估信息用于表征向所述账户推荐相应的多媒体文件时，所述账户对所述多媒体文件的预估操作行为。所述推荐模型的训练过程已在附图1对应的流程步骤中进行详细说明，在此不再赘述。

以包含5个多媒体文件的候选多媒体文件集合为例，对应生成5条待测试特征，推荐模型依次对每一条待测试特征进行处理，得到与所述每一条待测试特征对应的一个多媒体文件的目标评估信息，若以分数为所述目标评估信息的衡量单位，可以得到相应的结果为，多媒体文件1的目标评估信息：50分、多媒体文件2的目标评估信息：71分、多媒体文件3的目标评估信息：61分、多媒体文件4的目标评估信息：101分、多媒体文件5的目标评估信息：1分。

步骤204：基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐。

获得推荐模型输出的候选多媒体文件集合中各个多媒体文件的目标评估信息后，基于获得的所述目标评估信息，筛选出符合预设条件的多媒体文件进行推荐。具体的，可以将获得的各个目标评估信息按照取值从大到小的顺序进行排序，筛选出取值最大的N个目标评估信息，以及对所述N个目标评估信息对应的N个多媒体文件进行推荐，其中，N为预设自然数。

例如，对于包含300个多媒体文件的候选多媒体文件集合1，对应可以生成300条待测试特征，推荐模型完成处理后可以得到与所述300个多媒体文件对应的300个目标评估信息。然后将获得的全部目标评估信息按照取值从大到小的顺序进行排序，若设置筛选出100个多媒体文件进行推荐，则筛选出取值最大的100个目标评估信息对应的100个多媒体文件推荐给发起多媒体文件推荐请求的账户。

还可以分别将各个目标评估信息的取值与设定阈值进行比较，筛选出取值达到设定阈值的目标评估信息，以及对筛选出的目标评估信息对应的多媒体文件进行推荐。

例如，对于包含300个多媒体文件的候选多媒体文件集合2，对应可以生成300条待测试特征，推荐模型完成处理后可以得到与所述300个多媒体文件分别对应的目标评估信息。设定阈值为70分，将所述目标评估信息分别与设定阈值进行比较后发现有100个达到所述设定阈值的目标评估信息，则将所述100个达到设定阈值的目标评估信息筛选出来，并对筛选出的目标评估信息对应的多媒体文件进行推荐。

这样，可以根据实际的筛选需要筛选出要进行推荐的多媒体文件，一方面，可以以推荐的数量为考量依据，推荐出排序最高的一定数量的多媒体文件进行推荐，另一方面，可以筛选出目标评估信息达到设定阈值的多媒体文件进行推荐，保证了推荐的多媒体文件的质量，最大可能的推荐能够实现最大化真实评估信息的多媒体文件。

进一步的，完成多媒体文件的推荐之后，确定被推荐的各个多媒体文件对应的真实评估信息，其中，一个被推荐的多媒体文件对应的真实评估信息，是基于所述账户对所述一个被推荐的多媒体文件执行的实际操作产生的，然后，分别将各个被推荐的多媒体文件对应的真实评估信息，与相应的目标评估信息进行对比，其中，每比对一次，确定一条真实评估信息与相应的一条目标评估信息的差值达到预设门限值时，确定所述一条目标评估信息对应的一条待测试特征，采用加权对数损失函数，分别调整所述推荐模型中对应所述一条待测试特征包含的各个参量设置的权重。具体的调整过程与步骤107中描述的相同，在此不再赘述。

例如，设置目标评估信息与真实评估信息之间的差值的预设门限值为10分，对于多媒体文件N，对应生成的待测试特征n，对应所述待测试特征n中包含的参量1，设置的权重数值为1；参量2，设置的权重数值为20；参量3，设置的权重数值为60，推荐模型对所述待测试特征n进行分域离散化处理后并解析后，输出对应所述多媒体文件N的目标评估信息为81，所述媒体文件N被推荐给账户N后，基于所述账户N的真实操作行为，得到所述账户N的真实评估信息为60分，所述真实评估信息与所述目标评估信息的差值超过了所述预设门限值，则基于加权对数损失函数，对参量1、参量2、参量3的权重数值进行调整，如，调整后的权重数值为参量1，设置的权重数值为1.2；参量2，设置的权重数值为30；参量3，设置的权重数值为80。

同时，在实际应用中，若希望基于某一参量获取最大的真实评估信息，那么，可以基于加权对数损失函数，增加推荐模型中对应所述某一参量设置的权重；若希望减小某一参量对于实际得到的真实评估信息的影响，则可以减少推荐模型中对应所述某一参量设置的权重。

例如，对于某一视频文件，对于参量预估点击概率设置的权重为1，对于参量预估点赞概率设置的权重为60，对于参量预估关注概率设置的权重为80，若希望基于预估点赞概率获取最大收益(真实评估信息)，则适当增加所述对于参量预估点赞概率设置的权重，如，可增加至70，若希望减小预估关注概率对于实际得到的真实评估信息的影响，则可以减少推荐模型中所述对于参量预估关注概率设置的权重，如，可减小至75。

这样，能够基于实际情况灵活的配置推荐模型，而且能够实现对推荐模型的实时调整，一旦发现基于一条待测试特征输出的目标评估信息与真实评估信息差距较大，马上对所述推荐模型中对应一条待测试特征包含的各个参量设置的权重进行调整，增强了模型的实时性，保证了推荐模型的准确性，通过所述推荐模型，可以向所述账户推荐能够得到最大化真实评估信息，以及能够获取所述账户最多操作的多媒体文件。

基于上述实施例，参阅图3所示，本申请实施例中，多媒体文件的推荐装置300至少包括：

获取单元301，响应于账户发送的多媒体文件推荐请求，获取候选多媒体文件集合；

生成单元302，确定所述账户对所述候选多媒体文件集合中各个多媒体文件的预估操作概率，并至少基于获得的各个预估操作概率，生成所述各个多媒体文件的待测试特征，其中，每条待测试特征中包含有所述账户以及相应的一个多媒体文件的特征描述信息；

处理单元303，调用预设的推荐模型对获得的各个待测试特征进行处理，获得相应的各个多媒体文件的目标评估信息，所述推荐模型是基于样本多媒体文件，采用深度神经网络进行训练获得的，其中，在训练过程中，采用加权对数损失函数，对基于样本多媒体文件获得的样本待测试特征中的，各个参量的权重进行调整，所述目标评估信息用于表征向所述账户推荐相应的多媒体文件时，所述账户对所述多媒体文件的预估操作行为；

推荐单元304，基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐。

可选的，所述确定所述账户对所述候选多媒体文件集合中各个多媒体文件的预估操作概率，并至少基于获得的各个预估操作概率，生成所述各个多媒体文件的待测试特征时，所述生成单元302用于：

可选的，响应于账户发送的多媒体文件推荐请求之前，所述装置进一步包括训练单元305：采用深度神经网络对推荐模型进行训练；所述训练单元305具体用于：

采用深度神经网络架构，搭建初始的推荐模型；

可选的，所述基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐时，所述推荐单元304用于：

可选的，所述筛选出符合预设条件的多媒体文件进行推荐之后，所述推荐单元304进一步用于：

基于同一发明构思，参阅图4所示，本申请实施例示出的一种多媒体文件的推荐设备(如，服务器或客户端)，以下称为装置400，如图4所示，装置400包括处理组件422，其进一步包括一个或多个处理器，以及由存储器432所代表的存储器资源，用于存储可由处理组件422的执行的指令，例如应用程序。存储器432中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件422被配置为读取指令，执行以下操作：

响应于账户发送的多媒体文件推荐请求，获取候选多媒体文件集合；

可选的，所述确定所述账户对所述候选多媒体文件集合中各个多媒体文件的预估操作概率，并至少基于获得的各个预估操作概率，生成所述各个多媒体文件的待测试特征时，所述处理组件422用于：

可选的，响应于账户发送的多媒体文件推荐请求之前，所述处理组件422进一步用于：采用深度神经网络对推荐模型进行训练；所述处理组件422具体用于：

采用深度神经网络架构，搭建初始的推荐模型；

可选的，所述基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐时，所述处理组件422用于：

可选的，所述筛选出符合预设条件的多媒体文件进行推荐之后，所述处理组件422进一步用于：

装置400还可以包括一个电源组件426被配置为执行装置400的电源管理，一个有线或无线网络接口450被配置为将装置400连接到网络，和一个输入输出(I/O)接口458。装置400可以操作基于存储在存储器432的操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

基于同一发明构思，本申请实施例中提供一种存储介质，例如包括指令的存储器432，上述指令可由装置400的处理组件422执行以完成上述本申请实施例中的任一项方法。可选地，存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

综上所述，本申请实施例中，响应于账户发送的多媒体文件推荐请求，获取候选多媒体文件集合，针对所述多媒体文件集合中的各个多媒体文件生成各个待测试特征，再调用采用深度神经网络训练获得的推荐模型对获得的各个待测试特征进行处理，获得相应的各个多媒体文件的目标评估信息，基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐。这样，通过使用推荐模型，提高了输出的准确性，而且得到的目标评估信息能够有效的表征所述账户对于相应的多媒体文件的真实评估信息，可以向账户推荐能够获取所述账户最多操作的多媒体文件。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样，倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种多媒体文件的推荐方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述确定所述账户对所述候选多媒体文件集合中各个多媒体文件的预估操作概率，并至少基于获得的各个预估操作概率，生成所述各个多媒体文件的待测试特征，包括：

3.如权利要求2所述的方法，其特征在于，响应于账户发送的多媒体文件推荐请求之前，进一步包括：采用深度神经网络对推荐模型进行训练；具体包括：

采用深度神经网络架构，搭建初始的推荐模型；

4.如权利要求1-3任一项所述的方法，其特征在于，所述基于获得的各个目标评估信息，筛选出符合预设条件的多媒体文件进行推荐，包括：

5.如权利要求1-3任一项所述的方法，其特征在于，所述筛选出符合预设条件的多媒体文件进行推荐之后，进一步包括：

6.一种多媒体文件的推荐装置，其特征在于，包括：

7.如权利要求6所述的装置，其特征在于，所述确定所述账户对所述候选多媒体文件集合中各个多媒体文件的预估操作概率，并至少基于获得的各个预估操作概率，生成所述各个多媒体文件的待测试特征时，所述生成单元用于：

8.如权利要求7所述的装置，其特征在于，响应于账户发送的多媒体文件推荐请求之前，所述装置进一步包括训练单元：采用深度神经网络对推荐模型进行训练；所述训练单元具体用于：

采用深度神经网络架构，搭建初始的推荐模型；

9.一种电子设备，其特征在于，包括：

存储器，用于存储可执行指令；

处理器，用于读取并执行存储器中存储的可执行指令，以实现如权利要求1至5中任一项所述的多媒体文件的推荐方法。

10.一种存储介质，其特征在于，当所述存储介质中的指令由处理器执行时，使得能够执行如权利要求1至5中任一项所述的多媒体文件推荐方法。