CN109829063A

CN109829063A - 一种数据处理方法、装置及存储介质

Info

Publication number: CN109829063A
Application number: CN201910086094.1A
Authority: CN
Inventors: 梁超; 崔瑞; 李天浩
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Shenzhen Yayue Technology Co ltd
Priority date: 2019-01-29
Filing date: 2019-01-29
Publication date: 2019-05-31
Anticipated expiration: 2039-01-29
Also published as: CN109829063B

Abstract

本发明实施例公开一种数据处理方法、装置及存储介质，其中，方法包括：当向第一用户推荐多个第一多媒体数据时，记录每个第一多媒体数据与所述第一用户之间的数据推送关系，并基于每个数据推送关系以及每个第一多媒体数据携带的目标字符串，确定第一报表信息；当检测到多个第一多媒体数据中的目标多媒体数据对应的触发指令时，根据触发指令记录第一用户与所述目标多媒体数据之间的数据触发关系，并基于数据触发关系以及目标多媒体数据携带的目标字符串，确定第二报表信息；基于第一报表信息、第二报表信息，获取训练样本集，并基于训练样本集对历史预测模型进行训练，得到目标预测模型。采用本发明，可以确保模型训练的准确性。

Description

一种数据处理方法、装置及存储介质

技术领域

本发明涉及互联网技术领域，尤其涉及一种数据处理方法、装置及存储介质。

背景技术

现有的推荐系统通常具有候选集生成模块和点击率预估模块，其中，点击率预估模块可以用于预估用户点击一个内容的概率，即可以通过在线预测的方式得到该内容对应的内容点击率。

其中，内容点击率的影响因素可以包括用户的喜好、不同用户对某个内容的点击率、展现形式、内容素材等特征，因此，当这些特征的特征值产生变化时，比如，一个视频的内容素材(如标题)或者点击率产生变化时，会导致该在线预测所采用的特征(在线预测时所采用的特征可以称之为在线特征)和后续对模型进行离线训练所采用的特征(模型训练时所采用的特征可以称之为离线特征)不一致，进而无法确保模型训练的准确性，以至于无法准确筛选出符合用户喜好的内容。

发明内容

本发明实施例提供一种数据处理方法、装置及存储介质，可以确保在线特征和离线特征的一致性，进而可以确保模型训练的准确性。

本发明实施例一方面提供了一种数据处理方法，所述方法应用于应用服务器，包括：

当向第一用户推荐多个第一多媒体数据时，记录每个第一多媒体数据与所述第一用户之间的数据推送关系，并基于每个数据推送关系以及所述每个第一多媒体数据携带的目标字符串，确定第一报表信息；所述每个目标字符串为表征目标时刻下的所述第一用户和相应第一多媒体数据的字符串；

当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时，根据所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于所述数据触发关系以及所述目标多媒体数据携带的目标字符串，确定第二报表信息；

基于所述第一报表信息、所述第二报表信息，获取训练样本集，并基于所述训练样本集对历史预测模型进行训练，得到目标预测模型；所述目标预测模型用于预测第二用户对所述目标多媒体数据执行触发操作的概率。

其中，所述方法还包括：

将所有注册用户中每个注册用户的用户注册特征、用户历史行为特征分别确定为所述每个注册用户的用户状态特征；

当检测到针对所有注册用户中的第一用户与目标应用所对应的数据点击指令；

基于所述数据点击指令在多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的待推荐多媒体数据；

将筛选出的所有待推荐多媒体数据确定为第一多媒体数据，并将每个第一多媒体数据推荐给所述第一用户。

其中，所述基于所述数据点击指令在多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的待推荐多媒体数据，包括：

基于所述数据点击指令从多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的多媒体数据添加至第一候选数据集，并将所述第一候选数据集中每个多媒体数据分别确定为第二媒体数据；

基于历史预测模型、每个第二多媒体数据的物品特征以及所述第一用户的用户状态特征，对所述每个第二多媒体数据进行预测，得到所述每个第二多媒体数据对应的第一预测概率；

从所述第一候选数据集中选择第一预测概率大于第一推荐阈值的第二多媒体数据，确定为与所述第一用户的用户状态特征相匹配的待推荐多媒体数据。

其中，所述目标时刻是指生成所述第一候选数据集的时刻；

所述从所述第一候选数据集中选择第一预测概率大于第一推荐阈值的第二多媒体数据，确定为与所述第一用户的用户状态特征相匹配的待推荐多媒体数据，包括：

获取所述每个第二多媒体数据的物品特征，并基于特征映射规则对所述第一用户的用户状态特征以及所述每个第二多媒体数据的物品特征进行编码，得到所述每个第二多媒体数据对应的编码字符串；

根据所述每个第二多媒体数据对应的第一预测概率，从所述第一候选数据集中选择第一预测概率大于第一推荐阈值的第二多媒体数据，确定为第三多媒体数据；

获取所述历史预测模型对应的版本信息，并将所述版本信息分别与所述第三多媒体数据对应的编码字符串进行组合，并将组合后的编码字符串确定为目标字符串；

将每个携带目标字符串的第三多媒体数据，分别确定为与所述第一用户的用户状态特征相匹配的待推荐多媒体数据。

其中，所述将筛选出的所有待推荐多媒体数据分别作为第一多媒体数据，并将每个第一多媒体数据推荐给所述第一用户，包括：

将筛选出的所有待推荐多媒体数据添加至第二候选数据集，并在所述第二候选数据集中获取每个待推荐多媒体数据的关联属性特征，并基于所述关联属性特征、目标推荐模型，对所述每个待推荐多媒体数据进行预测，得到所述每个待推荐多媒体数据对应的第二预测概率；

从所述第二候选数据集中筛选第二预测概率大于第二推荐阈值的待推荐多媒体数据，作为与所述第一用户的用户状态特征相匹配的第一多媒体数据，并将筛选出的每个第一多媒体数据推荐给所述第一用户。

其中，所述从所述第二候选数据集中筛选第二预测概率大于第二推荐阈值的待推荐多媒体数据，作为与所述第一用户的用户状态特征相匹配的第一多媒体数据，并将筛选出的每个第一多媒体数据推荐给所述第一用户，包括：

将从所述第二候选数据集中筛选出的第二预测概率大于第二推荐阈值的待推荐多媒体数据，确定为第四多媒体数据；

为所述第四多媒体数据分配物品标识信息，并为所述第一用户分配用户标识信息，并基于所述第一用户的用户标识信息以及所述第四多媒体数据的物品标识信息，确定所述第四多媒体数据的目标标识信息；

将所述目标标识信息与所述第四多媒体数据对应的目标字符串进行关联，并将关联后的每个第四多媒体数据均确定为第一多媒体数据，并将所述多个第一多媒体数据推荐给所述第一用户。

其中，所述当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时，根据所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于所述数据触发关系以及所述目标多媒体数据携带的目标字符串，确定第二报表信息，包括：

当检测到所述第一用户与所述多个第一多媒体数据中的目标多媒体数据之间存在触发操作时，接收所述第一用户对应的第一终端基于所述触发操作发送的触发指令；

基于所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于记录到的数据触发关系获取所述目标多媒体数据携带的目标字符串；

基于所述数据触发关系、以及所述目标多媒体数据携带的目标字符串确定第二报表信息。

其中，所述基于所述第一报表信息、所述第二报表信息，获取训练样本集，包括：

获取所述第一报表信息中与每个数据推送关系对应的目标字符串作为第一字符串，并获取所述每个第一多媒体数据关联的目标标识信息；每个第一字符串包括对相应数据推送关系所关联的第一用户的用户状态特征与所述每个第一多媒体数据的物品特征进行编码后所得到的字符；

获取所述第二报表信息中的目标字符串作为第二字符串，并基于所述触发指令获取目标多媒体数据关联的目标标识信息；所述第二字符串为对相应数据触发关系所关联的第一用户的用户状态特征与所述目标多媒体数据的物品特征进行编码后所得到的字符；

基于所述目标多媒体数据关联的目标标识信息，在所述第二报表信息中确定所述第二字符串对应的目标标识信息，并基于所述第二字符串对应的目标标识信息，在所述第一报表信息中将具有相同目标标识信息的第一字符串作为正样本信息；

基于所述正样本信息的数量在所述第一报表信息中获取负样本信息，并基于所述正样本信息和所述负样本信息确定历史预测模型对应的训练样本集。

其中，所述基于所述训练样本集对历史预测模型进行训练，得到目标预测模型，包括：

获取所述多个第一多媒体数据对应的历史预测模型，并获取所述训练样本集中的正样本信息和负样本信息；

基于特征映射规则分别对所述正样本信息中携带的目标字符串以及所述负样本信息所携带的目标字符串进行解码，得到所述第一用户的用户状态特征和所述多个第一多媒体数据的物品特征；

基于所述第一用户的用户状态特征和每个第一多媒体数据的物品特征，对所述历史预测模型进行训练，并将训练后的历史预测模型确定为目标预测模型。

其中，所述方法还包括：

当将所述多个第一多媒体数据发送给所述第二用户时，基于记录到的所述第二用户与所述多个第一多媒体之间的数据推送关系确定每个数据推送关系对应的第三字符串，并将所述每个数据推送关系对应的第三字符串录入所述第一报表信息，得到更新后的第一报表信息；

当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时，基于所述触发指令确定所述第二用户与所述目标多媒体之间的数据触发关系，并确定所述数据触发关系对应的第四字符串，并将所述数据触发关系对应的第四字符串录入所述第二报表信息，得到更新后的第二报表信息；

基于所述更新后的第一报表信息和所述更新后的第二报表信息，更新所述目标预测模型。

本发明实施例一方面提供了一种数据处理装置，所述装置应用于应用服务器，包括：

第一报表确定模块，用于当向第一用户推荐多个第一多媒体数据时，记录每个第一多媒体数据与所述第一用户之间的数据推送关系，并基于每个数据推送关系以及所述每个第一多媒体数据携带的目标字符串，确定第一报表信息；所述每个目标字符串为表征目标时刻下的所述第一用户和相应第一多媒体数据的字符串；

第二报表确定模块，用于当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时，根据所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于所述数据触发关系以及所述目标多媒体数据携带的目标字符串，确定第二报表信息；

样本获取模块，用于基于所述第一报表信息、所述第二报表信息，获取训练样本集；

模型训练模块，用于基于所述训练样本集对历史预测模型进行训练，得到目标预测模型；所述目标预测模型用于预测第二用户对所述目标多媒体数据执行触发操作的概率。

其中，所述装置还包括：

状态特征获取模块，用于将所有注册用户中每个注册用户的用户注册特征、用户历史行为特征分别确定为所述每个注册用户的用户状态特征；

指令检测模块，用于当检测到针对所有注册用户中的第一用户与目标应用所对应的数据点击指令；

数据筛选模块，用于基于所述数据点击指令在多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的待推荐多媒体数据；

推荐模块，用于将筛选出的所有待推荐多媒体数据确定为第一多媒体数据，并将每个第一多媒体数据推荐给所述第一用户。

其中，所述数据筛选模块包括：

数据筛选单元，用于基于所述数据点击指令从多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的多媒体数据添加至第一候选数据集，并将所述第一候选数据集中每个多媒体数据分别确定为第二媒体数据；

第一预测单元，用于基于历史预测模型、每个第二多媒体数据的物品特征以及所述第一用户的用户状态特征，对所述每个第二多媒体数据进行预测，得到所述每个第二多媒体数据对应的第一预测概率；

待推荐单元，用于从所述第一候选数据集中选择第一预测概率大于第一推荐阈值的第二多媒体数据，确定为与所述第一用户的用户状态特征相匹配的待推荐多媒体数据。

其中，所述目标时刻是指生成所述第一候选数据集的时刻；

所述待推荐单元包括：

特征编码子单元，用于获取所述每个第二多媒体数据的物品特征，并基于特征映射规则对所述第一用户的用户状态特征以及所述每个第二多媒体数据的物品特征进行编码，得到所述每个第二多媒体数据对应的编码字符串；

选择确定子单元，用于根据所述每个第二多媒体数据对应的第一预测概率，从所述第一候选数据集中选择第一预测概率大于第一推荐阈值的第二多媒体数据，确定为第三多媒体数据；

组合子单元，用于获取所述历史预测模型对应的版本信息，并将所述版本信息分别与所述第三多媒体数据对应的编码字符串进行组合，并将组合后的编码字符串确定为目标字符串；

待推荐子单元，用于将每个携带目标字符串的第三多媒体数据，分别确定为与所述第一用户的用户状态特征相匹配的待推荐多媒体数据。

其中，所述推荐模块包括：

第二预测单元，用于将筛选出的所有待推荐多媒体数据添加至第二候选数据集，并在所述第二候选数据集中获取每个待推荐多媒体数据的关联属性特征，并基于所述关联属性特征、目标推荐模型，对所述每个待推荐多媒体数据进行预测，得到所述每个待推荐多媒体数据对应的第二预测概率；

筛选推荐单元，用于从所述第二候选数据集中筛选第二预测概率大于第二推荐阈值的待推荐多媒体数据，作为与所述第一用户的用户状态特征相匹配的第一多媒体数据，并将筛选出的每个第一多媒体数据推荐给所述第一用户。

其中，所述筛选推荐单元包括：

筛选确定子单元，用于将从所述第二候选数据集中筛选出的第二预测概率大于第二推荐阈值的待推荐多媒体数据，确定为第四多媒体数据；

标识分配子单元，用于为所述第四多媒体数据分配物品标识信息，并为所述第一用户分配用户标识信息，并基于所述第一用户的用户标识信息以及所述第四多媒体数据的物品标识信息，确定所述第四多媒体数据的目标标识信息；

数据推荐子单元，用于将所述目标标识信息与所述第四多媒体数据对应的目标字符串进行关联，并将关联后的每个第四多媒体数据均确定为第一多媒体数据，并将所述多个第一多媒体数据推荐给所述第一用户。

其中，所述第二报表确定模块包括：

指令接收单元，用于当检测到所述第一用户与所述多个第一多媒体数据中的目标多媒体数据之间存在触发操作时，接收所述第一用户对应的第一终端基于所述触发操作发送的触发指令；

字符串获取单元，用于基于所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于记录到的数据触发关系获取所述目标多媒体数据携带的目标字符串；

报表确定单元，用于基于所述数据触发关系、以及所述目标多媒体数据携带的目标字符串确定第二报表信息。

其中，所述样本获取模块包括：

第一字符串确定单元，用于获取所述第一报表信息中与每个数据推送关系对应的目标字符串作为第一字符串，并获取所述每个第一多媒体数据关联的目标标识信息；每个第一字符串包括对相应数据推送关系所关联的第一用户的用户状态特征与所述每个第一多媒体数据的物品特征进行编码后所得到的字符；

第二字符串确定单元，用于获取所述第二报表信息中的目标字符串作为第二字符串，并基于所述触发指令获取目标多媒体数据关联的目标标识信息；所述第二字符串为对相应数据触发关系所关联的第一用户的用户状态特征与所述目标多媒体数据的物品特征进行编码后所得到的字符；

正样本确定单元，用于基于所述目标多媒体数据关联的目标标识信息，在所述第二报表信息中确定所述第二字符串对应的目标标识信息，并基于所述第二字符串对应的目标标识信息，在所述第一报表信息中将具有相同目标标识信息的第一字符串作为正样本信息；

负样本确定单元，用于基于所述正样本信息的数量在所述第一报表信息中获取负样本信息，并基于所述正样本信息和所述负样本信息确定历史预测模型对应的训练样本集。

其中，所述模型训练模块包括：

历史模型获取单元，用于获取所述多个第一多媒体数据对应的历史预测模型，并获取所述训练样本集中的正样本信息和负样本信息；

字符串解码单元，用于基于特征映射规则分别对所述正样本信息中携带的目标字符串以及所述负样本信息所携带的目标字符串进行解码，得到所述第一用户的用户状态特征和所述多个第一多媒体数据的物品特征；

目标模型确定单元，用于基于所述第一用户的用户状态特征和每个第一多媒体数据的物品特征，对所述历史预测模型进行训练，并将训练后的历史预测模型确定为目标预测模型。

其中，所述模型训练模块还包括：

报表更新单元，用于当将所述多个第一多媒体数据发送给所述第二用户时，基于记录到的所述第二用户与所述多个第一多媒体之间的数据推送关系确定每个数据推送关系对应的第三字符串，并将所述每个数据推送关系对应的第三字符串录入所述第一报表信息，得到更新后的第一报表信息；

所述报表更新单元，还用于当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时，基于所述触发指令确定所述第二用户与所述目标多媒体之间的数据触发关系，并确定所述数据触发关系对应的第四字符串，并将所述数据触发关系对应的第四字符串录入所述第二报表信息，得到更新后的第二报表信息；

模型更新单元，用于基于所述更新后的第一报表信息和所述更新后的第二报表信息，更新所述目标预测模型。

本发明实施例一方面提供了一种数据处理装置，所述装置应用于应用服务器，所述装置包括：处理器、存储器以及网络接口；

所述处理器与存储器、网络接口相连，其中，网络接口用于提供数据通信功能，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行以下操作：

本发明实施例一方面提供了一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，当所述处理器执行所述程序指令时执行如本发明实施例一方面中的方法。

在本发明实施例中，通过对每个第一多媒体数据的物品特征和第一用户的用户状态特征进行编码，可以得到每个第一多媒体数据对应的编码字符串，进而可以基于得到的编码字符串和历史预测模型的版本信息得到目标字符串，从而可以使得向第一用户推荐的每个第一多媒体数据中均会携带有相应的目标字符串，此时，可以基于每个数据推送关系将每个字符串确定出第一报表信息，比如，可以将每个数据推送关系对应的目标字符串录入第一报表信息，换言之，该第一报表信息中的每个字符串用于记录每个第一多媒体数据的曝光行为。可以理解的是，每个第一多媒体数据中所携带的目标字符串是不同的，因此，当第一用户对携带目标字符串的目标多媒体数据执行触发操作时，可以接收到该触发操作对应的触发指令，进而可以基于该触发指令确定出数据触发关系，从而可以基于该数据触发关系以及该目标多媒体数据携带的目标字符串，确定出第二报表信息，该第二报表信息中的目标字符串用于记录第一用户对该目标多媒体数据所执行的播放行为。进一步地，可以基于每个第一多媒体所关联的第一报表信息和目标多媒体数据所关联的第二报表信息，确定出用于对历史预测模型进行训练的训练样本。应当理解，这些训练样本中的每个目标字符串所表征的特征为某个固定时刻所得到的用户状态特征和物品特征，通过对这些特征进行编码，使得这些特征的特征值并不会产生变化，因此，在用这些特征对历史预测模型进行训练的过程中，可以将各目标字符串所表征的特征还原出来，进而可以使得离线训练时所采用样本数据的离线特征和在线预测时所采用的在线特征是同一时刻下所获得的特征，从而可以确保模型训练的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种网络架构的结构示意图；

图2是本发明实施例提供的一种获取第一多媒体数据的示意图；

图3是本发明实施例提供的一种数据处理方法的流程示意图；

图4是本发明实施例提供的一种数据推送关系的示意图；

图5是本发明实施例提供的一种第一报表信息的示意图；

图6是本发明实施例提供的一种确定第二报表信息的示意图；

图7是本发明实施例提供的一种获取训练样本集的示意图；

图8是本发明实施例提供的另一种数据处理方法的流程示意图；

图9是本发明实施例提供的一种启动目标应用的示意图；

图10是本发明实施例提供的一种获取待待推荐多媒体多媒体数据的框架图；

图11是本发明实施例提供的一种获取第一多媒体数据的框架图；

图12是本发明实施例提供的一种数据处理装置的结构示意图；

图13是本发明实施例提供的另一种数据处理装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参见图1，是本发明实施例提供的一种网络架构的结构示意图。如图1所示，所述网络架构可以包括应用服务器2000和用户终端集群，所述用户终端集群可以包括多个用户终端，如图1所示，具体可以包括用户终端3000a、用户终端3000b、用户终端3000c、…、用户终端3000n；如图1所示，用户终端3000a、用户终端3000b、用户终端3000c、…、用户终端3000n可以分别与所述应用服务器2000进行网络连接，以便于每个用户终端可以通过该网络连接与应用服务器2000之间进行数据交互。

如图1所示，该用户终端集群中的每个用户终端均可以通过该目标应用对应的多媒体展示平台与所述应用服务器2000之间实现用户数据交互，例如，在该用户终端集群中，当所有注册用户中存在用户A通过该用户终端3000a中的目标应用向多媒体推荐系统请求多媒体数据，即该用户A与目标应用之间存在数据点击操作时，与该多媒体推荐系统对应的应用服务器2000可以接收该用户终端3000a发送数据点击指令，并可以从该数据点击指令中提取出该用户A的用户状态特征(例如，年龄20等特征)，进而可以从该多媒体推荐系统对应的多媒体数据库中筛选出与该用户状态特征相符的多媒体数据，作为第一多媒体数据，进而可以将该第一多媒体数据返回给用户终端3000a，以使该用户终端3000a可以在终端屏幕上向该用户A展示该接收到的第一多媒体数据。

其中，在图1所示的用户终端集群中发送上述数据点击指令的用户终端3000a可以称之为第一终端，所以，可以在所有注册用户中将与目标应用之间存在数据点击操作的用户A称之为第一用户。其中，该第一用户可以为即将登录或已登录该目标应用的注册用户。可以理解的是，若该第一用户为即将登录该目标应用的注册用户，则该数据点击指令可以为针对该目标应用的点击加载指令，比如，以该目标应用为视频播放应用为例，则该第一用户可以在触发该目标应用登录该目标应用时通过该第一终端向目标应用对应的应用服务器2000发送的该点击加载指令，从而可以使该应用服务器2000基于该点击加载指令从数据库中筛选出与该点击加载指令中所携带的用户状态特征相符的视频数据，作为第一多媒体数据返回给第一终端。可选地，若该第一用户为已登录该目标应用的注册用户，则该数据点击指令可以为针对该目标应用的数据筛选指令，比如，仍以该目标应用为视频播放应用为例，则该第一用户可以在该目标应用中，针对该目标应用的分类项目中的某个项目(例如，第一项目)执行数据点击操作，使得该第一终端可以基于该第一项目对应的数据点击操作生成上述数据筛选指令，并向该目标应用对应的应用服务器2000发送该数据筛选指令，从而可以使该应用服务器2000基于该数据筛选指令从数据库中筛选出与该数据筛选指令中所携带的用户状态特征相符的视频数据，作为第一多媒体数据返回给第一终端。

为便于理解，进一步地，请参见图2，是本发明实施例提供的一种获取第一多媒体数据的示意图。如图2所示的第一用户可以为上述用户终端集群中的即将接入该目标应用的任意一个用户终端所对应的注册用户；可选地，该第一用户也可以为上述用户终端集群中已登录该目标应用且与该目标应用之间存在数据点击操作的注册用户，此时该第一用户可以理解为在线用户。如图2所示，当第一用户与目标应用之间存在图2所示的数据点击操作时，则图2所示的第一终端则可以基于该数据点击操作生成图2所示的数据点击指令，并可以将该数据点击指令发送给图2所示的应用服务器2000。进一步地，该应用服务器2000可以在接收到该数据点击指令时，从该数据点击指令中获取图2所示的第一用户的用户状态特征，该用户状态特征可以包含用户注册特征和用户历史行为特征，鉴于此，该应用服务器2000可以基于该用户状态特征从图2所示的多媒体数据库中筛选与该第一用户的用户状态特征相符的多媒体数据作为第一多媒体数据，并可以将筛选出的第一多媒体数据推荐给图2所示的第一用户，换言之，该应用服务器2000可以将筛选出的第一多媒体数据返回给该第一用户对应的第一终端，以使该第一终端可以将接收到的多个多媒体数据进行展示。

其中，在本发明实施例中从多媒体数据库中筛选出图2所示的多个第一多媒体数据的具体过程可以大致包含粗排序筛选过程和精排序筛选过程。其中，所述粗排序筛选过程可以为：基于第一用户的用户状态特征以及第一候选数据集中每个多媒体数据的物品特征，对确定出的第一候选数据集中的每个多媒体数据进行预测，并根据预测结果筛选出第一预测概率大于第一推荐概率的多媒体数据。其中，所述第一候选数据集中的每个多媒体数据为基于用户的用户状态特征所确定出的。在本发明实施例中可以将得到该第一候选数据集的T时刻称之为目标时刻，因此，在粗排序筛选过程中通过历史预测模型对第一候选数据集中的每个多媒体数据进行预测时所使用的用户状态特征和物品特征则为该目标时刻下的特征。其中，用户状态特征可以包含从用户注册信息和用户历史行为信息中所提取出的特征，比如，用户状态特征可以包含该第一用户的用户年龄(例如，20岁)，用户性别(例如，女)，用户对目标应用中的第一项目的兴趣分(例如，对该目标应用中体育类的分类项目的兴趣分为0.5)，对该分类项目下的第一标签的兴趣分(例如，对体育类下的足球的兴趣为-1)；观看该第一标签所对应的多媒体数据的时间(例如，环境信息为周一上午12点)等特征，这些特征可以用预设的62个字符进行表征。可以理解的是，为确保在线预测所采用的多个第一多媒体数据的在线特征和后续基于这些第一多媒体数据的正负样本信息进行离线训练的的离线特征的一致性，该应用服务器可以在该粗排序筛选过程中同步对第一候选数据集中每个多媒体数据的物品特征和第一用户的用户状态特征进行编码处理，以将编码后所得到的目标字符串添加到通过粗排序筛选过程所确定出的多媒体数据中，以得到与所述第一用户的用户状态特征相匹配的待推荐多媒体数据，并将这些携带目标字符串的待推荐多媒体数据添加至第二候选数据集，从而可以将该第二候选数据集中的每个待推荐多媒体数据给到目标推荐模型，从而可以通过精排序筛选过程从该第二候选数据集中筛选出第二预测概率大于第二推荐阈值的待推荐多媒体数据，作为与所述第一用户的用户状态特征相匹配的第一多媒体数据。

其中，第二候选数据集中的每个待推荐多媒体数据是由粗排序筛选过程中所用户到的历史预测模型所确定出的；且每个待推荐多媒体数据中所携带的目标字符串，是由应用服务器2000对上述用户状态特征和物品特征进行特征离散化、以及编码处理后所得到的编码字符串，与该历史预测模型的版本信息进行组合所所确定的。其中，所述特征离散化处理是指将这些特征的特征值离散化为50个离散值，从而可以基于特征映射关系将这些离散化后的特征值映射为相应的字符，使得后续得到的目标字符串中的每个字符均可以表征一个特征。可以理解的是，基于该特征映射关系可以将每个在线特征用一个字符表示，且对这些特征的特征值进行离散化处理后所得到的离散值不会多余62个，从而使得最后编码得到的目标字符串的长度不超过62个字符。

可以理解的是，每个待推荐多媒体数据均会携带一个固定长度的目标字符串，比如，每个固定长度的目标字符串均由0～9、A～Z、a～z这62个字符按照固定位置进行分布。例如，目标字符串中第一位置上的字符可以用于表征年龄，第二位置上的字符可以用于表征性别等。这里将不对每个位置上的字符的含义进行限定。可以理解的是，在同一应用场景下，这62个位置上的字符的含义应当相同。因此，对于字符串A和字符串B而言，相同位置上的相同字符可以表征具有相同意义的特征，比如，视频1和视频2均为携带相同标签的多媒体数据。同理，相同位置上的不同字符可以表征具有不同意义的特征，比如，视频1和视频3可以为携带不同标签的多媒体数据。

进一步地，该应用服务器2000在将上述筛选出的多个第一多媒体数据(例如，视频A、视频B、视频C)下发给第一用户的过程中，可以根据每个第一多媒体数据与该第一用户之间的数据推送关系、以及每个第一多媒体数据中所携带的目标字符串(例如，视频A的目标字符串为A1，视频B的目标字符串为B1，视频C的目标字符串为C1)，确定第一报表信息，该第一报表信息中可以包含每个第一多媒体数据所携带的目标字符串以及每个目标字符串所关联的目标标识信息(例如，目标字符串A1关联的目标标识信息为1、目标字符串B1关联的目标标识信息为2、目标字符串C1关联的目标标识信息为3)；进一步地，当该第一用户与这些第一多媒体数据中的目标多媒体数据(例如，视频B)之间存在触发操作时，则可以接收该触发操作对应的操作指令，并基于该操作指令记录该目标多媒体数据与第一用户之间的数据触发关系，并基于该数据触发关系以及该目标多媒体数据携带的目标字符串，确定第二报表信息；该第二报表信息中可以目标多媒体数据所携带的目标字符串(例如，A1)以及每个目标字符串关联的目标标识信息。由于应用服务器在将上述视频A、视频B和视频C下发给第一用户之前，会为这些视频分配唯一的物品标识信息，与此同时，也会为该第一用户分配唯一的用户标识信息，并可以将每个物品标识信息和用户标识信息统称为目标标识信息。因此，应用服务器2000可以基于该第一用户对视频B的播放行为，接收该播放行为对应的触发指令，并从触发指令中获取该视频B的目标标识信息，从而可以在第二报表信息中找到该目标字符串作为正样本信息，并可以基于该正样本信息的数量获取负样本信息，从而可以得到对历史预测模型进行训练的训练样本集，通过该训练样本集对历史预测模型进行训练，可以得到目标预测模型，且该目标预测模型可以用于预测第二用户对所述目标多媒体数据执行触发操作的概率。可以理解的是，当在下一目标时刻(例如，T+1时刻)有新的用户(即第二用户)启用该目标应用时，可以将得到的目标预测模型作为新的历史预测模型，并将该新的历史预测模型运用到粗排序筛选过程中，以重复执行上述获取第一多媒体数据的具体过程，以得到新的第一多媒体数据下发给该新的用户。

可以理解的是，通过在上述获取第一多媒体数据的过程中，将第一候选数据库中的每个多媒体数据的物品特征和第一用户的用户状态特征进行编码，得到编码字符串，并通过将编码后的编码字符串与历史预测模型的版本信息进行组合，可以将组合后的编码字符串作为目标字符串，从而可以确保第二候选数据集中每个多媒体数据所携带的目标字符串均为对目标时刻下所得到的特征分别进行编码后所得到的。因此，在后续对历史预测模型进行离线训练时，所用到的训练样本集中的正负样本信息中所携带的目标字符串所表征的离线特征，应当是对第一候选数据集中的每个多媒体数据进行在线预测所使用的在线特征为同一目标时刻下的特征，进而可以确保在线预测和离线训练所使用的特征的一致性，从而可以提高模型训练的准确性。

其中，应用服务器获取多个第一多媒体数据、确定第一报表信息、第二报表信息、以及获得训练样本集的具体过程可以参见如下图3至图11所对应的实施例。

进一步地，请参见图3，是本发明实施例提供的一种数据处理方法的流程示意图。如图3所示，所述方法至少包括：

步骤S101，当向第一用户推荐多个第一多媒体数据时，记录每个第一多媒体数据与所述第一用户之间的数据推送关系，并基于每个数据推送关系以及所述每个第一多媒体数据携带的目标字符串，确定第一报表信息；

其中，所述每个目标字符串为表征目标时刻下的所述第一用户和相应第一多媒体数据的字符串；

可以理解的是，在本发明实施例中第一终端可以在检测到第一用户与目标应用之间存在数据点击操作时，获取该数据点击操作对应的数据点击指令，并将该数据点击指令发送给该目标应用对应的应用服务器，以使该应用服务器可以基于该数据点击指令中携带的第一用户的用户状态特征，在多媒体数据库中初步筛选与该用户状态特征(例如，该第一用户的年龄)具有关联关系的多媒体数据添加至第一候选数据集，并将所述第一候选数据集中每个多媒体数据分别确定为第二媒体数据。进一步地，该应用服务器可以进一步基于上述粗排序筛选过程中的历史预测模型从第一候选数据集中筛选出符合第一推荐条件的第二多媒体数据，确定为第三多媒体数据，与此同时，该应用服务器还可以基于该第二候选数据集中每个第三多媒体数据的物品特征和第一用户的用户状态特征进行编码处理，得到每个第三多媒体数据的编码字符串，并将每个第三多媒体的编码字符串和上述历史预测模型的版本信息进行组合，得到每个第三多媒体数据的目标字符串。进一步地，该应用服务器可以将携带目标字符串的第三多媒体数据添加到第二候选数据集，并将该第二候选数据集中的每个携带目标字符串的第三多媒体数据确定为与所述第一用户的用户状态特征相匹配的待推荐多媒体数据。可选地，该应用服务器还可以直接将上述每个携带目标字符串的第三多媒体数据确定为待推荐多媒体数据，并将每个待推荐多媒体数据添加到第二候选数据集，从而可以将第二候选数据集中的每个待推荐多媒体数据给到上述精排序筛选过程中的目标推荐模型，从而可以从第二候选数据集中筛选出符合第二推荐条件的待推荐多媒体数据作为与该用户状态特征相符的第一多媒体数据，并将筛选出的所有第一多媒体数据分别下发给第一用户对应的第一终端。

其中，上述粗排序筛选过程中的第一推荐条件可以理解为判断由上述历史预测模型对每个第二多媒体数据进行预测后所得到的第一预测概率是否大于第一推荐阈值，若是，则确定满足上述第一推荐条件，反之，可以确定为不满足上述第一推荐条件。

其中，上述静排序筛选过程中的第二推荐条件可以理解为判断由上述目标推荐模型对每个待推荐多媒体数据进行预测后所得到的第二预测概率是否大于第二推荐阈值，若是，则确定满足上述第二推荐条件，反之，可以确定为不满足上述第二推荐条件。其中，每个待推荐多媒体数据为携带目标字符串、且满足上述第一推荐条件的多媒体数据。因此，在将每个待推荐多媒体数据确定为第一多媒体数据时，每个下发给第一用户的第一多媒体数据中也必然携带有上述编码处理后的目标字符串，该目标字符串中的每个字符均表达一个特征，所以，每个目标字符串中的每个字符所表征的特征，可以包含用于表征用户性别、用户年龄、用户对某个物品的兴趣分等用户状态特征，也可以是该物品的分类项目、标签信息等物品特征。

其中，应用服务器可以为上述图1所对应实施例中的应用服务器2000，所述目标应用可以包含集成在第一终端中的社交应用、音频应用、视频应用、娱乐应用等。在该目标应用对应的多媒体展示平台上可以包含多个分类项目，比如，在目标应用中的所述多个分类项目可以包括第一项目、…、第N项目，其中，N为大于等于1的正整数。可以理解的是，与该目标应用具有关联关系的应用服务器中可以存储与这些分类项目相符的多媒体数据。其中，每个分类项目下可以包含多个携带不同标签信息的多媒体数据。比如，以所述多个分类项目中的第一项目为体育类项目为例，该体育类项目下的多媒体数据可以包含以时间标签进行分类的多媒体数据、以竞技标签进行分类的多媒体数据等，换言之，该体育类项目下的时间标签、…、竞技标签则为同一分类项目下的不同标签信息。其中，以竞技标签进行分类的多媒体数据还可以理解为：携带足球标签信息的多媒体数据、携带篮球标签信息的多媒体数据、…、携带排球标签信息的多媒体数据。

可以理解的是，不同分类项目下的不同多媒体数据之间可以携带相同标签，比如，第一分类项目下的视频A和第二分类项目下的视频B之间的标签信息均可以为时间标签，例如，该时间标签可以为2019年。同理，同一分类项目下携带同一标签的多媒体数据还可以为不同多媒体数据，比如，均为第一分类项目下的视频A和视频C之间的标签信息均可以为竞技标签，例如，该竞技标签可以为足球标签。可以理解的是，本发明实施例将不对各分类项目以及每个分类项目下具体的标签信息进行限制，且在本发明实施例中的每个多媒体数据可以称之为一个物品，所以，每个多媒体数据的分类项目以及该分类项目下的标签信息则可以统称为该物品的物品特征，另外，在该目标时刻之前所统计到的每个用户对某个物品的历史点击概率为可以称之为该物品的物品特征。

为便于理解，本发明实施例以目标应用为视频应用为例，当在第一时刻具有相似特征的用户1和用户2向应用服务器请求多媒体数据时，该应用服务器可以为这两个具有相似用户状态特征(例如，年龄都是20岁)的用户1和用户2筛选出多个第一多媒体数据，并可以在第二时刻将筛选出的所述多个第一多媒体数据下发给用户1和用户2。其中，在第一时刻和第二时刻之间可以存在生成上述第一候选数据集的目标时刻。其中，可以理解的是，当数据请求和数据下发的整个过程极为短暂时，对于第一用户而言，可以将第一时刻、目标时刻和第二时刻理解为是同一时刻，从而可以间接反映出该应用服务器可以快速对该第一用户的第一终端所发出的请求进行快速响应，即可以快速从该应用服务器对应的多媒体数据库中筛选出与该第一用户的用户状态特征相符的多媒体数据作为第一多媒体数据，并将其进行下发处理。

为便于理解，本发明实施例以筛选出的多个第一多媒体数据为多媒体数据库中的视频A、视频B和视频C为例，以阐述这三个视频分别与第一用户(该第一用户可以为用户1和用户2两个用户)之间的数据推送关系。为便于理解，进一步地，请参见图4，是本发明实施例提供的一种数据推送关系的示意图。其中，用户1和用户2可以称之为图4所示的第一用户，视频A、视频B和视频C可以称之为图4所示的第一多媒体数据。其中，在本发明实施例中的多个第一多媒体数据中的任意一个第一多媒体数据与任意一个第一用户之间的数据推送关系可以称之为数据下发关系，每个数据下发关系可以用图4所示的箭头所指示的数据信号流的流向表示。如图4所示的关系1和关系2分别表示将携带目标字符串1的视频A和携带目标字符串2的视频B下发给用户A，且目标字符串1不同于目标字符串2。换言之，目标字符串1是基于目标时刻下的视频A的物品特征和用户1的用户状态特征进行编码后，与历史预测模型所对应的版本信息进行组合而确定的；同理，目标字符串2是基于目标时刻下的视频B的物品特征和用户1的用户状态特征进行编码后，与历史预测模型所对应的版本信息进行组合而确定的。

同理，如图4所示的关系3和关系4可以分别表示将携带目标字符串3的视频B和携带目标字符串4的视频C下发给用户2，由于视频B与视频C为不同的视频，所以，这两个第一多媒体数据中所携带的目标字符串3会不同于目标字符串4。同理，可以理解的是，将同一视频B下发给不同的用户(即用户1和用户2)，也必然会导致上述目标字符串2会不同于目标字符串3，这两个用户(即用户1和用户2)虽然具有较多的相似特征，但是这两个用户的用户状态特征并不完全相同，进而会导致返回给用户1和用户2的多个第一多媒体数据也并不完全相同。如图4所示，应用服务器可以将视频A和视频B推荐给用户1，并可以将该视频A和视频B称之为与该用户1对应的多个第一多媒体数据。同理可得，应用服务器可以将视频B和视频C推荐给用户2，并可以将该视频B和视频C称之为用户2对应的多个第一多媒体数据。其中，目标字符串3是基于目标时刻下的视频B的物品特征和用户2的用户状态特征进行编码后，与历史预测模型所对应的版本信息进行组合而确定的；同理，目标字符串4是基于目标时刻下的视频C的物品特征和用户2的用户状态特征进行编码后，与历史预测模型所对应的版本信息进行组合而确定的。

其中，可以理解的是，所述历史预测模型所对应的版本信息可以包含：当前所使用的历史预测模型的模型版本信息，和/或在得到上述物品特征和用户状态特征时为各特征所分配的特征版本信息。所以，通过将这些编码后的特征与这些特征的特征版本信息以及模型版本信息进行组合，可以准确还原得到后续用于对历史预测模型进行训练的目标字符串的特征，从而可以确保在线特征和离线特征的一致性。

为便于理解，进一步地，请参见表1，是本发明实施例提供的一种数据推送关系与目标字符串之间的映射关系。其中，每个数据推送关系可以反映该应用服务器将每个第一多媒体数据下发给第一用户的过程中所记录到的数据下发关系。其中，视频A与用户1之间的数据下发关系可以分别为上述图4所示的关系1、视频B与用户1之间的数据下发关系可以分别为上述图4所示的关系2、视频B与用户2之间的数据下发关系可以分别为上述图4所示的关系3、视频C与用户2之间的数据下发关系可以分别为上述图4所示的关系4。由于表1中的每个第一多媒体数据均携带有对相应的目标字符串，且每个目标字符串均是由对每个第一用户的用户状态特征和相应第一多媒体数据的物品特征进行编码后所确定出的。所以，上述关系1和关系2可以分别表示将携带目标字符串1的视频A和携带目标字符串2的视频B下发给用户1，关系3和关系4可以分别表示将携带目标字符串3的视频B和携带目标字符串4的视频C下发给用户2。

表1

鉴于此，如上述表1所示，视频A与用户1之间的关系1可以表征该应用服务器在将视频A下发给用户1时所记录到的数据推送关系，另外，如上述表1所示，下发给用户1的视频A中携带的目标字符串为目标字符串1，且该应用服务器在将该视频A下发给用户1的过程中，应用服务器还会为用户1分配用户标识信息(比如，用户标识k1)，并为视频A分配物品标识信息(比如，物品标识x1)，进而可以得到该视频A与用户1之间的唯一标识信息，该唯一标识标识信息可以为a1，因此，该应用服务器在将视频A下发给用户1时，会一并将有该物品标识x1与用户标识k1进行整合，以得到能够用于共同表征视频A和用户1之间关系的目标标识信息(例如，a1)。同理，与此同时，视频B与用户1之间的关系2可以表征该应用服务器在将视频B下发给用户1时所记录到的数据推送关系，如上述表1所示，下发给用户1的视频B中携带的目标字符串为目标字符串2，且该应用服务器在将该视频B下发给同一用户(即用户1)的过程中，该应用服务器会基于为用户1所分配用户标识信息(比如，用户标识k1)，以及为视频B分配物品标识信息(比如，物品标识y1)，得到该视频B与用户1之间的唯一标识信息，该唯一标识标识信息可以为b1，因此，该应用服务器在将视频B下发给用户1时，会一并将上述表1中的物品标识y1与用户标识k1进行整合，以得到能够用于共同表征视频B和用户1之间关系的目标标识信息(例如，b1)。鉴于此，该应用服务器可以用目标标识信息(即a1)表征数据下发过程中视频A与用户1之间的数据推送关系(即可以得到图4所示的关系1)，用目标标识信息(即b1)表征数据下发过程中视频B与用户1之间的数据推送关系(即可以得到图4所示的关系2)。

同理可得，如上述表1所示，视频B与用户2之间的关系3可以表征该应用服务器在将视频B下发给用户2时所记录到的数据推送关系，如上述表1所示，下发给用户2的视频B中携带的目标字符串为目标字符串3，且该应用服务器在将该视频B下发给用户2的过程中，应用服务器还会为用户2分配用户标识信息(比如，用户标识k2)，并为视频B分配物品标识信息(比如，物品标识y2，此时，该物品标识y2可以用于与上述分配给用户1的物品标识y2进行区别)，进而可以得到该视频B与用户2之间的唯一标识信息，该唯一标识标识信息可以为b2，因此，该应用服务器在将视频B下发给用户2时，会一并将有该物品标识y2与用户标识k2进行整合，以得到能够用于共同表征视频B和用户2之间关系的目标标识信息(例如，b2)。同理，与此同时，视频C与用户2之间的关系4可以表征该应用服务器在将视频C下发给用户2时所记录到的数据推送关系，如上述表1所示，下发给用户2的视频C中携带的目标字符串为目标字符串4，且该应用服务器在将该视频同步下发给同一用户(即用户2)的过程中，该应用服务器会基于为用户2所分配用户标识信息(比如，用户标识k2)，以及为视频C分配物品标识信息(比如，物品标识z1)，得到该视频C与用户2之间的唯一标识信息，该唯一标识标识信息可以为c1，因此，该应用服务器在将视频C下发给用户2时，会一并将上述表1中的物品标识z1与用户标识k2进行整合，以得到能够用于共同表征视频C和用户2之间关系的目标标识信息(例如，c1)。鉴于此，该应用服务器可以用目标标识信息(即b2)表征数据下发过程中视频B与用户2之间的数据推送关系(即可以得到图4所示的关系3)，用目标标识信息(即c1)表征数据下发过程中视频C与用户2之间的数据推送关系(即可以得到图4所示的关系4)。

可以理解的是，在本发明实施例中，可以将同一时刻向上述应用服务器发送的数据点击指令的每个注册用户统称为第一用户。换言之，该应用服务器可以在上述第一时刻接收各第一用户通过相应第一终端所发送的数据点击指令。比如，上述用户1对应的第一终端可以为上述图1所对应实施例中的用户终端3000a，上述用户2对应的第一终端可以为上述图1所对应实施例中的用户终端3000b。所以，用户终端3000a可以接收上述应用服务器基于接收到的数据点击指令所下发的多个第一多媒体数据(即上述图4所对应实施例中的视频A和视频B)。同理，用户终端3000b可以接收上述应用服务器基于接收到的另一数据点击指令所下发的多个第一多媒体数据(即上述图4所对应实施例中的视频B和视频C)。

进一步地，该应用服务器可以基于每个数据推送关系以及每个第一多媒体数据中所携带的目标字符串，确定第一报表信息。为便于理解，本发明实施例仍以上述图4所对应实施例中将视频A和视频B下发给用户1，并将视频B和视频C下发给用户2为例。进一步地，请参见图5，是本发明实施例提供的一种第一报表信息的示意图。在图5所对应实施例中，当应用服务器将上述图4所对应实施例中的2个第一多媒体数据分别下发给用户1时，可以记录视频A(第一多媒体数据)与用户1之间的数据推送关系，此时，该数据推送关系可以用图5所示的目标标识信息a1表示，该目标标识信息a1可以用于共同表征为用户1所分配的用户标识信息(即上述表1所对应实施例中的k1)和为视频A所分配的物品标识信息(即上述表1所对应实施例中的x1)。与此同时，该应用服务器可以记录视频B(第一多媒体数据)与用户1之间的数据推送关系，此时，该数据推送关系可以用图5所示的目标标识信息b1表示，该目标标识信息b1可以用于共同表征为用户1所分配的用户标识信息(即上述表1所对应实施例中的k1)和为视频B所分配的物品标识信息(即上述表1所对应实施例中的y1)。另外，如图5所示，当应用服务器将上述图4所对应实施例中的2个第一多媒体数据分别下发给用户2时，可以记录视频B(第一多媒体数据)与用户2之间的数据推送关系，此时，该数据推送关系可以用图5所示的目标标识信息b2表示，该目标标识信息b2可以用于共同表征为用户2所分配的用户标识信息(即上述表1所对应实施例中的k2)和为视频B所分配的物品标识信息(即上述表1所对应实施例中的y2)。与此同时，该应用服务器可以记录视频C(第一多媒体数据)与用户2之间的数据推送关系，此时，该数据推送关系可以用图5所示的目标标识信息c1表示，该目标标识信息c1可以用于共同表征为用户2所分配的用户标识信息(即上述表1所对应实施例中的k2)和为视频C所分配的物品标识信息(即上述表1所对应实施例中的z1)。

应当理解，在应用服务器将上述4个第一多媒体数据分别下发给图5所示的用户1对应的第一终端10和用户2对应的第一终端20的过程中，该应用服务器可以记录上述4个数据推送关系，比如，这4个数据推送关系可以包含图5所示的视频A(第一多媒体数据)与用户1之间的关系1,视频B(第一多媒体数据)与用户1之间的关系2，图5所示的视频B(第一多媒体数据)与用户2之间的关系3,视频C(第一多媒体数据)与用户2之间的关系4。换言之，该应用服务器可以基于这4个数据推送关系、以及每个第一多媒体数据所携带的目标字符串，确定出图5所示的第一报表信息。鉴于此，在如图5所示的第一报表信息中，可以记录上述关系1(即目标标识信息a1)与目标字符串1之间的关联关系，上述关系2(即目标标识信息b1)与目标字符串2之间的关联关系，上述关系3(即目标标识信息b2)与目标字符串3之间的关联关系，以及上述关系4(即目标标识信息c1)与目标字符串4之间的关联关系。

可以理解的是，上述图5中的目标字符串1是由该应用服务器在目标时刻对获取到的视频A的物品特征和用户1的用户状态特征进行编码后所确定出的，同理，上述图5中的目标字符串2是由该应用服务器在目标时刻对获取到的视频B的物品特征和用户1的用户状态特征进行编码后所确定出的，同理，上述图5中的目标字符串3是由该应用服务器在目标时刻对获取到的视频B的物品特征和用户2的用户状态特征进行编码后所确定出的，同理，上述图5中的目标字符串4是由该应用服务器在目标时刻对获取到的视频A的物品特征和用户1的用户状态特征进行编码后所确定出的。

鉴于此，可以理解的是，在对历史预测模型进行训练之前，具有相似用户状态特征的用户1和用户2可以同时向应用服务器请求，并得到上述多个第一多媒体数据(例如，上述图4所对应实施例中的视频A、视频B、视频C)。由于用户1和用户2具有相似用户状态特征，因此，下发给用户1的多个第一多媒体数据和下发给用户2的多个第一多媒体数据之间可以部分相同。例如，以上述图4所对应实施例中将部分相同的视频B(即同一视频)分别下发给不同用户为例，该应用服务器下发给用户1的视频B中所携带的目标字符串2会不同于下发给用户2的视频B中所携带的目标字符串3。可选的，在对历史预测模型进行训练之前，该应用服务器还可以在不同时刻将同一视频(例如，视频A)下发给同一用户(例如，上述用户1)，且在不同时刻将同一视频下发给该第一用户的时间戳不同，故而在不同时刻为该视频A所分配得到的目标标识信息会不相同。鉴于此，在第一报表信息中可以将同一时刻所请求到的多个第一多媒体数据的字符串整理到一个文件夹中，以便于该应用服务器后续可以基于最新得到的文件夹中的各目标字符串(此时，第一报表信息中的每个目标字符串可以称之为第一字符串)对历史预测模型进行训练。可以理解的是，应用服务器在训练得到该历史预测模型时，会为该历史预测模型进行分配一个版本信息，以便于后续在对历史预测模型进行训练后，可以基于该版本信息确定出训练后的历史预测模型的版本信息。

步骤S102，当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时，根据所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于所述数据触发关系以及所述目标多媒体数据携带的目标字符串，确定第二报表信息；

具体地，在检测到所述第一用户与所述多个第一多媒体数据中的目标多媒体数据之间存在触发操作时，该应用服务器可以接收所述第一用户对应的第一终端基于所述触发操作发送的触发指令；进一步地，该应用服务器可以基于所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于记录到的数据触发关系获取所述目标多媒体数据携带的目标字符串；进一步地，该应用服务器可以基于所述数据触发关系、以及所述目标多媒体数据携带的目标字符串确定第二报表信息。

可以理解的是，本发明实施例将不对显示在该第一终端中的多个第一多媒体数据的具体展示形式进行限制，比如，每个终端的屏幕中可以展示接收到的一个或多个第一多媒体数据。本发明实施例仅以显示在上述第一终端10和上述第一终端20中的多个多媒体数据的数量为两个为例，以便于进一步阐释这两个用户与各第一终端中所展示的多个第一多媒体数据之间的关系，若用户1对第一终端10中的两个第一多媒体数据种的任意一个第一多媒体数据执行触发操作1(也可以称之为播放操作)，则该应用服务器可以记录该播放操作1对应的数据触发关系，同理，若用户2对第一终端20中的两个第一多媒体数据种的任意一个第一多媒体数据执行触发操作2(也可以称之为播放操作)，则该应用服务器可以记录该播放操作2对应的数据触发关系。可以理解的是，上述播放操作1和播放操作2可以是在同一时刻下执行的，也可以是在不同时刻下执行的；若是在同一时刻(例如，T3时刻)下执行的，则该应用服务器可以同步记录上述触发操作1对应的数据触发关系和上述触发操作2对应的数据触发关系，反之，若是在不同时刻下执行的(例如，播放操作1是在T3时刻执行的，播放操作2是在T4时刻执行的)，则该应用服务器可以异步记录上述触发操作1对应的数据触发关系以及上述触发操作2对应的数据触发关系。

为便于理解，进一步地，请参见图6，是本发明实施例提供的一种确定第二报表信息的示意图。如图6所示，上述图5所示的应用服务器可以在将上述视频A和视频B下发给用户1对应的第一终端10之后，该第一终端10可以在图6所示的显示界面中显示该视频A和视频B，进一步地，请参见图6所示的第一终端10的示意图。如图6所示，该第一终端10可以在上述T3时刻对图6所述的两个第一多媒体数据中的视频B执行触发操作(即上述播放操作1)，从而可以使图6所示的第一终端基于该播放操作1生成图6所示的触发指令1，并将该触发指令1发送给图6所示的应用服务器，以使该应用服务器可以基于该接收到的触发指令1记录所述用户1与所述目标多媒体数据之间的数据触发关系，并基于该数据触发关系获取所述目标多媒体数据中携带的目标字符串(即上述图5所对应实施例中的目标字符串2)。同理，如图6所示，上述图5所示的应用服务器可以在将上述视频A和视频B下发给用户1对应的第一终端10之后，该第一终端10可以在图6所示的显示界面中显示该视频A和视频B，进一步地，请参见图6所示的第一终端10的示意图。如图6所示，该第一终端20可以在上述T3时刻对图6所述的两个第一多媒体数据中的视频B执行触发操作(即上述播放操作2)，从而可以使图6所示的第一终端基于该播放操作2生成图6所示的触发指令2，并将该触发指令2发送给图6所示的应用服务器，以使该应用服务器可以基于该接收到的触发指令2记录所述用户2与所述目标多媒体数据之间的数据触发关系，并基于该数据触发关系获取目标多媒体数据中携带的目标字符串(即上述图5所对应实施例中的目标字符串3)。进一步地，该应用服务器可以基于每个数据触发关系、以及与每个数据触发关系对应的目标多媒体数据中携带的目标字符串，确定出图6所示的第二报表信息。即图6所述的第二报表信息中的可以包含与播放操作1具有关联关系的目标字符串2以及与该目标字符串2对应的目标标识信息(即b1)，和与播放操作2具有关联关系的目标字符串3以及该目标字符串3对应的目标标识信息(即b2)。

步骤S103，基于所述第一报表信息、所述第二报表信息，获取训练样本集，并基于所述训练样本集对历史预测模型进行训练，得到目标预测模型。

具体地，应用服务器可以获取所述第一报表信息中与每个数据推送关系对应的目标字符串作为第一字符串，并获取所述每个第一多媒体数据关联的目标标识信息；其中，每个第一字符串包括对相应数据推送关系所关联的第一用户的用户状态特征与所述每个第一多媒体数据的物品特征进行编码后所得到的字符；进一步地，该应用服务器可以获取所述第二报表信息中的目标字符串作为第二字符串，并基于所述触发指令获取目标多媒体数据关联的目标标识信息；其中，所述第二字符串为对相应数据触发关系所关联的第一用户的用户状态特征与所述目标多媒体数据的物品特征进行编码后所得到的字符；进一步地，该应用服务器可以基于所述目标多媒体数据关联的目标标识信息，在所述第二报表信息中确定所述第二字符串对应的目标标识信息，并基于所述第二字符串对应的目标标识信息，在所述第一报表信息中将具有相同目标标识信息的第一字符串作为正样本信息；进一步地，该应用服务器可以基于所述正样本信息的数量在所述第一报表信息中获取负样本信息，并基于所述正样本信息和所述负样本信息确定历史预测模型对应的训练样本集，进一步地，该应用服务器可以基于所述训练样本集对历史预测模型进行训练，得到目标预测模型。

为便于理解，进一步地，请参见图7，是本发明实施例提供的一种获取训练样本集的示意图。如图7所示，该应用服务器可以基于上述图5所得到的第一报表信息，从该第一报表信息中获取与每个数据推送关系对应的目标字符串作为第一字符串。换言之，在对历史预测模型进行训练之间，即该应用服务器在确定当前时刻未达到模型训练时长时，为上述用户1和用户2筛选出上述视频A、视频B和视频C，并按照上述图4所对应实施例之间的数据下发关系分别将该视频A和视频B下发给用户1，并同步将视频B和视频C下发给用户2，从而可以在上述图5所对应实施例中的第一报表信息中记录同一时刻向应用服务器请求第一多媒体数据的各第一用户与相应第一多媒体数据之间的数据推送关系。可以理解的是，上述图5所对应实施例中的第一报表信息中的每个目标字符串可以被称之为第一字符串，此时，每个第一字符串用于表征各第一多媒体数据在每个第一终端中所对应的曝光行为。另外，可以理解的是，上述第二报表信息中的每个目标字符串可以称之为第二字符串，此时，每个第二字符串可以用于表征上述第一多媒体数据在各第一终端中所对应的播放行为。

如图7所示，该应用服务器可以基于上述播放操作1和播放操作2得到图7所示的触发指令1和触发指令2。进一步地，该应用服务器可以获取触发指令1中所携带的与上述第一终端10中的目标多媒体数据(即视频B)关联的目标标识信息(即b1)，从而可以基于在图7所示的第二报表信息中找到与第二字符串对应的目标标识信息作为与触发指令1关联的目标标识信息(b1)。然后，该应用服务器可以进一步基于该目标标识信息在第一报表信息中找到具有相同目标标识信息(即b1)的第一字符串作为正样本信息,即可以将在第一样本信息中将第一字符串为目标字符串2的字符串作为正样本信息。同理，如图7所示的应用服务器可以获取触发指令2中所携带的与上述第一终端10中的目标多媒体数据(即视频B)关联的目标标识信息(即b2)，从而可以基于在图7所示的第二报表信息中找到与第二字符串对应的目标标识信息作为与触发指令1关联的目标标识信息(b2)。然后，该应用服务器可以进一步基于该目标标识信息(即b2)在第一报表信息中找到具有相同目标标识信息的第一字符串作为正样本信息，即可以将在第一样本信息中将第一字符串为目标字符串3的字符串作为正样本信息，从而可以得到图7所示的两个正样本信息。

进一步地，该应用服务器还可以将该第一报表信息中所获取到的正样本的数量，在该该第一报表信息中将剩余未被播放的目标字符串作为负样本信息。比图，可以在图7所示的第一报表信息中将第一字符串为目标字符串1和目标字符串4的目标字符串确定为负样本信息，从而可以基于确定出的正样本信息和负样本信息确定出用于对历史预测模型进行训练的训练样本集。

可以理解的是，在上述用户2对视频B执行完播放操作2之后，该应用服务器还可以在检测到当前时刻未达到预设训练时长时，进一步记录用户2对视频C所执行的播放操作3，从而可以得到与该播放操作对应的触发指令3。此时，该应用服务器可以重复指令上述步骤S102，即在上述第二报表信息中将上述目标字符串4录入第二报表信息中，比如，可以在第二报表信息中将上述目标字符串4嵌入上述目标字符串3的后面，从而可以在获得的训练样本集中将上述目标字符串4作为新的正样本信息，并从负样本信息中剔除该目标字符串4，此时，若该负样本信息的总数量小于新的正样本信息的总数量，则可以从上述第二候选数据集中获取任意差值数量相同的其余待推荐多媒体数据作为负样本，并获取该负样本对应的目标字符串，此时，该负样本的目标字符串仍是对上述同一目标时刻所确定的第一候选数据集中的第二多媒体数据的物品特征和用户2的用户状态特征进行编码后所确定的。通过对每个第一候选数据集中的每个第二多媒体数据的物品特征和第一用户的用户状态特征进行编码，可以确保目标时刻下的各物品特征和用户状态特征具有特征不变性。因此，在对历史预测模型进行训练之前，不论你在何时对接收到的第一多媒体数据执行触发操作，均可以确保对历史预测模型进行训练时所采样的离线特征与在线预测时所使用的特征是相同的特征，从而可以确保离线特征和在线特征的一致性，进而可以保障模型训练时数据的准确性。

进一步地，请参见图8，是本发明实施例提供的另一种数据处理方法的流程示意图。如图8所示，所述方法可以包括：

步骤S201，将所有注册用户中每个注册用户的用户注册特征、用户历史行为特征分别确定为所述每个注册用户的用户状态特征；

步骤S202，检测针对所有注册用户中的第一用户与目标应用所对应的数据点击指令；

步骤S203，基于所述数据点击指令在多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的待推荐多媒体数据；

步骤S204，将筛选出的所有待推荐多媒体数据确定为第一多媒体数据，并将每个第一多媒体数据推荐给所述第一用户；

由上述图3所对应实施例中所描述的数据点击指令可以包含已登录该目标应用的第一用户在目标应用中对该目标应用所执行的数据点击操作而生成的指令。可选地，该数据点击指令还可以为第一应用即将登录该目标应用之前对目标应用所执行的启动操作而生成的点击加载指令。为便于理解，进一步地，请参见图9，是本发明实施例提供的一种启动目标应用的示意图。如图9所示，第一终端可以通过在第一用户启动目标应用时，接收该第一用户针对该应用显示界面上的目标应用所执行的应用启动操作，该应用启动操作也可以称之为数据点击操作，从而可以在图9所示的第一终端中生成该数据点击操作对应的数据点击指令。进一步地，如图9所示，应用服务器可以接收图9所示的第一终端发送的数据点击指令，并可以基于该数据点击指令在图9所示的多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的待推荐多媒体数据，并可以进一步将筛选出的所有待推荐多媒体数据确定为第一多媒体数据，并将每个第一多媒体数据推荐给所述第一用户，从而可以使该第一终端接收到图9所示的应用服务器所下发的多个第一多媒体数据。该第一终端可以为上述图5所对应实施例中的第一终端10，可选地，该第一终端也可以为上述图5所对应实施例中的第一终端20。

为便于理解，进一步地，请参见图10，是本发明实施例提供的一种获取待待推荐多媒体多媒体数据的框架图。如图10所示的第一用户101可以为上述所有注册用户中与目标应用之间存在数据点击操作的注册用户，此时，执行该数据点击操作的注册用户可以称之为第一用户，在应用服务器中，该应用服务器可以将该第一用户的用户注册特征和用户历史行为特征统称为该第一用户101的用户状态特征，进一步地，该应用服务器可以通过图10所示的召回算法，比如，可以基于第一用户101的年龄(例如，20岁)和性别(例如，男)从目标应用对应的多媒体数据库(该多媒体数据库可以为上述图9所对应实施例中的多媒体数据库)中筛选出与该第一用户101的年龄和性别相符的多媒体数据添加至图10所示的第一候选数据集103，并将所述第一候选数据集103中的每个多媒体数据分别确定为第二媒体数据，以获取第一候选数据集103中确定出每个第二多媒体数据的物品特征，进一步地，该应用服务器可以从该第一候选数据集103中提取出每个第二多媒体数据的物品特征，并从第一用户101中获取第一用户的用户状态特征，进而可以将获取到的目标时刻下的这些特征进行图10所示的离散化处理步骤，以将每个特征离散化为50个字符，从而可以将离散化后的特征输入图10所示的历史预测模型113，进而可以对该第一候选数据集中的每个第二多媒体数据执行图10所示的预测步骤，以得到每个第二多媒体数据对应的第一预测概率。进一步地，该应用服务器可以继续执行图10所示的截断步骤，从而可以从第一候选数据集103中选择出第一预测概率大于第一推荐阈值的第二多媒体数据，确定为图10所示的待推荐多媒体数据112。其中，可以理解的是，该应用服务器在执行上述离散化处理步骤105的同时，还可以执行图10所示的另一离散化处理步骤109，从而可以得到相同的离散化处理后的特征，进一步地，该应用服务器可以对离散化处理后的特征执行图10所示的特征编码，从而可以得到每个第二多媒体数据对应的编码字符串。另外，该应用服务器在得到图10所示的待推荐多媒体数据112的过程中还包含首先将从第一候选数据集103中选择出第一预测概率大于第一推荐阈值的第二多媒体数据，确定为图10所示的第三多媒体数据108；可以理解的是，每个第二多媒体数据对应一个编码字符串，因此，当应用服务器确定出图10所示的第三多媒体数据108之后，则可相应地找到与第二多媒体数据相同的第三多媒体数据的编码字符串，从而可以进一步获取历史预测模型113对应的版本信息111，并将所述版本信息111分别与每个第三多媒体数据108对应的编码字符串进行组合，并将组合后的编码字符串确定为目标字符串；进一步地，该应用服务器可以将每个携带目标字符串的第三多媒体数据，分别确定为与所述第一用户的用户状态特征相匹配的待推荐多媒体数据，以实现上述通过粗排序筛选过程得到待推荐多媒体数据的步骤。

为便于理解，本发明实施例可以以第一候选数据集103中的一个第二多媒体数据(例如，该第二多媒体数据可以为上述视频A)为例，以阐述对该视频A的物品特征和第一用户(上述用户1)的用户状态特征进行编码得到编码字符串，并基于该编码字符串以及图10所示的版本信息111得到上述目标字符串1的具体过程。其中，用户侧的用户状态特征可以为上述用户1的用户年龄(20岁)，用户性别(例如，女)，用户1对体育类的兴趣分为0.5，对体育类下的足球的兴趣为-1；观看该足球的环境信息为周一上午12点，该视频A的物品特征可以包含分类项目为体育类，标签信息为足球的特征，该应用服务器2000在得到该第一用户的用户状态特征和视频A的物品特征时，可以按照预设的特征映射关系对这些特征进行映射，映射的具体过程如下：

用户年龄：20岁->20/2＝10->10(离散值)，将离散值10映射为字符K；

用户性别：女->0->0(离散值)，将离散值0映射为字符A；

环境信息1：12点->12(离散值)，将离散值12映射为字符M；

环境信息2：周一->1(离散值)，将离散值1映射为字符B；

项目兴趣分：用户1对体育类兴趣分数0.5->(0.5+1)*20＝15(离散值)，将离散值15映射为字符P；

标签兴趣分：用户1对体育类下的足球的兴趣分数-1->(-1+1)*20＝0(离散值)，将离散值0映射为字符A；

鉴于此，该应用服务器所得到编码后的特征字符串可以为KAMBPA；若此时获取到图10所述的版本信息111为1，则可以在该视频A加上版本号后，所得到的上述目标字符串1可以为1|KAMBPA。若该应用服务器在筛选出的多个第一多媒体数据中包含该视频A时，则可以将携带该目标字符串1的视频A下发给该用户1，并将该目标字符串记录到在第一报表信息中，以表征下发给用户1的该视频A的曝光行为。应当理解，本发明实施例仅以上述部分物品特征以及部分用户状态特征为例，对得到目标字符串1进行说明，所以，对该视频A上的其余物品特征和该用户1的其余用户状态特征进行编码的方法与此类似，这里不再一一赘述。另外，还应当理解，本发明实施例对第一候选数据集中其余的每个第二多媒体数据的物品特征和第一用户的用户状态特征进行编码，得到目标字符串的具体过程可以参见上述得到目标字符串1的具体过程，这里将不再对第一候选数据集中每个第二多媒体数据获取目标字符串的过程进行一一列举。

其中，在该目标应用对应的推荐系统中，为了可以准确地为第一用户推荐相应的第一多媒体数据，该应用服务器还可以通过精排序筛选过程中的目标推荐模型对每个待推荐多媒体数据的用户点击概率进行预测，换言之，该应用服务器可以将筛选出的所有待推荐多媒体数据添加至第二候选数据集，并在所述第二候选数据集中获取每个待推荐多媒体数据的关联属性特征，这里的关联属性特征为该应用服务器对目标推荐模型进行训练时所采用的更为精细的分类特征，这些分类特征并不能用上述映射关系进行表征。进一步地，该应用服务器可以基于所述关联属性特征、目标推荐模型，对所述每个待推荐多媒体数据进行预测，以得到所述每个待推荐多媒体数据对应的第二预测概率；进一步地，该应用服务器可以从所述第二候选数据集中筛选第二预测概率大于第二推荐阈值的待推荐多媒体数据，作为与所述第一用户的用户状态特征相匹配的第一多媒体数据，并将筛选出的每个第一多媒体数据推荐给所述第一用户。

其中，在该推荐系统中的点击率预估模型可以包含上述用于进行精排序筛选的目标推荐模型和上述用于进行粗排序筛选的历史预测模型，且该目标推荐模型属于一种分支预测模型，该分支预测模型也可以称之为决策树模型，每个分支下的特征均设定有相应的权重，从而可以将这些具备不同权重的特征关联起来，这些被关联起来的特征即为上述待输入该目标推荐模型的关联属性特征，该关联属性特征可以包含上述历史预测模型所用到的特征，换言之，通过更多的特征可以使该目标推荐模型筛选出更贴合用户兴趣的多媒体数据。可以理解的是，此时所获取到的关联属性特征并不会用于对后续历史训练模型进行训练，在模型训练时所采用的特征仍为训练样本集中的各目标字符串所表征的特征，即在模型训练时所采用的离线特征为对训练样本集中的各目标字符串进行解码、并还原后所得到的特征，从而可以确保在线预测和离线训练所采用的特征的一致性。

步骤S205，当向第一用户推荐多个第一多媒体数据时，记录每个第一多媒体数据与所述第一用户之间的数据推送关系，并基于每个数据推送关系以及所述每个第一多媒体数据携带的目标字符串，确定第一报表信息；

步骤S206，当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时，根据所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于所述数据触发关系以及所述目标多媒体数据携带的目标字符串，确定第二报表信息；

步骤S207，基于所述第一报表信息、所述第二报表信息，获取训练样本集；

步骤S208，基于所述训练样本集对历史预测模型进行训练，得到目标训练模型；

其中，所述目标预测模型用于预测第二用户对所述目标多媒体数据执行触发操作的概率。

为便于理解，进一步地，请参见图11，是本发明实施例提供的一种获取第一多媒体数据的框架图。如上述图10所示，该应用服务器可以通过图11所示的粗排序筛选201对应的历史预测模型113从第一候选集103中筛选出第一预测概率大于第一推荐阈值的第二多媒体数据，确定为与第一用户101的用户状态特征相匹配的待推荐多媒体数据112，进一步地，该应用服务器可以通过图11所示的精排序筛选202对应的目标推荐模型203对每个待推荐多媒体数据112进行预测，从而可以挑选出满足上述第二推荐条件的待推荐多媒体数据，作为第一多媒体数据，从而可以将图11所示的多个第一多媒体数据204下发给第一用户101对应的第一终端，进而可以在第一终端中展示多个第一多媒体数据204，与此同时，该应用服务器可以在将多个第一多媒体数据204下发给第一用户101时，记录每个第一多媒体数据204与第一用户101之间的数据推送关系，从而可以基于每个数据推送关系以及所述每个第一多媒体数据204携带的目标字符串，确定出第一报表信息，即可以得到图11所示的曝光日志205，此外，当第一用户101在第一终端中对多个第一多媒体数据204中的目标多媒体数据执行播放操作206时，则可以生成与该播放操作206对应的触发指令。鉴于此，该应用服务器可以基于该触发指令记录记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于所述数据触发关系以及所述目标多媒体数据携带的目标字符串，确定第二报表信息，从而可以得到图11所示的播放日志207，进一步地，该应用服务器可以将播放日志207和曝光日志205执行图11所示的日志合并步骤208，从而可以对历史预测模型113执行模型训练步骤209，在模型训练的过程中所使用的目标字符串与上述候选集生成模块中所得到待推荐多媒体数据中的目标字符串相同，即在模型训练的过程中所采用的离线特征，与在线预测模块所采用的在线特征均为图11所对应实施例中的目标字符串的物品特征和第一用户的用户状态特征，从而确保了在线特征与离线特征的一致性，进而保障了模型训练数据的准确性。

其中，应用服务器获取训练样本集的具体过程可以为：获取所述第一报表信息中与每个数据推送关系对应的目标字符串作为第一字符串，并获取所述每个第一多媒体数据关联的目标标识信息；每个第一字符串包括对相应数据推送关系所关联的第一用户的用户状态特征与所述每个第一多媒体数据的物品特征进行编码后所得到的字符；进一步地，获取所述第二报表信息中的目标字符串作为第二字符串，并基于所述触发指令获取目标多媒体数据关联的目标标识信息；所述第二字符串为对相应数据触发关系所关联的第一用户的用户状态特征与所述目标多媒体数据的物品特征进行编码后所得到的字符；进一步地，基于所述目标多媒体数据关联的目标标识信息，在所述第二报表信息中确定所述第二字符串对应的目标标识信息，并基于所述第二字符串对应的目标标识信息，在所述第一报表信息中将具有相同目标标识信息的第一字符串作为正样本信息；进一步地，基于所述正样本信息的数量在所述第一报表信息中获取负样本信息，并基于所述正样本信息和所述负样本信息确定历史预测模型对应的训练样本集。

其中，该应用服务器得到目标训练模型的具体过程可以为：获取所述多个第一多媒体数据对应的历史预测模型，并获取所述训练样本集中的正样本信息和负样本信息；进一步地，基于特征映射规则分别对所述正样本信息中携带的目标字符串以及所述负样本信息所携带的目标字符串进行解码，得到所述第一用户的用户状态特征和所述多个第一多媒体数据的物品特征；进一步地，基于所述第一用户的用户状态特征和每个第一多媒体数据的物品特征，对所述历史预测模型进行训练，并将训练后的历史预测模型确定为目标预测模型。

其中，步骤S205-步骤S208的具体实现过程请参见上述图3所对应实施例中对步骤S101-步骤S103的描述，这里将不再继续进行赘述。

可选地，当应用服务器执行完上述步骤之后，该应用服务器还可以进一步对该目标预测模型进行更新。即在下一个预测训练时长到达之前，当在所有注册用户中存在第二用户与该目标应用之间存在数据点击指令，则该应用服务器可以将上述步骤S208获得的目标预测模型作为新的历史预测模型，并将该新的历史预测模型给到上述粗排序筛选过程和上述精排序筛选过程，即此时，该应用服务器可以重复上述图8所对应实施例中的步骤S201-步骤S204，从而得到新的多个第一多媒体数据，从而可以将该新的第一多媒体数据推荐给该第二用户，以重复执行上述步骤S205-步骤S208，以对新的历史预测模型进行训练，得到新的目标预测模型。可以理解的是，该第二用户可以为与第一用户具有相似特征的注册用户，所以，该应用服务器为该第二用户所筛选的该新的多个第一多媒体数据可以与上述为第一用户所筛选的多个第一多媒体数据相同，或者部分相同。

换言之，当应用服务器将所述多个第一多媒体数据发送给所述第二用户时，基于记录到的所述第二用户与所述多个第一多媒体之间的数据推送关系确定每个数据推送关系对应的第三字符串，并将所述每个数据推送关系对应的第三字符串录入所述第一报表信息，得到更新后的第一报表信息；进一步地，当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时，基于所述触发指令确定所述第二用户与所述目标多媒体之间的数据触发关系，并确定所述数据触发关系对应的第四字符串，并将所述数据触发关系对应的第四字符串录入所述第二报表信息，得到更新后的第二报表信息；进一步地，基于所述更新后的第一报表信息和所述更新后的第二报表信息，更新所述目标预测模型。

可以理解的是，在得到该目标预测模型之后，若新的用户(即第二用户，该第二用户可以为上述图1所对应实施例中的用户终端3000c对应的用户3)在T+1时刻(即下一目标时刻)向应用服务器请求上述到上述视频A、视频B以及视频D时，该应用服务器可以将筛选出的这三个多媒体数据作为多个新的第一多媒体数据，并将该多个新的第一多媒体数据下发给该用户3，并在应用服务器中记录下这三个新的第一多媒体数据与该用户3之间的数据推送关系，从而在对上述第一报表信息进行更新的同时，还可以使该用户3对应的第一终端(即上述用户终端3000c)能够在终端屏幕上展示这三个新的第一多媒体数据。其中，该应用服务器可以在数据下发的过程中，将视频A中携带的目标字符串和视频A关联的目标标识信息录入上述第一报表信息，并将视频B中携带的目标字符串和视频B关联的目标标识信息录入上述第一报表信息，并将视频D中携带的目标字符串和视频D关联的目标标识信息录入上述第一报表信息，从而可以对上述第一报表信息的曝光日志进行更新，得到新的第一报表信息。进一步地，若该用户3在用户终端3000c中接收到针对这三个新的第一多媒体数据的(例如，视频D)的播放操作时，则可以在该用户终端3000c中生成该播放操作对应的触发指令，此时，该应用服务器可以接收到该触发指令以及用户3与视频D之间的数据触发关系，将视频D中携带的目标字符串和视频D关联的目标标识信息录入上述第二报表信息，以对上述第二报表信息中的数据进行累计并更新，得到新的第二报表信息。进一步地，该应用服务器基于该新的第一报表信息和新的的第二报表信息，更新上述目标预测模型。例如。应用服务器可以在检测到用户3对视频D执行完播放操作3(即触发操作)之后，可以进一步将视频D中携带的目标字符串(例如，目标字符串5)作为新的正样本信息，并在第一报表信息中获取新的负样本信息，从而可以基于该新的正样本信息和新的负样本信息，得到新的训练样本集，从而可以基于上述新的训练样本集对该新的历史预测模型进行更新，以得到新的目标预测模型。

可以理解的是，如图1所示的任意一个用户终端在接收到针对目标应用的启动指令时，可以向该应用服务器(即上述图1所对应实施例中的应用服务器2000)发送多媒体数据的加载请求，该应用服务器可可以基于该数据加载请求中所携带的存储在该用户终端中的用户注册信息和用户历史行为信息，为该用户终端筛选并推送具备不同物品特征的多媒体数据。其中，每个用户终端中的用户注册信息和用户历史行为信息可以统称为持有该用户终端的用户在目标时刻下的用户状态特征。该目标时刻可以理解为该应用服务器基于该用户终所发送的数据加载请求确定得到上述第一候选数据集的时刻。此时，该第一候选数据集中的每个第二多媒体数据的物品特征应当是确定在该目标时刻下的，所以，当对该第一候选数据集中的每个第二多媒体数据的物品特征和该目标时刻下的用户状态特征进行编码，由于在上述图11所对应实施例中，对第一候选数据集中的每个第二多媒体数据进行编码所得到的编码字符串所采用的特征与上述图11所对应实施例中的粗排序筛选过程中的在线预测所采用的特征是相同的，因此，该应用服务器可以在初步筛选出符合上述第一推荐条件的第二多媒体数据时，将初步筛选出的第二多媒体数据确定为第三多媒体数据，从而可以将携上述目标字符串的第三多媒体数据作为待推荐多媒体数据添加到第二候选数据集，从而可以将该第二候选数据集中的每个待推荐多媒体数据给到上述精排序筛选过程中的目标推荐模型，从而可以从第二候选数据集中筛选出满足上述第二推荐条件的待推荐多媒体数据，作为与第一用户的用户状态特征相符的第一多媒体数据，从而可以将筛选出的所有第一多媒体数据下发给该第一用户，从而可以基于该第一用户的播放行为从第一报表信息中确定出与该播放行为所指示的目标标识信息相同的第一字符串确定为正样本信息，并在该第一报表信息中获取负样本信息，由于参与对历史预测模型进行训练的每个样本信息的目标字符串所表征的特征均为上述同一目标时刻下的特征，进而可以保证在线预测和离线训练所采用的特征的一致性，从而可以确保模型训练数据的准确性、另外，在本发明实施例中，通过将上述曝光行为对应的各第一多媒体数据的目标字符串写入第一报表信息中，并将上述播放行为对应的目标多媒体数据的目标字符串写入第二报表信息中，可以通过将两个报表信息进行整合，即可以确定出用于对历史训练模型进行训练的正样本信息和负样本信息，从而可以降低系统的复杂度，进而可以快速得到上述用于进行上述模型训练的训练样本集。

进一步地，请参见图12，是本发明实施例提供的一种数据处理装置的结构示意图。所述数据处理装置1可以应用于上述应用服务器，该应用服务器可以为上述图1所对应实施例中的应用服务器2000。进一步地，该数据处理装置1可以包括：第一报表确定模块10，第二报表确定模块20，样本获取模块30和，模型训练模块40；进一步地，所述数据处理装置1还可以包括：状态特征获取模块50，指令检测模块60，数据筛选模块70和推荐模块80；

第一报表确定模块10，用于当向第一用户推荐多个第一多媒体数据时，记录每个第一多媒体数据与所述第一用户之间的数据推送关系，并基于每个数据推送关系以及所述每个第一多媒体数据携带的目标字符串，确定第一报表信息；所述每个目标字符串为表征目标时刻下的所述第一用户和相应第一多媒体数据的字符串；

第二报表确定模块20，用于当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时，根据所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于所述数据触发关系以及所述目标多媒体数据携带的目标字符串，确定第二报表信息；

其中，所述第二报表确定模块20包括：指令接收单元201，字符串获取单元202，报表确定单元203；

指令接收单元201，用于当检测到所述第一用户与所述多个第一多媒体数据中的目标多媒体数据之间存在触发操作时，接收所述第一用户对应的第一终端基于所述触发操作发送的触发指令；

字符串获取单元202，用于基于所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于记录到的数据触发关系获取所述目标多媒体数据携带的目标字符串；

报表确定单元203，用于基于所述数据触发关系、以及所述目标多媒体数据携带的目标字符串确定第二报表信息。

其中，指令接收单元201，字符串获取单元202，报表确定单元203的具体实现方式可参见上述图3所对应实施例中对第二报表信息的描述，这里将不再继续进行赘述。

样本获取模块30，用于基于所述第一报表信息、所述第二报表信息，获取训练样本集；

其中，样本获取模块30包括：第一字符串确定单元301，第二字符串确定单元302，正样本确定单元303和负样本确定单元304；

第一字符串确定单元301，用于获取所述第一报表信息中与每个数据推送关系对应的目标字符串作为第一字符串，并获取所述每个第一多媒体数据关联的目标标识信息；每个第一字符串包括对相应数据推送关系所关联的第一用户的用户状态特征与所述每个第一多媒体数据的物品特征进行编码后所得到的字符；

第二字符串确定单元302，用于获取所述第二报表信息中的目标字符串作为第二字符串，并基于所述触发指令获取目标多媒体数据关联的目标标识信息；所述第二字符串为对相应数据触发关系所关联的第一用户的用户状态特征与所述目标多媒体数据的物品特征进行编码后所得到的字符；

正样本确定单元303，用于基于所述目标多媒体数据关联的目标标识信息，在所述第二报表信息中确定所述第二字符串对应的目标标识信息，并基于所述第二字符串对应的目标标识信息，在所述第一报表信息中将具有相同目标标识信息的第一字符串作为正样本信息；

负样本确定单元304，用于基于所述正样本信息的数量在所述第一报表信息中获取负样本信息，并基于所述正样本信息和所述负样本信息确定历史预测模型对应的训练样本集。

其中，第一字符串确定单元301，第二字符串确定单元302，正样本确定单元303和负样本确定单元304的具体实现方式可参见上述图3所对应实施例中对获取训练样本集的描述，这里将不再继续进行赘述。

模型训练模块40，用于基于所述训练样本集对历史预测模型进行训练，得到目标训练模型；所述目标预测模型用于预测第二用户对所述目标多媒体数据执行触发操作的概率；

其中，模型训练模块40包括：历史模型获取单元401，字符串解码单元402，目标模型确定单元403，报表更新单元404和模型更新单元405；

历史模型获取单元401，用于获取所述多个第一多媒体数据对应的历史预测模型，并获取所述训练样本集中的正样本信息和负样本信息；

字符串解码单元402，用于基于特征映射规则分别对所述正样本信息中携带的目标字符串以及所述负样本信息所携带的目标字符串进行解码，得到所述第一用户的用户状态特征和所述多个第一多媒体数据的物品特征；

目标模型确定单元403，用于基于所述第一用户的用户状态特征和每个第一多媒体数据的物品特征，对所述历史预测模型进行训练，并将训练后的历史训练模型确定为目标预测模型。

可选地，报表更新单元404，用于当将所述多个第一多媒体数据发送给所述第二用户时，基于记录到的所述第二用户与所述多个第一多媒体之间的数据推送关系确定每个数据推送关系对应的第三字符串，并将所述每个数据推送关系对应的第三字符串录入所述第一报表信息，得到更新后的第一报表信息；

所述报表更新单元404，还用于当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时，基于所述触发指令确定所述第二用户与所述目标多媒体之间的数据触发关系，并确定所述数据触发关系对应的第四字符串，并将所述数据触发关系对应的第四字符串录入所述第二报表信息，得到更新后的第二报表信息；

模型更新单元405，用于基于所述更新后的第一报表信息和所述更新后的第二报表信息，更新所述目标预测模型。

其中，所述历史模型获取单元401，字符串解码单元402，目标模型确定单元403，报表更新单元404和模型更新单元405的具体实现方式可参见上述图3所对应实施例中对步骤S103的描述，这里将不再继续进行赘述。

其中，所述第一报表确定模块10，第二报表确定模块20，样本获取模块30和，模型训练模块40的具体实现方式可参见上述图3所对应实施例中对步骤S101-步骤S103的描述，这里将不再继续进行赘述。

可选地，状态特征获取模块50，用于将所有注册用户中每个注册用户的用户注册特征、用户历史行为特征分别确定为所述每个注册用户的用户状态特征；

指令检测模块60，用于检测针对所有注册用户中的第一用户与目标应用所对应的数据点击指令；

数据筛选模块70，用于基于所述数据点击指令在多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的待推荐多媒体数据；

其中，数据筛选模块70包括：数据筛选单元701，第一预测单元702和待推荐单元703；

数据筛选单元701，用于基于所述数据点击指令从多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的多媒体数据添加至第一候选数据集，并将所述第一候选数据集中每个多媒体数据分别确定为第二媒体数据；

第一预测单元702，用于基于历史预测模型、每个第二多媒体数据的物品特征以及所述第一用户的用户状态特征，对所述每个第二多媒体数据进行预测，得到所述每个第二多媒体数据对应的第一预测概率；

待推荐单元703，用于从所述第一候选数据集中选择第一预测概率大于第一推荐阈值的第二多媒体数据，确定为与所述第一用户的用户状态特征相匹配的待推荐多媒体数据。

其中，所述目标时刻是指生成所述第一候选数据集的时刻；

所述待推荐单元703包括：特征编码子单元7031，选择确定子单元7032，组合子单元7033，待推荐子单元7034；

特征编码子单元7031，用于获取所述每个第二多媒体数据的物品特征，并基于特征映射规则对所述第一用户的用户状态特征以及所述每个第二多媒体数据的物品特征进行编码，得到所述每个第二多媒体数据对应的编码字符串；

选择确定子单元7032，用于根据所述每个第二多媒体数据对应的第一预测概率，从所述第一候选数据集中选择第一预测概率大于第一推荐阈值的第二多媒体数据，确定为第三多媒体数据；

组合子单元7033，用于获取所述历史预测模型对应的版本信息，并将所述版本信息分别与所述第三多媒体数据对应的编码字符串进行组合，并将组合后的编码字符串确定为目标字符串；

待推荐子单元7034，用于将每个携带目标字符串的第三多媒体数据，分别确定为与所述第一用户的用户状态特征相匹配的待推荐多媒体数据。

其中，所述特征编码子单元7031，选择确定子单元7032，组合子单元7033，待推荐子单元7034的具体实现方式可参见上述图8所对应实施例中对确定待推荐多媒体数据的描述，这里将不再继续进行赘述。

其中，数据筛选单元701，第一预测单元702和待推荐单元703的具体实现方式可参见上述图8所对应实施例中对步骤S203的描述，这里将不再继续进行赘述。

推荐模块80，用于将筛选出的所有待推荐多媒体数据确定为第一多媒体数据，并将每个第一多媒体数据推荐给所述第一用户。

其中，所述推荐模块80包括：第二预测单元801和筛选推荐单元802；

第二预测单元801，用于将筛选出的所有待推荐多媒体数据添加至第二候选数据集，并在所述第二候选数据集中获取每个待推荐多媒体数据的关联属性特征，并基于所述关联属性特征、目标推荐模型，对所述每个待推荐多媒体数据进行预测，得到所述每个待推荐多媒体数据对应的第二预测概率；

筛选推荐单元802，用于从所述第二候选数据集中筛选第二预测概率大于第二推荐阈值的待推荐多媒体数据，作为与所述第一用户的用户状态特征相匹配的第一多媒体数据，并将筛选出的每个第一多媒体数据推荐给所述第一用户。

其中，所述筛选推荐单元802包括：筛选确定子单元8021，标识分配子单元8022，数据推荐子单元8023；

筛选确定子单元8021，用于将从所述第二候选数据集中筛选出的第二预测概率大于第二推荐阈值的待推荐多媒体数据，确定为第四多媒体数据；

标识分配子单元8022，用于为所述第四多媒体数据分配物品标识信息，并为所述第一用户分配用户标识信息，并基于所述第一用户的用户标识信息以及所述第四多媒体数据的物品标识信息，确定所述第四多媒体数据的目标标识信息；

数据推荐子单元8023，用于将所述目标标识信息与所述第四多媒体数据对应的目标字符串进行关联，并将关联后的每个第四多媒体数据均确定为第一多媒体数据，并将所述多个第一多媒体数据推荐给所述第一用户。

其中，筛选确定子单元8021，标识分配子单元8022，数据推荐子单元8023的具体实现方式可参见上述图8所对应实施例中对确定第一多媒体数据的描述，这里将不再继续进行赘述。

其中，第二预测单元801和筛选推荐单元802的具体实现方式可参见上述图8所对应实施例中对步骤S204的描述，这里将不再继续进行赘述。

其中，状态特征获取模块50，指令检测模块60，数据筛选模块70和推荐模块80的具体实现方式可参见上述图8所对应实施例中对步骤S201-步骤S204的描述，这里将不再继续进行赘述。

进一步地，请参见图13，是本发明实施例提供的另一种数据处理装置的结构示意图。如图13所示，该数据处理装置1000可以应用于应用服务器，该应用服务器可以为上述图1所对应实施例中的应用服务器2000。该数据处理装置1000可以包括：处理器1001，网络接口1004和存储器1005，此外，所述数据处理装置1000还可以包括：用户接口1003，和至少一个通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。其中，用户接口1003可以包括显示屏(Display)、键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1004可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatilememory)，例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图13所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。

其中，数据处理装置1000中的网络接口1004还可以与上述图1所对应实施例中的第一终端进行网络连接，且可选用户接口1003还可以包括显示屏(Display)、键盘(Keyboard)。在图13所示的数据处理装置1000中，网络接口1004可提供网络通讯功能；而用户接口1003主要用于为用户提供输入的接口；而处理器1001可以用于调用存储器1005中存储的设备控制应用程序，以实现：

基于所述第一报表信息、所述第二报表信息，获取训练样本集，并基于所述训练样本集对历史预测模型进行训练，得到目标训练模型；所述目标预测模型用于预测第二用户对所述目标多媒体数据执行触发操作的概率。

应当理解，本发明实施例中所描述的数据处理装置1000可执行前文图3或图8所对应实施例中对所述数据处理方法的描述，也可执行前文图12所对应实施例中对所述数据处理装置1的描述，在此不再赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。

此外，这里需要指出的是：本发明实施例还提供了一种计算机存储介质，且所述计算机存储介质中存储有前文提及的数据处理装置1所执行的计算机程序，且所述计算机程序包括程序指令，当所述处理器执行所述程序指令时，能够执行前文图3或图8所对应实施例中对所述数据处理方法的描述，因此，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。对于本发明所涉及的计算机存储介质实施例中未披露的技术细节，请参照本发明方法实施例的描述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种数据处理方法，所述方法应用于应用服务器，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，还包括：

检测针对所有注册用户中的第一用户与目标应用所对应的数据点击指令；

3.根据权利要求2所述的方法，其特征在于，所述基于所述数据点击指令在多媒体数据库中筛选与所述第一用户的用户状态特征相匹配的待推荐多媒体数据，包括：

4.根据权利要求3所述的方法，其特征在于，所述目标时刻是指生成所述第一候选数据集的时刻；

5.根据权利要求4所述的方法，其特征在于，所述将筛选出的所有待推荐多媒体数据分别作为第一多媒体数据，并将每个第一多媒体数据推荐给所述第一用户，包括：

6.根据权利要求5所述的方法，其特征在于，所述从所述第二候选数据集中筛选第二预测概率大于第二推荐阈值的待推荐多媒体数据，作为与所述第一用户的用户状态特征相匹配的第一多媒体数据，并将筛选出的每个第一多媒体数据推荐给所述第一用户，包括：

7.根据权利要求1所述的方法，其特征在于，所述当检测到所述多个第一多媒体数据中的目标多媒体数据对应的触发指令时，根据所述触发指令记录所述第一用户与所述目标多媒体数据之间的数据触发关系，并基于所述数据触发关系以及所述目标多媒体数据携带的目标字符串，确定第二报表信息，包括：

8.根据权利要求6所述的方法，其特征在于，所述基于所述第一报表信息、所述第二报表信息，获取训练样本集，包括：

9.根据权利要求1所述的方法，其特征在于，所述基于所述训练样本集对历史预测模型进行训练，得到目标推荐模型，包括：

10.根据权利要求9所述的方法，其特征在于，还包括：

11.一种数据处理装置，所述装置应用于应用服务器，其特征在于，包括：

模型训练模块，用于基于所述训练样本集对历史预测模型进行训练，得到目标推荐模型；所述目标预测模型用于预测第二用户对所述目标多媒体数据执行触发操作的概率。

12.根据权利要求11所述的装置，其特征在于，所述装置还包括：

指令检测模块，用于检测针对所有注册用户中的第一用户与目标应用所对应的数据点击指令；

13.根据权利要求12所述的装置，其特征在于，所述数据筛选模块包括：

14.一种数据处理装置，其特征在于，所述装置应用于应用服务器，其特征在于，包括：处理器、存储器以及网络接口；

15.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时，执行如权利要求1-10任一项所述的方法。