CN108804619A

CN108804619A - 兴趣偏好预测方法、装置、计算机设备及存储介质

Info

Publication number: CN108804619A
Application number: CN201810547279.3A
Authority: CN
Inventors: 何飞; 韦鹏志
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-05-31
Filing date: 2018-05-31
Publication date: 2018-11-13
Anticipated expiration: 2038-05-31
Also published as: CN108804619B

Abstract

本申请涉及一种兴趣偏好预测方法，该方法包括：获取待预测用户标识对应的多个候选兴趣点，获取每个候选兴趣点对应的兴趣点特征向量，所述兴趣点特征向量是根据与所述候选兴趣点对应的推荐内容的历史行为记录得到的，将所述兴趣点特征向量作为兴趣偏好预测模型的输入，获取所述兴趣偏好预测模型输出的与所述候选兴趣点对应的兴趣参数，根据各个候选兴趣点对应的兴趣参数确定所述待预测用户标识对应的目标偏好兴趣点。该兴趣偏好预测方法大大提高了兴趣偏好预测的准确性。此外，还提出了一种兴趣偏好预测装置、计算机设备及存储介质。

Description

兴趣偏好预测方法、装置、计算机设备及存储介质

技术领域

本申请涉及计算机处理技术领域，特别是涉及一种兴趣偏好预测方法、装置、计算机设备及存储介质。

背景技术

随着互联网的迅速发展，人们的生活越来越多的与互联网联系在了一起，在这个快节奏的时代，人们希望能够快速地获取自己感兴趣的内容。为了快速地为用户推荐感兴趣的内容，首先需要确定用户的兴趣偏好，传统的用户的兴趣偏好的评估往往只是简单地收集兴趣标签，而兴趣标签往往有很多个，所以无法准确地得到用户的兴趣偏好。

发明内容

基于此，有必要针对上述问题，提出了一种准确率高的兴趣偏好预测方法、装置、计算机设备及存储介质。

一种兴趣偏好预测方法，所述方法包括：

获取待预测用户标识对应的多个候选兴趣点；

获取每个候选兴趣点对应的兴趣点特征向量，所述兴趣点特征向量是根据与所述候选兴趣点对应的推荐内容的历史行为记录得到的；

将所述兴趣点特征向量作为兴趣偏好预测模型的输入，获取所述兴趣偏好预测模型输出的与所述候选兴趣点对应的兴趣参数；

根据各个候选兴趣点对应的兴趣参数确定所述待预测用户标识对应的目标偏好兴趣点。

一种兴趣偏好预测装置，所述装置包括：

兴趣点获取模块，用于获取待预测用户标识对应的多个候选兴趣点；

特征向量获取模块，用于获取每个候选兴趣点对应的兴趣点特征向量，所述兴趣点特征向量是根据与所述候选兴趣点对应的推荐内容的历史行为记录得到的；

预测模块，用于将所述兴趣点特征向量作为兴趣偏好预测模型的输入，获取所述兴趣偏好预测模型输出的与所述候选兴趣点对应的兴趣参数；

确定模块，用于根据各个候选兴趣点对应的兴趣参数确定所述待预测用户标识对应的目标偏好兴趣点。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：

获取待预测用户标识对应的多个候选兴趣点；

一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行以下步骤：

获取待预测用户标识对应的多个候选兴趣点；

上述兴趣偏好预测方法、装置、计算机设备及存储介质，通过获取待预测用户标识对应的多个候选兴趣点，以及每个候选兴趣点对应的兴趣点特征向量，兴趣点特征向量是根据与候选兴趣点对应的推荐内容的历史行为记录得到。然后将兴趣点特征向量作为兴趣偏好预测模型的输入，获取输出的与候选兴趣点对应的兴趣参数，最后根据各个候选兴趣点对应的兴趣参数确定目标偏好兴趣点。根据与候选兴趣对应的推荐内容的历史行为记录构建与候选兴趣点对应的兴趣点特征向量，然后采用基于大数据训练得到的兴趣偏好预测模型进行预测，大大提高了兴趣偏好预测的准确率。

附图说明

图1为一个实施例中兴趣偏好预测方法的应用环境图；

图2为一个实施例中兴趣偏好预测方法的流程图；

图3A为一个实施例中浏览内容的场景示意图；

图3B为一个实施例中播放行为的场景示意图；

图3C为一个实施例中上报的数据内容的示意图；

图3D为一个实施例中推荐的感兴趣的内容的示意图；

图4为一个实施例中得到兴趣点特征向量的方法流程图；

图5为另一个实施例中得到兴趣点特征向量的方法流程图；

图6A为一个实施例中没有交叉的三个历史时间窗口的示意图；

图6B为一个实施例中有交叉的三个历史时间窗口的示意图；

图7为一个实施例中三个历史时间窗口的示意图；

图8为一个实施例中兴趣偏好预测模型的训练流程图；

图9为一个实施例中兴趣偏好预测模型的训练架构图；

图10为一个实施例中训练样本生成的流程图；

图11为一个实施例中训练兴趣偏好预测模型的流程示意图；

图12为一个实施例中兴趣偏好预测模型进行预测的流程图；

图13为另一个实施例中兴趣偏好预测方法的流程图；

图14为一个实施例中兴趣偏好预测模型的训练以及应用的结构示意图；

图15为又一个实施例中兴趣偏好预测方法的流程图；

图16A为一个实施例中点击率的对比效果示意图；

图16B为一个实施例中人均观看时长的对比效果示意图；

图17为一个实施例中兴趣偏好预测装置的结构框图；

图18为一个实施例中特征向量获取模块的结构框图；

图19为另一个实施例中兴趣偏好预测装置的结构框图；

图20为又一个实施例中兴趣偏好预测装置的结构框图；

图21为一个实施例中计算机设备的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

图1为一个实施例中兴趣偏好预测方法的应用环境图。参照图1，该兴趣偏好预测方法应用于兴趣偏好预测系统。该兴趣偏好预测系统包括终端110和服务器120。终端110和服务器120通过网络连接，终端110具体可以是台式终端或移动终端，移动终端具体可以是手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。终端110发送推荐请求给到服务器120，该推荐请求中携带待预测用户标识，服务器120获取待预测标识对应的多个候选兴趣点，然后获取每个候选兴趣点对应的兴趣点特征向量，兴趣点特征向量是根据与候选兴趣点对应的推荐内容的历史行为记录得到的，将兴趣点特征向量作为兴趣偏好预测模型的输入，获取兴趣偏好预测模型输出的与候选兴趣点对应的兴趣参数，根据各个候选兴趣点对应的兴趣参数确定待预测用户标识对应的目标偏好兴趣点。然后根据目标偏好兴趣点获取相应的目标推荐内容，返回给终端110。

如图2所示，在一个实施例中，提供了一种兴趣偏好预测方法。既可以应用于终端，也可以应用于服务器，本实施例以应用于服务器举例说明。该兴趣偏好预测方法具体包括如下步骤：

步骤S202，获取待预测用户标识对应的多个候选兴趣点。

其中，待预测用户标识是指待预测的当前用户对应的用户标识。兴趣点是指用户感兴趣的事物。比如，如果用户对NBA(National Basketball Association)感兴趣，那么NBA就是用户的兴趣点。获取待预测用户标识对应的多个候选兴趣点，以便后续从多个候选兴趣点中确定出用户当前的目标偏好兴趣点。在一个实施例中，候选兴趣点的获取可以根据待预测用户标识对应的历史行为记录得到，历史行为记录中包括：用户历史浏览过的内容，根据浏览过的内容所对应的兴趣标签确定该预测用户标识对应的多个候选兴趣点。

在另一个实施例中，候选兴趣点的获取是根据用户对推荐内容的反馈操作得到的，反馈操作可以根据实际需要自定义设置，比如，反馈操作可以为是否点击，是否转发，是否评论、是否播放、是否分享等中的至少一种。反馈操作包括正反馈操作和负反馈操作。正反馈操作和负反馈操作是相对的，比如，如果将点击作为正反馈操作，那么没有点击就是负反馈操作。获取对应于正反馈操作的正反馈推荐内容，根据正反馈推荐内容对应的兴趣标签确定待预测用户标识对应的候选兴趣点。

步骤S204，获取每个候选兴趣点对应的兴趣点特征向量，兴趣点特征向量是根据与候选兴趣点对应的推荐内容的历史行为记录得到的。

其中，兴趣点特征向量是用来表示兴趣点状态的向量，是由兴趣点的多个兴趣特征组成的。兴趣点特征向量是根据与候选兴趣点对应的推荐内容的历史行为记录得到的。每个推荐内容对应有相应的兴趣标签。一个推荐内容可以对应一个或多个兴趣标签。历史行为记录中包括与候选兴趣点对应的推荐内容以及用户对推荐内容的反馈。根据用户对候选兴趣点对应的推荐内容的反馈确定与候选兴趣点对应的兴趣点特征向量。

在一个实施例中，兴趣点特征向量的特征包括但不限于：对兴趣点的正反馈次数、最近一次对兴趣点正反馈的时间、对兴趣点的正反馈率、正反馈率基于平均正反馈率的显著程度等。如果设定点击为正反馈，那么兴趣点的特征包括:用户点击兴趣点的次数、用户最近一次点击兴趣点的时间、用户对兴趣点的点击率、用户对兴趣点的点击率基于平均点击率的显著程度等。

步骤S206，将兴趣点特征向量作为兴趣偏好预测模型的输入，获取兴趣偏好预测模型输出的与候选兴趣点对应的兴趣参数。

其中，兴趣偏好预测模型用于根据兴趣点特征向量预测出用户对每个候选兴趣点的偏好程度。偏好程度可以通过预测用户对兴趣点的正反馈概率(比如，点击概率)来衡量。兴趣参数反映了用户对该候选兴趣点的偏好程度。通过将候选兴趣点对应的兴趣点特征向量输入兴趣偏好预测模型，就可以获取输出的与候选兴趣点对应的兴趣参数。在一个实施例中，兴趣参数为输出的与候选兴趣点对应的兴趣分数值，兴趣分数值与兴趣点偏好程度成正相关，分数值越高，说明对该兴趣点的偏好程度越深。在另一个实施例中，兴趣参数为输出的与候选兴趣点对应的正反馈概率，正反馈概率与兴趣点偏好程度成正相关，概率越大，说明对该兴趣点的偏好程度越深。通过将用户的偏好问题转化为用户在该兴趣点上的正反馈概率，然后利用海量数据进行模型训练，有利于提高兴趣偏好预测的准确度。兴趣偏好预测模型可以采用决策树模型进行训练得到，也可以采用深度学习模型进行训练得到。这里并不对兴趣偏好预测模型的训练方法进行限定。

步骤S208，根据各个候选兴趣点对应的兴趣参数确定待预测用户标识对应的目标偏好兴趣点。

其中，兴趣参数用于反映用户对候选兴趣点的偏好程度，兴趣参数与偏好程度成正相关。在一个实施例中，兴趣参数为点击该兴趣点的概率，概率越大，说明对该兴趣点越偏好。获取到各个候选兴趣点对应的兴趣参数后，便可以根据各个候选兴趣点对应的兴趣参数确定待预测用户标识对应的目标偏好兴趣点。在一个实施例中，根据各个兴趣参数的大小将各个候选兴趣点进行排序，将前预设个数的候选兴趣点作为目标偏好兴趣点。比如，假设候选兴趣点有10个，根据各个候选兴趣点对应的兴趣参数的大小进行排序(从大到小)，可以将排在前3个的候选兴趣点作为目标偏好兴趣点。

上述兴趣偏好预测方法，通过获取待预测用户标识对应的多个候选兴趣点，以及每个候选兴趣点对应的兴趣点特征向量，兴趣点特征向量是根据与候选兴趣点对应的推荐内容的历史行为记录得到的。然后将兴趣点特征向量作为兴趣偏好预测模型的输入，获取输出的与候选兴趣点对应的兴趣参数，最后根据各个候选兴趣点对应的兴趣参数确定目标偏好兴趣点。根据与候选兴趣点对应的推荐内容的历史行为记录构建与候选兴趣点对应的兴趣点特征向量，然后采用基于大数据训练得到的兴趣偏好预测模型进行预测，大大提高了兴趣偏好预测的准确率。

如图3所示，在一个短视频推荐的场景中，用户使用终端在短视频的信息流中浏览内容，如图3A所示为浏览内容的场景；终端获取用户在信息流中产生的播放行为，如图3B所示为播放行为的场景；然后将在终端展示过的内容以及相应的播放行为的数据上报到服务器，如图3C所示为上报的数据内容；服务器对获取到的数据进行处理，得到用户对应的候选兴趣点以及各个候选兴趣点对应的兴趣点特征向量，将兴趣点特征向量作为兴趣偏好预测模型的输入，得到输出的兴趣参数，兴趣参数反映了对兴趣点的偏好程度。然后根据兴趣参数的大小召回用户感兴趣的内容池。然后还需要使用另一个模型：点击率预测模型。然后采用点击率预测模型对用户接下来的感兴趣的内容进行预测，得到用户当前最可能感兴趣的内容，然后下发到终端进行推荐，如图3D所示，为推荐给用户的最可能感兴趣的内容。

当然，上述兴趣偏好预测方法还可以应用其他推荐场景，比如，文章、新闻推荐的场景、图片推荐的场景等。

在一个实施例中，候选兴趣点是采用以下方式得到的：根据当前时间获取对应的第一历史时间窗口，根据第一历史时间窗口获取待预测用户标识对应的第一历史行为记录；根据第一历史行为记录获取兴趣标签，兴趣标签对应的推荐内容存在正反馈操作；根据兴趣标签确定与待预测用户标识对应的候选兴趣点。

其中，当前时间是指当前所处的时间点。历史时间窗口是指过去的一段时间的窗口。历史时间窗口包括起始端点和终止端点。具体地，根据当前时间确定第一历史时间窗口对应的起始端点和终止端点，从而获取到第一历史时间窗口。在一个实施例中，将当前时间直接作为历史时间窗口的终止端点，然后根据预设的第一历史时间窗口的时间长度确定第一历史时间窗口的起始端点，比如，假设预设的时间长度为1小时，那么将当前时间向前1个小时作为起始端点。在另一个实施例中，首先根据当前时间确定终止端点，比如，将当前时间的前10分钟所在的时间点作为终止端点。比如，当前时间为10:10，那么将当前时间的前10分钟，即10:00所在的时间点作为终止端点。然后同样地，根据预设的时间长度确定相应的起始端点。根据确定的第一历史时间窗口获取对应的第一历史行为记录，即获取在该历史窗口时间段内的历史行为记录。历史行为记录中包括：历史展示过的推荐内容，以及用户对推荐内容的反馈操作，反馈操作包括正反馈操作和负反馈操作。获取产生过正反馈操作的推荐内容所对应的兴趣标签，然后根据兴趣标签来确定待预测用户标识对应的候选兴趣点，每个兴趣标签对应一个兴趣点。

需要说明的是，本申请各实施例中的“第一”和“第二”仅用作区分，而并不用于大小、先后、从属等方面的限定。

如图4所示，在一个实施例中，兴趣点特征向量是采用以下方式得到的：

步骤S402，根据当前时间获取对应的第二历史时间窗口，根据第二历史时间窗口获取对应的第二历史行为记录。

其中，第二历史时间窗口是根据当前时间确定的，历史时间窗口包括起始端点和终止端点，根据当前时间确定第二历史时间窗口对应的起始端点和终止端点，确定的方法与上述确定第一历史时间窗口的方法相同。第二历史时间窗口与第一历史时间窗口可以相同，也可以不同。在确定了第二历史时间窗口后，然后获取对应的第二历史行为记录。第二历史行为记录中记录了历史推荐内容以及对历史推荐内容的反馈操作。一个推荐内容可以对应一个或多个兴趣点。

步骤S404，根据第二历史行为记录获取同一候选兴趣点对应的历史推荐内容集，历史推荐内容集中包括多个历史推荐内容。

其中，第二历史行为记录中记录了历史推荐内容以及对历史推荐内容的反馈操作。每个推荐内容对应一个或多个兴趣标签，而每个兴趣标签对应一个兴趣点，统计同一候选兴趣点对应的历史推荐内容集，即历史推荐内容集中的推荐内容对应有相同的候选兴趣点。历史推荐内容集中包括多个历史推荐内容。

步骤S406，获取历史推荐内容集中每个历史推荐内容对应的反馈操作，反馈操作包括正反馈操作和负反馈操作。

其中，反馈操作包括正反馈操作和负反馈操作。正反馈操作是指产生正面反馈的操作，与负反馈操作是相对的。比如，假设将对历史推荐内容的点击行为称为正反馈操作，那么如果没有对历史推荐内容进行过点击，则称为负反馈操作。

步骤S408，根据每个历史推荐内容对应的反馈操作确定与候选兴趣点对应的兴趣点特征向量。

其中，获取每个历史推荐内容对应的反馈操作，然后统计出与候选兴趣点对应的兴趣点特征向量。在一个实施例中，兴趣点特征向量中包括兴趣点总的展示次数、正反馈的兴趣点的次数，最近一次对兴趣点正反馈的时间、对兴趣点的正反馈率等。兴趣点总的展示次数可以通过统计展示与兴趣点对应的推荐内容的次数得到，正反馈的兴趣点的次数可以通过统计对兴趣点对应的推荐内容的正反馈次数得到，兴趣点产生正反馈的概率可以根据产生正反馈的兴趣点的次数与兴趣点总的展示次数的比值得到。

在一个实施例中，第二历史行为记录包括待预测用户标识对应的历史行为记录和其他用户标识对应的历史行为记录；兴趣点特征向量的生成包括以下步骤：根据预测用户标识对应的历史行为记录得到与候选兴趣点对应的直接兴趣特征；根据预测用户标识对应的历史行为记录和其他用户标识对应的历史行为记录得到与候选兴趣点对应的间接兴趣特征；根据直接兴趣特征和间接兴趣特征得到与候选兴趣点对应的兴趣点特征向量。

其中，第二历史行为记录既包括待预测用户标识对应的历史行为记录，也包括其他用户标识对应的历史行为记录。其他用户标识是指除了预测用户标识以外的所有的用户标识。也就是说，第二历史行为记录包括所有用户标识对应的历史行为记录。兴趣点特征向量中包括直接兴趣特征和间接兴趣特征。直接兴趣特征是指根据待预测用户标识对应的历史行为记录就可以获取到的兴趣特征。间接兴趣特征是指根据待预测用户标识对应的历史行为记录和其他用户标识对应的历史行为记录才能得到的兴趣特征。

举个例子，假设兴趣点i为用户A对应的候选兴趣点，将产生点击的行为作为正反馈操作，那么，兴趣点i对应的兴趣点特征向量包括:用户A点击过多少次兴趣点i的推荐内容，最近一次点击兴趣点i的时间，用户A对兴趣点i的点击率，用户A对兴趣点i的点击率基于平均点击率水平的显著程度，用户A对兴趣点i的点击次数基于平均点击次数水平的显著程度等。其中，用户A点击过多少次兴趣点i的推荐内容，最近一次点击兴趣点i的时间，用户A对兴趣点i的点击率，可以直接根据用户A对应的历史行为记录得到，属于直接兴趣特征。而用户A对兴趣点i的点击率基于平均点击率水平的显著程度，用户A对兴趣点i的点击次数基于平均点击次数水平的显著程度，则需要依赖于其他用户标识对应的历史行为记录才能得到，属于间接兴趣特征。因为如果要评价用户A对兴趣点的点击率基于平均点击率水平的显著程度，用户A对兴趣点的点击次数基于平均点击次数水平的显著程度，首先需要确定兴趣点的点击率的平均水平，以及兴趣点的点击次数的平均水平，兴趣点的点击率的平均水平是通过统计所有用户标识对应的点击率得到，兴趣点的点击次数的平均水平是通过统计所有用户标识对应的点击次数得到的。在一个实施例中，兴趣点的点击次数基于平均点击次数水平的显著程度采用比值来表示，比如，假设兴趣点的点击次数为20，计算得到的平均点击次数为10，那么显著程度就是20/10＝2。

如图5所示，在一个实施例中，兴趣点特征向量是根据与候选兴趣点的推荐内容的历史行为记录得到的，包括：

步骤S502，根据当前时间获取多个历史时间窗口，根据历史时间窗口获取对应的窗口历史行为记录。

其中，为了能够表现出兴趣点随着时间的变化，需要根据当前时间获取多个不同的历史时间窗口，历史时间窗口可以自定义设置。在一个实施例中，多个历史时间窗口之间是没有交叉的，比如，首先将当前时间作为一个历史时间窗口的终止端点，然后根据预设的时间长度(比如，1小时)确定相应的起始端点，然后将起始端点作为下一个历史时间窗口的终止端点，依次类推，得到多个历史时间窗口，且多个历史时间窗口之间是没有交叉的。在另一个实施例中，多个历史时间窗口之间是有交叉的，比如，分别根据当前时间确定每个历史时间窗口的终止端点，终止端点之间的距离小于预设的历史时间窗口的长度。如图6A为一个实施例中，没有交叉的三个历史时间窗口的示意图，如图6B为一个实施例中，有交叉的三个历史时间窗口的示意图。

在确定了每个历史时间窗口后，分别获取每个历史时间窗口对应的历史行为记录，为了便于区分，称为“窗口历史行为记录”。窗口历史行为记录可以既包括与待预测用户标识对应的历史行为记录，也可以包括与其他用户标识对应的历史行为记录。

步骤S504，根据窗口历史行为记录获取对应候选兴趣点的窗口推荐内容，和窗口推荐内容对应的反馈操作。

其中，窗口历史行为记录中包括历史推荐内容以及对历史推荐内容的反馈操作。获取候选兴趣点对应的窗口推荐内容，即在该历史时间窗口中的与候选兴趣点对应的推荐内容。并获取窗口推荐内容对应的反馈操作，反馈操作包括正反馈操作和负反馈操作。

步骤S506，根据窗口推荐内容和窗口推荐内容对应的反馈操作确定与候选兴趣点对应的子兴趣点特征向量。

其中，根据与候选兴趣点对应的窗口推荐内容和窗口推荐内容的反馈操作确定与候选兴趣点对应的子兴趣特征向量。即根据每个历史时间窗口对应的窗口历史行为记录得到与候选兴趣点对应的子兴趣点特征向量。

步骤S508，根据各个历史时间窗口对应的子兴趣点特征向量确定与候选兴趣点对应的兴趣点特征向量。

其中，确定了与每个历史时间窗口对应的子兴趣点特征向量，然后根据各个子兴趣点特征向量得到与候选兴趣点对应的兴趣点特征向量。在一个实施例中，将各个子兴趣点特征向量按照预设的顺序进行拼接得到完整的兴趣点特征向量。比如，可以按照各个历史时间窗口的先后顺序进行拼接。

在一个实施例中，历史时间窗口包括起始端点和终止端点；将当前时间点作为多个历史时间窗口的终止端点，多个历史时间窗口的起始端点不同。

其中，历史时间窗口包括起始端点和终止端点。起始端点和终止端点之间的时间段即为历史时间窗口。获取多个历史时间窗口，然后将当前时间点作为各个历史时间窗口的终止端点，相应的起始端点各不相同。通过获取多个历史时间窗口对应的历史行为记录，有利于发现兴趣点随着时间的变化规律。

如图7所示，为一个实施例中，获取三个历史时间窗口的示意图，该三个历史时间窗口都是以当前时间作为终止端点，第一个历史时间窗口为90天，第二个历史时间窗口为2天，第三个历史时间窗口为2小时。以这三个历史时间窗口为例，确定兴趣点对应的兴趣点特征向量。分别计算这三个历史时间窗口内兴趣点的展现、点击、搜索、点赞、转发等行为发生的次数以及最近一次最后发生的时间，从而反映出兴趣点在不同周期上的波动以及迁移。其中，对于前2天以及前2小时采用准实时计算，比如，可以每20秒计算更新一次，将20秒内的行为进行累计并更新到状态存储中。状态存储分别以天或小时进行分片存储，状态存储为历史时间窗口内所有行为的累计。对于90天的历史时间窗口，采用天级批量更新，将当天的行为进行累计，并合并到90天的状态存储中，实现近实时更新。由于90天为一个相对稳定的时间，还可以基于90天计算兴趣点在所有用户上的平均点击水平以及平均点击率水平，以便计算兴趣点基于平均水平的显著程度。分别计算每个历史时间窗口对应的子兴趣点特征向量，然后进行合并得到总的兴趣点特征向量。

如图8所示，在一个实施例中，兴趣偏好预测模型采用以下方法训练得到：

步骤S802，获取第一预设时间段内对应的训练历史行为记录。

其中，训练历史行为记录是指在第一预设时间段(比如，一个星期)内与训练用户标识对应的历史行为记录。训练历史行为记录中包括训练推荐内容和训练推荐内容对应的反馈操作。

步骤S804，根据训练历史行为记录获取训练推荐内容，和训练推荐内容对应的反馈操作，反馈操作包括正反馈操作和负反馈操作。

其中，训练推荐内容是指在第一预设时间段内为训练用户推荐的内容。训练推荐内容对应的反馈操作是指训练用户对训练推荐内容的反馈，比如，对训练推荐内容是否点击的操作。反馈操作包括正反馈操作和负反馈操作。

步骤S806，获取训练推荐内容对应的兴趣标签，根据兴趣标签确定对应的训练兴趣点。

其中，训练历史行为记录中包括多个训练推荐内容，然后获取每个训练推荐内容对应的兴趣标签，进而根据兴趣标签确定对应的训练兴趣点，一个兴趣标签对应一个兴趣点。

步骤S808，获取各个训练兴趣点对应的训练兴趣点特征向量，训练兴趣点特征向量是根据第二预设时间段内对应的第二训练历史行为记录得到的，第二预设时间段大于第一预设时间段。

其中，确定了各个训练兴趣点后，获取各个训练兴趣点对应的训练兴趣点特征向量，训练兴趣点特征向量是根据第二预设时间段内对应的第二训练历史行为记录得到的。在一个实施例中，第二训练历史行为记录包括所有用户标识对应的历史行为记录。第二预设时间段大于第一预设时间段，比如，将距离当前时间的前一个星期作为第一预设时间段，将距离当前时间的前一个月作为第二预设时间段。

步骤S810，根据训练推荐内容对应的反馈操作确定与训练兴趣点特征向量对应的行为标签。

其中，获取训练兴趣点对应的训练推荐内容，获取训练推荐内容对应的反馈操作，然后根据反馈操作确定与训练兴趣点对应的行为标签。将训练兴趣点对应的训练兴趣点特征向量和相应的行为标签一起构成一个完成的训练样本，即训练样本表示为：<训练兴趣点特征向量，行为标签>。反馈操作包括正反馈操作和负反馈操作。若训练推荐内容的反馈操作为正反馈操作，则相应的行为标签为正样本标签，若训练推荐内容的反馈操作为负反馈操作，则相应的行为标签为负样本标签。若同一训练兴趣点对应多个训练推荐内容，则需要获取多个训练推荐内容的反馈操作，若其中一个训练推荐内容的反馈操作为正反馈操作，则将该训练兴趣点对应的行为标签标注为正样本标签。

步骤S812，将训练兴趣点特征向量作为兴趣偏好预测模型的输入，将对应的行为标签作为兴趣偏好预测模型期望的输出，对兴趣偏好预测模型进行训练，得到目标兴趣偏好预测模型。

其中，采用有监督的学习对兴趣偏好预测模型进行训练，将训练样本中的训练兴趣点特征向量作为兴趣偏好预测模型的输入，将对应的行为标签作为兴趣偏好预测模型期望的输出，对兴趣偏好预测模型进行训练，得到目标兴趣偏好预测模型。具体训练的方法可以采用决策树模型，也可以采用深度学习模型进行训练。

在一个实施例中，采用梯度迭代决策树模型对兴趣偏好预测模型进行训练。梯度迭代决策树以回归决策树作为基学习器，以兴趣特征作为特征空间，依据增益对特征进行空间划分。将基学习器得到的结果加入到当前模型，在下一次迭代中对本轮结果中的错误进行修正，经过多次迭代得到集成学习的模型，该集成学习的模型包括多个回归决策树。

如图9所示，为一个实施例中，兴趣偏好预测模型的训练的架构图。日志收集模块用于一方面从客户端收集用户的行为记录，另一方面从兴趣偏好预测模型收集用户历史请求中各兴趣点的状态。样本生成模块，用于处理日志收集模块产生的数据，生成用户兴趣偏好预测模型的训练样本。然后使用训练样本对兴趣偏好预测模型进行预测，得到目标兴趣偏好预测模型。接收客户端发送的请求，根据请求中携带的待预测用户标识，获取相应的兴趣点特征向量(兴趣点状态)，然后采用目标兴趣偏好预测模型进行预测。

如图10所示，为一个实施例中，训练样本生成的流程图。首先，获取用户的训练历史行为记录(对应于第一预设时间段)，训练历史行为记录中包括训练推荐内容和对训练推荐内容的反馈(正反馈和负反馈)，根据训练历史行为记录生成行为样本，<训练推荐内容，反馈标签>。然后获取训练推荐内容对应的兴趣标签，根据兴趣标签确定训练兴趣点，得到兴趣行为样本<训练兴趣点，反馈标签>，然后获取训练兴趣点对应的训练兴趣点特征向量(训练兴趣点特征向量是根据第二预设时间段对应的历史行为记录得到)，若训练兴趣点不存在对应的兴趣点特征向量，则过滤掉，保留对应有训练兴趣点特征向量的兴趣点，得到最终的训练样本<训练兴趣点特征向量，反馈标签>。

在一个实施例中，可以使用集成树学习性能高、可拓展的xgboost开源库，为了方便的处理海量数据，可以使用spark(计算引擎)大规模分布式计算框架上xgboost的移植，并使用yarn(另一种资源协调者)作为集群的资源管理器。如图10所示，为训练模型所使用的框架示意图。

如图11所示，在一个实施例中，训练兴趣偏好预测模型的流程示意图。首先，进行训练样本训练集和测试集的划分，具体地，获取所有用户一周产生的训练样本，按照时间进行划分，将前六天的训练样本作为训练集，将最后一天的训练样本作为测试集。其次，测试集和训练集的效果评估，具体地，使用训练集进行训练，得到的模型分别使用测试集和训练集进行评估，评估指标包括测试集和训练集的AUC指标，正负样本预测的准确率，以及每次迭代训练集AUC的变化。AUC(Area under the Curve of ROC)指标是判断二分类预测模型优劣的标准。再次，选取模型超参数。超参数包括决策树的最大树深、最大迭代次数、正规项、损失函数减少小于多少时不再进行叶子节点的划分、学习率等参数，根据模型效果评估进行超参数选取。最后，根据训练样本对模型进行训练得到最终模型。

在一个实施例中，获取训练推荐内容对应的兴趣标签，根据兴趣标签确定对应的训练兴趣点，包括：获取与兴趣标签对应的候选训练兴趣点；从候选训练兴趣点中筛选出存在训练兴趣点特征向量的训练兴趣点。

其中，每个兴趣标签对应一个兴趣点，根据兴趣标签获取对应的候选训练兴趣点。如果某个候选训练兴趣点对应的推荐内容在预设的第二时间段内从未产生过正反馈操作，那么该候选训练兴趣点就不存在相应的兴趣点特征向量。所以得到候选训练兴趣点后，还需要从候选训练兴趣点中筛选出存在训练兴趣点特征向量的兴趣点作为最终的训练兴趣点。

如图12所示，在一个实施例中，兴趣偏好预测模型采用梯度决策树模型训练得到，梯度决策树模型包括多个回归决策树：将兴趣点特征向量作为兴趣偏好预测模型的输入，获取兴趣偏好预测模型输出的与候选兴趣点对应的兴趣参数，包括：

步骤S206A，将兴趣点特征向量作为各个回归决策树的输入，获取每个回归决策树输出的与候选兴趣点对应的兴趣子参数。

其中，兴趣偏好预测模型采用梯度决策树模型训练得到，梯度决策树模型包括多个回归决策树。分别将兴趣点特征向量作为各个回归决策树的输入，然后获取每个回归决策树输出的与候选兴趣点对应的兴趣子参数。

步骤S206B，获取各个回归决策树对应的兴趣权重。

其中，每个回归决策树都对应相应的兴趣权重，所以为了根据各个回归决策树的输出来确定兴趣参数，还需要获取每个回归决策树对应的权重，即兴趣权重。

步骤S206C，根据各个回归决策树对应的兴趣子参数和对应的兴趣权重计算得到候选兴趣点对应的兴趣参数。

其中，获取到各个回归决策树对应的兴趣子参数以及对应的兴趣权重后，可以采用加权求和的方式计算得到与候选兴趣点对应的兴趣参数。举个例子，假设存在5个回归决策树，各个回归决策树输出的兴趣子参数分别为x1，x2,x3,x4,x5，对应的兴趣权重分别为w1，w2，w3，w4，w5。那么计算得到的兴趣参数＝x1*w1+x2*w2+x3*w3+x4*w4+x5*w5。

如图13所示，在一个实施例中，上述兴趣偏好预测方法还包括：

步骤S210，根据待预测用户标识对应的目标偏好兴趣点从内容池中获取目标偏好兴趣点对应的多个目标内容。

其中，确定了与待预测用户标识对应的目标偏好兴趣点后，根据目标偏好兴趣点从内容池中获取目标偏好兴趣点对应的多个目标内容。目标内容即对应于目标偏好兴趣点的待推荐内容。

步骤S212，获取待预测用户标识对应的当前待推荐状态，根据多个目标内容和当前待推荐状态确定与待预测用户标识对应的目标推荐内容。

其中，获取待预测用户标识对应的当前待推荐状态，当前待推荐状态包括：使用的网络类型、使用的设备类型和当前所处的时间点等中的至少一种。其中，网络类型分为移动网络和wifi网络。设备类型分为Android系统的设备和IOS系统的设备。当前所处的时间点为当前对应的时间点。目标内容包括文章或视频的内容。举个例子，假设将网络类型作为当前待推荐状态，若网络类型为wifi网络，则优先选择推荐视频，若网络类型为移动网络，则优先选择推荐文章。获取到多个目标内容和当前待推荐状态确定与待预测用户标识对应的目标推荐内容。

如图14所示，为一个实施例中，兴趣偏好预测模型的训练以及应用的结构示意图。当接收到客户端请求推荐内容时，获取当前请求用户对应的候选兴趣点，以及各个候选兴趣点对应的兴趣点特征向量，使用兴趣偏好预测模型进行预测，得到目标偏好兴趣点，然后经过推荐系统根据目标偏好兴趣点和当前环境以及内容进行综合评估选取推荐内容，然后将推荐内容下发到客户端。获取当前请求用户对应的各个兴趣点状态，上报到日志收集模块，为后续训练模型准备训练样本数据，即模型训练是一个不断完善的过程。

如图15所示，在一个实施例中，提出了一种兴趣偏好预测方法，具体包括以下步骤：

步骤S1501，根据当前时间获取对应的第一历史时间窗口，根据第一历史时间窗口获取待预测用户标识对应的第一历史行为记录；

步骤S1502，根据第一历史行为记录获取兴趣标签，兴趣标签对应的推荐内容存在正反馈操作；

步骤S1503，根据兴趣标签确定与待预测用户标识对应的候选兴趣点。

步骤S1504，根据当前时间获取多个历史时间窗口，根据历史时间窗口获取对应的窗口历史行为记录。

步骤S1505，根据窗口历史行为记录获取对应候选兴趣点的窗口推荐内容，和窗口推荐内容对应的反馈操作。

步骤S1506，根据窗口推荐内容和窗口推荐内容对应的反馈操作确定与候选兴趣点对应的子兴趣点特征向量。

步骤S1507，根据各个历史时间窗口对应的子兴趣点特征向量确定与候选兴趣点对应的兴趣点特征向量。

步骤S1508，将兴趣点特征向量作为兴趣偏好预测模型的输入，获取兴趣偏好预测模型输出的与候选兴趣点对应的兴趣参数。

步骤S1509，根据各个候选兴趣点对应的兴趣参数确定待预测用户标识对应的目标偏好兴趣点。

步骤S1510，根据待预测用户标识对应的目标偏好兴趣点从内容池中获取目标偏好兴趣点对应的多个目标内容。

步骤S1511，获取待预测用户标识对应的当前待推荐状态，根据多个目标内容和当前待推荐状态确定与待预测用户标识对应的目标推荐内容。

如图16所示，在一个实施例中，为采用本申请的兴趣偏好预测模型进行兴趣偏好预估和采用传统的兴趣偏好预估的情况下，进行内容推荐的效果比对图，如图16A为采用点击率指标进行效果比对的示意图，如图16B为采用人均观看时长指标进行效果比对的示意图。从图中可以看到，不管是点击率还是人均观看时长，采用本申请的兴趣偏好预测模型的情况下都要优于传统的效果。图中实线代表采用本申请的方法，虚线代表采用传统的方法的。

如图17所示，在一个实施例中，提出了一种兴趣偏好预测装置，该装置包括：

兴趣点获取模块1702，用于获取待预测用户标识对应的多个候选兴趣点；

特征向量获取模块1704，用于获取每个候选兴趣点对应的兴趣点特征向量，所述兴趣点特征向量是根据与所述候选兴趣点对应的推荐内容的历史行为记录得到的；

预测模块1706，用于将所述兴趣点特征向量作为兴趣偏好预测模型的输入，获取所述兴趣偏好预测模型输出的与所述候选兴趣点对应的兴趣参数；

确定模块1708，用于根据各个候选兴趣点对应的兴趣参数确定所述待预测用户标识对应的目标偏好兴趣点。

在一个实施例中，所述兴趣点获取模块还用于根据当前时间获取对应的第一历史时间窗口，根据所述第一历史时间窗口获取所述待预测用户标识对应的第一历史行为记录；根据所述第一历史行为记录获取兴趣标签，所述兴趣标签对应的推荐内容存在正反馈操作；根据所述兴趣标签确定与所述待预测用户标识对应的候选兴趣点。

在一个实施例中，所述特征向量获取模块还用于根据当前时间获取对应的第二历史时间窗口，根据所述第二历史时间窗口获取对应的第二历史行为记录；根据所述第二历史行为记录获取同一候选兴趣点对应的历史推荐内容集，所述历史推荐内容集中包括多个历史推荐内容；获取历史推荐内容集中每个历史推荐内容对应的反馈操作，所述反馈操作包括正反馈操作和负反馈操作；根据所述每个历史推荐内容对应的反馈操作确定与所述候选兴趣点对应的兴趣点特征向量。

在一个实施例中，所述第二历史行为记录包括所述待预测用户标识对应的历史行为记录和其他用户标识对应的历史行为记录；所述特征向量获取模块还用于根据所述预测用户标识对应的历史行为记录得到与所述候选兴趣点对应的直接兴趣特征；根据所述预测用户标识对应的历史行为记录和其他用户标识对应的历史行为记录得到与所述候选兴趣点对应的间接兴趣特征；根据所述直接兴趣特征和所述间接兴趣特征得到与所述候选兴趣点对应的兴趣点特征向量。

如图18所示，在一个实施例中，所述特征向量获取模块1704包括：

记录获取模块1704A，用于根据当前时间获取多个历史时间窗口，根据所述历史时间窗口获取对应的窗口历史行为记录；

反馈获取模块1704B，用于根据所述窗口历史行为记录获取对应所述候选兴趣点的窗口推荐内容，和所述窗口推荐内容对应的反馈操作；

子特征向量确定模块1704C，用于根据所述窗口推荐内容和所述窗口推荐内容对应的反馈操作确定与所述候选兴趣点对应的子兴趣点特征向量；

特征向量确定模块1704D，用于根据各个历史时间窗口对应的子兴趣点特征向量确定与所述候选兴趣点对应的兴趣点特征向量。

在一个实施例中，所述历史时间窗口包括起始端点和终止端点；将当前时间点作为所述多个历史时间窗口的终止端点，所述多个历史时间窗口的起始端点不同。

如图19所示，在一个实施例中，上述兴趣偏好预测装置还包括：

训练记录获取模块1710，获取第一预设时间段内对应的训练历史行为记录；

内容反馈获取模块1712，用于根据所述训练历史行为记录获取训练推荐内容，和所述训练推荐内容对应的反馈操作，所述反馈操作包括正反馈操作和负反馈操作；

兴趣点确定模块1714，用于获取所述训练推荐内容对应的兴趣标签，根据所述兴趣标签确定对应的训练兴趣点；

训练特征向量获取模块1716，用于获取各个训练兴趣点对应的训练兴趣点特征向量，所述训练兴趣点特征向量是根据第二预设时间段内对应的第二训练历史行为记录得到的，所述第二预设时间段大于第一预设时间段；

行为标签确定模块1718，用于根据所述训练推荐内容对应的反馈操作确定与所述训练兴趣点特征向量对应的行为标签；

训练模块1720，用于将所述训练兴趣点特征向量作为所述兴趣偏好预测模型的输入，将对应的所述行为标签作为所述兴趣偏好预测模型期望的输出，对所述兴趣偏好预测模型进行训练，得到目标兴趣偏好预测模型。

在一个实施例中，所述兴趣点确定模块还用于获取与所述兴趣标签对应的候选训练兴趣点；从所述候选训练兴趣点中筛选出存在训练兴趣点特征向量的训练兴趣点。

在一个实施例中，所述兴趣偏好预测模型采用梯度决策树模型训练得到，所述梯度决策树模型包括多个回归决策树：所述预测模块还用于将所述兴趣点特征向量作为各个回归决策树的输入，获取每个回归决策树输出的与所述候选兴趣点对应的兴趣子参数；获取各个回归决策树对应的兴趣权重；根据各个回归决策树对应的兴趣子参数和对应的所述兴趣权重计算得到所述候选兴趣点对应的兴趣参数。

如图20所示，在一个实施例中，上述兴趣偏好预测装置还包括：

内容召回模块1722，用于根据所述待预测用户标识对应的目标偏好兴趣点从内容池中获取所述目标偏好兴趣点对应的多个目标内容；

推荐内容确定模块1724，用于获取所述待预测用户标识对应的当前待推荐状态，根据所述多个目标内容和当前待推荐状态确定与所述待预测用户标识对应的目标推荐内容。

图21示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端，也可以是服务器。如图21所示，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现兴趣偏好预测方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行兴趣偏好预测方法。本领域技术人员可以理解，图21中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的兴趣偏好预测方法可以实现为一种计算机程序的形式，计算机程序可在如图21所示的计算机设备上运行。计算机设备的存储器中可存储组成该兴趣偏好预测方法装置的各个程序模块，比如，图17的兴趣点获取模块1702、特征向量获取模块1704、预测模块1706和确定模块1708。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的兴趣偏好预测方法装置中的步骤。例如，图21所示的计算机设备可以通过如图17所示的兴趣偏好预测方法装置的兴趣点获取模块1702获取待预测用户标识对应的多个候选兴趣点；通过特征向量获取模块1704获取每个候选兴趣点对应的兴趣点特征向量，所述兴趣点特征向量是根据与所述候选兴趣点对应的推荐内容的历史行为记录得到的；通过预测模块1706将所述兴趣点特征向量作为兴趣偏好预测模型的输入，获取所述兴趣偏好预测模型输出的与所述候选兴趣点对应的兴趣参数；通过确定模块1708根据各个候选兴趣点对应的兴趣参数确定所述待预测用户标识对应的目标偏好兴趣点。

在一个实施例中，提出了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：获取待预测用户标识对应的多个候选兴趣点；获取每个候选兴趣点对应的兴趣点特征向量，所述兴趣点特征向量是根据与所述候选兴趣点对应的推荐内容的历史行为记录得到的；将所述兴趣点特征向量作为兴趣偏好预测模型的输入，获取所述兴趣偏好预测模型输出的与所述候选兴趣点对应的兴趣参数；根据各个候选兴趣点对应的兴趣参数确定所述待预测用户标识对应的目标偏好兴趣点。

在一个实施例中，所述计算机程序还使得所述处理器执行如下步骤：根据当前时间获取对应的第一历史时间窗口，根据所述第一历史时间窗口获取所述待预测用户标识对应的第一历史行为记录；根据所述第一历史行为记录获取兴趣标签，所述兴趣标签对应的推荐内容存在正反馈操作；根据所述兴趣标签确定与所述待预测用户标识对应的候选兴趣点。

在一个实施例中，所述计算机程序还使得所述处理器执行如下步骤：根据当前时间获取对应的第二历史时间窗口，根据所述第二历史时间窗口获取对应的第二历史行为记录；根据所述第二历史行为记录获取同一候选兴趣点对应的历史推荐内容集，所述历史推荐内容集中包括多个历史推荐内容；获取历史推荐内容集中每个历史推荐内容对应的反馈操作，所述反馈操作包括正反馈操作和负反馈操作；根据所述每个历史推荐内容对应的反馈操作确定与所述候选兴趣点对应的兴趣点特征向量。

在一个实施例中，所述第二历史行为记录包括所述待预测用户标识对应的历史行为记录和其他用户标识对应的历史行为记录；所述计算机程序还使得所述处理器执行如下步骤：根据所述预测用户标识对应的历史行为记录得到与所述候选兴趣点对应的直接兴趣特征；根据所述预测用户标识对应的历史行为记录和其他用户标识对应的历史行为记录得到与所述候选兴趣点对应的间接兴趣特征；根据所述直接兴趣特征和所述间接兴趣特征得到与所述候选兴趣点对应的兴趣点特征向量。

在一个实施例中，所述兴趣点特征向量是根据与所述候选兴趣点的推荐内容的历史行为记录得到的，包括：根据当前时间获取多个历史时间窗口，根据所述历史时间窗口获取对应的窗口历史行为记录；根据所述窗口历史行为记录获取对应所述候选兴趣点的窗口推荐内容，和所述窗口推荐内容对应的反馈操作；根据所述窗口推荐内容和所述窗口推荐内容对应的反馈操作确定与所述候选兴趣点对应的子兴趣点特征向量；根据各个历史时间窗口对应的子兴趣点特征向量确定与所述候选兴趣点对应的兴趣点特征向量。

在一个实施例中，所述计算机程序还使得所述处理器执行如下步骤：获取第一预设时间段内对应的训练历史行为记录；根据所述训练历史行为记录获取训练推荐内容，和所述训练推荐内容对应的反馈操作，所述反馈操作包括正反馈操作和负反馈操作；获取所述训练推荐内容对应的兴趣标签，根据所述兴趣标签确定对应的训练兴趣点；获取各个训练兴趣点对应的训练兴趣点特征向量，所述训练兴趣点特征向量是根据第二预设时间段内对应的第二训练历史行为记录得到的，所述第二预设时间段大于第一预设时间段；根据所述训练推荐内容对应的反馈操作确定与所述训练兴趣点特征向量对应的行为标签；将所述训练兴趣点特征向量作为所述兴趣偏好预测模型的输入，将对应的所述行为标签作为所述兴趣偏好预测模型期望的输出，对所述兴趣偏好预测模型进行训练，得到目标兴趣偏好预测模型。

在一个实施例中，所述根据所述兴趣标签确定对应的训练兴趣点，包括：获取与所述兴趣标签对应的候选训练兴趣点；从所述候选训练兴趣点中筛选出存在训练兴趣点特征向量的训练兴趣点。

在一个实施例中，所述兴趣偏好预测模型采用梯度决策树模型训练得到，所述梯度决策树模型包括多个回归决策树；所述将所述兴趣点特征向量作为兴趣偏好预测模型的输入，获取所述兴趣偏好预测模型输出的与所述候选兴趣点对应的兴趣参数，包括：将所述兴趣点特征向量作为各个回归决策树的输入，获取每个回归决策树输出的与所述候选兴趣点对应的兴趣子参数；获取各个回归决策树对应的兴趣权重；根据各个回归决策树对应的兴趣子参数和对应的所述兴趣权重计算得到所述候选兴趣点对应的兴趣参数。

在一个实施例中，所述计算机程序还使得所述处理器执行如下步骤：根据所述待预测用户标识对应的目标偏好兴趣点从内容池中获取所述目标偏好兴趣点对应的多个目标内容；获取所述待预测用户标识对应的当前待推荐状态，根据所述多个目标内容和当前待推荐状态确定与所述待预测用户标识对应的目标推荐内容。

在一个实施例中，提出了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行以下步骤：

获取待预测用户标识对应的多个候选兴趣点；获取每个候选兴趣点对应的兴趣点特征向量，所述兴趣点特征向量是根据与所述候选兴趣点对应的推荐内容的历史行为记录得到的；将所述兴趣点特征向量作为兴趣偏好预测模型的输入，获取所述兴趣偏好预测模型输出的与所述候选兴趣点对应的兴趣参数；根据各个候选兴趣点对应的兴趣参数确定所述待预测用户标识对应的目标偏好兴趣点。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种兴趣偏好预测方法，所述方法包括：

获取待预测用户标识对应的多个候选兴趣点；

2.根据权利要求1所述的方法，其特征在于，所述候选兴趣点是采用以下方式得到的：

根据当前时间获取对应的第一历史时间窗口，根据所述第一历史时间窗口获取所述待预测用户标识对应的第一历史行为记录；

根据所述第一历史行为记录获取兴趣标签，所述兴趣标签对应的推荐内容存在正反馈操作；

根据所述兴趣标签确定与所述待预测用户标识对应的候选兴趣点。

3.根据权利要求1所述的方法，其特征在于，所述兴趣点特征向量是采用以下方式得到的：

根据当前时间获取对应的第二历史时间窗口，根据所述第二历史时间窗口获取对应的第二历史行为记录；

根据所述第二历史行为记录获取同一候选兴趣点对应的历史推荐内容集，所述历史推荐内容集中包括多个历史推荐内容；

获取历史推荐内容集中每个历史推荐内容对应的反馈操作，所述反馈操作包括正反馈操作和负反馈操作；

根据所述每个历史推荐内容对应的反馈操作确定与所述候选兴趣点对应的兴趣点特征向量。

4.根据权利要求3所述的方法，其特征在于，所述第二历史行为记录包括所述待预测用户标识对应的历史行为记录和其他用户标识对应的历史行为记录；

所述兴趣点特征向量的生成包括以下步骤：

根据所述预测用户标识对应的历史行为记录得到与所述候选兴趣点对应的直接兴趣特征；

根据所述预测用户标识对应的历史行为记录和其他用户标识对应的历史行为记录得到与所述候选兴趣点对应的间接兴趣特征；

根据所述直接兴趣特征和所述间接兴趣特征得到与所述候选兴趣点对应的兴趣点特征向量。

5.根据权利要求1所述的方法，其特征在于，所述兴趣点特征向量是根据与所述候选兴趣点的推荐内容的历史行为记录得到的，包括：

根据当前时间获取多个历史时间窗口，根据所述历史时间窗口获取对应的窗口历史行为记录；

根据所述窗口历史行为记录获取对应所述候选兴趣点的窗口推荐内容，和所述窗口推荐内容对应的反馈操作；

根据所述窗口推荐内容和所述窗口推荐内容对应的反馈操作确定与所述候选兴趣点对应的子兴趣点特征向量；

根据各个历史时间窗口对应的子兴趣点特征向量确定与所述候选兴趣点对应的兴趣点特征向量。

6.根据权利要求4所述的方法，其特征在于，所述历史时间窗口包括起始端点和终止端点；将当前时间点作为所述多个历史时间窗口的终止端点，所述多个历史时间窗口的起始端点不同。

7.根据权利要求1所述的方法，其特征在于，所述兴趣偏好预测模型采用以下方法训练得到：

获取第一预设时间段内对应的训练历史行为记录；

根据所述训练历史行为记录获取训练推荐内容，和所述训练推荐内容对应的反馈操作，所述反馈操作包括正反馈操作和负反馈操作；

获取所述训练推荐内容对应的兴趣标签，根据所述兴趣标签确定对应的训练兴趣点；

获取各个训练兴趣点对应的训练兴趣点特征向量，所述训练兴趣点特征向量是根据第二预设时间段内对应的第二训练历史行为记录得到的，所述第二预设时间段大于第一预设时间段；

根据所述训练推荐内容对应的反馈操作确定与所述训练兴趣点特征向量对应的行为标签；

将所述训练兴趣点特征向量作为所述兴趣偏好预测模型的输入，将对应的所述行为标签作为所述兴趣偏好预测模型期望的输出，对所述兴趣偏好预测模型进行训练，得到目标兴趣偏好预测模型。

8.根据权利要求7所述的方法，其特征在于，所述根据所述兴趣标签确定对应的训练兴趣点，包括：

获取与所述兴趣标签对应的候选训练兴趣点；

从所述候选训练兴趣点中筛选出存在训练兴趣点特征向量的训练兴趣点。

9.根据权利要求1所述的方法，其特征在于，所述兴趣偏好预测模型采用梯度决策树模型训练得到，所述梯度决策树模型包括多个回归决策树；

所述将所述兴趣点特征向量作为兴趣偏好预测模型的输入，获取所述兴趣偏好预测模型输出的与所述候选兴趣点对应的兴趣参数，包括：

将所述兴趣点特征向量作为各个回归决策树的输入，获取每个回归决策树输出的与所述候选兴趣点对应的兴趣子参数；

获取各个回归决策树对应的兴趣权重；

根据各个回归决策树对应的兴趣子参数和对应的所述兴趣权重计算得到所述候选兴趣点对应的兴趣参数。

10.根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据所述待预测用户标识对应的目标偏好兴趣点从内容池中获取所述目标偏好兴趣点对应的多个目标内容；

获取所述待预测用户标识对应的当前待推荐状态，根据所述多个目标内容和当前待推荐状态确定与所述待预测用户标识对应的目标推荐内容。

11.一种兴趣偏好预测装置，所述装置包括：

12.根据权利要求11所述的装置，其特征在于，所述兴趣点获取模块还用于根据当前时间获取对应的第一历史时间窗口，根据所述第一历史时间窗口获取所述待预测用户标识对应的第一历史行为记录；根据所述第一历史行为记录获取兴趣标签，所述兴趣标签对应的推荐内容存在正反馈操作；根据所述兴趣标签确定与所述待预测用户标识对应的候选兴趣点。

13.根据权利要求11所述的装置，其特征在于，所述特征向量获取模块还用于根据当前时间获取对应的第二历史时间窗口，根据所述第二历史时间窗口获取对应的第二历史行为记录；根据所述第二历史行为记录获取同一候选兴趣点对应的历史推荐内容集，所述历史推荐内容集中包括多个历史推荐内容；获取历史推荐内容集中每个历史推荐内容对应的反馈操作，所述反馈操作包括正反馈操作和负反馈操作；根据所述每个历史推荐内容对应的反馈操作确定与所述候选兴趣点对应的兴趣点特征向量。

14.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至10中任一项所述方法的步骤。

15.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至10中任一项所述方法的步骤。