CN110162690A

CN110162690A - 确定用户对物品的兴趣度的方法与装置、设备和存储介质

Info

Publication number: CN110162690A
Application number: CN201811233142.7A
Authority: CN
Inventors: 徐聪; 马明远
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-10-23
Filing date: 2018-10-23
Publication date: 2019-08-23
Anticipated expiration: 2038-10-23
Also published as: CN110162690B; US20210027146A1; WO2020083020A1

Abstract

本公开提供了一种确定用户对物品的兴趣度的方法与装置、机器设备和计算机可读存储介质。该方法包括：根据目标用户的行为的分类，获取所述目标用户的每个分类行为的分类行为信息表示；获取候选物品的信息表示；根据所述目标用户的分类行为的分类行为信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品的兴趣度。通过本公开实施例，可以使得所确定的兴趣度更接近用户的真实情况。

Description

确定用户对物品的兴趣度的方法与装置、设备和存储介质

技术领域

本公开涉及互联网技术领域，具体涉及一种确定用户对物品的兴趣度的方法与装置、机器设备和计算机可读存储介质。

背景技术

在互联网产品中，推荐系统应用广泛，其一般以大数据和算法为基础，确定或预测用户偏好/兴趣度，推荐尽可能符合用户偏好/兴趣度的物品，以提高推荐成功率。常见的推荐方法可分为三种方式：基于内容的推荐，基于协同过滤的推荐以及交叉混合的推荐。

例如，在新闻推荐领域，现有的个性化智能推荐方法有如下几种：(1)分析用户日志，获取用户兴趣爱好标签，通过标签给用户推荐感兴趣的新闻产品；(2)基于相似度推荐，即，通过计算余弦相似度等方式计算用户和产品之间的相似度，若相似度高于设定阈值则将产品加入推荐序列；(3)分析产品和用户的个体特征，基于机器学习的方法预测产品的点击通过率(Click-Through-Rate，CTR)。

随着互联网产品推荐中的交互模式不断深化，用户、内容和产品等维度不断碰撞并加速融合。在这种背景下，以上现有技术的缺点也突出反映出来：

现有技术(1)，通过更新标签给用户推荐新闻产品，具有简单高效的优点，但是个性化效果较差，标签定义宽泛，不能够准确、充分地反映用户对新闻的固有喜好特征，并且受噪点影响明显。

现有技术(2)，利于提供令人信服的推荐解释，但是如果用户很多，计算相似度矩阵代价很大，面临数据稀疏问题。

现有技术(3)，推荐直观，不需要领域知识，但是推荐结果直接取决于特征的选取，并且大多只以用户对产品的点击作为建模标准。

发明内容

本公开的目的之一在于提供一种信息向量化方法与装置、互动图谱形成方法与装置、机器设备和计算机可读存储介质，以克服以上问题中的一个或多个。

根据本公开实施例的第一方面，公开了一种确定用户对物品的兴趣度的方法，其包括：

根据目标用户的行为的分类，获取所述目标用户的每个分类行为的分类行为信息表示；

获取候选物品的信息表示；

根据所述目标用户的分类行为的分类行为信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品的兴趣度。

根据本公开实施例的第二方面，公开了一种确定用户对物品的兴趣度的装置，其包括：

分类行为信息表示获取模块，其被配置为：根据目标用户的行为的分类，获取所述目标用户的每个分类行为的分类行为信息表示；

物品信息获取模块，其被配置为：获取候选物品的信息表示；

兴趣度确定模块，其被配置为：根据所述目标用户的分类行为的分类行为信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品的兴趣度。

根据本公开实施例的第三方面，公开了一种机器设备，其包括处理器以及存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现如上所述各实施例的方法。

根据本公开实施例的第四方面，公开了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述各实施例的方法。

本公开的实施例提供的技术方案可以具有以下有益效果：

在本公开各实施例的一个或多个中，在确定目标用户对候选物品的兴趣度或者确定目标用户的信息表示时，引入对目标用户的分类行为信息的考虑，根据目标用户的分类行为信息表示确定目标用户的信息表示，或者根据目标用户的分类行为信息表示以及候选物品的信息表示一起来确定用户对候选物品的兴趣度，使得目标用户的信息表示中包含该用户的分类行为信息，或者实现了将用户的分类行为信息与物品本身的信息结合起来考虑来确定用户兴趣度。用户的分类行为除点击行为外还可以包括其他一种或多种行为，使得用户的信息表示和兴趣度确定能够更真实地反映用户的真实情况。在一些实施例中，可以将作为分类行为的对象的物品的向量表示按照分类行为的发生时间顺序排成向量序列，来形成分类行为向量序列作为分类行为信息表示，从而使得用户的信息表示和兴趣度确定充分考虑了物品特征信息、行为特征信息的互补性，并将物品特征信息、行为特征信息和时序特征信息三者融合在一起构成用户整体信息的表示，使得其更贴近用户的真实情况。在一些实施例中，根据用户的分类行为信息表示和候选物品的信息表示确定用户对候选物品进行每个分类行为的相应概率，从而确定用户对候选物品的兴趣度，使得兴趣度的确定不仅仅基于对点击率的预测，而是综合考虑各种分类行为的概率预测，使得确定出的兴趣度更准确。在一些实施例中，使用经过机器学习而得到的分类行为概率预测模型来得到用户对候选物品进行每个分类行为的相应概率，该模型是通过使用历史行为数据对神经网络进行训练而得到的，提供了一种确定兴趣度的新颖方式。

本公开的以上以及其他特性和优点将通过下面的详细描述变得清楚，或部分地通过本公开的实践而习得。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。

附图说明

通过参照附图对本公开示例性实施例的详细描述，本公开的上述和其它目标、特征及优点将变得清楚。本公开的附图被并入说明书中并构成本说明书的一部分。附图示例性地示出了适合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1示出根据本公开一示例性实施例的本公开所涉及的实施环境的示意图。

图2示出根据本公开一示例性实施例的确定用户对物品的兴趣度的方法的示意流程图。

图3示出图2所示的方法实施例的步骤S210的一示例性具体实施方式的流程示意图。

图4示出根据本公开一示例性实施例的信息向量化方法的示意流程图。

图5示出根据本公开一示例性实施例的以关系列表的形式记录的关系数据的示意图。

图6示出根据本公开一示例性实施例的以互动图谱的形式记录的关系数据的示意图。

图7示出图4所示的信息向量化方法实施例的步骤S430的一示例性具体实施方式的流程示意图。

图8示出图4所示的信息向量化方法实施例的步骤S430的另一示例性具体实施方式的流程示意图。

图9示出根据本公开一示例性实施例的神经网络对输入的实体向量表示进行重表示的示意图

图10示出图2所示的方法实施例的步骤S230的一示例性具体实施方式的流程示意图。

图11示出图10所示的方法实施例的步骤S1010的一示例性具体实施方式的流程示意图。

图12示出根据本公开一示例性实施例的适用于本公开的神经网络的组成示意图。

图13示出图10所示的方法实施例的步骤S1010基于图12所示的神经网络的一示例性具体实施方式的流程示意图。

图14示出图10所示的方法实施例的步骤S1010的一示例性具体实施方式的流程示意图。

图15示出图10所示的方法实施例的步骤S1010的另一示例性具体实施方式的流程示意图。

图16示出根据本公开一示例性实施例的确定用户对物品的兴趣度的装置的示意组成框图。

图17示出根据本公开一示例性实施例的机器设备的示意组成框图。

具体实施方式

现在将参考附图更全面地描述本公开的示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些示例实施方式目的是使得本公开的描述将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多示例实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的示例实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、步骤等。在其它情况下，不详细示出或描述公知结构、方法、实现或者操作以避免喧宾夺主而使得本公开的各方面变得模糊。

附图中所示的一些框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

在本申请的以上和以下描述中，所述“物品”可以指任何可以推荐给用户的项目，例如产品(诸如各种商品或非售物品、材料、服务)，内容(诸如新闻、微博、广告、文档、网页、其他数据)，等等。所述“兴趣度”可以指用户对某物品的偏好程度、感兴趣程度、会有所动作的概率等等。

图1示出了根据本公开一示例性实施例的本公开的原理所涉及的实施环境的示意图。根据本公开各实施例的确定用户对物品的兴趣度的方法、用户信息的向量表示方法可以实现在如图1所示的机器设备110中，根据本公开各实施例的确定用户对物品的兴趣度的装置、用户信息的向量表示装置可以被实现为如图1所示的机器设备110或其一部分。在如图1所示的实施例中，机器设备110可以根据作为输入的目标用户的分类行为信息表示和候选物品信息表示，输出目标用户对该候选物品的兴趣度。在本申请的各实施例中的一个或多个中，可以将用户的行为进行分类，例如，分为点击、浏览、购买、评论等，再例如，分为点击、评论、点赞、转发、关注等。在一个示例中，分类行为信息表示为分类行为向量序列，即，每次行为用一个向量来表示，每一类分类行为的向量序列由按发生时间顺序排列的多次的该分类行为的向量组成。在一些示例中，可以直接将每次行为所针对的对象(即物品)的向量表示作为该次行为的向量表示。因此，用户的每个分类行为的分类行为向量序列可以是作为该分类行为的对象的物品的向量表示按照分类行为的发生时间顺序排成的向量序列。在一个示例中，物品信息表示为物品向量表示。在以上或以下描述中，分类行为向量序列为分类行为信息表示的一种示例方式，即使用如上所述的向量序列来表示分类行为，物品向量表示或物品的向量表示也是物品信息表示的一种示例方式，应当理解的是，也可以使用其他任何适当的信息表示方式。

在一个示例中，如在图1中所示，机器设备110可以包括用户信息表示单元111、分类行为概率确定单元112和兴趣度确定单元113，其中，用户信息表示单元111根据输入的分类行为信息表示(例如，分类行为向量序列)确定用户的信息表示(例如，用户的向量表示)，分类行为概率确定单元112根据用户的信息表示和候选物品的信息表示确定用户对候选物品进行每种分类行为的相应概率(如图1中所示，分类行为1概率、分类行为2概率、分类行为3概率，……)，兴趣度确定单元113根据所有分类行为的相应概率综合确定出用户对候选物品的兴趣度。如图1中所示，用户的信息表示、各分类行为概率和用户对候选物品的兴趣度均可以作为机器设备110的输出。

在一个示例中，机器设备110可以通过网络或其他通信介质与其他设备相连接，从其他设备接收用户的分类行为向量序列和候选物品向量表示。在另一示例中，机器设备110本身可以根据诸如用户历史行为数据的信息生成分类行为向量序列，根据候选物品的诸如属性特征的相关信息生成候选物品向量表示。

机器设备110可以是任何能够实现如上所述的生成或确定用户的分类行为信息表示、物品信息表示、用户信息表示、分类行为概率、兴趣度等功能以及通信等功能的设备。在一个示例中，机器设备110可以是服务器，例如，应用服务器(例如，购物应用的服务器、搜索应用的服务器、社交应用、新闻应用的服务器等)、网站服务器(例如，购物网站、搜索网站、社交网站、新闻网站等的服务器)等。在另一示例中，机器设备110可以是诸如计算机、移动终端设备、平板电脑等的终端设备，在这些终端设备上可以安装/运行有诸如购物APP、搜索APP、社交APP、新闻APP等的终端APP，候选物品可以是这些APP上的产品或内容等。

机器设备110所生成的用户的向量表示、各分类行为概率和用户对候选物品的兴趣度可以被机器设备110中的其他单元/模块使用，也可以被传输给机器设备110之外的其他设备，以供进一步使用或处理。例如，可以将它们进一步用于内容推荐/物品推荐/社交关系推荐等中。例如，将各分类行为概率和兴趣度用于新闻推荐，以解决互动性场景推荐的体验问题，也可以应用在搜索场景，提高推荐成功率。

图2示出了根据本公开一示例性实施例的确定用户对物品的兴趣度的方法的示意流程图。该示例方法可以由如上所述的机器设备110来执行。如图2所示，该示例方法可以包括步骤：

S210，根据目标用户的行为的分类，获取所述目标用户的每个分类行为的分类行为信息表示。

所述“目标用户”是指要确定其信息表示或确定其对物品的兴趣度的用户，或者要向其推荐物品的用户。

用户对物品的行为可以是多种多样的，例如，对于产品，可以包括：点击、浏览、购买、评论等，再例如，对于内容，可以包括：点击、评论、点赞、转发、关注等。在现有技术中，在将确定用户的信息表示、确定用户兴趣度或向用户推荐物品时通常只考虑一种行为(例如点击)，或者虽然考虑了多种行为，但没有将用户行为分类并形成分类行为信息表示(例如分类行为向量序列)。本申请的发明人创造性地引入了分类行为信息表示，使得用户的信息表示和用户兴趣度的确定更精确，更贴近用户的实际情况。

用户的分类行为信息表示表征用户的分类行为，其可以是根据用户的历史行为数据形成的。用户的历史行为数据可以是某应用或网站的历史记录(例如是应用或网站的操作日志记录、用户访问记录等)或其一部分。应用或网站的历史记录记载了诸如用户、物品等实体的交互行为，其可以不仅包括目标用户的历史行为数据，还包括其他用户的历史行为数据，可以不仅包括用户对物品的历史行为，还包括用户之间的历史行为和/或物品之间的相互联系。根据用户的历史行为数据，可以确定用户进行了哪些分类行为以及这些分类行为的对象是哪些物品。下面以分类行为向量序列作为分类行为信息表示的示例来说明如何实现分类行为的信息表示。

根据历史行为数据可以发现，每个分类行为(即每一种/每一类分类行为)可能针对一个或多个对象发生了不止一次，分类行为的每次发生可以用一个向量来表示，由历史行为数据得到的某分类行为的分类行为向量序列为与该分类行为的多次发生相对应的多个向量按发生时间顺序排列而成。在一些示例中，可以直接将每次行为所针对的对象(即物品)的向量表示作为该次行为的向量表示。因此，用户的每个分类行为的分类行为向量序列可以是作为该分类行为的对象的物品的向量表示按照分类行为的发生时间顺序排成的向量序列。

图3示出了如何获取目标用户的每个分类行为的分类行为向量序列(即步骤S210)的一个示例。在图3所示的实施例中，步骤S210可以包括步骤：

S310，根据所述目标用户的历史行为数据，确定作为所述目标用户的每个分类行为的行为对象的一个或多个物品。

在步骤S310中，通过分析目标用户的历史行为数据，可以确定出目标用户的每个分类行为的每次发生所针对的对象是哪个物品。

S320，分别获取与每个分类行为相对应的所述一个或多个物品中每个物品的向量表示。

每个物品的信息都可以用向量来表示。将物品信息向量化的方法多种多样。例如，可以根据物品的描述/内容确定出其类别、属性或标签，然后使用其类别、属性或标签的词向量来表示该物品。在步骤S320中，每个物品的向量表示可以是从别处直接接收的，也可以是在步骤S320中生成的。

在本申请一个或多个实施例中，提出了适用于本申请技术方案的一种新的物品信息向量化方法，将在步骤S220下对该方法进行详细的示例说明。

S330，对于每个分类行为，将相对应的所述一个或多个物品的向量表示按照该分类行为发生的时间顺序形成向量序列，作为该分类行为的分类行为向量序列。

用户的每个分类行为可以用一个向量序列来表示，其中，该向量序列中的每个向量代表该分类行为的每次发生，将与该分类行为的每次发生相对应的向量按照发生时间的顺序排列，就形成了该分类行为的分类行为向量序列。在步骤S330中，作为一个示例，将分类行为的每次发生所针对的物品的向量表示作为分类行为的该次发生的向量表示。因此，根据目标用户的历史行为数据确定出的每个分类行为的分类行为向量序列是由该分类行为的所有历史对象的向量表示按照该分类行为发生的时间顺序排列而成。

返回参考图2，示例方法进入步骤S220。

S220，获取候选物品的信息表示。

所述“候选物品”是指待被考察用户对其的兴趣度的物品。下面以物品的向量表示作为物品的信息表示的示例来说明如何获取物品的信息表示。

类似于分类行为向量序列，候选物品的向量表示可以是从别处直接接收的，也可以是在步骤S220中生成的。如上所述，物品信息的向量化有多种多样的方式。在本申请的实施例中，提出了一种根据历史行为数据确定物品的向量表示的新方法，其中不仅考虑物品本身的语义，还考虑该历史行为数据中所包含的关系数据(即多个用户与多个物品之间的交互关系数据)。图4示出了一个这种方法的实施例，该方法实施例为信息向量化方法，其不仅适用于物品的向量表示，还适用于诸如用户的其他实体的向量表示(但在本申请确定用户兴趣度的技术方案中，对于用户的向量表示未使用这种方法)。如图4所示，该示例信息向量化方法包括步骤：

S410，获取记录多个实体之间的行为或联系的信息。

记录多个实体之间的行为或联系的信息可以是从原始数据中提炼出来的包含实体间关系数据的信息。例如，原始数据可以是某应用或网站的历史行为数据记录，该历史行为数据记录可以是任何反映诸如用户、物品等实体的交互行为的历史数据，例如是应用或网站的操作日志记录、用户访问记录等。

通过步骤S410，可以获得记录多个实体之间的行为或联系的信息，例如，记录了一个微博用户关注了另一微博博主这一行为的信息，记录了该博主发布了一个属于某话题的微博的信息，记录了该微博用户点赞了属于该话题的某微博的信息，记录了某微博属于某话题的信息，等等。再例如，在新闻网站或新闻应用的情形下，该信息记录了一个新闻用户关注了另一新闻用户这一行为的信息，记录了该新闻用户发布了一个属于某话题的新闻的信息，记录了该新闻用户评论了属于该话题的某新闻的信息，记录了某新闻属于某话题的信息，等等。由这些信息可以方便地得出实体(例如，微博用户/新闻用户、另一新闻用户/博主、新闻/微博、话题)间的关系。

现在接着返回参考图4，在步骤S410中获取记录多个实体之间的行为或联系的信息之后，示例方法进入步骤S420。

S420，根据所述信息确定所述信息的关系数据。

所述信息记录了实体之间的行为或联系，通过对该信息进行分析，可以得到实体间的关系。对于该信息中包含的每条数据记录，可以通过相关的字段名称检索，来得到该条数据记录所涉及的实体，例如，可以检索字段名称“用户ID”、“物品/内容ID”等，将与这些字段名称相应的值识别为实体。在其他示例中，在该信息所包含的每条数据记录中，在预定位置包含预定类型的信息，例如每条数据记录的前32个字节记录“发起行为者的ID”，在这种情况下，可以通过获取预定位置的字节内容来识别出该条数据记录所涉及的实体。

在识别出了数据记录所涉及的实体后，可以进一步分析数据记录以确定所识别出的实体间的关系。在一个示例中，确定实体间的关系可以包括仅确定所识别出的实体间是否具有关系。在另一示例中，确定实体间的关系不仅包括确定所识别出的实体间是否具有关系，还可以包括进一步确定该关系的属性，例如，该关系的类型、方向、强度等等。

一般地，信息所包含的数据记录中记载了行为或联系的双方、行为或联系的类型、行为的发生/持续时间等。在本公开的各实施例中，如果通过分析数据记录发现存在行为或联系，则将作为该行为或联系的双方的两个实体确定为具有关系。例如，如果一条数据记录记录了“新闻用户A评论了属于话题B的新闻C的信息”，则基于评论行为可以确定关系R1：新闻用户A与新闻C之间具有关系，基于联系“属于话题B的新闻C”可以确定关系R2：话题B与新闻C之间具有关系。

在其他示例中，还可以进一步地确定关系的方向，例如，根据评论行为可以确定关系R1的方向为从新闻用户A指向新闻C，该关系的类型为“评论”，根据联系“属于话题B的新闻C”可以确定关系R2的方向为从新闻C指向话题B。

在一些实施例中，除了确定两者之间具有关系，还可以进一步确定该关系的权重值。关系的权重值可以表征该关系的强度。在一实施例中，对于由行为引起的关系，通过分析该行为的行为类型、行为持续时间、行为频次中的一个或多个，来确定相应的权重值。在一个示例中，可以单独使用行为类型、行为持续时间、行为频次中的一个来确定权重值。例如，可以设定不同的行为类型对应不同的权重值(例如，设定浏览行为对应1/3的权重值，点击行为对应2/3的权重值)，不同的行为持续时间对应不同的权重值(例如，设定持续时间在1分钟以下权重值为1/10，在1-3分钟之间权重值为2/5，在3分钟以上权重值为1/2)，不同的行为频次对应不同的权重值(例如，设定行为频次在1次/月以下权重值为1/10，在1-5次/月之间权重值为1/5，在5-10次/月之间权重值为3/10，在10次以上/月权重值为1/2)。在另一实施例中，可以使用行为类型、行为持续时间、行为频次中的多个的组合来确定权重值，例如，可以计算根据行为类型、行为持续时间、行为频次中的多个分别得到的单独权重值，然后计算所得到的单独权重值的加权和，作为最终的权重值。在计算行为的频次时，将在相同行为双方间发生的类型和方向相同、但发生时间不同的两个行为视为同一个行为发生了两次。

对于由于联系而引起的关系，可以设定其权重值为预定值，例如为1。

以上各实施例描述了如何确定实体两两之间的关系。在另一实施例中，除了根据信息中的所述数据记录确定实体两两之间的关系作为该信息的关系数据，还可以包括如下步骤：确定所述多个实体中每个实体的属性特征；将每个实体与该实体的每个属性特征确定为具有关系，并将该关系添加到所述信息的关系数据中。例如，对于从信息中识别出的实体“新闻C”，可以根据该新闻的内容确定其属性特征“标签”和“类别”的值，例如，确定其标签为“台海”，类别为“时政”。通过确定实体的属性特征，可以发现具有相同的一个或多个属性特征的实体，可以将这样的两个实体视为通过该相同的属性特征具有间接关系。

通过如上处理，可以确定出所述信息所涉及的实体两两之间所具有的关系。可以将所确定出的这些关系记录下来以供后续使用。

可以将实体间的关系记录成多种形式的数据，例如，可以记录成实体间每条关系(这里指两个实体间的直接关系)的列表，也可以记录成结构化数据的形式。例如，假设确定了如下关系：

用户A与话题F之间具有关系，关系类型为关注，权重值为ω₁；

用户A与新闻C之间具有关系，关系类型为评论，权重值为ω₂；

用户A与用户E之间具有关系，关系类型为关注，权重值为ω₃；

用户E与新闻C之间具有关系，关系类型为发布新闻，权重值为ω₄；

新闻C与话题B之间具有关系，关系类型为从属于，权重值为ω₅；

新闻D与话题B之间具有关系，关系类型为从属于，权重值为ω₆；

属性特征cut1与新闻C之间具有关系，关系类型为从属于，权重值为ω₇；

属性特征tag1与新闻C之间具有关系，关系类型为从属于，权重值为ω₈；

属性特征cat1与新闻C之间具有关系，关系类型为从属于，权重值为ω₉；

属性特征cat2与用户A之间具有关系，关系类型为从属于，权重值为ω₁₀；

属性特征tag2与用户A之间具有关系，关系类型为从属于，权重值为ω₁₁。

在一个示例中，可以将如上关系记录成关系列表的形式，如图5所示。在另一个示例中，可以将如上关系记录成诸如互动图谱的结构化数据的形式，如图6所示。在图5中，以列表的方式，逐条列出了实体两两间的每条关系及该关系的属性(类型、权重值)。在图6的互动图谱中，每个实体表示为互动图谱中的一个节点，两个实体之间的关系用两个相应节点之间的连线来表示。在一个示例中，也可以将连线的权重值(关系的权重值)、连线的类型(关系/行为类型)、连线的方向(关系的方向)等一个或多个连线属性标注在互动图谱中相应的连线上。

由图6可以看出，其中，

所包含的实体类型有：新闻、用户和话题，其中用户属于用户实体，新闻和话题属于物品实体；

所包含的关系类型有：(1)实体-属性关系：从属关系；(2)实体间关系：新闻与话题(多对多)、用户与新闻(一对多、多对多；互动关系包含：评论、点击、转发、浏览)、用户与用户(多对多；关注，被关注)、用户与话题(多对多；关注，被关注)；

所包含的属性特征：对于新闻，包括内容切词(cut)、标签(tag)、类别(cat)；对于用户，包括标签(tag)、类别(cat)；对于话题，包括内容切词(cut)、标签(tag)、类别(cat)。

对比图5和图6可以看出，虽然由图5的表格和图6的互动图谱都可以方便地看出实体间的直接关系，但是对于实体间的间接关系，由图5无法方便地看出，只能通过搜索的方式来使共享一个行为/联系方的两个关系连接起来形成间接关系，而在图6中，则可以直观地看出实体间的间接关系的路径。由此，可知，将关系数据记录为互动图谱的形式，可以方便、直观地得知实体间的所有直接和间接关系，便于对关系数据的引用、分析、搜索和使用。尤其是在海量关系数据的情况下，关系列表形式的关系数据使用起来非常不方便，而诸如互动图谱的结构化形式则可以直观、清楚地体现海量的关系。

可以用如下公式来表示互动图谱：

其中，互动图谱节点集合V＝U∪M_c∪Uf∪T∪C∪Tag；互动图谱连线集合互动图谱连线与节点的关联映射以图6中的互动图谱为例，用户集合U＝{u₁，u₂，…，u_|u|}，新闻集合Mc＝{mc₁，mc₂，…，mc_|Mc|}，用户集合Uf＝{uf₁，uf₂，…，uf_|Uf|}，话题集合T＝{t₁，t₂，…，t_|T|}，内容切词集合W＝{w₁,w₂,…,w_|W|},类别集合C＝{c₁，c₂，…，c_|C|}，标签集合Tag＝{tag₁，tag₂，…，tag_|Tag|}，权重集合Ω＝{ω₁，ω₂，…，ω_|Ω|}。

互动图谱中的一个连通节点序列v₁e₁v₂e₂…e_p-1v_p，v_i≠v_j，v_i，v_j∈V称为图谱中节点v₁到节点v_p的路径，记为p(v₁，v_p)，路径的长度为|p(v₁，v_p)|＝p-1，路径的赋权长度为|p(v₁，v_p)|_ω＝Π_e∈p(v₁，v_p)ω_ei，两节点之间所有路径的集合记为P(v₁，v_p)，两节点在互动图谱上的度量为

从信息中确定实体间关系并将其展现为互动图谱的方法非常适于处理海量的用户历史行为数据，可以方便、直观地以结构化的形式展现各实体之间的关系。

现在返回图4，在步骤S420中得到所述信息的关系数据之后，可以在步骤S430中将该关系数据(可以是关系列表的形式，也可以是诸如互动图谱的结构化关系数据)用在实体(例如用户、物品等)的向量表示过程中。

S430，根据所述关系数据，形成所述多个实体中一个或多个实体的向量表示。

在现有技术中，在对实体信息进行向量化时，采取的是单纯的语义表示或者以分类类别来表示的方式。而在本公开的实施例中，提出了一种新的信息向量化方式，即根据从海量用户历史行为数据中确定出来的关系数据来进行实体的向量表示。

下面参考图7和图8，分别以两个实施例来说明步骤S430的示例具体实现方式。

在图7的实施例中，根据关系数据确定与待向量化的目标实体的关联实体，并根据关联确定目标实体的环境向量表示，作为实体向量表示的一部分。如图7所示，在该实施例中，步骤S430可以包括步骤：

S710，对于所述多个实体中的每个待向量化的目标实体：根据所述关系数据，确定所述多个实体中与该目标实体在第一预定跳数内具有直接或间接关系的实体，作为该目标实体的关联实体。

对于一个待向量化的目标实体，在步骤S710中可以根据实体间的关系数据来确定其关联实体。关联实体可以泛指与目标实体具有直接或间接关系的实体，所述间接关系是指：两个实体通过一个中间实体而间接具有了关系，即，两个实体中的一个实体与一个中间实体有直接关系，该中间实体与两个实体中的另一实体有直接关系，或者两个实体通过多个中间实体而间接具有了关系，即，两个实体中的一个实体与第一个中间实体有直接关系，之后的这些中间实体彼此接续着有直接关系，直到最后一个中间实体，最后一个中间实体与两个实体中的另一实体有直接关系。在互动图谱中，两个实体之间有间接关系体现为：这两个实体之间具有由节点间的连线连成的路径。

在图7的实施例中，并不是要确定出目标实体的所有关联实体，而是仅确定出与目标实体相距的跳数小于或等于第一预定跳数的关联实体，以用来计算目标实体的环境向量表示。

其中，所述跳数是指：沿着所述多个实体两两之间的关系，从所述多个实体中的一个实体到与该实体具有直接或间接关系的另一实体所经过的关系的条数。在互动图谱上，两个实体之间的跳数体现为：这两个实体对应的节点之间的路径所包含的连线条数。

第一预定跳数可以设置为大于等于1的整数值。例如，在设置第一预定跳数为1的情况下，则仅确定出与目标实体具有直接关系的实体作为关联实体。在一个实施例中，将第一预定跳数设置为2，即确定出与目标实体具有直接关系的实体以及与目标实体通过一个中间实体具有间接关系的实体，作为关联实体。

在有些情况下，两个实体/节点之间的路径可能有多条，导致沿着不同的路径两个实体/节点之间相距的跳数也不同。在这种情况下，只要其中最小的跳数小于或等于第一预定跳数，就视为满足步骤S710中关联实体的条件。

以图5和6所示的关系数据为例，假设目标实体为新闻C，第一预定跳数为2，则由图5和图6可以看出，与新闻C在2跳内具有直接或间接关系的实体包括：用户A、用户E、话题B、话题F、新闻D，其中，用户A、用户E、话题B与新闻C相距一跳(即为直接关系)，话题F、新闻D与新闻C相距两跳(即为间接关系)。由此可以确定，用户A、用户E、话题B、话题F、新闻D这些实体为新闻C的关联实体。

对比从图5和图6确定关联实体的过程可知，由图6可以非常方便、直观地快速确定出与新闻C在两跳内具有直接或间接关系的上述关联实体，因为只要从新闻C出发，沿着连线组成的路径走一跳和两跳，即可将所到达的实体确定为关联实体。而在图5的关系列表中，只能直观地看出与新闻C具有直接关系的实体用户A、用户E、话题B，然后通过分别搜索与用户A、用户E、话题B有直接关系的实体而得到话题F、新闻D，无法直观地确定出话题F、新闻D，确定关联实体的速度明显较慢。在关系数据来自于海量信息、从而比较庞大复杂的情况下，诸如互动图谱的结构化数据的优势就更为明显，处理互动图谱数据的速度明显快于处理关系列表数据。

在上面的示例中，将在第一预定跳数内与目标实体具有直接或间接关系的所有实体都作为关联实体。在另一示例中，关系数据中的实体分为用户实体(例如用户)和物品实体(例如新闻和话题)，在确定目标实体(不管其是用户实体还是物品实体)时，将与该目标实体在第一预定跳数内具有直接或间接关系的物品实体，作为该目标实体的关联实体，而去除与该目标实体在第一预定跳数内具有直接或间接关系的用户实体。

确定目标实体的关联实体之后，示例信息向量化方法的流程进入步骤S720。

S720，计算该目标实体的关联实体的初始向量表示W_i的加权平均值，作为该目标实体的环境向量表示。

这里，每个实体的初始向量表示为未考虑由关系数据确定出的关联实体之前每个实体的向量表示。初始向量表示可以是实体的任意向量表示，例如可以是初始语义向量表示。

在步骤S720中，使用通过关系数据得到的关联实体来生成目标实体的环境向量表示。具体地，可以对所得到的关联实体的初始向量表示求加权平均值，以作为目标实体的环境向量表示。其中，在求加权平均值时，各关联实体的初始向量表示的权重系数可以凭经验、根据统计结果、根据实验等方式来确定，该权重系数应当反映相应的关联实体与目标实体的关系强度，从而反映该相应的关联实体的初始向量表示在计算目标实体的环境向量表示时所应占的比重。

如上所述，每个实体的初始向量表示可以是多种向量表示方式中的一种。例如，可以通过语义表示的方式来确定每个实体的初始向量表示，将每个实体的语义表示方式的初始向量表示称为基本语义向量表示。实体的基本语义向量表示的方式可以有很多种。在一个示例中，可以使用实体的诸如内容、类别、标签等属性特征中的一个或多个的词向量来作为实体的基本语义向量表示。例如，可以将这些属性特征的词向量相加、拼接或以其他方式相组合来形成基本语义向量表示。

因此，对于每个关联实体，首先需要确定该关联实体的属性特征。确定实体的属性特征的方式有多种，例如，可以通过分析该实体的内容或行为数据得到其内容切词、标签或类别等属性特征，然后将这些属性特征进行词向量转换(例如通过word2vec模型进行转换)而得到属性特征的语义向量表示。还可以从其他设备或模块(例如用户中心)接收实体的已分析好的属性特征，然后进行词向量转换。例如，对于新闻C的关联实体新闻D，假设通过分析新闻D的内容，可以确定新闻D的属性特征为：内容切词n个，对应的词向量分别为标签为m个，对应的词向量分别为类别为l个，对应的词向量分别为

之后，将该关联实体的所有属性特征的语义向量表示进行向量拼接，作为该关联实体的基本语义向量表示。如上所述，可以将实体的属性特征的词向量相加、拼接或以其他方式相组合来形成该实体的基本语义向量表示。在本实施例中，通过向量拼接的方式来形成基本语义向量表示，即将每个关联实体的所有属性特征的语义向量表示进行向量拼接，以得到该关联实体的基本语义向量表示。例如，可以得到新闻D的基本语义向量表示为：

同样，按照上述处理可以确定出其他每个关联实体的基本语义向量表示。

如上所述，各关联实体的初始向量表示的权重系数α_i的确定方式多种多样。在本实施例中，以作为每个关联实体的权重系数，即其中，ρ_i为该目标实体到该关联实体所经过的一条或多条关系的权重值的乘积，λ_i为该目标实体到该关联实体所经过的跳数。

如前所述，目标实体与其关联实体之间可能会有多条路径。在目标实体到该关联实体所经过的路径具有多条的情况下，该路径所经过的关系(在互动图谱上为两节点之间的连线)的权重值的乘积可能并不相同，即每条路径的ρ_i和λ_i不相同。在这种情况下，以互动图谱上目标实体与关联实体之间的度量作为ρ_i，即选取目标实体到该关联实体所经过的一条或多条关系的权重值的乘积中最大的那个。另外，将目标实体与关联实体之间最短的跳数作为λ_i。由此，可以求得每个关联实体的权重系数。因此，可以根据如下公式计算所述加权平均值W_e：

其中，N为该目标实体的关联实体的个数。即，对各关联实体的初始向量表示W_i求加权平均，具体地，将各关联实体的初始向量表示W_i乘以各自的权重系数α_i并求和，然后再除以关联实体的个数N，从而得到目标实体的环境向量表示W_e。

由初始向量表示的确定过程可知，各关联实体的初始向量表示的维度可能是不相同的。在计算关联实体的初始向量表示的加权和时，可以以各初始向量表示中最大的维度作为加权平均值W_e的维度，对于各初始向量表示中维度不够的向量，通过补零的方式使得其维度达到该最大的维度。

虽然在上面的实施例中以语义表示方式来确定各关联实体的初始向量表示(基本语义向量表示)并求得目标实体的环境向量表示(环境语义向量表示)，但应当理解，也可以以其他表示方式来确定各关联实体的初始向量表示，从而求得目标实体的同样表示方式的环境向量表示。

通过步骤S720，可以根据关联实体确定出目标实体的环境向量。之后，进入步骤S730。

S730，将该目标实体的初始向量表示与环境向量表示共同作为该目标实体的向量表示。

在步骤S730中，将在步骤S720中得到的环境向量表示作为目标实体的向量表示的一部分。初始向量表示与环境向量表示共同作为该目标实体的向量表示是指：将目标实体的初始向量表示与环境向量表示相结合，相结合的方式可以是多种多样的。在一示例中，将目标实体的初始向量表示与环境向量表示相加，作为该目标实体的向量表示。在另一示例中，将目标实体的初始向量表示与环境向量通过向量拼接的方式形成一个向量，作为该目标实体的向量表示。在又一示例中，将目标实体的初始向量表示与环境向量分别作为独立的向量，形成向量集合，作为该目标实体的向量表示。

图7的实施例描述了通过确定目标实体的关联实体、进而根据关联实体确定目标实体的环境向量的方式将关系数据体现在目标实体的向量表示中。图8示出了将关系数据体现在目标实体的向量表示中的另一实施方式，即步骤S430的另一示例性具体实施方式。在该实施方式中，借助于随机游走算法而通过沿着实体两两之间的关系多次随机游走得到预定个数的实体表示序列，并通过词向量转换模型得到每个目标实体的向量表示。如图8所示，步骤S430的该示例性具体实施方式可以包括步骤：

S810，将所述多个实体中的一个实体作为源实体，从所述源实体出发沿着所述多个实体两两之间的关系随机游走第二预定跳数，到达作为目的实体的、所述多个实体中的另一实体，其中，将所述随机游走所经过的位于所述源实体与所述目的实体之间的实体作为中间实体。

这里所述的多个实体是指如前面所述的关系数据中所包含的多个实体。在步骤S810中，根据随机游走算法，基于关系数据，沿着实体之间的关系(在互动图谱上表现为沿着节点之间的连线)随机游走第二预定跳数。这样的随机游走会经过多个实体/节点，按照随机游走的顺序，可以得到所经过的实体/节点的序列。

跳数是指：沿着所述多个实体两两之间的关系，从所述多个实体中的一个实体到与该实体具有直接或间接关系的另一实体所经过的关系的条数，在互动图谱上表现为一个实体到另一个实体的路径所包含的节点之间的连线的条数。第二预定跳数是指：在随机游走时，从源实体(在互动图谱上对应于源节点)需经过第二预定跳数才到达目的实体(在互动图谱上对应于目的节点)。可以通过诸如凭经验确定、根据统计结果确定、根据实验结果确定等方式来确定第二预定跳数的数值。例如，可以将第二预定跳数设置为20。

这里的“随机游走算法”是指控制对源实体/源节点、中间实体/中间节点、目的实体/目的节点的选取，使得以随机的方式沿着关系数据形成一条具有预定跳数的路径，从而确定出按照游走的先后顺序排列的多个实体/节点(源实体/源节点、中间实体/中间节点、目的实体/目的节点)。

S820，将所述源实体、中间实体和目的实体的实体表示按照所述随机游走的顺序形成实体表示序列。

在步骤S820中，将步骤S810中的随机游走所经过的实体/节点(包括源实体/源节点、中间实体/中间节点、目的实体/目的节点)的实体表示按照随机游走的顺序形成一个实体表示序列。

这里的“实体表示”是指实体的表征，其可以是实体的标识符(ID)，也可以是其他可以标识实体的字符串。

S830，循环执行步骤S810和S820达预定次数，以得到预定个数的实体表示序列。

在步骤S830中，多次循环步骤S810和S820，以得到多个不同的实体表示序列。其中，选择每次循环的随机游走所经过的源实体、中间实体和目的实体，使得所得到的所述预定个数的实体表示序列各不相同，并且使得所述预定个数的实体表示序列包含所有待向量化的目标实体的实体表示。多次循环以得到多个实体表示序列的意义在于：(1)使得最终得到的多个实体表示序列包含所有待向量化的目标实体的实体表示，这样才能在步骤S840中得到每个目标实体的向量表示；(2)将关系数据所体现的关系尽量完整地体现在实体表示序列的实体的顺序中，并且通过每次随机游走截取关系数据的一部分，经过多个部分的拼接增加关系数据在实体表示序列中体现的多样性。

循环的次数与所得到的实体表示序列的个数是相等的。所要循环的预定次数可以通过诸如凭经验确定、根据统计结果确定、根据实验结果确定等方式来确定。在一个示例中，在平衡处理时间与处理速度的情况下，将循环所要达到的预定次数设置得尽量大，以更系统、更完善地利用关系数据来向量化信息。

S840，将所述预定个数的实体表示序列输入词向量转换模型，以得到每个目标实体的向量表示。

将多个实体表示序列转换成实体的向量表示可以有多种已知的方式。常见的一种方式是通过词向量转换模型进行转换，即，将在步骤S830中得到的多个实体表示序列输入词向量转换模型，词向量转换模型输出实体表示序列中所包含的所有实体的向量表示。在一个示例中，词向量转换模型可以是word2vec模型，其根据输入的多个实体表示序列而输出每个实体的词向量表示(embedding表示)。

图7和图8中的实施例虽然以不同的流程步骤实施了步骤S430，但都是在将信息向量化时完善、系统地利用了由该信息确定出的完整关系数据，使得信息的向量化表示更加准确。

在一个实施例中，在步骤S730或步骤S840中得到目标实体的向量表示后，还可以包括后续处理，以使目标实体的向量表示更精准。例如，可以通过后续处理使得目标实体的向量空间保持一致，并使信息更紧密。例如，可以通过神经网络来执行该后续处理，使得目标实体的向量空间保持一致，并使信息更紧密。在该示例性中，在步骤S730或步骤S840之后，通过神经网络将每个目标实体的向量表示进行重表示。这里所述的“目标实体的向量表示”可以是在步骤S730中得到的目标实体的向量表示，也可以是在步骤S840中得到的目标实体的向量表示。

对于在步骤S730中得到的由初始向量表示和环境向量表示共同组成的向量表示，在一个示例中，将初始向量表示和环境向量表示分别单独输入神经网络。在另一示例中，将初始向量表示和环境向量表示的拼接向量输入神经网络，并在输入参数中表明拼接向量的哪部分为初始向量表示，哪部分是环境向量表示。

神经网络可以是任何可以从输入的向量表示中提取信息并将输入向量进行重表示的神经网络。在一个示例中，所述神经网络为卷积神经网络。在另一示例中，所述神经网络为深度神经网络。

图9示出了根据本公开一示例性实施例的神经网络对输入的实体向量表示进行重表示的示意图。在该实施例中，所述神经网络为卷积神经网络，所述实体向量表示由初始向量表示和环境向量表示共同组成。

如图9所示，卷积神经网络的输入层910接收输入的初始向量表示901和环境向量表示902。在一个示例中，在实体向量表示为初始向量表示和环境向量表示的拼接向量的情况下，输入层910根据输入参数(即表明实体向量表示的哪部分是初始向量表示、哪部分是环境向量表示的信息)来将输入的向量表示拆分成初始向量表示901和环境向量表示902。输入层910的输出901和902连接到平行放置的卷积窗口大小不同的卷积层920，在卷积层920中进行卷积运算之后，将卷积层920的输出连接到池化层930，池化层930将卷积层920的输出打压成向量，该向量是所输入的实体向量表示的重表示向量，将该重表示向量作为目标实体的最终向量表示。

在一个示例中，可以根据实验结果对神经网络的各参数进行设置调整，以得到最优的重表示向量，上述参数例如为神经网络的输出向量的维度、各卷积窗口的大小、神经网络的卷积层的层数，等等。

以上以卷积神经网络以及步骤S730的向量表示为例进行了说明，应当理解的是，在深度神经网络和/或步骤S840的向量表示的情况下，操作处理与上述类似，在此不再赘述。

在上面的步骤S410-430、S710-730和S810-840中描述了将诸如用户和物品的实体的信息向量化的方法实施例，该方法实施例可以适用于生成步骤S220中所述的候选物品的信息表示，也可以适用于生成步骤S320中所述的作为分类行为对象的物品的向量表示。应当理解的是，候选物品的向量表示以及作为分类行为对象的物品的向量表示也可以采用其他方法来形成。

在另一示例中，步骤S220中候选物品的信息表示以及步骤S320中作为分类行为对象的物品的向量表示相比于如上所述的信息向量化方法实施例采取进一步的改进，即，对于一物品，使用按照如上所述的信息向量化方法实施例得到的该物品的向量表示与其从属于的实体的向量表示的拼接向量作为该物品的最终向量表示。在该示例中，对于一物品，假设根据如上所述的信息向量化方法实施例得到的向量表示为W1，并且与其具有从属关系的另一实体的向量表示为W2，则可以将该物品最终向量表示为W1和W2的拼接向量。例如，按照如上所述的信息向量化方法实施例，新闻C的向量表示为W_C，新闻C所从属于的话题B的向量表示为W_B，则可以将新闻C最终向量表示为向量W_C和向量W_B的拼接向量。

现在返回图2中的步骤S220。在图2中虽然将步骤S210和S220示出为具有先后顺序，然而应当理解的是，这两个步骤之间并不存在必然的先后执行顺序，它们的执行顺序可以互换，也可以并行地同时执行。之后，示例方法进入步骤S230。

S230，根据所述目标用户的分类行为的分类行为信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品的兴趣度。

在步骤S230中，除了考虑在步骤S220中获取的候选物品的信息表示(例如候选物品的向量表示)，本申请的发明人创造性地使用了在步骤S210中获取到的分类行为信息表示(例如分类行为向量序列)来确定目标用户对候选物品的兴趣度，使得兴趣度的确定更接近目标用户的真实情况。由步骤S410-430、S710-730和S810-840和根据步骤S310-S330如上所述的分类行为向量序列的形成方式实施例可知，分类行为向量序列可以包含如下信息：

物品特征信息：使用作为分类行为对象的物品的向量表示来形成分类行为向量序列，因此包含了物品特征信息；

目标用户的行为特征信息：根据目标用户的关系数据形成了作为分类行为对象的物品的向量表示，该关系数据中包含有目标用户的完整、系统的行为特征信息；

时序特征信息：各个分类行为对象的向量按照发生时间顺序排列，构成时间序列，因此包含了时序特征。

在步骤S230的各实施例中，在确定目标用户的兴趣度时充分使用了上述三个特征中的一个或多个。

如何根据分类行为信息表示和候选物品的信息表示来确定兴趣度具有各种各样的具体实施方式。例如，可以通过计算分类行为信息表示和候选物品的信息表示的相似度，用相似度来表征兴趣度。再例如，可以使用机器学习模型来预测兴趣度。

图10示出了根据分类行为信息表示和候选物品的信息表示来确定兴趣度(即步骤S230)的一个示例具体实施方式，在该示例中，先根据分类行为信息表示和候选物品的信息表示确定与目标用户的各分类行为相对应的分类行为概率，再根据各分类行为概率确定兴趣度。如图10所示，在该示例中，步骤S230可以包括步骤：

S1010，根据所述目标用户的分类行为的分类行为信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品进行每个分类行为的相应概率。

在本示例中，并不是直接确定兴趣度，而是在步骤S1010中先确定与目标用户的各分类行为相对应的分类行为概率。例如，如果目标用户的分类行为包括：点击、点赞、评论、转发，则在步骤S1010中确定目标用户对候选物品进行点击的概率、进行点赞的概率、进行评论的概率、进行转发的概率。

图11示出了如何确定各分类行为概率(即步骤S1010)的一个示例实施方式。如图11的示例所示，步骤S1010可以包括步骤：

S1110，根据所述目标用户的分类行为的分类行为信息表示，得到所述目标用户的信息表示。

在本示例中，先根据目标用户的分类行为信息表示来确定目标用户的信息表示。如前所述，用户信息的向量化也可以使用如前所述的信息向量化方法实施例，但是，在本本申请的各实施例中，目标用户的信息表示并不采用该方法实施例，而是根据分类行为信息表示来确定目标用户的信息表示，例如根据分类行为向量序列来确定目标用户的向量表示。将一个或多个向量序列(分类行为向量序列)重表达成一个向量(目标用户的向量表示)可以通过各种各样的向量变换和运算来实现。稍后将参考图12来详细说明如何根据分类行为向量序列来确定目标用户的向量表示的一个示例具体实施方式。

S1120，根据所述目标用户的信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品进行每个分类行为的相应概率。

根据目标用户的信息表示和候选物品的信息表示，可以通过相似度计算、机器学习等多种方式来确定分类行为概率。

在一个示例中，目标用户的信息表示为目标用户的向量表示，候选物品的信息表示为候选物品的向量表示，则步骤S1110中的目标用户的信息表示为目标用户的向量表示。可以将步骤S1110中目标用户向量表示的计算和步骤S1120中分类行为概率的计算通过机器学习模型来实现，即，将目标用户的分类行为的分类行为向量序列和候选物品的向量表示作为分类行为概率预测模型的输入，通过该模型得到所述相应概率。分类行为概率预测模型可以通过使用大量的历史数据(例如大量的用户历史行为数据)对机器学习算法进行训练来得到。具体地，可以从大量用户历史行为数据中提取出用户的分类行为向量序列和作为该用户的分类行为对象的物品的向量表示，输入机器学习模型，通过调节模型参数，使得模型输出的分类行为概率尽可能接近历史行为数据所载明的实际发生的分类行为概率。

通过使用大量用户的历史行为数据进行训练，可以确定出合适的模型参数，从而对于任何输入的分类行为向量序列和候选物品的向量表示均可以输出较精确的分类行为概率预测。

在一个示例中，可以通过神经网络来实现上述机器学习模型的训练以及分类行为概率的预测，其中，可以将从大量用户历史行为数据中提取出的用户的分类行为向量序列和作为该用户的分类行为对象的物品的向量表示输入神经网络，使得神经网络输出的分类行为概率尽可能接近历史行为数据所载明的实际发生的分类行为概率。在训练神经网络时，可以根据神经网络输出的相应概率与历史行为数据载明的真实概率之间的偏差，确定损失函数，并将确定出的损失函数反馈给神经网络(例如通过反向传播算法)，以用于调整神经网络的参数使得神经网络的输出概率接近实际概率，从而通过训练确定出合适的神经网络参数。在一个示例中，可以通过以下公式来确定损失函数Loss(θ)：

其中，n为输入样本的个数(即针对不同输入预测的次数)，θ^K为第k个输入，c₁、c₂分别为最大间隔正则项R₁(θ)和流形正则项R₂(θ)的权重系数，其中，经验损失CE(θ^K)为：

其中，|B|为分类行为的个数(种类数)，表示真实概率，表示神经网络预测的概率，i下标表示分类行为的对应编号。

其中，最大间隔正则R₁(θ)为：

流形正则R₂(θ)为：

R₂(θ)＝tr(FLF^T)

其中，tr()为对括号中的矩阵的对角线元素求和，矩阵F∈R^|B|×n，其元素矩阵F^T为矩阵F的转置矩阵。L为赋权的拉普拉斯矩阵，L＝D-W，其中，D为训练用的历史行为数据所形成的互动图谱的顶点度矩阵(只包含n个物品顶点，其他顶点只参与计算，不进行表示)，W为赋权的邻接矩阵。参数c₁、c₂、α_i均可以通过指定、实验、统计、训练等手段来得到。

可以将目标用户的分类行为的分类行为向量序列和候选物品的向量表示作为训练后的神经网络的输入，通过神经网络得到作为神经网络输出的相应分类行为概率，即目标用户对候选物品执行各分类行为的相应概率。

图12示出了这样的神经网络的一个示例。如图12所示，在该示例中，这样的神经网络示例称为广度行为感知网络1200，广度行为感知网络1200的输入为目标用户的分类行为向量序列和候选物品的向量表示，输出为用户对候选物品的分类行为概率，其训练过程如上所述。在图12的示例中，广度行为感知网络1200包括循环神经网络1201和全连接神经网络1202，其中，循环神经网络1201用于接收作为输入的目标用户的分类行为向量序列，输出目标用户的向量表示，全连接神经网络1202用于接收作为输入的候选物品的向量表示和来自循环神经网络1201的目标用户的向量表示，输出目标用户对候选物品的分类行为概率。在图12中，作为示例，将循环神经网络1201示出为LSTM(长短期记忆，Long Short-TermMemory)神经网络。但应当理解的是，循环神经网络1201也可以是除LSTM外的其他循环神经网络，例如基本RNN(循环神经网络，Recurrent Neural Network)、GRU(门控循环单元，Gated Recurrent Unit)等。

如图12所示，循环神经网络1201可以包括与每个分类行为向量序列一一相对应的多个部分：第一LSTM部分1201a、第二LSTM部分1201b、第三LSTM部分1201c、第四LSTM部分1201d、第五LSTM部分1201e，它们分别对应于分类行为点击、点赞、评论、共享、关注以及相应的分类行为向量序列。虽然在图12中将循环神经网络1201示出为包括五个部分、每个部分对应一个分类行为向量序列，但应当理解的是，它可以包括更多或更少的与分类行为向量序列相对应的部分。另外，虽然在图12中将循环神经网络1201的每个部分示出为对应一个分类行为向量序列，但应当理解的是，也可以两个或多个分类行为向量序列共用(例如通过时分复用)一个LSTM部分。

在图12的示例中，每个LSTM部分可以包括一个或多个LSTM单元。每个分类行为向量序列为包含一个或多个向量的时间序列，相对应的LSTM部分的LSTM单元在每一时间步处理这一个或多个向量中的一个，其中，每个时间步的LSTM单元输出(例如，隐状态h_t和记忆单元状态c_t)被输入到下一时间步的LSTM单元。即，在每一时间步，LSTM单元的输入量包括分类行为向量序列中对应的向量和上一时间步的LSTM单元输出。每个LSTM部分将最后一个时间步的LSTM单元输出作为该LSTM部分的输出，称为分类行为处理向量。每个分类行为向量序列经过LSTM部分的处理得到一个相应的分类行为处理向量。

目标用户的各分类行为处理向量与候选物品的向量表示一起作为全连接神经网络1202的输入。在一个示例中，全连接神经网络1202引入了注意力机制，即，将各分类行为处理向量乘以各自的权重并求和，作为目标用户的向量表示，与候选物品的向量表示一起作为全连接神经网络1202的输入。在一个示例中，除了各分类行为向量序列，循环神经网络1201还处理与目标用户的所有分类行为相对应的总行为向量序列，即，循环神经网络1201还包括与总行为向量序列相对应的LSTM部分(如图12中的第六LSTM部分1201f)。不同于每个分类行为向量序列包括一种分类行为相对应的物品(即作为该分类行为的对象的物品)的向量，总行为向量序列是将所有分类行为相对应的物品的向量表示按照行为发生的时间顺序形成向量序列。LSTM部分处理总行为向量序列的操作与处理分类行为向量序列的操作类似，此处不再赘述。经过相对应LSTM部分的处理，总行为向量序列被变换成总行为处理向量。可以将总行为处理向量与各分类行为处理向量的加权和向量经过向量变换(诸如相加、向量拼接等)，作为目标用户的向量表示。在图12的示例中，通过向量拼接(concat)的方式将总行为处理向量与各分类行为处理向量的加权和向量拼接成目标用户的向量表示。上面提到的各分类行为处理向量的权重为神经网络1200的参数，可以通过对神经网络1200的训练而得到。

可以通过各种向量变换来将目标用户的向量表示和候选物品的向量表示转换成一个向量来输入全连接神经网络1202。在图12的示例中，将目标用户的向量表示和候选物品的向量表示进行向量拼接(concat)，将得到的向量作为全连接神经网络1202的输入。

在图12的示例中，全连接神经网络1202的输入为目标用户的向量表示和候选物品的向量表示的拼接向量，输出为各个分类行为概率。例如，对应于点击、点赞、评论、共享、关注五种分类行为向量序列，输出点击行为概率、点赞行为概率、评论行为概率、共享行为概率、关注行为概率。在图12的示例中，除了上述输出，全连接神经网络1202还可以输出另一概率：不喜欢概率，其值为1减去其他各分类行为概率值而得到的值。

在图12中，将全连接神经网络1202示出为包括输入层1202a、两个隐藏层1202b和1202c、输出层1202d，但应当理解的是，其可以根据需要包括更多或更少的隐藏层。

图13示出了基于图12所示的广度行为感知网络1200根据目标用户的分类行为向量序列和候选物品的向量表示确定目标用户对候选物品的分类行为概率的示例具体实施方式，即步骤S1010的示例具体实施方式。如图13的示例所示，步骤S1010可以包括步骤：

S1310，对于所述目标用户的每个分类行为向量序列，将该分类行为向量序列作为循环神经网络的输入，并将循环神经网络的最后一个时间步的输出作为该分类行为向量序列的分类行为处理向量。

例如，从目标用户的历史行为数据中提取出了如下分类行为向量序列：

点击行为向量序列clickseq：{cl₁,cl₂,cl₃,…,cl_m}；

点赞行为向量序列likeseq：{li₁,li₂,li₃,…,li_n}；

评论行为向量序列commentseq：{co₁,co₂,co₃,…,co_l}；

共享行为向量序列shareseq：{sh₁,sh₂,sh₃,…,sh_r}；

关注行为向量序列followseq：{fo₁,fo₂,fo₃,…,fo_t}。

将上述五个向量序列输入循环神经网络1201，其中，每个序列对应一个LSTM部分。每个LSTM部分通过分别将最后一个时间步的输出作为最终输出，将相应的向量序列处理成相应的处理向量，分别为：点击行为处理向量CL、点赞行为处理向量LI、评论行为处理向量CO、共享行为处理向量SH、关注行为处理向量FO。

S1320，对所述目标用户的所有分类行为向量序列的相应的分类行为处理向量求加权和，以得到分类行为处理总向量。

由于图12的广度行为感知网络1200引入了注意力机制，因此，将上述五个处理向量乘以各自的权重并求和，得到分类行为处理总向量TC。

在一个示例中，可以将分类行为处理总向量直接作为目标用户的向量表示，与候选物品的向量表示一起作为全连接神经网络1202的输入。在图13的该示例中，是将分类行为处理总向量与步骤S1330中得到的总行为处理向量一起拼接成目标用户的向量表示。

S1330，获取与所述目标用户的所有分类行为相对应的总行为向量序列，作为循环神经网络的输入，并将循环神经网络的最后一个时间步的输出作为所述总行为向量序列的总行为处理向量。

由目标用户的历史行为数据还可以得到其总行为向量序列totalseq：{to₁,to₂,to₃,…,to_s}，由上面对总行为向量序列的描述可知，其组成向量包括上面所述的五个分类行为向量序列的全部组成向量。通过循环神经网络1201的相应LSTM部分(例如图12中的第六LSTM部分1201f)的处理，总行为向量序列被变换成总行为处理向量TO。

虽然在图13中将步骤S1330示出为位于步骤S1310和S1320之后，但应当理解的是，步骤S1330与步骤S1310和S1320之间并没有必要的先后执行顺序，步骤S1330可以在步骤S1310和S1320之前、之后或同时执行。

S1340，根据所述分类行为处理总向量以及所述总行为处理向量，得到所述目标用户的向量表示。

如图12所示，广度行为感知网络1200将步骤S1320中得到的分类行为处理总向量TC与步骤S1330中得到的总行为处理向量TO进行向量拼接，得到目标用户的向量表示UA。可以理解的是，也可以通过其他向量运算来根据分类行为处理总向量TC和总行为处理向量TO得到目标用户的向量表示UA。

虽然在图13中作为示例示出为包括步骤S1330和步骤S1340，但应当理解的是，如上所述，在其他示例中可以直接将步骤S1320中得到的分类行为处理总向量TC作为目标用户的向量表示UA，而省略步骤S1330和步骤S1340。

S1350，将所述目标用户的向量表示与候选物品的向量表示一起作为全连接神经网络的输入，得到作为全连接神经网络的输出的分类行为概率。

在图12的示例中，广度行为感知网络1200将目标用户的向量表示UA与候选物品的向量表示IA进行向量拼接，将拼接得到的向量作为全连接神经网络1202的输入。可以理解的是，也可以通过其他向量运算(例如相加)来将目标用户的向量表示UA与候选物品的向量表示IA变换为全连接神经网络1202的一个输入向量。可选的是，也可以把目标用户的向量表示UA与候选物品的向量表示IA分别作为全连接神经网络1202的独立的两个输入。

全连接神经网络1202根据训练获得的参数和模型，基于输入而得到相应的各分类行为概率。对应于步骤S1310中的五种分类行为，可以得到五个相应的分类行为概率：点击行为概率CL_P、点赞行为概率LI_P、评论行为概率CO_P、共享行为概率SH_P、关注行为概率FO_P。除此之外，在图12的示例中，还确定出不喜欢概率UNLI_P。

通过以上描述的步骤S1010的示例具体实施方式，可以由目标用户的分类行为向量序列和候选物品的向量表示得到目标用户对候选物品的进行每个分类行为概率。

现在返回参考图10，示例方法进入步骤S1020。

S1020，根据所述目标用户对所述候选物品进行每个分类行为的相应概率，确定所述目标用户对所述候选物品的兴趣度。

在步骤S1020中，根据在步骤S1010中得到的各分类行为概率确定目标用户对候选物品的兴趣度。在一个示例中，在步骤S1020中可以将各分类行为概率直接作为目标用户对候选物品的兴趣度的表征。在其他示例中，在步骤S1020中可以对各分类行为概率进行各种转换运算以得到兴趣度。

图14和图15分别示出了如何根据分类行为概率确定兴趣度(即步骤S1020)的两个示例具体实施方式。

在图14的示例中，通过对各分类行为概率计算加权和来确定兴趣度。如图14所示，在该示例中步骤S1020可以具体包括步骤：

S1410，接收所述目标用户对所述候选物品进行每个分类行为的相应概率。

兴趣度的确定可以在神经网络1200的组成模块中进行，也可以在神经网络1200之外的模块中执行。在步骤S1410中，该兴趣度确定模块获取神经网络1200输出的各分类行为概率，并在步骤S1420中对其求加权和。

S1420，对所述相应概率求加权和，并将得到的结果作为所述目标用户对所述候选物品的兴趣度。

兴趣度确定模块根据每种分类行为的现实意义对各分类行为概率赋予给定的权重值，并对它们求加权和，作为目标用户对候选物品的兴趣度。各分类行为概率的权重值可以通过指定、实验、统计、机器学习训练等手段来获得。

在一个示例中，对于上述加权和还要通过考虑候选物品与目标用户的关系强度而进行调整，即将加权和乘以一个调整系数作为兴趣度。例如，可以从上面提到的关系数据确定出候选物品与目标用户的关系强度(假设候选物品为关系数据中所包含的一个实体)。在一个示例中，可以将对上述加权和的调整系数设置为其中，ρ(mc,u)为候选物品与目标用户在互动图谱上的度量，即候选物品到目标用户所经过的一条或多条关系的权重值的乘积中最大的那个，|p(mc,u)|为候选物品与目标用户在关系数据中相距的最短跳数。因此，目标用户对候选物品的兴趣度S可以表示为：

其中，|B|为分类行为的个数(种类数)，p_i为分类行为概率，ω_i为其权重值。

在图15的示例中，除了对各分类行为概率求加权和，还引入根据候选物品的历史推荐成功率而计算出的候选物品的兴趣度修正值。如图14所示，在该示例中步骤S1020可以具体包括步骤：

S1510，对所述目标用户对所述候选物品进行每个分类行为的相应概率求加权和，以得到初始兴趣度。

步骤S1510与步骤S1420相似，在此不再赘述。通过步骤S1510，可以得到初始兴趣度S₁：

S1520，根据所述候选物品的历史数据，确定所述候选物品的兴趣度修正值。

图15不同于图14的示例的地方在于，还引入了修正值S₂。具体地，若通过分析历史数据获知候选物品作为行为对象的次数较少和/或被推荐的次数较少，则可以给予其一定的奖励，使计算得到的用户对其的兴趣度变大，从而使其得到适当更多的推荐。因此，在一个示例中，可以将修正值S₂设置为：

S₂＝exp(-deg(mc)×show(mc))

其中，deg(mc)表示候选物品在过往作为行为对象的次数，show(mc)表示候选物品在过往被推荐的次数。

S1530，对所述初始兴趣度和所述兴趣度修正值求加权和，并将得到的结果作为所述目标用户对所述候选物品的兴趣度。

在步骤S1530中，通过对S₁和S₂求加权和来得到兴趣度S：

S＝β₁×S₁+β₂×S₂

其中，β₁和β₂分别为S₁和S₂的权重值，可以通过指定、实验、统计、机器学习训练等手段来获得。在一个示例中，可以将β₂设置为1。

通过上面所述的各实施例，可以由目标用户的分类行为信息表示和候选物品的信息表示得到目标用户对一候选物品的兴趣度。对于候选物品集合中的每个候选物品，均可以通过上述各实施例得到目标用户对其的兴趣度，从而可以按照兴趣度的大小对它们进行排序。在一示例推荐方法中，对于候选物品集合的候选物品，所计算出的兴趣度越大，其推荐优先级越高。

根据本公开的又一方面，还提供一种确定用户对物品的兴趣度的装置。该装置可以执行如上所述的确定用户对物品的兴趣度的方法的各实施例，其可以被实现在如图1中所示的机器设备110中，或者可以被实现为与机器设备110相连接的其他装置中。图16示出了根据本公开一示例性实施例的这样的装置的示意组成框图。如图16的实施例所示，该示例装置1601可以包括：

分类行为信息表示获取模块1610，其被配置为：根据目标用户的行为的分类，获取所述目标用户的每个分类行为的分类行为信息表示；

物品信息获取模块1620，其被配置为：获取候选物品的信息表示；

兴趣度确定模块1630，其被配置为：根据所述目标用户的分类行为的分类行为信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品的兴趣度。

在图16所示的实施例中，分类行为信息表示获取模块1610可以进一步包括：

行为对象确定单元1611，其被配置为：根据所述目标用户的历史行为数据，确定作为所述目标用户的每个分类行为的行为对象的一个或多个物品；

物品向量表示获取单元1612，其被配置为：分别获取与每个分类行为相对应的所述一个或多个物品中每个物品的向量表示；

向量序列形成单元1613，其被配置为：对于每个分类行为，将相对应的所述一个或多个物品的向量表示按照该分类行为发生的时间顺序形成向量序列，作为该分类行为的分类行为向量序列，即分类行为信息表示。

在图16所示的实施例中，兴趣度确定模块1630可以进一步包括：

分类行为概率确定单元1631，其被配置为：根据所述目标用户的分类行为的分类行为信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品进行每个分类行为的相应概率；

兴趣度确定单元1632，其被配置为：根据所述目标用户对所述候选物品进行每个分类行为的相应概率，确定所述目标用户对所述候选物品的兴趣度。

在图16所示的实施例中，分类行为概率确定单元1631可以进一步包括：

用户信息表示单元1631a，其被配置为：根据所述目标用户的分类行为的分类行为信息，得到所述目标用户的信息表示；

概率确定单元1631b，其被配置为：根据所述目标用户的信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品进行每个分类行为的相应概率。

上述装置中各个单元/模块的功能和作用的实现过程以及相关细节具体详见上述方法实施例中对应步骤的实现过程，在此不再赘述。

以上各实施例中的装置实施例可以通过硬件、软件、固件或其组合的方式来实现，并且其可以被实现为一个单独的装置，也可以被实现为各组成单元/模块分散在一个或多个计算设备中并分别执行相应功能的逻辑集成系统。

以上各实施例中组成该装置的各单元/模块是根据逻辑功能而划分的，它们可以根据逻辑功能被重新划分，例如可以通过更多或更少的单元/模块来实现该装置。这些组成单元/模块分别可以通过硬件、软件、固件或其组合的方式来实现，它们可以是分别的独立部件，也可以是多个组件组合起来执行相应的逻辑功能的集成单元/模块。所述硬件、软件、固件或其组合的方式可以包括：分离的硬件组件，通过编程方式实现的功能模块、通过可编程逻辑器件实现的功能模块，等等，或者以上方式的组合。

根据一个示例性实施例，该装置可被实现为一种机器设备，该机器设备包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序在被所述处理器执行时，使得所述机器设备执行如上所述的各方法实施例中的任一个，或者，所述计算机程序在被所述处理器执行时使得该机器设备实现如上所述的各装置实施例的组成单元/模块所实现的功能。

上面的实施例中所述的处理器可以指单个的处理单元，如中央处理单元CPU，也可以是包括多个分散的处理单元/处理器的分布式处理器系统。

上面的实施例中所述的存储器可以包括一个或多个存储器，其可以是计算设备的内部存储器，例如暂态或非暂态的各种存储器，也可以是通过存储器接口连接到计算设备的外部存储装置。

图17示出了这样的机器设备的一个示例性实施例1701的示意组成框图。如图17所示，该机器设备可以包括但不限于：至少一个处理单元1710、至少一个存储单元1720、连接不同系统组件(包括存储单元1720和处理单元1710)的总线1730。

所述存储单元存储有程序代码，所述程序代码可以被所述处理单元1710执行，使得所述处理单元1710执行本说明书上述示例性方法的描述部分中描述的根据本公开各种示例性实施方式的步骤。例如，所述处理单元1710可以执行如说明书附图中的各流程图所示的各个步骤。

存储单元1720可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)1721和/或高速缓存存储单元1722，还可以进一步包括只读存储单元(ROM)1723。

存储单元1720还可以包括具有一组(至少一个)程序模块1725的程序/实用工具1724，这样的程序模块1725包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线1730可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

该机器设备也可以与一个或多个外部设备1770(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该机器设备交互的设备通信，和/或与使得该机器设备能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1750进行。并且，该机器设备还可以通过网络适配器1760与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器1760通过总线1730与该机器设备的其它模块通信。应当明白，尽管图中未示出，但该机器设备可以使用其它硬件和/或软件模块来实现，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。

在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有计算机可读指令，当所述计算机可读指令被计算机的处理器执行时，使计算机执行上述方法实施例部分描述的方法。

根据本公开的一个实施例，还提供了一种用于实现上述方法实施例中的方法的程序产品，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外，尽管在附图中以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由所附的权利要求指出。

Claims

1.一种确定用户对物品的兴趣度的方法，其特征在于，包括：

获取候选物品的信息表示；

2.根据权利要求1所述的方法，其特征在于，所述分类行为信息表示为分类行为向量序列，所述根据目标用户的行为的分类，获取所述目标用户的每个分类行为的分类行为信息表示包括：

确定作为所述目标用户的每个分类行为的行为对象的一个或多个物品；

分别获取与每个分类行为相对应的所述一个或多个物品中每个物品的向量表示；

对于每个分类行为，将相对应的所述一个或多个物品的向量表示按照该分类行为发生的时间顺序形成向量序列，作为该分类行为的分类行为向量序列。

3.根据权利要求1所述的方法，其特征在于，所述根据所述目标用户的分类行为的分类行为信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品的兴趣度包括：

根据所述目标用户的分类行为的分类行为信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品进行每个分类行为的相应概率；

根据所述目标用户对所述候选物品进行每个分类行为的相应概率，确定所述目标用户对所述候选物品的兴趣度。

4.根据权利要求3所述的方法，其特征在于，所述根据所述目标用户对所述候选物品进行每个分类行为的相应概率，确定所述目标用户对所述候选物品的兴趣度包括：

对所述目标用户对所述候选物品进行每个分类行为的相应概率求加权和，并将得到的结果作为所述目标用户对所述候选物品的兴趣度。

5.根据权利要求3所述的方法，其特征在于，所述根据所述目标用户对所述候选物品进行每个分类行为的相应概率，确定所述目标用户对所述候选物品的兴趣度包括：

对所述目标用户对所述候选物品进行每个分类行为的相应概率求加权和，以得到初始兴趣度；

根据所述候选物品的历史数据，确定所述候选物品的兴趣度修正值；

对所述初始兴趣度和所述兴趣度修正值求加权和，并将得到的结果作为所述目标用户对所述候选物品的兴趣度。

6.根据权利要求3所述的方法，其特征在于，所述根据所述目标用户的分类行为的分类行为信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品进行每个分类行为的相应概率包括：

根据所述目标用户的分类行为的分类行为信息表示，得到所述目标用户的信息表示；

根据所述目标用户的信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品进行每个分类行为的相应概率。

7.根据权利要求3所述的方法，其特征在于，所述分类行为信息表示为分类行为向量序列，所述候选物品的信息表示为所述候选物品的向量表示，所述根据所述目标用户的分类行为的分类行为信息表示和所述候选物品的信息表示，确定所述目标用户对所述候选物品进行每个分类行为的相应概率包括：

将所述目标用户的分类行为的分类行为向量序列和所述候选物品的向量表示作为分类行为概率预测模型的输入，通过所述分类行为概率预测模型得到所述相应概率。

8.根据权利要求7所述的方法，其特征在于，所述分类行为概率预测模型是通过使用历史行为数据对神经网络进行训练而得到的，所述将所述目标用户的分类行为的分类行为向量序列和所述候选物品的向量表示作为分类行为概率预测模型的输入，通过所述分类行为概率预测模型得到所述相应概率包括：

将所述目标用户的分类行为的分类行为向量序列和所述候选物品的向量表示作为训练后的神经网络的输入，通过所述神经网络得到作为所述神经网络的输出的所述相应概率。

9.根据权利要求8所述的方法，其特征在于，所述神经网络包括循环神经网络和全连接神经网络，其中，所述通过所述神经网络得到作为所述神经网络的输出的所述相应概率包括：

将所述目标用户的分类行为的分类行为向量序列作为循环神经网络的输入，以得到作为循环神经网络输出的所述目标用户的向量表示；

将所述目标用户的向量表示和所述候选物品的向量表示作为全连接神经网络的输入，以得到作为全连接神经网络的输出的所述相应概率。

10.根据权利要求9所述的方法，其特征在于，所述将所述目标用户的分类行为的分类行为向量序列作为循环神经网络的输入，以得到作为循环神经网络输出的所述目标用户的向量表示包括：

对于所述目标用户的每个分类行为向量序列，将该分类行为向量序列作为循环神经网络的输入，并将循环神经网络的最后一个时间步的输出作为该分类行为向量序列的分类行为处理向量；

对所述目标用户的所有分类行为向量序列的相应的分类行为处理向量求加权和，并将得到的值作为所述目标用户的向量表示。

11.根据权利要求9所述的方法，其特征在于，所述将所述目标用户的分类行为的分类行为向量序列作为循环神经网络的输入，以得到作为循环神经网络输出的所述目标用户的向量表示包括：

对所述目标用户的所有分类行为向量序列的相应的分类行为处理向量求加权和，以得到分类行为处理总向量；

获取与所述目标用户的所有分类行为相对应的总行为向量序列，作为循环神经网络的输入，并将循环神经网络的最后一个时间步的输出作为所述总行为向量序列的总行为处理向量；

根据所述分类行为处理总向量以及所述总行为处理向量，得到所述目标用户的向量表示。

12.根据权利要求8所述的方法，其特征在于，所述使用历史行为数据对神经网络进行训练包括：

根据神经网络输出的所述相应概率与所述历史行为数据载明的真实概率之间的偏差，确定损失函数；

将确定出的损失函数反馈给神经网络，以用于调整神经网络的参数。

13.一种确定用户对物品的兴趣度的装置，其特征在于，包括：

14.一种机器设备，其特征在于，包括处理器以及存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现根据权利要求1至12中任一项所述的方法。

15.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现根据权利要求1至12中任一项所述的方法。