CN113139834A

CN113139834A - 信息处理方法、装置、电子设备和存储介质

Info

Publication number: CN113139834A
Application number: CN202110475122.6A
Authority: CN
Inventors: 裴英瑞; 张万书; 金林荣; 李森; 肖智鹏; 施文祥; 殷威; 徐昊
Original assignee: Beijing Wodong Tianjun Information Technology Co Ltd
Current assignee: Beijing Wodong Tianjun Information Technology Co Ltd
Priority date: 2021-04-29
Filing date: 2021-04-29
Publication date: 2021-07-20

Abstract

本发明实施例公开了一种信息处理方法、装置、电子设备和存储介质，该信息处理方法包括：获取目标用户的用户标签，并确定与用户标签匹配的物品推荐信息，得到候选推荐信息；将用户标签输入向量化模型进行向量化处理，得到用户向量，该向量化模型基于样本用户的历史操作数据训练得到；在候选推荐信息对应的物品编码的编码向量中检索与用户向量匹配的编码向量，得到目标编码向量，该候选推荐信息对应的物品编码的编码向量通过将候选推荐信息对应的物品编码输入向量化模型进行向量化处理得到；根据目标编码向量对应的目标物品编码获取目标推荐信息，并将目标推荐信息作为针对目标用户的召回信息。本发明实施例能够提高召回信息的准确度和质量。

Description

信息处理方法、装置、电子设备和存储介质

技术领域

本发明涉及互联网技术领域，尤其涉及一种信息处理方法、装置、电子设备和存储介质。

背景技术

随着互联网的飞速发展，在线的物品推荐信息(例如广告)随处可见，所推送的物品推荐信息是否合适，关系着用户体验、物品供应商(例如商家)的成交总额(GrossMerchandise Volume，GMV)、信息投放者(例如广告主)的投资回报率(Return OnInvestment，ROI)，因而，如何为用户推送合适的物品推荐信息，成为研究热点。

信息投放者投放的物品推荐信息，通常会被存储在信息推荐引擎中，信息推荐引擎会对其内存储的所有物品推荐信息建立倒排索引，当有用户访问时，信息推荐引擎会通过建立的倒排索引搜索与用户标签匹配的物品推荐信息，然后按照信息投放者的出价对搜索到的物品推荐信息进行排序、截断，得到召回结果。在实现本发明的过程中，发现人发现，这种方法召回的物品推荐信息相对用户而言，不够准确、质量偏低。

发明内容

本发明实施例提供了一种信息处理方法、装置、电子设备和存储介质，能够提高召回信息的准确度和质量。

第一方面，本发明实施例提供一种信息处理方法，包括：

获取目标用户的用户标签，并确定与所述用户标签匹配的物品推荐信息，得到候选推荐信息；

将所述用户标签输入向量化模型进行向量化处理，得到用户向量，所述向量化模型基于样本用户的历史操作数据训练得到；

在所述候选推荐信息对应的物品编码的编码向量中检索与所述用户向量匹配的编码向量，得到目标编码向量，所述候选推荐信息对应的物品编码的编码向量通过将所述候选推荐信息对应的物品编码输入所述向量化模型进行向量化处理得到；

根据所述目标编码向量对应的目标物品编码获取目标推荐信息，并将所述目标推荐信息作为针对所述目标用户的召回信息。

第二方面，本发明实施例提供一种信息处理装置，所述装置包括：

确定模块，用于获取目标用户的用户标签，并确定与所述用户标签匹配的物品推荐信息，得到候选推荐信息；

向量化模块，用于将所述用户标签输入向量化模型进行向量化处理，得到用户向量，所述向量化模型基于样本用户的历史操作数据训练得到；

检索模块，用于在所述候选推荐信息对应的物品编码的编码向量中检索与所述用户向量匹配的编码向量，得到目标编码向量，所述候选推荐信息对应的物品编码的编码向量通过将所述候选推荐信息对应的物品编码输入所述向量化模型进行向量化处理得到；

召回模块，用于根据所述目标编码向量对应的目标物品编码获取目标推荐信息，并将所述目标推荐信息作为针对所述目标用户的召回信息。

第三方面，本发明实施例还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如本发明实施例中任一所述的信息处理方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例中任一所述的信息处理方法。

本发明实施例中，在获取目标用户的用户标签，并确定与用户标签匹配的物品推荐信息，得到候选推荐信息之后，会将将用户标签输入向量化模型进行向量化处理，得到用户向量，该向量化模型基于样本用户的历史操作数据训练得到；在候选推荐信息对应的物品编码的编码向量中检索与用户向量匹配的编码向量，得到目标编码向量，该候选推荐信息对应的物品编码的编码向量通过将该候选推荐信息对应的物品编码输入向量化模型进行向量化处理得到；根据目标编码向量对应的目标物品编码获取目标推荐信息，并将目标推荐信息作为针对目标用户的召回信息。由于向量化模型是基于样本用户的历史操作数据训练得到的，因而通过向量化模型将目标用户及候选推荐信息对应的物品编码向量化之后，通过向量匹配获取的目标推荐信息是与用户的习惯、兴趣强相关的，故召回的目标推荐信息将更贴合用户的实际需求，提高了召回信息的准确度和质量。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本发明实施例提供的倒排索引的一个结构示意图。

图2是本发明实施例提供的信息处理方法的一个流程示意图。

图3是本发明实施例提供的向量化模型的训练方法的一个流程示意图。

图4是本发明实施例提供的向量树的构建方法的一个流程示意图。

图5是本发明实施例提供的向量树的一个结构示意图。

图6是本发明实施例提供的信息处理装置的一个结构示意图。

图7是本发明实施例提供的电子设备的一个结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

在描述本发明实施例提供的信息处理方法之前，先介绍一下信息推荐引擎中的倒排索引，一个具体的倒排索引例如图1所示。当物品推荐信息(例如广告)存入信息推荐引擎时，会根据定向条件对物品推荐信息分类，定向条件可依据物品推荐信息的属性设置。如图1所示，其中的主属性可以是系统预先指定的属性，其余的属性称为副属性，一个主属性下可以包括多个副属性。某一个定向条件下会记录所有符合此定向条件的物品推荐信息。例如，某定向条件为“地域：广州”，我们称“地域”为属性，“广州”为属性值，属性值“广州”下面会记录所有拥有该定向条件的物品推荐信息列表(例如广告列表)。例如针对图1中的副属性1下的值a，副属性1为“地域”，值a为“广州”，则值a下挂的列表中则包括符合“广州”这一属性值的物品推荐信息；针对副属性1下的值b，副属性1为“地域”，值b为“北京”，则值b下挂的列表中则包括符合“北京”这一属性值的物品推荐信息。依此类推，每个属性值下都记录着拥有对应定向条件的广告，整个倒排索引就是由属性和属性值组合起来的。

现有技术中，当有用户请求时，通常会先通过建立的倒排索引搜索定向条件与用户标签匹配的物品推荐信息，用户标签比如用户的性别、年龄、地域等，用户标签可通过用户的注册信息、大数据统计信息等获取。例如，某个用户的用户标签为“地域：广州”，与倒排索引中的定向条件“地域：广州”相符，则获取倒排索引中“广州”这一属性值下挂的物品推荐信息，根据信息投放者的出价对获取的物品推荐信息进行排序、截断，得到针对该用户的召回结果。

这种召回方式召回的推荐信息对用户而言，不够准确、质量偏低。比如，某用户最近一段时间都在浏览“戴尔”的笔记本电脑，通过倒排索引获取与用户标签匹配的笔记本电脑的广告之后，发现有一条“联想”笔记本电脑的广告与该用户的用户标签匹配且出价最高，此时就会将“联想”笔记本电脑的广告召回给该用户，但实际上，该用户的购买意图是“戴尔”的笔记本电脑，所以对召回的“联想”笔记本电脑的广告点击的可能性就很小，且购买“联想”笔记本电脑的可能性也很小，这种召回对该用户而言，就是一个不够准确、质量偏低的召回。

另外，每个物品推荐信息中都会有很多素材，这些素材比如可以是图片、标题等，每个素材都对应着一个物品编码，素材与对应的物品编码可以绑定。物品编码比如可以是库存量单位(Stock Keeping Unit，SKU)编码，一个SKU编码可以用来唯一标识一款物品；比如，某厂家生产的最新手机，有蓝色、白色和黑色，则蓝色款手机、白色款手机和黑色款手机分别有不同的SKU编码。

以物品推荐信息为手机广告为例，一条手机广告中可能包括多个用于宣传不同款式(比如蓝色款、白色款和黑色款，可用SKU编码区分标识)手机的素材(例如图片、标题)，一个素材绑定一个SKU编码，则一条手机广告可以对应多个SKU编码。

物品推荐信息、素材与物品编码的关系，比如可如下表1所示：

表1

表1所示，即广告1包括素材11、素材12和素材13，其中，素材11、素材12和素材13对应绑定SKU11、SKU12和SKU13；广告2包括素材21、素材22、素材23和素材24，其中，素材21、素材22、素材23和素材24对应绑定SKU21、SKU22、SKU23和SKU24；广告3包括素材31和素材32，其中，素材31和素材32对应绑定SKU31和SKU32。

通常来说，在召回物品推荐信息之后，还会从物品推荐信息中选择召回素材。现有技术中，在选择召回素材时，通常是从召回的物品推荐信息中随机选取一定数量的素材，选取的召回素材质量偏低。

另外，随机选取的召回素材构成的集合可以称为粗排集合，由于粗排集合中的素材是随机从召回的物品推荐信息中选取的，为了尽可能的减少随机性带来的偶然因素，一般会在性能允许的情况下，从召回的物品推荐信息中尽可能多的选取素材，这样就导致粗排集合比较大，不便于后续精排模型使用。

针对以上问题，本发明实施例提供了一种信息处理方法，如图2所示，图2是本发明实施例提供的信息处理方法的一个流程示意图，该方法可以由本发明实施例提供的信息处理装置来执行，该装置可采用软件和/或硬件的方式实现。在一个具体的实施例中，该装置可以集成在电子设备中，电子设备比如可以是服务器。以下实施例将以该装置集成在电子设备中为例进行说明，参考图2，该方法具体可以包括如下步骤：

步骤101，获取目标用户的用户标签，并确定与用户标签匹配的物品推荐信息，得到候选推荐信息。

示例地，用户标签例如可以是用户的年龄、性别、学历、地域等，用户标签可以包括多个，可以根据用户注册信息、大数据统计信息等获取目标用户的用户标签。在获取用户标签之后，可以通过倒排索引获取与每个用户标签匹配的物品推荐信息，最终，每个用户标签都可以得到对应的候选推荐信息，一个用户标签对应的候选推荐信息可以包括多个，这些候选推荐信息比如可以是广告。

具体地，一个候选推荐信息可以包括多个素材，每个素材都绑定有物品编码，即一个候选推荐信息可以对应多个物品编码。

步骤102，将用户标签输入向量化模型进行向量化处理，得到用户向量，向量化模型基于样本用户的历史操作数据训练得到。

示例地，向量化模型可以预先通过采集样本用户的历史操作数据离线或在线训练得到，向量化模型用于将输入信息进行向量化处理；样本用户可以是全网用户，也可以是从全网用户中选取的部分用户；历史操作数据可以包括样本用户在网上对物品的浏览、点击、收藏、加入购物车、购买等的数据，历史操作数据可以是过去产生的所有操作数据，也可以是过去某个时间段内产生的操作数据，此处不做具体限定。

具体地，可以将目标用户的用户标签输入至向量化模型进行向量化处理，得到一个用于表示目标用户的用户向量。具体实现中，步骤102与步骤101采用的目标用户的用户标签可以相同，也可以不同，步骤102采用的用户标签可以是步骤101采用的用户标签的一个子集，步骤102采用的用户标签具体可由向量化模型训练时采用的用户标签决定，即步骤102采用的用户标签可与向量化模型训练时采用的用户标签相同。

步骤103，在候选推荐信息对应的物品编码的编码向量中检索与用户向量匹配的编码向量，得到目标编码向量，候选推荐信息对应的物品编码的编码向量通过将候选推荐信息对应的物品编码输入向量化模型进行向量化处理得到。

具体地，可以将候选推荐信息对应的所有物品编码依次输入至向量化模型进行向量化处理，得到每个物品编码的编码向量，将每个编码向量均与用户向量进行匹配，从而得到目标编码向量。其中，两个向量的匹配可以通过计算两个向量的余弦值实现，比如，如果两个向量的余弦值大于某个预设值，则确定两个向量匹配。

具体实现中，当目标用户的用户标签有多个时，可以将用户向量与每个用户标签匹配的候选推荐信息对应的物品编码的编码向量进行匹配检索，针对每个用户标签，都可以检索到对应的目标编码向量。

步骤104，根据目标编码向量对应的目标物品编码获取目标推荐信息，并将目标推荐信息作为针对目标用户的召回信息。

具体地，每个物品编码经向量化后都有对应的编码向量，可以记录物品编码和编码向量的对应关系，根据物品编码和编码向量的对应关系获取目标编码向量对应的目标物品编码。

具体实现中，可以预先维护物品编码与物品推荐信息的对应关系，根据物品编码与物品推荐信息的对应关系获取目标物品编码对应目标推荐信息。

在一个具体的实施例中，物品编码与物品推荐信息的对应关系比如可如下表2所示：

物品编码(SKU编码)	物品推荐信息(广告)
		SKU11、SKU12、SKU13	广告1
SKU21、SKU22、SKU23、SKU24	广告2
		SKU31、SKU32	广告3

表2

针对每个用户标签检索到的对应的目标编码向量，都可以获取其对应的目标物品编码，根据物品编码与物品推荐信息的对应关系获取目标物品编码对应的目标推荐信息。最后，可以将每个用户标签对应得到的目标推荐信息求交集，从而得到同时符合目标用户的所有用户标签的物品推荐信息，将同时符合目标用户的所有用户标签的物品推荐信息召回。

进一步地，还可以从召回的目标推荐信息中获取与目标物品编码绑定的目标素材，将目标素材作为针对目标用户的召回素材。

比如，得到的目标物品编码包括SKU11、SKU12和SKU24，根据表2可知，SKU11、SKU12对应的广告为广告1，SKU24对应的广告为广告2，则可以确定召回广告1和广告2；根据表1可知，SKU11、SKU12绑定的素材分别是素材11、素材12，SKU24绑定的素材是素材24，则可以从广告1中选取素材11、素材12，从广告2中选取素材24，将素材11、素材12、素材24作为召回素材。

由于向量化模型是基于样本用户的历史操作数据训练得到的，因而通过向量化模型将目标用户及候选推荐信息对应的物品编码向量化之后，通过向量匹配得到目标物品编码，根据目标物品编码从目标推荐信息中选取的素材将是与用户的习惯、兴趣强相关的，相较于随机选取召回的素材，本发明实施例召回的目标素材更贴合用户的实际需求，召回素材质量更高。

另外，由于可以根据目标物品编码从目标推荐信息中选取素材并召回，因而可以直接避免随机性带来的偶然因素，可以实现素材的精准选取，减小召回素材形成的粗排集合，避免粗排集合比较大、不便于后续精排模型使用的问题。

在一个具体的实施例中，本发明实施例所使用的向量化模型可以通过图3所示方法训练得到，如图3所示，该方法可以包括如下步骤：

步骤201，根据历史操作数据建立样本用户和物品编码的关联图，并对关联图中的各个节点随机赋予向量。

示例地，样本用户可以是全网用户，也可以是从全网用户中选取的部分用户；历史操作数据可以包括样本用户在网上对物品的浏览、点击、收藏、加入购物车、购买等的数据，历史操作数据可以是过去产生的所有操作数据，也可以是过去某个时间段内产生的操作数据，此处不做具体限定。

具体地，可以将样本用户作为用户节点，将物品编码作为编码节点，根据历史操作数据确定关联的用户节点和编码节点，关联的用户节点和编码节点为对应的样本用户和物品编码之间存在操作关系的节点，将关联的用户节点和编码节点连接起来，形成关联图。

例如，某个样本用户对某个物品编码所标识的物品有过点击、收藏、加入购物车、购买中的至少一个操作时，则确定该样本用户与该物品编码之间存在操作关系，则可以将该样本用户对应的用户节点和该物品编码对应的编码节点连接起来。

形成的关联图中包括大量的节点，在初始训练时，可以随机对每个节点赋予向量值。

步骤202，从关联图中选取预设数量的目标节点，并通过聚合函数对目标节点的邻居节点的向量进行聚合，生成目标节点的向量。

示例地，预设数量可以根据实验数据或实际需求自定义取值，所选取的目标节点包括用户节点和编码节点。

具体实现中，为了降低计算复杂度并兼顾精度，在通过聚合函数对目标节点的邻居节点的向量进行聚合时，可以采样目标节点的一跳邻居节点和二跳邻居节点，具体聚合方法可如下：

首先，通过聚合函数将目标节点的二跳邻居节点的向量进行聚合，生成目标节点的一跳邻居节点的向量；

其次，通过聚合函数将目标节点的一跳邻居节点的向量进行聚合，生成目标节点的向量。

示例地，该聚合函数可以采用平均聚合算法，即可以通过计算所有二跳邻居节点的向量的平均值，得到对应一跳邻居节点的向量；通过计算所有一跳邻居节点的向量的平均值，得到对应目标节点的向量。

步骤203，根据目标节点的向量计算样本预测标签。

在计算样本预测标签之前，可以先确定样本预设标签，样本预设标签可以通过如下方式得到：

(1)建立样本集，样本集中的每个样本包括样本用户和物品编码。

即每个样本可以由样本用户和物品编码构成。

(2)针对每个样本，根据历史操作数据确定样本中的样本用户与物品编码之间是否存在操作关系。

例如，某个样本中的样本用户对该样本中的物品编码所标识的物品有过点击、收藏、加入购物车、购买中的至少一个操作时，则确定该样本中的样本用户与该物品编码之间存在操作关系。

(3)如果样本中的样本用户与物品编码之间存在操作关系，则将样本赋予第一标签值，如果样本中的样本用户与物品编码之间不存在操作关系，则将样本赋予第二标签值。

示例地，如果样本中的样本用户与物品编码之间存在操作关系，则可以认为该样本为正样本，如果样本中的样本用户与物品编码之间不存在操作关系，则可以认为该样本为负样本。具体地，第一标签值可以是1，第二标签值可以是0，当然，反之亦可。

在得到样本预设标签之后，可以根据目标节点的向量和样本预设标签计算样本预测标签，具体可以如下：

(1)根据第一标签值和第二标签值确定映射区间。

例如，当第一标签值为1，第二标签值为0时，可以确定映射区间为[0,1]。

(2)计算目标节点中的用户节点和编码节点的向量相似度，将计算得到的相似度值映射至映射区间，得到样本预测标签。

示例地，目标节点中的用户节点和编码节点的向量相似度，可以通过计算该用户节点的向量与该编码节点的向量的余弦值得到。

示例地，将相似度值映射至映射区间，可以通过sigmod函数实现，即可以通过sigmod函数将相似度值映射至区间[0,1]。

步骤204，通过损失函数对样本预测标签和样本预设标签进行损失计算，得到损失值。

示例地，损失函数可以交叉熵函数，具体可以按照如下公式计算损失值：

其中，loss表示损失值，n表示样本数量，y_i表示样本预设标签，

表示样本预测标签。

步骤205，根据损失值反向优化聚合函数的参数和所述各个节点的向量，得到向量化模型。

例如，可以采用梯度下降法反向优化聚合函数的参数和所述各个节点的向量，从而得到向量化模型。

需要说明的是，本发明实施例提供的向量化模型的训练方法仅为可选或优选方法，并不作为对向量化模型的训练方法的唯一限定。

本发明实施例中，历史操作数据的获取及向量化模型的训练均可以在离线系统中运行的，不影响线上业务。离线系统把训练好的向量化模型序列化到文件中，线上机器直接加载文件到内存即可通过该向量化模型计算得出向量信息。向量化模型版本的更新和信息推荐引擎系统全量物料的更新一致，全量物料的更新推动向量化模型的更新，同时向量化模型版本的更新也支持实时更新，在存放向量化模型的目录下有一个名为列表(list)的文件，该文件会实时记录向量化模型的版本，当向量化模型更新的时候，模型系统会在列表文件的末尾追加最新的模型版本信息。智能索引会实时检测列表文件的内容，当发现列表末尾记录的模型版本和当前系统使用的版本不一致时，会触发模型的更新。

在一个具体的实施例中，为了加快目标编码向量的检索速度，提高信息处理效率，还可以根据候选推荐信息对应的物品编码的编码向量构建向量树，通过向量树检索与用户向量匹配的编码向量，得到目标编码向量。

具体向量树的构建方法可如下图4所示，包括如下步骤：

步骤301，将候选推荐信息对应的物品编码输入向量化模型进行向量化处理，得到候选推荐信息对应的物品编码的编码向量。

其中，一个物品编码可以对应得到一个编码向量。

步骤302，将候选推荐信息对应的物品编码的编码向量作为一簇整体，采用K均值聚类算法将一簇整体划分成两个簇。

本实施例以K均值聚类算法中的K取2为例进行说明，具体划分方法可以如下：

(1)将这一簇整体划分成两个簇，从每个簇中随机选取一个编码向量作为对应簇的初始质心。

(2)计算所有编码向量到两个簇质心的距离，将每个编码向量划分到与其距离最近的质心对应的簇中，从而实现簇的重新划分。

(3)对重新划分得到的簇中的所有编码向量求均值，得到对应簇的新质心。

(4)计算前后两次得到的对应质心间的距离，如果距离小于设定距离值，则两个簇划分完毕；如果距离不小于设定距离值，则重复执行(2)(3)步。

步骤303，将当前得到的两个簇中密集程度较低的簇继续划分成两个簇。

具体地，可以计算每个簇中的所有编码向量到该簇质心的距离和，将距离和较大的簇作为密集程度较低的簇继续划分。

步骤304，是否满足预设终止条件，如果满足，则执行步骤305，否则，返回步骤303。

预设终止条件可根据实际需求自定义设置，比如划分出指定个数的簇。

步骤305，将得到的所有簇作为树节点建立二叉树，得到向量树。

在一个具体的实施例中，所建立的向量树可如图5所示，向量树中的每个节点都是一个簇。

在得到向量树之后，可以按照如下方法对向量树进行检索：

(1)从向量树的每一层中检索出与用户向量匹配的簇，得到目标簇。

具体地，可以计算用户向量与向量树的每一层中的簇的质心的向量相似度，选取计算得到的相似度值满足预设相似度阈值的簇，得到目标簇。其中，簇的质心可以是簇中所有向量的均值。

比如，可以对向量树每一层计算得到的相似度按照从大到小的顺序进行排序，选取排序靠前的M个相似度值对应的簇，得到目标簇，M为正整数，如果某层总共的簇不满M个，则该层的簇全部选取。

(2)从目标簇中检索出与用户向量匹配的编码向量，得到目标编码向量。

比如，可以计算每个目标簇中的编码向量与用户向量的相似度，然后对计算得到的相似度按照从大到小的顺序进行排序，选取排序靠前的M个相似度值对应的编码向量，得到目标编码向量。

通过构建向量树的方法检索获取目标编码向量，通过相似度条件的设置，可以只检索目标簇，减小了检索范围，从而提到了检索速度。当然，实际应用中，也可以不构建向量树，而采用暴力检索方法全部检索，本发明实施例对此不做具体限定。

图6是本发明是实施例提供的信息处理装置的一个结构图，该装置适用于执行本发明实施例提供的信息处理方法。如图6所示，该装置具体可以包括：

确定模块401，用于获取目标用户的用户标签，并确定与所述用户标签匹配的物品推荐信息，得到候选推荐信息；

向量化模块402，用于将所述用户标签输入向量化模型进行向量化处理，得到用户向量，所述向量化模型基于样本用户的历史操作数据训练得到；

检索模块403，用于在所述候选推荐信息对应的物品编码的编码向量中检索与所述用户向量匹配的编码向量，得到目标编码向量，所述候选推荐信息对应的物品编码的编码向量通过将所述候选推荐信息对应的物品编码输入所述向量化模型进行向量化处理得到；

召回模块404，用于根据所述目标编码向量对应的目标物品编码获取目标推荐信息，并将所述目标推荐信息作为针对所述目标用户的召回信息。

一实施例中，所述装置还包括模型建立模块，所述模型建立模块用于：

根据所述历史操作数据建立样本用户和物品编码的关联图，并对所述关联图中的各个节点随机赋予向量；

从所述关联图中选取预设数量的目标节点，并通过聚合函数对所述目标节点的邻居节点的向量进行聚合，生成所述目标节点的向量；

根据所述目标节点的向量计算样本预测标签；

通过损失函数对所述样本预测标签和样本预设标签进行损失计算，得到损失值；

根据所述损失值反向优化所述聚合函数的参数和所述各个节点的向量，得到所述向量化模型。

一实施例中，所述模型建立模块根据所述历史操作数据建立样本用户和物品编码的关联图，包括：

将样本用户作为用户节点，将物品编码作为编码节点，根据所述历史操作数据确定关联的用户节点和编码节点，所述关联的用户节点和编码节点为对应的样本用户和物品编码之间存在操作关系的节点；

将所述关联的用户节点和编码节点连接起来，形成所述关联图。

一实施例中，所述模型建立模块通过聚合函数对所述目标节点的邻居节点的向量进行聚合，生成所述目标节点的向量，包括：

通过所述聚合函数将所述目标节点的二跳邻居节点的向量进行聚合，生成所述目标节点的一跳邻居节点的向量；

通过所述聚合函数将所述目标节点的一跳邻居节点的向量进行聚合，生成所述目标节点的向量。

一实施例中，所述样本预设标签通过如下方式得到：

建立样本集，所述样本集中的每个样本包括样本用户和物品编码；

针对每个所述样本，根据所述历史操作数据确定所述样本中的样本用户与物品编码之间是否存在操作关系；

如果所述样本中的样本用户与物品编码之间存在操作关系，则将所述样本赋予第一标签值，如果所述样本中的样本用户与物品编码之间不存在操作关系，则将所述样本赋予第二标签值。

一实施例中，所述目标节点包括用户节点和编码节点，所述模型建立模块根据所述目标节点的向量计算样本预测标签，包括：

根据所述第一标签值和所述第二标签值确定映射区间；

计算所述目标节点中的用户节点和编码节点的向量相似度，将计算得到的相似度值映射至所述映射区间，得到所述样本预测标签。

一实施例中，所述检索模块403在所述候选推荐信息对应的物品编码的编码向量中检索与所述用户向量匹配的编码向量，得到目标编码向量，包括：

根据所述候选推荐信息对应的物品编码的编码向量构建向量树；

在所述向量树上检索与所述用户向量匹配的编码向量，得到所述目标编码向量。

一实施例中，所述检索模块403根据所述候选推荐信息对应的物品编码的编码向量构建向量树，包括：

将所述候选推荐信息对应的物品编码的编码向量作为一簇整体，采用K均值聚类算法将所述一簇整体划分成两个簇；

将当前得到的两个簇中密集程度较低的簇继续划分并重复当前步骤，直至满足预设终止条件时停止划分；

将得到的所有簇作为树节点建立二叉树，得到所述向量树。

一实施例中，所述检索模块403所述在所述向量树上检索与所述用户向量匹配的编码向量，得到所述目标编码向量，包括：

从所述向量树的每一层中检索出与所述用户向量匹配的簇，得到目标簇；

从所述目标簇中检索出与所述用户向量匹配的编码向量，得到所述目标编码向量。

一实施例中，所述检索模块403从所述向量树的每一层中检索出与所述用户向量匹配的簇，得到目标簇，包括：

计算所述用户向量与所述向量树的每一层中的簇的质心的向量相似度，选取计算得到的相似度值满足预设相似度阈值的簇，得到所述目标簇。

一实施例中，所述召回模块404还用于：

从所述目标推荐信息中获取与所述目标物品编码绑定的目标素材，将所述目标素材作为针对所述目标用户的召回素材。

本领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述功能模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本发明实施例的装置，在获取目标用户的用户标签，并确定与用户标签匹配的物品推荐信息，得到候选推荐信息之后，会将将用户标签输入向量化模型进行向量化处理，得到用户向量，该向量化模型基于样本用户的历史操作数据训练得到；在候选推荐信息对应的物品编码的编码向量中检索与用户向量匹配的编码向量，得到目标编码向量，该候选推荐信息对应的物品编码的编码向量通过将该候选推荐信息对应的物品编码输入向量化模型进行向量化处理得到；根据目标编码向量对应的目标物品编码获取目标推荐信息，并将目标推荐信息作为针对目标用户的召回信息。由于向量化模型是基于样本用户的历史操作数据训练得到的，因而通过向量化模型将目标用户及候选推荐信息对应的物品编码向量化之后，通过向量匹配获取的目标推荐信息是与用户的习惯、兴趣强相关的，故召回的目标推荐信息将更贴合用户的实际需求，提高了召回信息的准确度和质量。

本发明实施例还提供了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一实施例提供的信息处理方法。

本发明实施例还提供了一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现上述任一实施例提供的信息处理方法。

下面参考图7，其示出了适于用来实现本发明实施例的电子设备的计算机系统500的结构示意图。图7示出的电子设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图7所示，计算机系统500包括中央处理单元(CPU)501，其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中，还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

以下部件连接至I/O接口505：包括键盘、鼠标等的输入部分506；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507；包括硬盘等的存储部分508；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器510上，以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分509从网络上被下载和安装，和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块和/或单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块和/或单元也可以设置在处理器中，例如，可以描述为：一种处理器包括确定模块、向量化模块、检索模块和召回模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：获取目标用户的用户标签，并确定与所述用户标签匹配的物品推荐信息，得到候选推荐信息；将所述用户标签输入向量化模型进行向量化处理，得到用户向量，所述向量化模型基于样本用户的历史操作数据训练得到；在所述候选推荐信息对应的物品编码的编码向量中检索与所述用户向量匹配的编码向量，得到目标编码向量，所述候选推荐信息对应的物品编码的编码向量通过将所述候选推荐信息对应的物品编码输入所述向量化模型进行向量化处理得到；根据所述目标编码向量对应的目标物品编码获取目标推荐信息，并将所述目标推荐信息作为针对所述目标用户的召回信息。

根据本发明实施例的技术方案，在获取目标用户的用户标签，并确定与用户标签匹配的物品推荐信息，得到候选推荐信息之后，会将将用户标签输入向量化模型进行向量化处理，得到用户向量，该向量化模型基于样本用户的历史操作数据训练得到；在候选推荐信息对应的物品编码的编码向量中检索与用户向量匹配的编码向量，得到目标编码向量，该候选推荐信息对应的物品编码的编码向量通过将该候选推荐信息对应的物品编码输入向量化模型进行向量化处理得到；根据目标编码向量对应的目标物品编码获取目标推荐信息，并将目标推荐信息作为针对目标用户的召回信息。由于向量化模型是基于样本用户的历史操作数据训练得到的，因而通过向量化模型将目标用户及候选推荐信息对应的物品编码向量化之后，通过向量匹配获取的目标推荐信息是与用户的习惯、兴趣强相关的，故召回的目标推荐信息将更贴合用户的实际需求，提高了召回信息的准确度和质量。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种信息处理方法，其特征在于，包括：

2.根据权利要求1所述的信息处理方法，其特征在于，所述向量化模型通过如下方式训练得到：

根据所述目标节点的向量计算样本预测标签；

3.根据权利要求2所述的信息处理方法，其特征在于，所述根据所述历史操作数据建立样本用户和物品编码的关联图，包括：

4.根据权利要求2所述的信息处理方法，其特征在于，所述通过聚合函数对所述目标节点的邻居节点的向量进行聚合，生成所述目标节点的向量，包括：

5.根据权利要求3所述的信息处理方法，其特征在于，所述样本预设标签通过如下方式得到：

6.根据权利要求5所述的信息处理方法，其特征在于，所述目标节点包括用户节点和编码节点，所述根据所述目标节点的向量计算样本预测标签，包括：

根据所述第一标签值和所述第二标签值确定映射区间；

7.根据权利要求1至6任一所述的信息处理方法，其特征在于，所述在所述候选推荐信息对应的物品编码的编码向量中检索与所述用户向量匹配的编码向量，得到目标编码向量，包括：

8.根据权利要求7所述的信息处理方法，其特征在于，所述根据所述候选推荐信息对应的物品编码的编码向量构建向量树，包括：

将得到的所有簇作为树节点建立二叉树，得到所述向量树。

9.根据权利要求7所述的信息处理方法，其特征在于，所述在所述向量树上检索与所述用户向量匹配的编码向量，得到所述目标编码向量，包括：

10.根据权利要求9所述的信息处理方法，其特征在于，所述从所述向量树的每一层中检索出与所述用户向量匹配的簇，得到目标簇，包括：

11.根据权利要求1所述的信息处理方法，其特征在于，所述方法还包括：

12.一种信息处理装置，其特征在于，包括：

13.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至11中任一所述的信息处理方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至11中任一所述的信息处理方法。