CN113762992A

CN113762992A - 一种处理数据的方法和装置

Info

Publication number: CN113762992A
Application number: CN202010495399.0A
Authority: CN
Inventors: 蒋权; 陈希; 李鑫
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Priority date: 2020-06-03
Filing date: 2020-06-03
Publication date: 2021-12-07

Abstract

本发明公开了一种处理数据的方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征，生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量；将所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量拼接成所述目标用户的组合嵌入向量；将所述目标用户的组合嵌入向量输入到预先训练好的计算模型中，从而输出所述目标用户对所述目标物品的行为概率。该实施方式能够解决无法精准和高效地挖掘用户与物品之间的隐含的向量表式，无法区分用户长期、中期和近期的兴趣变化的技术问题。

Description

一种处理数据的方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种处理数据的方法和装置。

背景技术

个性化排序是依据用户个性化特性，利用机器学习和深度学习算法，在不同应用场景给用户呈现个性化推送结果的技术。该技术最重要的目的是从海量的候选集中给用户呈现极少数用户心中优先级最高的物品。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：

无法精准和高效地挖掘用户与物品之间的隐含的向量表式，无法区分用户长期、中期和近期的兴趣变化，导致计算结果不准确。

发明内容

有鉴于此，本发明实施例提供一种处理数据的方法和装置，以解决无法精准和高效地挖掘用户与物品之间的隐含的向量表式，无法区分用户长期、中期和近期的兴趣变化的技术问题。

为实现上述目的，根据本发明实施例的一个方面，提供了一种处理数据的方法，包括：

根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征，生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量；

将所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量拼接成所述目标用户的组合嵌入向量；

将所述目标用户的组合嵌入向量输入到预先训练好的计算模型中，从而输出所述目标用户对所述目标物品的行为概率；

其中，所述计算模型采用如下方法训练得到：

根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征，生成各个所述用户的组合嵌入向量；

采用各个所述用户的组合嵌入向量训练全连接神经网络，从而得到计算模型。

可选地，根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征，生成各个所述用户的组合嵌入向量，包括：

采用第一图嵌入模型将训练样本中各个用户的近期行为特征和基础特征，转换成各个所述用户的嵌入向量；

采用第二图嵌入模型将训练样本中各个物品的近期行为特征和基础特征，转换成各个所述物品的嵌入向量；

采用注意力神经网络将训练样本中各个所述用户的不同时期的行为特征，转换成各个所述用户的行为嵌入向量；

采用记忆网络模型将训练样本中各个所述用户的不同时期的行为特征，转换成各个所述用户的兴趣演化嵌入向量；

将各个所述用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及各个所述物品的嵌入向量分别拼接成各个所述用户的组合嵌入向量。

可选地，所述第一图嵌入模型为Node2vec模型，所述第二图嵌入模型为Node2vec模型，所述记忆网络模型为分层周期记忆网络模型。

可选地，所述不同时期的行为特征包括近期的行为特征、中期的行为特征和长期的行为特征。

可选地，还包括：

若所述用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述物品的嵌入向量中缺少任一维度的特征，则采用不参与计算的标记符对该维度的特征进行补齐。

可选地，根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征，生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量，包括：

采用所述第一图嵌入模型将目标用户的近期行为特征和基础特征，转换成所述目标用户的嵌入向量；

采用所述第二图嵌入模型目标物品的近期行为特征和基础特征，转换成所述目标物品的嵌入向量；

采用所述注意力神经网络将所述目标用户的不同时期的行为特征，转换成所述目标用户的行为嵌入向量；

采用所述记忆网络模型将所述目标用户的不同时期的行为特征，转换成所述目标用户的兴趣演化嵌入向量。

可选地，输出所述目标用户对所述目标物品的行为概率之后，还包括：

将所述目标用户对各个所述目标物品的行为概率进行降序排列；

筛选出行为概率靠前的N个目标物品，N为大于零的整数；

将所述N个目标物品加入到所述目标用户对应的待推荐物品集合中。

另外，根据本发明实施例的另一个方面，提供了一种处理数据的装置，包括：

特征模块，用于根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征，生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量；

组合模块，用于将所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量拼接成所述目标用户的组合嵌入向量；

计算模块，用于将所述目标用户的组合嵌入向量输入到预先训练好的计算模型中，从而输出所述目标用户对所述目标物品的行为概率；

训练模块，用于根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征，生成各个所述用户的组合嵌入向量；采用各个所述用户的组合嵌入向量训练全连接神经网络，从而得到计算模型。

可选地，所述训练模块还用于：

可选地，所述特征模块还用于：

可选地，所述计算模块还用于：

输出所述目标用户对所述目标物品的行为概率之后，将所述目标用户对各个所述目标物品的行为概率进行降序排列；

筛选出行为概率靠前的N个目标物品，N为大于零的整数；

根据本发明实施例的另一个方面，还提供了一种电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，所述一个或多个处理器实现上述任一实施例所述的方法。

根据本发明实施例的另一个方面，还提供了一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现上述任一实施例所述的方法。

上述发明中的一个实施例具有如下优点或有益效果：因为采用将目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及目标物品的嵌入向量输入到预先训练好的计算模型中，从而输出目标用户对目标物品的行为概率的技术手段，所以克服了现有技术中无法精准和高效地挖掘用户与物品之间的隐含的向量表式，无法区分用户长期、中期和近期的兴趣变化的技术问题。本发明实施例利用图嵌入技术从用户和物品的多维度特征中精准和高效地用户与物品之间的隐含的向量表式，从而得到用户直接和隐含的个性化偏好；从用户不同时期的行为特征挖掘用户的用户历史的偏好、用户中长期的兴趣偏好，从而能够很大程度上覆盖用户的行为；同时结合注意力机制神经网络和记忆网络模型，充分利用深度学习网络的学习的灵活性及强大的学习能力，因此能够有效减少大量特征工程的工作及时间衰减因子的人工干预。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是根据本发明实施例的处理数据的方法的主要流程的示意图；

图2是根据本发明实施例的训练计算模型的流程示意图；

图3是根据本发明一个可参考实施例的处理数据的方法的主要流程的示意图；

图4是根据本发明实施例的处理数据的装置的主要模块的示意图；

图5是本发明实施例可以应用于其中的示例性系统架构图；

图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

目前，常用个性化排序算法主要包括以下几种：

1)基于用户和物品的个性化标签排序：该方法本质上是依赖海量数据和大量的特征工程给用户和物品属性打上显性的个性化标签，然后基于传统的xgboost模型或者learning to rank模型打分排序。

这种方法主要存在以下问题：

依赖于大量的历史数据，并且对海量数据质量有要求；需要大量的人工提取特征，尤其是在不同的业务场景下，建模人员不仅需要熟悉不同场景的业务，还需要重复性开发特征；传统的模型很难学习重要的但是隐含的交叉特征，比如<用户，品类，颜色>高阶的偏好是很难人工加工的。

2)基于用户多行为的偏好，利用贝叶斯个性化排序：该方法是假设用户之间的偏好行为相互独立，同一用户对不同物品的偏序相互独立，然后基于矩阵分解针对每个用户自己偏好的物品做排序优化。

这种方法主要存在以下问题：

用户的行为偏好往往是相互影响的，该方法的计算结果与用户实际需求有偏差；该方法针对每个用户的物品池进行排序，所以不能达到全局全优，并且输入数据需要用户对物品的喜好程度排序的三元组做训练集，不适合对大量数据做排序。

3)DeepFM和DIEN深度学习方法进行个性化排序：该方法利用深度学习网络的强大学习的优势，挖掘用户和物品之间的更高阶和更隐含的关系。

DeepFM模型的缺点是不能捕捉用户的兴趣的变化，并且因输入网络时必须规定一个长度，但类别特征不同的维度相差很大，向量表式长度是不一致的，比如三级类目id和性别(男、女、未知)用0补齐后Embedding(嵌入)到相同的长度既增大参数量也影响效率。

DIEN算法的用户行为序列数据是基于用户一段时间的购物行为，只能表式用户近期内有限的兴趣的变化，线上系统要想处理用户长期的行为序列是非常困难的，并且也没有区分用户的长期、中期和近期的兴趣变化。

目前需要个性化排序场景的线上系统多数都依赖于大量的人工特征、分析不同的业务场景的用户历史行为数据、用户购买的物品属性、基于业务需求来进行个性化排序，最终导致线上系统部署着不同的、冗杂的、大量的、不可复用的个性化排序方法，同时还存在考虑不全面的情况。基于以上技术背景，本发明实施例提供了一种处理数据的方法，图1是根据本发明实施例的处理数据的方法的主要流程的示意图。作为本发明的一个实施例，如图1所示，所述处理数据的方法可以包括：

步骤101，根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征，生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量。

首先获取目标用户的行为特征和基础特征，以及目标物品的行为特征和基础特征，然后相应地生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量。在本发明的实施例中，所述目标物品可以是所述目标用户前一天或者前几天浏览、关注、点击等的物品，也可以将与这些目标物品同品类的其他物品都作为目标物品。

可选地，所述目标用户的行为特征包括所述目标用户对物品发生关注、加购、浏览、点击等行为的特征，所述目标用户的基础特征包括所述目标用户的年龄、性别、出生地等维度的特征。所述目标物品的行为特征包括所述目标物品被哪些用户关注、加购、浏览、点击等行为的特征，所述目标物品的基础特征包括所述目标物品的id、品类、品牌、型号等维度的特征。

可选地，步骤101可以包括：采用预先训练好的第一图嵌入模型将目标用户的近期行为特征和基础特征，转换成所述目标用户的嵌入向量；采用预先训练好的第二图嵌入模型目标物品的近期行为特征和基础特征，转换成所述目标物品的嵌入向量；采用预先训练好的注意力神经网络将所述目标用户的不同时期的行为特征，转换成所述目标用户的行为嵌入向量；采用预先训练好的记忆网络模型将所述目标用户的不同时期的行为特征，转换成所述目标用户的兴趣演化嵌入向量。

利用图嵌入特征表式方法(比如Node2vec模型)生成特征，主要是从用户id、物品id、三级品类id、用户基础画像等类别特征中自动构造用户和物品之间隐含的交叉特征(组合特征)，这样可以将人工手动的构造交叉来发现用户对物品、品类、订单对应何种兴趣偏好的问题转化为利用图嵌入特征表式方式自动化发现用户与物品之间隐含但更重要的关系。如用户有三个特征维度：年龄、性别、出生地，那么想获取“用户在北京出生且年龄是25岁的男性”这种交叉特征人工是非常耗时，并且因不同业务场景还需要熟悉不同的业务才能加工出来，但用图嵌入特征表式方法就可以自动生成特征。

可选地，所述不同时期的行为特征包括近期的行为特征、中期的行为特征和长期的行为特征。针对不同时期的时长，可以分别设置时间窗口，比如1天、3天、7天、14天、1个月、2个月、3个月、半年等，可以分别作为近期、中期和长期。

若所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量中缺少任一维度的特征，则采用不参与计算的标记符(比如mask)对该维度的特征进行补齐。针对图嵌入表式向量，输入计算模型时必须规定一个长度，超过此长度的截断，少于此长度的补齐，补齐的这部分特征其实是没有用户行为的，可以用mask盖住，表示不参与计算。

步骤102，将所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量拼接成所述目标用户的组合嵌入向量。

得到所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量后，对这四组向量进行拼接和拉直处理，从而得到所述目标用户的组合嵌入模型。

步骤103，将所述目标用户的组合嵌入向量输入到预先训练好的计算模型中，从而输出所述目标用户对所述目标物品的行为概率。

为了准确地计算出所述目标用户对所述目标物品的行为概率，需要预先训练计算模型，可选地，所述计算模型采用如下方法训练得到：

根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征，生成各个所述用户的组合嵌入向量；采用各个所述用户的组合嵌入向量训练全连接神经网络，从而得到计算模型。

可选地，如图2所示，根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征，生成各个所述用户的组合嵌入向量，包括：采用第一图嵌入模型将训练样本中各个用户的近期行为特征和基础特征，转换成各个所述用户的嵌入向量；采用第二图嵌入模型将训练样本中各个物品的近期行为特征和基础特征，转换成各个所述物品的嵌入向量；采用注意力神经网络将训练样本中各个所述用户的不同时期的行为特征，转换成各个所述用户的行为嵌入向量；采用记忆网络模型将训练样本中各个所述用户的不同时期的行为特征，转换成各个所述用户的兴趣演化嵌入向量；将各个所述用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及各个所述物品的嵌入向量分别拼接成各个所述用户的组合嵌入向量。可选地，所述第一图嵌入模型为Node2vec模型，所述第二图嵌入模型为Node2vec模型，所述记忆网络模型为分层周期记忆网络模型。可选地，基于图嵌入的算法，如DeepWalk、LINE、SDNE等算法都可以在本发明实施例中替代Node2Vec的词嵌入工作，不再赘述。

利用图嵌入特征表式方法(比如Node2vec模型)生成特征，主要是从用户id、物品id、三级品类id、用户基础画像等类别特征中自动构造用户和物品之间隐含的交叉特征(组合特征)，这样可以将人工手动的构造交叉来发现用户对物品、品类、订单对应何种兴趣偏好的问题转化为利用图嵌入特征表式方式自动化发现用户与物品之间隐含但更重要的关系。第一图嵌入模型用于构建用户的嵌入向量，在构建过程中，以用户作为节点，通过行为特征、基础特征等挖掘各个用户之间的关联关系，从而构建得到各个用户的嵌入向量。第二图嵌入模型用于构建物品的嵌入向量，在构建过程中，以物品作为节点，通过行为特征、基础特征等挖掘各个物品之间的关联关系，从而构建得到各个物品的嵌入向量。

利用注意力机制方法对用户兴趣加权，并且通过用户对物品的历史行为统计加权，一方面是可以利用大量的历史数据，另一方面根据给用户添加用户行为编好权重也是个性化技术中非常重要的一步。

本发明实施例利用用户时间序列构建丰富的用户和物品的特征向量，考虑到初始序列的合理和重要性，构造用户行为序列时利用并查集方法获取初步的用户行为特征序列、商品行为特征序列，代替直接用用户一段时间关注、加购、浏览、点击的物品取topN的方式。

若所述用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述物品的嵌入向量中缺少任一维度的特征，则采用不参与计算的标记符(比如mask)对该维度的特征进行补齐。针对图嵌入表式向量，输入计算模型时必须规定一个长度，超过此长度的截断，少于此长度的补齐，补齐的这部分特征其实是没有用户行为的，可以用mask盖住，表示不参与计算。

记忆网络模型可以采用HPMN(Hierarchical Periodic Memory Network，分层周期记忆网络)网络思想，其借鉴层级循环神经网络，采用周期向上归纳的设计，分层刻画用户长期、中期、近期的兴趣偏好，建立用户变化趋势的兴趣向量列表，因用户的兴趣偏好是变化的，记忆网络模型学习的目的就是代替以往人工时间衰减因子来描述了这种渐变属性的操作。可选地，所述不同时期的行为特征包括近期的行为特征、中期的行为特征和长期的行为特征。针对不同时期的时长，可以分别设置时间窗口，比如1天、3天、7天、14天、1个月、2个月、3个月、半年等，可以分别作为近期、中期和长期。

然后，如图2所示，对上述得到的嵌入向量进行拼接和拉直(Embedding concat&Flatten)操作，接着连接的网络是全连接神经网络，然后采用softmax分类输出。

可选地，在步骤103之后，还包括：将所述目标用户对各个所述目标物品的行为概率进行降序排列；筛选出行为概率靠前的N个目标物品，N为大于零的整数；将所述N个目标物品加入到所述目标用户对应的待推荐物品集合中。

以点击率作为行为概率，采用本发明实施例提供的方法使得模型评估指标AUC(Area Under Curve)能够达到0.6837，相比传统的方法0.6529，本申请的提升效果比较明显。并且还测试了用户个性化物品的列表排序效果，在搜索评价指标NDCG@20和NDCG@50结果分别0.042和0.038，由于本申请加入了用户历史行为的偏好权重和用户兴趣偏好的变化权重，所以向用户推荐的物品符合用户中长期的兴趣偏好。

根据上面所述的各种实施例，可以看出本发明实施例通过将目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及目标物品的嵌入向量输入到预先训练好的计算模型中，从而输出目标用户对目标物品的行为概率的技术手段，解决了现有技术中无法精准和高效地挖掘用户与物品之间的隐含的向量表式，无法区分用户长期、中期和近期的兴趣变化的技术问题。本发明实施例利用图嵌入技术从用户和物品的多维度特征中精准和高效地用户与物品之间的隐含的向量表式，从而得到用户直接和隐含的个性化偏好；从用户不同时期的行为特征挖掘用户的用户历史的偏好、用户中长期的兴趣偏好，从而能够很大程度上覆盖用户的行为；同时结合注意力机制神经网络和记忆网络模型，充分利用深度学习网络的学习的灵活性及强大的学习能力，因此能够有效减少大量特征工程的工作及时间衰减因子的人工干预。

图3是根据本发明一个可参考实施例的处理数据的方法的主要流程的示意图。作为本发明的又一个实施例，如图3所示，所述处理数据的方法可以包括：

步骤301，采用第一图嵌入模型将训练样本中各个用户的近期行为特征和基础特征，转换成各个所述用户的嵌入向量。

可选地，所述第一图嵌入模型为Node2vec模型，采用Node2vec模型将训练样本中各个用户的近期行为特征和基础特征转换成各个所述用户的嵌入向量，在构建嵌入向量过程中，以用户作为节点，通过行为特征、基础特征等挖掘各个用户之间的关联关系，从而挖掘出用户和物品之间隐含的交叉特征。

步骤302，采用第二图嵌入模型将训练样本中各个物品的近期行为特征和基础特征，转换成各个所述物品的嵌入向量。

可选地，所述第二图嵌入模型为Node2vec模型，采用Node2vec模型将训练样本中各个物品的近期行为特征和基础特征转换成各个所述物品的嵌入向量，在构建嵌入向量过程中，以物品作为节点，通过行为特征、基础特征等挖掘各个物品之间的关联关系，从而挖掘出用户和物品之间隐含的交叉特征。

步骤303，采用注意力神经网络将训练样本中各个所述用户的不同时期的行为特征，转换成各个所述用户的行为嵌入向量。

所述不同时期的行为特征包括近期的行为特征、中期的行为特征和长期的行为特征。针对不同时期的时长，可以分别设置时间窗口，比如1天、3天、7天、14天、1个月、2个月、3个月、半年等，可以分别作为近期、中期和长期。

步骤304，采用分层周期记忆网络模型将训练样本中各个所述用户的不同时期的行为特征，转换成各个所述用户的兴趣演化嵌入向量。

所述不同时期的行为特征包括近期的行为特征、中期的行为特征和长期的行为特征，将不同时期的行为特征分布输入到不同层的网络中，通过学习得到各个所述用户的兴趣演化嵌入向量。

需要指出的是，步骤301、步骤302、步骤303和步骤304可以同步执行，也可以顺序执行，而且步骤301-步骤304的执行顺序可以随机，本发明实施例对此不作限制。

步骤305，将各个所述用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及各个所述物品的嵌入向量分别拼接成各个所述用户的组合嵌入向量。

步骤306，根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征，生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量。

该步骤与步骤301、步骤302、步骤303和步骤304类似，不再赘述。

步骤307，将所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量拼接成所述目标用户的组合嵌入向量，采用各个所述用户的组合嵌入向量训练全连接神经网络，从而得到计算模型。

步骤308，将所述目标用户的组合嵌入向量输入到预先训练好的计算模型中，从而输出所述目标用户对所述目标物品的行为概率。

步骤309，将所述目标用户对各个所述目标物品的行为概率进行降序排列，筛选出行为概率靠前的N个目标物品，N为大于零的整数，将所述N个目标物品加入到所述目标用户对应的待推荐物品集合中。

获得目标用户对各个目标物品的行为概率后，基于行为概率对目标物品进行排序，筛选出前N个目标物品，作为待推荐给所述目标用户的物品。由于本申请加入了用户历史行为的偏好权重和用户兴趣偏好的变化权重，所以向用户推荐的物品符合用户中长期的兴趣偏好。

另外，在本发明一个可参考实施例中处理数据的方法的具体实施内容，在上面所述处理数据的方法中已经详细说明了，故在此重复内容不再说明。

图4是根据本发明实施例的处理数据的装置的主要模块的示意图，如图4所示，所述处理数据的装置400包括特征模块401、组合模块402、计算模块403和训练模块404；其中，特征模块401用于根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征，生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量；组合模块402用于将所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量拼接成所述目标用户的组合嵌入向量；计算模块403用于将所述目标用户的组合嵌入向量输入到预先训练好的计算模型中，从而输出所述目标用户对所述目标物品的行为概率；训练模块404用于根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征，生成各个所述用户的组合嵌入向量；采用各个所述用户的组合嵌入向量训练全连接神经网络，从而得到计算模型。

可选地，所述训练模块404还用于：

可选地，所述特征模块401还用于：

可选地，所述计算模块403还用于：

筛选出行为概率靠前的N个目标物品，N为大于零的整数；

需要说明的是，在本发明所述处理数据的装置的具体实施内容，在上面所述处理数据的方法中已经详细说明了，故在此重复内容不再说明。

图5示出了可以应用本发明实施例的处理数据的方法或处理数据的装置的示例性系统架构500。

如图5所示，系统架构500可以包括终端设备501、502、503，网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备501、502、503通过网络504与服务器505交互，以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用，例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器505可以是提供各种服务的服务器，例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的物品信息查询请求等数据进行分析等处理，并将处理结果(例如目标推送信息、物品信息——仅为示例)反馈给终端设备。

需要说明的是，本发明实施例所提供的处理数据的方法一般由服务器505执行，相应地，所述处理数据的装置一般设置在服务器505中。本发明实施例所提供的处理数据的方法也可以由终端设备501、502、503执行，相应地，所述处理数据的装置可以设置在终端设备501、502、503中。

应该理解，图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

下面参考图6，其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统600包括中央处理单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括特征模块、组合模块、计算模块和训练模块，其中，这些模块的名称在某种情况下并不构成对该模块本身的限定。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，该设备实现如下方法：根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征，生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量；将所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量拼接成所述目标用户的组合嵌入向量；将所述目标用户的组合嵌入向量输入到预先训练好的计算模型中，从而输出所述目标用户对所述目标物品的行为概率；其中，所述计算模型采用如下方法训练得到：根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征，生成各个所述用户的组合嵌入向量；采用各个所述用户的组合嵌入向量训练全连接神经网络，从而得到计算模型。

根据本发明实施例的技术方案，因为采用将目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及目标物品的嵌入向量输入到预先训练好的计算模型中，从而输出目标用户对目标物品的行为概率的技术手段，所以克服了现有技术中无法精准和高效地挖掘用户与物品之间的隐含的向量表式，无法区分用户长期、中期和近期的兴趣变化的技术问题。本发明实施例利用图嵌入技术从用户和物品的多维度特征中精准和高效地用户与物品之间的隐含的向量表式，从而得到用户直接和隐含的个性化偏好；从用户不同时期的行为特征挖掘用户的用户历史的偏好、用户中长期的兴趣偏好，从而能够很大程度上覆盖用户的行为；同时结合注意力机制神经网络和记忆网络模型，充分利用深度学习网络的学习的灵活性及强大的学习能力，因此能够有效减少大量特征工程的工作及时间衰减因子的人工干预。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种处理数据的方法，其特征在于，包括：

其中，所述计算模型采用如下方法训练得到：

2.根据权利要求1所述的方法，其特征在于，根据训练样本中各个用户的行为特征和基础特征以及各个物品的行为特征和基础特征，生成各个所述用户的组合嵌入向量，包括：

3.根据权利要求2所述的方法，其特征在于，所述第一图嵌入模型为Node2vec模型，所述第二图嵌入模型为Node2vec模型，所述记忆网络模型为分层周期记忆网络模型。

4.根据权利要求2所述的方法，其特征在于，所述不同时期的行为特征包括近期的行为特征、中期的行为特征和长期的行为特征。

5.根据权利要求2所述的方法，其特征在于，还包括：

6.根据权利要求2所述的方法，其特征在于，根据目标用户的行为特征和基础特征以及目标物品的行为特征和基础特征，生成所述目标用户的嵌入向量、行为嵌入向量、兴趣演化嵌入向量以及所述目标物品的嵌入向量，包括：

7.根据权利要求1所述的方法，其特征在于，输出所述目标用户对所述目标物品的行为概率之后，还包括：

筛选出行为概率靠前的N个目标物品，N为大于零的整数；

8.一种处理数据的装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

10.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。