CN110264277A

CN110264277A - 由计算设备执行的数据处理方法及装置、介质和计算设备

Info

Publication number: CN110264277A
Application number: CN201910557742.7A
Authority: CN
Inventors: 张俊; 潘胜一; 杨杰; 罗晓华
Original assignee: Hangzhou Netease Zaigu Technology Co Ltd
Current assignee: Hangzhou Netease Zaigu Technology Co Ltd
Priority date: 2019-06-25
Filing date: 2019-06-25
Publication date: 2019-09-20
Anticipated expiration: 2039-06-25
Also published as: CN110264277B

Abstract

本发明提供了一种由计算设备执行的数据处理方法及装置、一种介质和一种计算设备。该方法包括获取训练样本集，训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的对象；上下文对象的标识信息与中心对象的标识信息在同一个行为序列中的排列位置相邻，行为序列包括用户操作过的一个或多个对象的标识信息，在行为序列中按照对象被操作的时间顺序排列对象的标识信息；根据每一条训练数据中各个对象的标识信息，获取各个对象中的每个对象的属性信息；基于各个对象中的每个对象的标识信息和属性信息训练向量生成模型，以使得训练后的向量生成模型能够用于输出表征对象的对象向量。

Description

由计算设备执行的数据处理方法及装置、介质和计算设备

技术领域

本发明的实施方式涉及计算机技术领域，更具体地，本发明的实施方式涉及一种由计算设备执行的数据处理方法及装置、一种介质和一种计算设备。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

随着计算机技术的快速发展，丰富了用户获取信息的方式。例如，用户可以利用计算设备中的应用程序了解新闻信息，利用应用程序进行搜索，利用应用程序在网上交易等等。具体地，例如，网上购物已经成为用户的主流购物方式，电商网站则会提供智能贴心的功能改善用户购物体验。

但是，在实现本发明的过程中，发明人发现，采用相关技术处理用户在网上交互过程中所生成的操作数据不能较好的刻画用户兴趣、感知用户意图和促进用户转化为完成购买行为的用户。

发明内容

因此，在现有技术中，采用相关技术处理用户在网上交互过程中所生成的操作数据不能较好的刻画用户兴趣、感知用户意图和促进用户转化为完成购买行为的用户，这是非常令人烦恼的过程。

为此，非常需要一种改进的数据处理方法及装置、介质和计算设备，以使得能够较好的刻画用户兴趣、感知用户意图和促进用户转化为完成购买行为的用户。

在本上下文中，本发明的实施方式期望提供一种由计算设备执行的数据处理方法及装置、一种介质和一种计算设备。

在本发明实施方式的第一方面中，提供了一种由计算设备执行的数据处理方法，包括：获取训练样本集，其中，上述训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的对象；上述上下文对象的标识信息与上述中心对象的标识信息在同一个行为序列中的排列位置相邻，上述行为序列包括用户操作过的一个或多个对象的标识信息，其中，在上述行为序列中按照对象被操作的时间顺序排列上述对象的标识信息。

在本发明实施方式的第二方面中，提供了一种由计算设备执行的数据处理装置，包括：第一获取模块，用于获取训练样本集，其中，上述训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的对象；上述上下文对象的标识信息与上述中心对象的标识信息在同一个行为序列中的排列位置相邻，上述行为序列包括用户操作过的一个或多个对象的标识信息，其中，在上述行为序列中按照对象被操作的时间顺序排列上述对象的标识信息；第二获取模块，用于根据上述每一条训练数据中各个对象的标识信息，获取上述各个对象中的每个对象的属性信息；以及训练模块，用于基于上述各个对象中的每个对象的标识信息和属性信息训练向量生成模型，以使得训练后的上述向量生成模型能够用于输出表征对象的对象向量。

在本发明实施方式的第三方面中，提供了一种介质，存储有计算机可执行指令，上述指令在被处理单元执行时用于实现如上所述的方法。

在本发明实施方式的第四方面中，提供了一种计算设备，包括：处理单元；以及存储单元，存储有计算机可执行指令，上述指令在被上述处理单元执行时用于实现如上所述的方法。

根据本发明实施方式的由计算设备执行的数据处理方法及装置、介质和计算设备，通过获取训练样本集，其中，每一条训练数据包括中心对象、上下文对象和目标操作针对的对象的标识信息，上下文对象的标识信息与中心对象的标识信息在同一个行为序列中的排列位置相邻，在行为序列中按照对象被操作的时间顺序排列对象的标识信息；基于每个对象的标识信息和属性信息训练向量生成模型，训练后的向量生成模型能够用于输出表征对象的对象向量，可以通过大数据、机器学习和深度学习等技术，基于数据和算法的配合，输出对象的对象向量，以便刻画用户兴趣和感知用户意图，可以缩短用户的需求表达路径，降低用户中断购买流程的概率，为用户带来了更好的体验。

附图说明

通过参考附图阅读下文的详细描述，本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若干实施方式，其中：

图1示意性地示出了根据本发明实施方式的数据处理方法及其装置的应用场景示意图；

图2示意性地示出了根据本发明实施例的由计算设备执行的数据处理方法的流程图；

图3示意性示出了根据本发明实施例的融合属性信息的向量表征模型结构的示意图；

图4示意性示出了根据本发明另一实施例的数据处理方法的流程图；

图5示意性示出了根据本发明实施例的构建目标用户的用户向量的流程图；

图6示意性示出了根据本发明实施例的构建目标用户的检索词向量的流程图；

图7示意性示出了根据本发明实施例的实时推荐目标对象的流程图；

图8示意性示出了根据本发明另一实施例的实时推荐目标对象的流程图；

图9示意性示出了根据本发明另一实施例的个性化推荐目标对象的流程图；

图10示意性地示出了根据本发明实施例的由计算设备执行的数据处理装置的框图；

图11示意性地示出了根据本发明实施方式的用于实现数据处理方法的程序产品示意图；以及

图12示意性地示出了根据本发明实施例的用于实现数据处理方法的计算设备的框图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明，而并非以任何方式限制本发明的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本发明的实施方式，提出了一种由计算设备执行的数据处理方法及装置、一种介质和一种计算设备。

在本文中，需要理解的是，所涉及的术语含义如下。

行为序列：基于时间顺序对用户和商品产生的各种交互行为进行排序(交互行为包括但不限于例如商品详情页浏览、商品加入购物车、商品查看评论、商品分享等等)。

嵌入模型(Embedding Model)：是指将高维空间嵌入到一个维数低得多的连续向量空间中的模型。

搜索底纹：用于呈现在搜索框中的默认搜索词，以引导触发用户进行搜索。

搜索发现：用于呈现个性化的一批搜索词，供用户选择使用。

向量表征：指将一个对象(例如可以为用户、商品、检索词)表示为多维空间的向量。

搜索意图：指用户潜意识想搜索的检索词或者商品，可能没有通过查询行为序列表达出来。

此外，附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

下面参考本发明的若干代表性实施方式，详细阐释本发明的原理和精神。

发明概述

本发明人发现，随着计算机技术的快速发展，丰富了用户获取信息的方式。例如，用户可以利用计算设备中的应用程序了解新闻信息，利用应用程序进行搜索，利用应用程序在网上交易等等。

具体地，例如，网上购物已经成为用户的主流购物方式，电商网站则会提供智能贴心的功能改善用户购物体验。在用户的整个购物流程中，搜索是较为频繁使用的功能，其能表达用户的购买需求。在相关技术中，由于每个人对相同商品的书面表述都不同，用户输入检索词寻找商品，使用过程中可能会多次调整检索词以定位目标商品，因此，在基于用户搜索意图多维度推荐多种数据时需要构建多个模型生产所需推荐的数据。但该技术无法从同一个特征空间去表示用户、商品、检索词的相关性，无法进行全局统一模型优化，导致有些用户在检索词调整的过程中会自然流失。

同时，发明人发现相关技术一般只关注用户当下搜索什么，不能根据用户调整检索词和实时点击商品的变化去推断搜索意图，无法基于实时行为序列做搜索意图判断。例如，当用户想买滋补品，依次搜索人参、燕窝、蜂蜜之后，最后仍然没有找到想要的商品可能就离开页面了。可见，如果用户的搜索词序列是需求表达路径，当需求表达路径比较长时用户就比较容易流失。

由此可见，采用相关技术处理用户在网上交互过程中所生成的操作数据(例如，搜索，浏览，点击等操作数据)不能较好的刻画用户兴趣、感知用户意图和促进用户转化为完成购买行为的用户。

基于以上分析，发明人构想到通过获取训练样本集，其中，每一条训练数据包括中心对象、上下文对象和目标操作针对的对象的标识信息，上下文对象的标识信息与中心对象的标识信息在同一个行为序列中的排列位置相邻，在行为序列中按照对象被操作的时间顺序排列对象的标识信息；基于每个对象的标识信息和属性信息训练向量生成模型，训练后的向量生成模型能够用于输出表征对象的对象向量，可以通过大数据、机器学习和深度学习等技术，基于数据和算法的配合，输出对象的对象向量，以便刻画用户兴趣和感知用户意图，可以缩短用户的需求表达路径，降低用户中断购买流程的概率，为用户带来了更好的体验。

在介绍了本发明的基本原理之后，下面具体介绍本发明的各种非限制性实施方式。

应用场景总览

首先参考图1详细阐述本发明实施例的数据处理方法及其装置的应用场景。

图1示意性地示出了根据本发明实施方式的数据处理方法及其装置的应用场景示意图。

如图1所示，根据该实施例的系统架构可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线和/或无线通信链路等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有客户端应用。

终端设备101、102、103可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对用户利用终端设备101、102、103所请求的数据提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求进行分析等处理，并将处理结果(例如根据用户请求获取信息、或数据等)反馈给终端设备。

需要说明的是，本发明实施例所提供的数据处理方法一般可以由服务器105执行。相应地，本发明实施例所提供的数据处理装置一般可以设置于服务器105中。本发明实施例所提供的数据处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地，本发明实施例所提供的数据处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。或者，本发明实施例所提供的数据处理方法也可以由终端设备101、102、或103执行，或者也可以由不同于终端设备101、102、或103的其他终端设备执行。相应地，本发明实施例所提供的数据处理装置也可以设置于终端设备101、102、或103中，或设置于不同于终端设备101、102、或103的其他终端设备中。

例如，训练样本集可以存储在终端设备101、102、或103中的任意一个之中，如终端设备101，但不限于此，或者存储在外部存储设备上并可以导入到终端设备101中。然后，终端设备101可以在本地执行本发明实施例所提供的数据处理方法，或者将训练样本集发送到其他终端设备、服务器、或服务器集群，并由接收该训练样本集的其他终端设备、服务器、或服务器集群来执行本发明实施例所提供的数据处理方法。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

需要注意的是，图1所示仅为可以应用本发明实施例的应用场景的系统架构的示例，以帮助本领域技术人员理解本发明的技术内容，但并不意味着本发明实施例不可以用于其他设备、系统、环境或场景。

示例性方法

下面结合图1的应用场景，参考图2来描述根据本发明示例性实施方式的由计算设备执行的数据处理方法。需要注意的是，上述应用场景仅是为了便于理解本发明的精神和原理而示出，本发明的实施方式在此方面不受任何限制。相反，本发明的实施方式可以应用于适用的任何场景。

图2示意性地示出了根据本发明实施例的由计算设备执行的数据处理方法的流程图。

如图2所示，根据本发明实施例的由计算设备执行的数据处理方法包括操作S210～操作S230。

在操作S210，获取训练样本集，其中，训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的对象；上下文对象的标识信息与中心对象的标识信息在同一个行为序列中的排列位置相邻，行为序列包括用户操作过的一个或多个对象的标识信息，其中，在行为序列中按照对象被操作的时间顺序排列对象的标识信息。

根据本发明的实施例，获取训练样本集包括：获取预定时间段内多个用户的行为日志，对多个用户中每个用户的行为日志进行处理，构建与每个用户对应的行为序列，得到多个用户的行为序列，根据多个用户的行为序列构建训练样本集。

根据本发明的实施例，每个用户的行为日志可以包括用户在多个会话内的行为记录，每个行为记录可以作为用户的一条行为路径。可以将用户的行为路径分为两类，一类是探索型路径，另一类为购买型路径。其中，探索型路径是指用户最终没有购买商品的路径，购买型路径是指用户最终购买了商品的路径。

例如，用户存在如下两种行为路径。

(一)购买型路径：(V，I_1)→(V，I_2)→(V，I_2)→(V，I_3)→(V，I_4)→(V，I_5)→(B，I_5)→(V，I_3)→(V，I_8)→(V，I_9)→(V，I_7)→(V，I_7)→(V，I_10)→(V，I_9)→(B，I_9)；

(二)探索型路径：(V，I_1)→(V，I_2)→(V，I_2)→(V，I_3)→(V，I_4)→(V，I_8)→(V，I_7)。

其中，V表示非购买行为(包括但不限于浏览、查看评论、收藏、分享等)，B表示购买行为(包括但不限于加入购物车和下单等)，I_i表示商品的标识信息。对于购买型路径，用户会经历浏览-购买-浏览-购买这样的路径；对于探索型路径，用户一直在浏览没有任何购物行为。

在对每个用户的行为日志进行处理，构建与每个用户对应的行为序列时，可以对用户的行为路径进行拆解。

根据本发明的实施例，在电商场景下，用户在将一件商品加入购物车之后，往往会再看看其他东西，这个时候可能会发生兴趣偏移，因此对于购买型路径，可以将其做进一步拆解，以购买行为作为拆解节点，对购买型路径进行如下拆分。

part 1：I_1，I_2，I_3，I_4，I_5：行为序列一；

part 2：I_1，I_2，I_3，I_4，I_5，I_3，I_8，I_9，I_7，I_10，I_9：行为序列二。

根据本发明的实施例，对于探索型路径，用户一直在浏览商品，并没有购买行为，所以无需对商品序列进行拆分，但可以对连续重复出现的商品去重，得到如下序列。

part 3：I_1，I_2，I_3，I_4，I_8，I_7：行为序列三。

根据本发明的实施例，在行为序列中，按照商品被操作的时间顺序排列商品的标识信息。

根据本发明的实施例，基于上述拆分得到的行为序列，可以基于SkipGram和全局购买(Global)信息构建训练样本集。

根据本发明的实施例，训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的对象。

根据本发明的实施例，每一条训练数据的基本格式可以为：中心对象(以下称为center)：上下文对象(以下称为contexts)：全局购买对象(以下称为global)。

在操作S220，根据每一条训练数据中各个对象的标识信息，获取各个对象中的每个对象的属性信息。

根据本发明的实施例，对于训练数据中的每一个商品，都会有其对应的属性信息(例如类目、价格、产地等)，文件格式为：id，p_1，p_2，p_3(商品Id，商品属性1，商品属性2，商品属性3)，可以将训练样本集中的每一条训练数据所涉及的商品的属性信息以上述文件格式整理为Map文件，其中，Map文件是指包含商品对应属性信息的映射文件。在模型训练过程中，通过各个对象的标识信息和Map文件可以获取每个商品的属性信息。然后进行对应的嵌入向量表征(embedding)操作。通过Map文件整理商品属性的方式，一方面可以方便获得扩展商品属性，无需去更改训练数据的格式center：contexts：global；另一方面可以极大的减少训练数据的存储空间和访问耗时。

在操作S230，基于各个对象中的每个对象的标识信息和属性信息训练向量生成模型，以使得训练后的向量生成模型能够用于输出表征对象的对象向量。

根据本发明的实施例，在训练向量生成模型时，对于每一条训练数据center：contexts：global，center和contexts，以及center和global的空间距离越接近越好。因此，可以结合矩阵运算的优势，在构建向量生成模型的损失函数的时候，可以一次性算出center和contexts的相似度以及center和global的相似度，然后再加上负采样的约束。对于负采样，可以采取在一个batch(模型一次处理的训练数据条数)内构建负样本的方式，这种方式简单有效且能满足按照样本出现的频率进行采样，同时结合矩阵运算能加快训练数据，并且能很方便的进行分布式训练。在获取负样本后，可以进一步构建pair-wise的损失函数。

需要说明的是，在向量生成模型中商品对应的向量并不是对商品直接进行向量表征(embedding)得到的向量，而是把商品自身的向量以及商品对应的各种属性信息的向量融合后得到的向量，通过融合后的向量一方面能学习到基于用户行为的商品向量表征，另一方面把商品的属性信息也可以学习进去。

通过本发明的实施例，通过获取训练样本集，其中，每一条训练数据包括中心对象、上下文对象和目标操作针对的对象的标识信息，上下文对象的标识信息与中心对象的标识信息在同一个行为序列中的排列位置相邻，在行为序列中按照对象被操作的时间顺序排列对象的标识信息；基于每个对象的标识信息和属性信息训练向量生成模型，训练后的向量生成模型能够用于输出表征对象的对象向量，可以通过大数据、机器学习和深度学习等技术，基于数据和算法的配合，输出对象的对象向量，以便刻画用户兴趣和感知用户意图，可以缩短用户的需求表达路径，降低用户中断购买流程的概率，为用户带来了更好的体验。

下面将结合具体实施例对向量生成模型做进一步说明。

根据本发明的实施例，向量生成模型具有损失函数(一)，所述损失函数包括：

其中，表示将所述每一条训练数据中的中心对象(即center)的标识信息和属性信息进行向量初始化得到的第一初始向量；表示将所述每一条训练数据中的上下文对象(即contexts)的标识信息和属性信息进行向量初始化得到的第二初始向量；表示将所述每一条训练数据中的目标操作(例如可以是global)针对的对象的标识信息和属性信息进行向量初始化得到的第三初始向量；r_ii表示将所述第一初始向量和所述第三初始向量进行矩阵相乘后，得到的结果矩阵的对角线上的元素；r_ij表示所述结果矩阵中除所述对角线上的元素之外的其他元素；b表示所述向量生成模型并行处理的训练数据的条数；n表示所述上下文对象的个数，α为权重系数。

根据本发明的实施例，下面将对对象向量的表征过程做进一步说明，主要涉及以下五部分，每部分计算过程可以通过矩阵运算高效完成，其中，以对象为商品，以对象向量为商品向量为例。

(1)批量相似度计算

假定每个商品的商品向量记为v，向量维度为(1，d)，batch size简记为b，表征向量生成模型并行处理的训练数据的条数。

对于center(中心对象)，可以表示为下式(二)，简记为C，可知C的维度为(b，d)。

对于contexts(上下文对象)，假设上下文对象包含了n个商品，那么可以表示为下式(三)，简记为S，可知S的维度为(b，n，d)。

对于global(全局购买对象)，和center(中心对象)类似，可以表示为下式(四)，简记为G，可知G的维度为(b，d)。

将C扩展一维得到C__expand，其中，C__expand的维度为(b，1，d)。

于是，center和contexts的相似度可通过C_expand·S^T得到，其维度是(b，1，d)×(b，d，n)＝(b，1，n)，压缩一维后得到(b，n)。

同样的，center和global的相似度可通过取矩阵对角线diag(C·G^T)得到，其维度是(b，1)。

如此，完成了构建两种正样本的相似度计算，进一步可以计算得到损失函数(一)的一部分。

σ表示sigmoid函数，Squeeze表示压缩维度函数。

(2)batch内负采样

正样本构建完成后就需要考虑负样本的获取，假设不添加负样本，模型训练的结果就是所有向量都变成一样，因为这样上述公式(五)的损失可以达到最小。

在本发明的向量生成模型中，针对特定的一条样本，选取当前batch内其他global信息作为当前center的负样本，考虑到同一batch内可能会存在多个实际上是center的正样本，却被当作了负样本，因此，给同一batch的内所有其他global信息一个权重α。

如果数据分布足够随机，那么在一个batch中，当分批样本量(batch_size)足够大的情况下(可根据实际情况确定实际数量)，对于任意一个样本，其负样本集合中是正的样本的数量一定小于真实是负的样本的数量(等效于在随机的一条路上逛街遇到陌生人的数量肯定比遇到熟人的数量多)。例如，假定正样本始终是4个，batch_size选择为2001，α选择为0.002，那么负样本集合等于贡献了2000×0.002＝4个样本，就算其中混杂的正的样本大于正样本集合中的样本数量，比如有100个，这些噪音贡献的量也只有100×0.002＝0.2，和正样本的4比起来可以被忽略。所以在这个情况下，相当于用4个正样本、3.8个负样本、0.2个噪音数据训练向量生成模型，向量生成模型可以得到较好的训练。

(3)pair-wise的损失函数的构建

在模型训练中，相当于是针对一个global的样本对应获取几个负样本，那么较好的情况是global的样本比负样本更接近center，采用如下pair-wise的方式会更合理，具体公式描述如下。

其中，表示center和global的相似度，表示center和负样本的相似度。

按照上文逻辑，对于batch内每一个样本都要考虑除它以外的所有样本，这个操作如果用循环来做，耗时是很巨大的，而且在各种深度学习模型框架下在构建loss的时候运用循环是比较难实现的，即使实现了代码也会很复杂。对此，本发明利用矩阵运算能轻松解决这个问题，直接算出所有需要的结果。

对于center的向量C和global的向量G，进行矩阵相乘，可以得到新的矩阵记为R，其维度是(b，b)。

从矩阵(七)中可以看到，对于第i行r_ii就是公式中的而所有的r_ij，(i≠j)就是公式中的因此，只需要针对每一行构建出所有r_ii-r_ij，(i≠j)即可。

首先，获取R的对角线部分记为R_diag。

然后，运用矩阵广播运算，通过R_diag和R相减得到下式矩阵(九)。

从矩阵(九)中可以看到，在矩阵(九)的每一行都获取到了r_ii-r_ij，(i≠j)，0的部分是常数，不影响损失函数loss的训练，可以忽略。因此，上述损失函数(一)中的部分可以通过公式(十)求得。

考虑到batch内采样融合样本权重α，所以最终在确定损失函数时，对公式(十)添加了权重约束。

本发明的矩阵模式的损失函数如下公式(十一)。

其中，公式(十一)中各个参数的含义与公式(五)和公式(十)中的含义相同，具体描述可参考本发明针对公式(五)和公式(十)的描述，在此不再赘述。

(4)商品属性融合embedding

在损失函数Loss构建完成之后，需要将商品的其他属性信息融合到向量表征中。

图3示意性示出了根据本发明实施例的融合属性信息的向量表征模型结构的示意图。

如图3所示，在对商品的标识信息进行向量表征的同时，可以利用Map文件对每个属性也进行嵌入表征，商品的属性例如可以是适用季节，商品类目，适用人群等等。然后将各个属性的向量进行拼接(可以采用求和或横向拼接的方式)。如此，可以获得商品的标识信息的向量表示V_I，和其对应属性融合得到的向量V_P，最终将[V_I，V_P]作为对商品的向量表征，即在(1)批量相似度计算时所提到的商品向量v。

在电商场景中，需要较好的确定商品和用户的关系才能有效的向用户推荐商品。在构建完商品向量之后，本发明可以基于商品向量和用户在全站的行为序列构建用户向量，结合Embedding算法，对用户和商品在同一个向量空间做向量表征，该技术能大幅缩短用户的需求表达路径，能够有效的刻画用户特征。

根据本发明的实施例，对于用户向量的构建方式通常有两种。

第一种是基于用户和商品的历史交互行为，在模型中将两者一起进行embedding操作(即嵌入表征操作)，然后学习其向量表征。常见的有图嵌入(graph-embedding)的方式，通过将用户和商品均作为网络的节点来学习节点向量。

第二种是基于商品向量聚合的方式。比如经典Youtube模型中，通过预测下一次点击训练模型，然后利用该模型通过输入交互历史，层层计算之后，输出能够表征用户的向量，或者，将用户交互过的商品向量通过一定的逻辑聚合成用户向量。

但无论是哪种方案，其中很关键的一点就是要保证商品向量和用户向量是在同一个向量空间内构建的。在实际业务中，可以运用向量间的相似度计算来获取用户和商品之间的关联，此外，也可以使用类似于局部敏感哈希(LSH)的方案来获取与特定用户最接近的商品或者与特定商品最接近的用户。

为了同时兼顾向量效果和工程的高效性，本发明选取向量聚合的方式。并且设计了多个聚合的关键逻辑，比如时间衰减、累计加权、自适应注意力机制等等，将在下文具体叙述。

下面参考图4～图8，结合具体实施例对图2所示的方法做进一步说明。

图4示意性示出了根据本发明另一实施例的数据处理方法的流程图。在该实施例中，除了包括上文参考图2描述的操作S210～S230之外，还包括操作S410～S430。为了描述的简洁起见，这里省略对操作S210～S230的描述。

如图4所示，数据处理方法还包括操作S410～S430。

在操作S410，获取目标用户的目标行为序列。

根据本发明的实施例，可以根据目标用户的标识信息获取目标用户的目标行为序列。例如，可以根据目标用户的账号信息获取目标用户在网上交互时生成的行为序列。目标行为序列可以是目标用户所有的行为序列，也可以是目标用户的部分行为序列。

根据本发明的实施例，可以基于行为序列的获取方式将行为序列分为离线运用行为序列和在线运用行为序列；基于行为序列的长短将行为序列分为用户短期兴趣行为序列和长期兴趣行为序列，即基于不同时间跨度的用户和商品的行为序列，可以将行为序列分为用户短期兴趣行为序列和长期兴趣行为序列，其中，长期兴趣行为序列时间跨度较长，短期兴趣行为序列时间跨度较短。在获取目标用户的目标行为序列时，可以综合考虑运用场景选取合适的行为序列。

在操作S420，确定目标行为序列所涉及的多个第一交互对象。

根据本发明的实施例，例如，目标用户的其中一个目标行为序列为浏览薄外套、浏览短袖、点击长袖、下单长袖。第一交互对象可以包括薄外套、短袖和长袖。

在操作S430，根据与多个第一交互对象中的每个第一交互对象对应的第一交互对象向量和目标行为序列来构建目标用户的用户向量，其中，目标用户的用户向量用于表征目标用户感兴趣的一个或多个关联对象。

根据本发明的实施例，例如，第一交互对象的对象集合为{o₁，o₂，...o_m}，简记为O；对象集合中第一交互对象的第一交互对象向量为{v₁，v₂，...v_m}，(i＝1...m)，简记为O_v。目标用户对应的目标行为序列为l₁，l₂，...l_n；l_i∈O，目标行为序列中所涉及的对象为O的子集记为O_sub。O_sub中的对象对应的向量记录为

图5示意性示出了根据本发明实施例的构建目标用户的用户向量的流程图。

如图5所示，构建目标用户的用户向量包括操作S431～S432。

在操作S431，根据目标行为序列确定针对多个第一交互对象中的每个第一交互对象的权重。

根据本发明的实施例，每个第一交互对象的权重可以相同，也可以不同。

在操作S432，根据针对每个第一交互对象的权重和每个第一交互对象的第一交互对象向量构建目标用户的用户向量。

根据本发明的实施例，根据针对每个第一交互对象的权重和所述每个第一交互对象的第一交互对象向量构建所述目标用户的用户向量包括：

根据针对每个第一交互对象的权重和每个第一交互对象的第一交互对象向量按照如下公式(十二)构建目标用户的用户向量。

其中，V_U表示目标用户的用户向量，h表示第一交互对象的个数；v_top表示权重最大的第一交互对象的第一交互对象向量；表示任意一个第一交互对象的第一交互对象向量；表示权重最大的第一交互对象的第一交互对象向量和任意一个第一交互对象的第一交互对象向量之间的相似性计算函数；decay(j)表示时间衰减函数；l_j表示目标用户的行为序列；表示目标用户的行为序列所涉及的第一交互对象。

下面通过一个示例对公式(十二)进行说明。例如，有如下有序行为序列：a，a，b，c，b。其中，越靠近左边，则越接近当前时间，其中，a，b，c表示不同的对象，例如，对象可以是商品。

根据本发明的实施例，可以将越接近当前时间的行为对用户兴趣的描述有更强的权重，所以可以加入一个衰减因子，为了简单起见，可以使用1/n作为对应对象的权重。对于上述行为序列，可以得到各个对象的权重如下：1，1/2，1/3，1/4，1/5。

对于每个对象而言，计算每个对象的权重累加之和。其中：

a：(1+1/2)＝3/2；

b：(1/3+1/5)＝8/15；

c：(1/4)＝1/4。

通过比较各个对象的权重累加之和，可以看出表示权重最大的第一交互对象v_top为对象a。可以将对象a作为目标用户的主要兴趣对象，然后计算sim(V_a，V_b)和sim(V_a，V_c)，其中，sim可以任意制定，一般可以选取余弦计算。

最后，根据公式(十二)，得到用户向量V_U。

V_U＝V_a×3/2×sim(V_a，V_a)+V_b×8/15×sim(V_a，V_b)+V_c×1/4×sim(V_a，V_c)。

通过本发明的实施例，基于用户的行为序列构建的向量生成模型，在计算过程中去除负采样，直接进行矩阵运算以计算损失，能大幅提升训练性能，根据实际运行结果，可以在6分钟左右处理完成3千万条数据。

根据本发明的实施例，检索词向量的构建可以从用户向量构建的角度进行构建。检索词和点击过的商品之间的关系与用户和其交互过的商品之间的关系是类似的，所以检索词的构建也可以通过聚合的方式来完成，但是考虑到检索词还存在分词以及新词等等情况，所以会在聚合之前做一些预处理操作。

图6示意性示出了根据本发明实施例的构建目标用户的检索词向量的流程图。

如图6所示，构建目标用户的检索词向量包括操作S610～S630。

在操作S610，获取基于检索词搜索生成的有序点击序列。

在操作S620，确定有序点击序列所涉及的多个第二交互对象。

根据本发明的实施例，例如，目标用户的其中一个有序点击序列为点击正在售卖的不同服装，例如，点击短袖、点击长袖、点击薄外套。第二交互对象可以包括短袖、长袖和薄外套。

在操作S630，根据多个第二交互对象中的每个第二交互对象的第二交互对象向量和有序点击序列构建检索词向量，其中，检索词向量用于表征与检索词关联的一个或多个关联对象。

根据本发明的实施例，根据多个第二交互对象中的每个第二交互对象的第二交互对象向量和有序点击序列构建检索词向量包括：根据有序点击序列确定针对多个第二交互对象中的每个第二交互对象的权重；以及根据针对每个第二交互对象的权重和每个第二交互对象的第二交互对象向量构建检索词向量。

根据本发明的实施例，可以按照如下公式(十三)构建检索词向量。

根据本发明的实施例，其中，在公式(十三)中，h表示第二交互对象的个数；v_top表示权重最大的第二交互对象的第二交互对象向量；表示第二交互对象的第二交互对象向量；表示权重最大的第二交互对象的第二交互对象向量和每个第二交互对象的第二交互对象向量之间的相似性计算函数；l_j表示所述目标用户的行为序列；表示所述目标用户的行为序列所涉及的第二交互对象。

根据本发明的实施例，关于公式(十三)的介绍，可以参考上述对公式(十二)所做的说明。公式(十三)与公式(十二)的主要区别在于将公式(十二)中的decay(j)替换成1。

与用户向量聚合不同的是，在构建检索词向量时，会对词汇本身进行扩展。对于从来没有出现过的检索词，可以使用分词后的向量或者聚合方式获得它的向量描述，这种方式与自然语言处理技术中的词向量用途基本是一致的，所以，本发明的构建检索词向量的方式可以称之为基于用户历史行为的检索词向量表征。

例如，存在一系列检索词及其对应的点击序列。其中，本发明用字母代表最小分词粒度，例如检索词abc可以被分词为a，b，c。

检索词一abc：I_1，I_2，I_4(点击序列一)；

检索词二b：I_3，I_2(点击序列二)；

检索词三ab：I_1，I_4，I_6，I_8(点击序列三)。

对检索词做分词处理(同时保留原有的)，可以得到如下内容。

(一)对于检索词一abc：

abc，I_1，I_2，I_4；

a，I_1，I_2，I_4；

b，I_1，I_2，I_4；

c，I_1，I_2，I_4。

(二)对于检索词二b：

b，I_3，I_2。

(三)对于检索词三ab：

ab，I_1，I_4，I_6，I_8；

a，I_1，I_4，I_6，I_8；

b，I_1，I_4，I_6，I_8。

将分词得到的每个词对应的商品进行聚合。

abc，I_1，I_2，I_4；

ab，I_1，I_4，I_6，I_8；

a，I_1，I_2，I_4，I_6，I_8；

b，I_1，I_2，I_3，I_4，I_6，I_8；

c，I_1，I_2，I_4。

依据上述用于构建检索词向量的计算公式(十三)，确定权重最大的主要商品，计算注意力权重，最后可以得到检索词向量。

通过本发明的实施例，可以在统一的向量空间同时表征用户、商品、检索词。在搜索推荐场景，支持用户到商品、用户到检索词、检索词到检索词、检索词到商品多维度的数据相关性推荐。在定向推广场景，当确定商品后，可以基于向量之间的空间距离确定感兴趣的目标人群列表用于流量营销。

图7示意性示出了根据本发明实施例的实时推荐目标对象的流程图。

如图7所示，实时推荐目标对象包括操作S710～S720。

在操作S710，实时获取目标用户当前输入的实时操作信息。

根据本发明的实施例，可以在目标用户进行搜索时，采集目标用户当前输入的实时操作信息。基于目标用户当前输入的实时操作信息，推断用户实时意图，基于用户实时行为序列的演变来推断用户搜索意图，推荐用户相关检索词和潜在购买需求商品。

在操作S720，根据对象向量和/或检索词向量与用户当前输入的实时操作信息向目标用户推荐目标对象。

根据本发明的实施例，根据对象向量和/或检索词向量与目标用户当前输入的实时操作信息向目标用户推荐目标对象包括：将用户当前输入的实时操作信息进行向量化，得到实时行为向量；确定与实时行为向量相似的第一相似向量，其中，第一相似向量为对象向量和检索词向量中的一个或多个；从第一相似向量对应的对象中确定目标对象。

根据本发明的实施例，例如，用户当前输入的实时操作信息为用户输入关键字人参和燕窝，可以将人参和燕窝进行向量化，得到与人参和燕窝对应的实时行为向量，然后从大量的对象向量和检索词向量中，确定与人参和燕窝对应的实时行为向量相似的第一相似向量。例如，对象向量和检索词向量中包括海参、石斛、阿胶等商品的向量，由于海参、石斛、阿胶等商品与人参和燕窝都是滋补品，其向量可能与人参、燕窝对应的向量相似度很高，因此，可以将海参、石斛、阿胶等商品的向量确定为人参和燕窝对应的实时行为向量相似的向量，然后从海参、石斛、阿胶等商品中确定出目标商品，向目标用户推荐。

根据本发明的实施例，在确定与实时行为向量相似的第一相似向量时，可以先计算实时行为向量分别与对象向量和检索词向量的相似度，然后将相似度最高的向量作为第一相似向量。

图8示意性示出了根据本发明另一实施例的实时推荐目标对象的流程图。

如图8所示，用户在网上操作商品时，会产生操作行为序列，操作行为序列中涉及用户操作的交互商品。在实时推荐目标对象时，可以获取用户实时输入的检索词，对检索词所涉及的商品和交互商品的类目进行实时统计，得到类目1～类目3对应的商品。将类目1～类目3对应的商品进行向量化，得到类目向量1～类目向量3。根据本发明的实施例，挑选与当前检索词对应的检索词向量距离最近的类目向量作为激活类目向量，将检索词向量和激活类目向量进行加权融合生成最终的检索向量。基于在线的最近邻向量查询(Approximately Nearest Neighbor，简称ANN，一种向量检索系统，通过给定一个向量可以找到和该向量在空间上距离最近的一个或多个向量)，召回和上述检索词向量距离最近的对象向量，从而可以推荐该召回的对象向量所表征的商品，实现用户的搜索意图的实时识别。

通过本发明的实施例，可以基于用户实时搜索行为扩展生成建议的搜索词，使用用户行为的向量表征，还可以召回与用户行为语义相关的商品。

图9示意性示出了根据本发明另一实施例的个性化推荐目标对象的流程图。

如图9所示，个性化推荐目标对象可以用于用户进行实时搜索前，该方法包括操作S910～S940。

在操作S910，获取与目标用户相关联的对象向量、用户向量和检索词向量。

在操作S920，确定目标用户相关联的对象向量、用户向量和检索词向量中每两个向量之间的第二相似度。

根据本发明的实施例，可以确定对象向量与用户向量之间的第二相似度，对象向量与检索词向量之间的第二相似度，检索词向量与用户向量之间的第二相似度。

根据本发明的实施例，为保证高流量场景个性化意图识别的服务性能，可以预先计算目标用户相关联的对象向量、用户向量和检索词向量中每两个向量之间的相似度，同时把计算结果存放到关系型数据库以支持高效的查询。

在操作S930，将每两个向量之间的第二相似度与预设阈值进行比较。

根据本发明的实施例，可以将对象向量与用户向量之间的第二相似度与预设阈值进行比较，将对象向量与检索词向量之间的第二相似度与预设阈值进行比较，将检索词向量与用户向量之间的第二相似度与预设阈值进行比较。

在操作S940，根据第二相似度大于或等于预设阈值的向量对应的多个对象确定搜索对象。

根据本发明的实施例，例如，对象向量与用户向量之间的第二相似度为0.6，对象向量与检索词向量之间的第二相似度为0.7，检索词向量与用户向量之间的第二相似度为0.9，预设阈值为0.8。可以确定第二相似度大于或等于预设阈值的向量为检索词向量与用户向量。从检索词向量与用户向量所涉及的多个对象中确定搜索对象。

根据本发明的实施例，根据第二相似度大于或等于预设阈值的向量对应的对象确定搜索对象包括：将第二相似度大于或等于预设阈值的向量对应的多个对象进行去重处理，将去重后得到的对象确定为搜索对象。

根据本发明的实施例，例如，如前示例，确定第二相似度大于或等于预设阈值的向量为检索词向量与用户向量，将检索词向量与用户向量所涉及的对象进行去重，将去重后得到的对象确定为搜索对象。

根据本发明的实施例，在从与第二相似向量对应的对象中确定搜索对象之后，可以在搜索框中以目标显示方式显示搜索对象。

根据本发明的实施例，目标显示方式可以是以搜索底纹的方式显示，也可以是在“搜索发现”中显示。

通过本发明的实施例，可以使得在使用搜索功能之前，提供感兴趣的对象标识信息以搜索底纹的显示方式显示在搜索框中，同时，也可以生成一批用户想搜索的检索词进行呈现。

通过本发明的实施例，可以感知用户的查询意图，当捕获到足够的用户行为数据后，可以及时将用户需要的检索词或商品呈现出来，降低用户流失概率，提升购物转化。

根据本发明的实施例，需要说明的是，虽然上述实施例主要是针对电商场景中商品推荐进行描述，但本领域技术人员可以理解的是，本发明并不限于此。例如，本发明也可以适用于新闻推荐，食谱推荐等其它推荐场景，本发明在此不再赘述。

示例性装置

在介绍了本发明示例性实施方式的方法之后，接下来，参考图10对本发明示例性实施方式的由计算设备执行的数据处理装置进行描述。

图10示意性地示出了根据本发明实施例的由计算设备执行的数据处理装置的框图。

如图10所示，该由计算设备执行的数据处理装置1000包括第一获取模块1010、第二获取模块1020和训练模块1030。

第一获取模块1010用于获取训练样本集，其中，上述训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的对象；上述上下文对象的标识信息与上述中心对象的标识信息在同一个行为序列中的排列位置相邻，上述行为序列包括用户操作过的一个或多个对象的标识信息，其中，在上述行为序列中按照对象被操作的时间顺序排列上述对象的标识信息；

第二获取模块1020用于根据上述每一条训练数据中各个对象的标识信息，获取上述各个对象中的每个对象的属性信息；以及

训练模块1030用于基于上述各个对象中的每个对象的标识信息和属性信息训练向量生成模型，以使得训练后的上述向量生成模型能够用于输出表征对象的对象向量。

根据本发明实施方式的由计算设备执行的数据处理装置，通过获取训练样本集，其中，每一条训练数据包括中心对象、上下文对象和目标操作针对的对象的标识信息，上下文对象的标识信息与中心对象的标识信息在同一个行为序列中的排列位置相邻，在行为序列中按照对象被操作的时间顺序排列对象的标识信息；基于每个对象的标识信息和属性信息训练向量生成模型，训练后的向量生成模型能够用于输出表征对象的对象向量，可以通过大数据、机器学习和深度学习等技术，基于数据和算法的配合，输出对象的对象向量，以便刻画用户兴趣和感知用户意图，可以缩短用户的需求表达路径，降低用户中断购买流程的概率，为用户带来了更好的体验。

根据本发明的实施例，上述向量生成模型具有损失函数，上述损失函数包括：

其中，表示将上述每一条训练数据中的中心对象的标识信息和属性信息进行向量初始化得到的第一初始向量；表示将上述每一条训练数据中的上下文对象的标识信息和属性信息进行向量初始化得到的第二初始向量；表示将上述每一条训练数据中的目标操作针对的对象的标识信息和属性信息进行向量初始化得到的第三初始向量；r_ii表示将上述第一初始向量和上述第三初始向量进行矩阵相乘后，得到的结果矩阵的对角线上的元素；r_ij表示上述结果矩阵中除上述对角线上的元素之外的其他元素；b表示上述向量生成模型并行处理的训练数据的条数；n表示上述上下文对象的个数，α为权重系数。

根据本发明的实施例，由计算设备执行的数据处理装置1000还包括第三获取模块、第一确定模块和第一构建模块。

第三获取模块用于获取目标用户的目标行为序列；

第一确定模块用于确定上述目标行为序列所涉及的多个第一交互对象；以及

第一构建模块用于根据与上述多个第一交互对象中的每个第一交互对象对应的第一交互对象向量和上述目标行为序列来构建上述目标用户的用户向量，其中，上述目标用户的用户向量用于表征上述目标用户感兴趣的一个或多个关联对象。

根据本发明的实施例，上述第一构建模块用于：根据上述目标行为序列确定针对上述多个第一交互对象中的每个第一交互对象的权重；以及根据针对上述每个第一交互对象的权重和上述每个第一交互对象的第一交互对象向量构建上述目标用户的用户向量。

根据本发明的实施例，根据针对上述每个第一交互对象的权重和上述每个第一交互对象的第一交互对象向量构建上述目标用户的用户向量包括：

根据针对上述每个第一交互对象的权重和上述每个第一交互对象的第一交互对象向量按照如下公式构建上述目标用户的用户向量：

其中，V_U表示目标用户的用户向量，h表示第一交互对象的个数；v_top表示权重最大的第一交互对象的第一交互对象向量；表示任意一个第一交互对象的第一交互对象向量；表示权重最大的第一交互对象的第一交互对象向量和任意一个第一交互对象的第一交互对象向量之间的相似性计算函数；decay(j)表示时间衰减函数；l_j表示上述目标用户的行为序列；表示上述目标用户的行为序列所涉及的第一交互对象。

根据本发明的实施例，由计算设备执行的数据处理装置1000还包括第四获取模块、第二确定模块和第二构建模块。

第四获取模块用于获取基于检索词搜索生成的有序点击序列；

第二确定模块用于确定上述有序点击序列所涉及的多个第二交互对象；以及

第二构建模块用于根据上述多个第二交互对象中的每个第二交互对象的第二交互对象向量和上述有序点击序列构建检索词向量，其中，上述检索词向量用于表征与上述检索词关联的一个或多个关联对象。

根据本发明的实施例，上述第二构建模块用于：根据上述有序点击序列确定针对上述多个第二交互对象中的每个第二交互对象的权重；以及根据针对上述每个第二交互对象的权重和上述每个第二交互对象的第二交互对象向量构建上述检索词向量。

根据本发明的实施例，由计算设备执行的数据处理装置1000还包括第五获取模块和第一推荐模块。

第五获取模块用于实时获取上述目标用户当前输入的实时操作信息；

第一推荐模块用于根据上述对象向量和/或上述检索词向量与上述用户当前输入的实时操作信息向上述目标用户推荐目标对象。

根据本发明的实施例，上述第一推荐模块用于：将上述用户当前输入的实时操作信息进行向量化，得到实时行为向量；确定与上述实时行为向量相似的第一相似向量，其中，上述第一相似向量为上述对象向量和上述检索词向量中的一个或多个；以及从上述第一相似向量对应的对象中确定上述目标对象。

根据本发明的实施例，由计算设备执行的数据处理装置1000还包括第六获取模块、第三确定模块、比较模块和第四确定模块。

第六获取模块用于获取与上述目标用户相关联的对象向量、用户向量和检索词向量；

第三确定模块用于确定上述目标用户相关联的对象向量、用户向量和检索词向量中每两个向量之间的第二相似度；

比较模块用于将上述每两个向量之间的第二相似度与预设阈值进行比较；以及

第四确定模块，用于根据上述第二相似度大于或等于上述预设阈值的向量对应的多个对象确定上述搜索对象。

根据本发明的实施例，上述第四确定模块用于：将上述第二相似度大于或等于上述预设阈值的向量对应的多个对象进行去重处理；以及将去重后得到的对象确定为上述搜索对象。

根据本发明的实施例，由计算设备执行的数据处理装置1000还包括显示模块，用于在从与上述第二相似向量对应的对象中确定上述搜索对象之后，在搜索框中以目标显示方式显示上述搜索对象。

根据本发明的实施例，上述第一获取模块用于获取预定时间段内多个用户的行为日志；对多个用户中每个用户的行为日志进行处理，构建与每个用户对应的行为序列，得到上述多个用户的行为序列；以及根据上述多个用户的行为序列构建上述训练样本集。

示例性介质

在介绍了本发明示例性实施方式的装置之后，接下来，参考图11对本发明示例性实施方式的、用于存储有计算机可执行指令，该指令在被处理单元执行时用于实现如上所述的数据处理方法的介质进行描述。

在一些可能的实施方式中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在计算设备上运行时，所述程序代码用于使所述计算设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的数据处理方法中的步骤，例如，所述计算设备可以执行如图2中所示的操作S210，获取训练样本集；操作S220，根据每一条训练数据中各个对象的标识信息，获取各个对象中的每个对象的属性信息；操作S230，基于各个对象中的每个对象的标识信息和属性信息训练向量生成模型，以使得训练后的向量生成模型能够用于输出表征对象的对象向量。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

图11示意性地示出了根据本发明实施方式的用于实现数据处理方法的程序产品示意图。

如图11所示，描述了根据本发明的实施方式的实现数据处理方法的程序产品110，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在计算设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括一—但不限于——无线、有线、光缆，RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言——诸如Java，C++等，还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

示例性计算设备

在介绍了本发明示例性实施方式的方法、介质和装置之后，接下来，参考图12对本发明示例性实施方式的计算设备进行描述，该计算设备包括处理单元和存储单元，存储单元存储有计算机可执行指令，上述指令在被上述处理单元执行时用于实现如上所述的数据处理方法进行描述。

本发明实施例还提供了一种计算设备。所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

在一些可能的实施方式中，根据本发明的计算设备可以至少包括至少一个处理单元、以及至少一个存储单元。其中，所述存储单元存储有程序代码，当所述程序代码被所述处理单元执行时，使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的数据处理方法中的步骤。例如，所述处理单元可以执行如图2中所示的操作S210，获取训练样本集；操作S220，根据每一条训练数据中各个对象的标识信息，获取各个对象中的每个对象的属性信息；操作S230，基于各个对象中的每个对象的标识信息和属性信息训练向量生成模型，以使得训练后的向量生成模型能够用于输出表征对象的对象向量。

下面参照图12来描述根据本发明的这种实施方式的数据处理的计算设备120。如图12所示的计算设备120仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图12所示，计算设备120以通用计算设备的形式表现。计算设备120的组件可以包括但不限于：上述至少一个处理单元1201、上述至少一个存储单元1202、连接不同系统组件(包括存储单元1202和处理单元1201)的总线1203。

总线1203表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储单元1202可以包括易失性存储器形式的可读介质，例如随机存取存储器(RAM)12021和/或高速缓存存储器12022，还可以进一步包括只读存储器(ROM)12023。

存储单元1202还可以包括具有一组(至少一个)程序模块12024的程序/实用工具12025，这样的程序模块12024包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

计算设备120也可以与一个或多个外部设备1204(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与计算设备120交互的设备通信，和/或与使得计算设备120能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/0)接口1205进行。并且，计算设备120还可以通过网络适配器1206与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器1206通过总线1203与计算设备120的其它模块通信。应当明白，尽管图中未示出，可以结合计算设备120使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

应当注意，尽管在上文详细描述中提及了装置的若干单元/模块或子单元/模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之，上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本发明的精神和原理，但是应该理解，本发明并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

1.一种由计算设备执行的数据处理方法，包括：

获取训练样本集，其中，所述训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的对象；所述上下文对象的标识信息与所述中心对象的标识信息在同一个行为序列中的排列位置相邻，所述行为序列包括用户操作过的一个或多个对象的标识信息，其中，在所述行为序列中按照对象被操作的时间顺序排列所述对象的标识信息；

根据所述每一条训练数据中各个对象的标识信息，获取所述各个对象中的每个对象的属性信息；以及

基于所述各个对象中的每个对象的标识信息和属性信息训练向量生成模型，以使得训练后的所述向量生成模型能够用于输出表征对象的对象向量。

2.根据权利要求1所述的方法，其中，所述向量生成模型具有损失函数，所述损失函数包括：

其中，表示将所述每一条训练数据中的中心对象的标识信息和属性信息进行向量初始化得到的第一初始向量；表示将所述每一条训练数据中的上下文对象的标识信息和属性信息进行向量初始化得到的第二初始向量；表示将所述每一条训练数据中的目标操作针对的对象的标识信息和属性信息进行向量初始化得到的第三初始向量；r_ii表示将所述第一初始向量和所述第三初始向量进行矩阵相乘后，得到的结果矩阵的对角线上的元素；r_ij表示所述结果矩阵中除所述对角线上的元素之外的其他元素；b表示所述向量生成模型并行处理的训练数据的条数；n表示所述上下文对象的个数，α为权重系数。

3.根据权利要求1所述的方法，还包括：

获取目标用户的目标行为序列；

确定所述目标行为序列所涉及的多个第一交互对象；以及

根据与所述多个第一交互对象中的每个第一交互对象对应的第一交互对象向量和所述目标行为序列来构建所述目标用户的用户向量，其中，所述目标用户的用户向量用于表征所述目标用户感兴趣的一个或多个关联对象。

4.根据权利要求3所述的方法，其中，所述构建所述目标用户的用户向量包括：

根据所述目标行为序列确定针对所述多个第一交互对象中的每个第一交互对象的权重；以及

根据针对所述每个第一交互对象的权重和所述每个第一交互对象的第一交互对象向量构建所述目标用户的用户向量。

5.根据权利要求4所述的方法，其中，根据针对所述每个第一交互对象的权重和所述每个第一交互对象的第一交互对象向量构建所述目标用户的用户向量包括：

根据针对所述每个第一交互对象的权重和所述每个第一交互对象的第一交互对象向量按照如下公式构建所述目标用户的用户向量：

其中，V_U表示目标用户的用户向量，h表示第一交互对象的个数；v_top表示权重最大的第一交互对象的第一交互对象向量；表示任意一个第一交互对象的第一交互对象向量；表示权重最大的第一交互对象的第一交互对象向量和任意一个第一交互对象的第一交互对象向量之间的相似性计算函数；decay(j)表示时间衰减函数；l_j表示所述目标用户的行为序列；表示所述目标用户的行为序列所涉及的第一交互对象。

6.根据权利要求1或3所述的方法，还包括：

获取基于检索词搜索生成的有序点击序列；

确定所述有序点击序列所涉及的多个第二交互对象；以及

根据所述多个第二交互对象中的每个第二交互对象的第二交互对象向量和所述有序点击序列构建检索词向量，其中，所述检索词向量用于表征与所述检索词关联的一个或多个关联对象。

7.根据权利要求6所述的方法，其中，所述构建检索词向量包括：

根据所述有序点击序列确定针对所述多个第二交互对象中的每个第二交互对象的权重；以及

根据针对所述每个第二交互对象的权重和所述每个第二交互对象的第二交互对象向量构建所述检索词向量。

8.一种由计算设备执行的数据处理装置，包括：

第一获取模块，用于获取训练样本集，其中，所述训练样本集包括多条训练数据，每一条训练数据至少包括以下对象的标识信息：中心对象、上下文对象和目标操作针对的对象；所述上下文对象的标识信息与所述中心对象的标识信息在同一个行为序列中的排列位置相邻，所述行为序列包括用户操作过的一个或多个对象的标识信息，其中，在所述行为序列中按照对象被操作的时间顺序排列所述对象的标识信息；

第二获取模块，用于根据所述每一条训练数据中各个对象的标识信息，获取所述各个对象中的每个对象的属性信息；以及

训练模块，用于基于所述各个对象中的每个对象的标识信息和属性信息训练向量生成模型，以使得训练后的所述向量生成模型能够用于输出表征对象的对象向量。

9.一种介质，存储有计算机可执行指令，所述指令在被处理单元执行时用于实现权利要求1至7中任一项所述的方法。

10.一种计算设备，包括：

处理单元；以及

存储单元，存储有计算机可执行指令，所述指令在被所述处理单元执行时用于实现权利要求1至7中任一项所述的方法。