CN111966889A

CN111966889A - 一种图嵌入向量的生成方法以及推荐网络模型的生成方法

Info

Publication number: CN111966889A
Application number: CN202010431356.6A
Authority: CN
Inventors: 江勇; 周慧敏; 李清
Original assignee: Shenzhen International Graduate School of Tsinghua University; Peng Cheng Laboratory
Current assignee: Shenzhen International Graduate School of Tsinghua University; Peng Cheng Laboratory
Priority date: 2020-05-20
Filing date: 2020-05-20
Publication date: 2020-11-20
Anticipated expiration: 2040-05-20
Also published as: CN111966889B

Abstract

本申请公开了一种图嵌入向量的生成方法以及推荐网络模型的生成方法，所述图嵌入向量的生成方法包括获取待处理的数据样本；基于若干用户历史行为序列，确定所述数据样本对应的静态图数据以及动态时间图数据，基于所述静态图数据确定所述数据样本对应的静态图嵌入向量表，并基于所述动态时间图数据确定所述数据样本对应的动态图嵌入向量表；基于所述静态图嵌入向量表以及所述动态图嵌入向量表，确定所述数据样本对应的图嵌入向量表。本发明通过确定数据样本的静态图数据以及动态时间图数据，确定静态嵌入向量表和动态嵌入向量表，这样通过静态嵌入向量表和动态嵌入向量表可以扩大项目对应的嵌入向量的适用范围。

Description

一种图嵌入向量的生成方法以及推荐网络模型的生成方法

技术领域

本申请涉及数据处理技术领域，特别涉及一种图嵌入向量的生成方法以及推荐网络模型的生成方法。

背景技术

随着深度学习不断发展，深度学习模型已经普遍应用于推荐算法。在目前的深度学习推荐系统基础框架中，嵌入方法主要是作为深度学习网络中的嵌入层，作用是完成从高维稀疏特征向量到低维稠密特征向量的转换。然而，在基于深度学习的推荐方法中，嵌入层操作普遍是针对序列数据的，现已不再适用于真实环境下的图形数据的嵌入。

发明内容

本申请要解决的技术问题在于，针对现有技术的不足，提供一种图嵌入向量的生成方法以及推荐网络模型的生成方法。

为了解决上述技术问题，本申请实施例第一方面提供了一种图嵌入向量的生成方法，所述方法包括：

获取待处理的数据样本，其中，所述数据样本包括若干用户历史行为序列；

基于若干用户历史行为序列，确定所述数据样本对应的静态图数据以及动态时间图数据，其中，所述静态图数据的顶点和动态时间图数据的顶点均为用户历史序列中的项目；

基于所述静态图数据确定所述数据样本对应的静态图嵌入向量表，并基于所述动态时间图数据确定所述数据样本对应的动态图嵌入向量表；

基于所述静态图嵌入向量表以及所述动态图嵌入向量表，确定所述数据样本对应的图嵌入向量表。

所述图嵌入向量的生成方法，其中，所述静态图数据中的权重用于反映若干用户历史行为中相关项目对的频率。

所述图嵌入向量的生成方法，其中，所述静态图数据的构建过程具体包括：

获取若干用户历史行序列包括的所有项目，以得到所述静态图数据对应的顶点集；

对于若干用户历史行为中对每个用户历史行为，确定该用户历史行为对应的项目对，其中，所述项目对包括第一项目和第二项目，所述第一项目和第二项目按照时间顺序为相邻项目；

根据获取到的所有项目对，确定顶点序列中各顶点之间的边以及各边的出现次数；

将各边的出现次数作为各边对应的权重，以得到所述静态图数据。

所述图嵌入向量的生成方法，其中，所述基于所述静态图数据确定所述数据样本对应的静态图嵌入向量表具体包括：

获取所述静态图数据对应的顶点集合，根据所述顶点集合形成若干参考顶点序列；

对于每个参考顶点序列，对该参考点序列进行随机游走以得到若干随机顶点序列；

基于获取到的所有随机顶点序列进行词向量训练，生成每个顶点对应的静态图嵌入向量，以得到所述数据样本对应的静态图嵌入向量表。

所述图嵌入向量的生成方法，其中，所述动态时间图数据中的权重用于反映若干用户历史行为中相关项目对的频率以及项目对中两个项目转换的行为时间。

所述图嵌入向量的生成方法，其中，所述动态时间图数据的构建过程具体包括：

获取若干用户历史行序列包括的所有项目，以得到所述动态时间图数据对应的顶点集；

根据获取到的所有项目对，确定顶点序列中各顶点之间的边，以得到动态时间图数据对应的边；

对于动态时间图数据的每条边，确定该边对应的各项目对以及各项目对中目标项目对应的时间戳，并基于各项目以及各项目对应的时间戳确定该边对应的权重，以得到所述动态时间图数据。

所述图嵌入向量的生成方法，其中，所述基于所述动态时间图数据确定所述数据样本对应的动态图嵌入向量表具体包括：

获取所述动态时间图数据对应的顶点集合，根据所述顶点集合形成若干参考顶点序列；

对于每个参考顶点序列，对该参考点序列进行时态游走以得到若干随机顶点序列，其中，所述时态游走为以时序顺序为约束条件的随机游走；

基于获取到的所有随机顶点序列进行词向量训练，生成每个顶点对应的动态图嵌入向量，以得到所述数据样本对应的动态图嵌入向量表。

本实施例第二方面提供了一种推荐网络模型的生成方法，所述方法包括：

获取训练样本集；

对于训练样本集中的每个训练样本，基于预设图嵌入向量表确定该训练样本对应的图嵌入向量，其中，所述图嵌入向量为基于如上任一所述的图嵌入向量的生成方法确定的；

基于所述训练样本以及所述图嵌入向量，对预设网络模型进行训练，以得到推荐网络模型。

第三方面本实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如上所述的图嵌入向量的生成方法中的步骤，和/或以实现如上所述的推荐网络模型的生成方法中的步骤。

第四方面本实施例提供了一种终端设备，其包括：处理器、存储器及通信总线；所述存储器上存储有可被所述处理器执行的计算机可读程序；

所述通信总线实现处理器和存储器之间的连接通信；

所述处理器执行所述计算机可读程序时实现如上所述的图嵌入向量的生成方法中的步骤，和/或实现如上所述的推荐网络模型的生成方法中的步骤。

有益效果：与现有技术相比，本申请提供了一种图嵌入向量的生成方法以及推荐网络模型的生成方法，所述图嵌入向量的生成方法包括获取待处理的数据样本；基于若干用户历史行为序列，确定所述数据样本对应的静态图数据以及动态时间图数据，基于所述静态图数据确定所述数据样本对应的静态图嵌入向量表，并基于所述动态时间图数据确定所述数据样本对应的动态图嵌入向量表；基于所述静态图嵌入向量表以及所述动态图嵌入向量表，确定所述数据样本对应的图嵌入向量表。本发明通过确定数据样本的静态图数据以及动态时间图数据，确定静态嵌入向量表和动态嵌入向量表，这样通过静态嵌入向量表和动态嵌入向量表可以扩大项目对应的嵌入向量的适用范围。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员而言，在不符创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请提供的图嵌入向量的生成方法的流程图。

图2为本申请提供的图嵌入向量的生成方法中数据样本的一个示例图。

图3为本申请提供的图嵌入向量的生成方法中静态图数据的一个示例图。

图4为本申请提供的图嵌入向量的生成方法中动态时间图数据的一个示例图。

图5为本申请提供的图嵌入向量的生成方法中随机游走的一个示例图。

图6为本申请提供的推荐网络模型的生成方法的流程图。

图7为本申请提供的推荐网络模型的生成方法的流程示意图。

图8为本申请提供的推荐网络模型的生成方法中注意力机制的原理示意图。

图9为本申请提供的终端设备的结构原理图。

具体实施方式

本申请提供一种图嵌入向量的生成方法以及推荐网络模型的生成方法，为使本申请的目的、技术方案及效果更加清楚、明确，以下参照附图并举实施例对本申请进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

下面结合附图，通过对实施例的描述，对申请内容作进一步说明。

本实施提供了一种图嵌入向量的生成方法，如图1所示，所述方法包括：

S10、获取待处理的数据样本，其中，所述数据样本包括若干用户历史行为序列。

具体地，所述数据样本包括若干用户历史行为序列，若干用户历史行为序列中的每个用户历史行为序列均包括若干用户行为项，每个用户行为项包括行为对象以及行为时间，所述行为对象与行为时间相同。这里将行为对象作为项目，行为时间作为时间戳。可以理解的是，每个用户历史行为序列均包括若干由项目和时间戳构成的用户行为项；并且用户历史行为序列中各用户行为项按照时间顺序依次排列。例如，如图2所示，所述数据样本包括四个用户历史行为序列，分别记为用户1对应的用户历史行为序列，用户2对应的用户历史行为序列，用户3对应的用户历史行为序列以及用户4对应的用户历史行为序列，其中，用户1对应的用户历史行为序列包括4个用户行为项，分别为(A，t1)，(C、t5)，(E，t9)和(F，t12)，(A，t1)，(C、t5)，(E，t9)和(F，t12)形成的历史行为序列为{(A，t1)，(C、t5)，(E，t9)，(F，t12)}其中，(a，b)中a表示项目，b表示时间戳。此外，对于两个用户行为项，位于前的用户行为项的发生时间早于位于后的用户行为项的发生时间，例如，对于(C、t5)和(E，t9)，(C、t5)的发生时间早于(E，t9)的发生时间。

此外，值得说明的是，在下面的说明中，对于各用户历史行为序列终端用户行为项中的时间戳采用tn表示，其中，n为正整数，并且tn中n值越大，表示该时间戳的发生时间越晚，即对于tn-1和tn，tn-1对应的用户行为项的发生时间早于tn对应的用户行为项的发生时间。

进一步，对于若干用户历史行为序列中的任意两个用户历史行为序列，记为第一用户历史行为序列和第二用户历史行为序列，第一用户历史行为序列中各用户行为项对应的时间戳与第二用户历史行为序列中各用户行为项对应的时间戳互不相同，第一用户历史行为序列中可以存在用户行为项对应的项目与第二用户历史行为序列中的用户行为项对应的项目相同。例如，如图2所示，用户1对应的用户历史行为序列中的(C，t2)和用户2对应的用户历史行为序列中的(C，t7)，(C，t2)和(C，t7)对应的项目均为C，(C，t2)对应的时间戳为t2，(C，t7)对应的时间戳为t7。

S20、基于若干用户历史行为序列，确定所述数据样本对应的静态图数据以及动态时间图数据，其中，所述静态图数据的顶点和动态时间图数据的顶点均为用户历史序列中的项目。

具体地，图数据是一种抽象程度高，表达能力强的数据结构。图数据结构很好的表达了数据之间的关联性(relationships between data)，关联性计算是大数据计算的核心——通过获得数据的关联性，可以从噪音很多的海量数据中抽取有用的信息。比如，通过为购物者之间的关系建模，就能很快找到兴趣相似的用户，并为之推荐商品；或者在社交网络中，通过传播关系发现意见领袖。

进一步，图数据可以包括若干非空顶点以及一组顶点之间的边组成，通常表示为：G(V,E)，其中，G表示一个图，V＝{v₁,v₂,...,v_n}是图中的一组顶点，

是图中的一组边，n为正整数。对于V＝{v₁,v₂,...,v_n}中的两个顶点v_i和v_j之间的边e_ij，若边e_ij为无向边，则G为无向导图；若边e_ij为有向边，则G为有向导图。此外，图中的边可以携带有权重，所述权重可以表示一个顶点到另一个顶点的距离或成本，并且将具有权重的图成为加权图。在加权图中，两个顶点v_i和v_j之间的边e_ij的权重记为w_ij，其中，w_ij的值通常为非负的，即如果边e_ij存在，则w_ij>0，若边e_ij不存在，基于此，可以将加权图记为G(V,E,W)。

此外，在图数据中顶点之间的度量参数包括一阶邻近度和二阶邻近度，其中，顶点v_i和v_j之间的边e_ij的权重w_ij称为顶点v_i和v_j之间的一阶邻近度，因为它是两个顶点之间的相似度的第一个度量。为了方便起见，我们将v_i和v_j之间的一阶邻近度记录为fp_ij。二阶邻近度为两个顶点的邻域之间的相似度，令PF_i＝{fp_i1，fp_i2，...，fp_in}表示v_i与其他顶点之间的一阶接近度集合。然后，可以由PF_i和PF_j的相似性确定v_i和v_j之间的二阶邻近度。PF_i和PF_j的相似性可以用欧式距离(Euclidean Distance)、夹角余弦(Cosine)、杰卡德距离(Jaccard Distance)等方法度量。二阶邻近度比较的是两个顶点的邻域，如果它们具有相似的邻域，则将它们视为相似。当然，我们也可以使用其他指标来定义高阶接近度。

进一步，在本实施例的一个实现方式中，所述静态图数据为有向加权图，所述静态图数据中的权重用于反映若干用户历史行为中相关项目对的频率。相应的，所述静态图数据的构建过程具体包括：

A10、获取若干用户历史行序列包括的所有项目，以得到所述静态图数据对应的顶点集；

A20、对于若干用户历史行为中对每个用户历史行为，确定该用户历史行为对应的项目对，其中，所述项目对包括第一项目和第二项目，所述第一项目和第二项目按照时间顺序为相邻项目；

A30、根据获取到的所有项目对，确定顶点序列中各顶点之间的边以及各边的出现次数；

A40、将各边的出现次数作为各边对应的权重，以得到所述静态图数据。

具体地，所有项目指的是若干用户历史行序列中包括的不相同项目，可以理解的是，对于所有项目中的任一项目，至少一个用户历史行序列包含各项目，并且所有项目中的各项目互不相同。例如，如图2所示，用户1对应的项目A、C、E以及F，用户2对应的项目为B、C以及D，那么用户1和用户2对应的所有项目为A、B、C、D、E以及F。

进一步，在获取到静态图数据的顶点集后，对于每个用户历史行序列，将用户历史行序列中相邻两个项目作为一个项目对，以得到若干项目对。对于每个项目对中的两个项目，分别记为第一项目和第二项目，第一项目和第二项目包含于同一用户历史行为序列中，并且在该用户行为序列中，按照时间顺序第一项目和第二项目相邻。可以理解的是，在第一项目和第二项目中，该用户历史行为序列中不存在一个第三项目，第三项目对应的时间戳位于第一项目对应的时间戳和第二项目对应的时间戳之间。例如，如图2所示的用户1对应的用户历史行为序列中，项目A和项目C构成一个项目对，项目C和项目E构成一个项目对，项目E和项目F构成一个项目对。

进一步，在获取到若干用户历史行为序列对应的所有项目对后，对于每个项目对(item_i，item_j)，如果项目item_i和项目item_j之间不存在边e_ij，则添加边e_ij，且该边e_ij为有向边，边e_ij的方向为时间戳较早的项目指向时间戳较晚的项目，并记边e_ij的权重w_ij为1；如果项目对中的两个项目item_i和item_j之间已存在边e_ij，则不再添加边，并把边e_ij对应的权重w_ij加1。基于此，针对项目对(item_i，item_j)的边e_ij的权重w_ij的确定规则可以为：

其中，e_ij表示项目item_i和项目item_j之间的边，w_ij表示为边e_ij对应的权重。

基于此，各边e_ij的权重w_ij为边e_ij的出现次数；即静态图数据中的权重为全部用户历史行为中的有关联的项目对的出现次数。可以理解的是，边的权重等于全部用户购买历史行为中的项目间的转化频率。这样构建的静态图数据能够保留用户历史行为中的项目间的前后关系以及不同项目之间的相似性。

举例说明：数据样本包括如图2所示的用户1对应的用户历史行为序列，用户2对应的用户历史行为序列，用户3对应的用户历史行为序列以及用户4对应的用户历史行为序列，基于上述的动态时间图数据的生成过程，可以得到如图3所示的静态图数据。

进一步，在本实施例的一个实现方式中，所述动态时间图数据中的权重用于反映若干用户历史行为中相关项目对的频率以及项目对中两个项目转换的行为时间。所述动态时间图数据中的权重包括频率权重wf_ij以及时间权重wt_ij，所述频率权重用于反映相关项目对的出现频率，时间权重用于反映相关项目对的行为时间。相应的，所述动态时间图数据的构建过程具体包括：

B10、获取若干用户历史行包括的所有项目，以得到所述动态时间图数据对应的顶点序列；

B20、对于若干用户历史行为中对每个用户历史行为，确定该用户历史行为对应的项目对，其中，所述项目对包括第一项目和第二项目，所述第一项目和第二项目按照时间顺序为相邻项目；

B30、根据获取到的所有项目对，确定顶点序列中各顶点之间的边，以得到动态时间图数据对应的边；

B40、对于动态时间图数据的每条边，确定该边对应的各项目对以及各项目对中目标项目对应的时间戳，并基于各项目以及各项目对应的时间戳确定该边对应的权重，以得到所述动态时间图数据。

具体地，所述动态时间图数据中的边为待时间标签的边，动态时间图数据可以为记为G_T(V,E_T,τ)，其中，V＝{v₁,v₂,...,v_n}是动态时间图数据的顶点集合，E_T为动态时间图数据中一组带有时间标签的边，τ是一个将边带有的时间标签映射为时间戳的函数。为方便起见，没有特别说明的情况下，τ表示时间戳Unixtime与真实时间的转换函数。此外，所述动态时间图数据对应的所有项目与静态图数据对应的所有项目相同，所有项目为若干用户历史行序列中包括的不相同项目。可以理解的是，对于所有项目中的任一项目，至少一个用户历史行序列包含各项目，并且所有项目中的各项目互不相同。

进一步，在获动态时间图数据的顶点集后，对于每个用户历史行序列，将用户历史行序列中相邻两个项目作为一个项目对，以得到若干项目对。对于每个项目对中的两个项目，分别记为第一项目和第二项目，第一项目和第二项目包含于同一用户历史行为序列中，并且在该用户行为序列中，按照时间顺序第一项目和第二项目相邻。可以理解的是，在第一项目和第二项目中，该用户历史行为序列中不存在一个第三项目，第三项目对应的时间戳位于第一项目对应的时间戳和第二项目对应的时间戳之间。例如，如图2所示的用户1对应的用户历史行为序列中，项目A和项目C构成一个项目对，项目C和项目E构成一个项目对，项目E和项目F构成一个项目对。

进一步，在获取到若干用户历史行为序列对应的所有项目对后，对于每个项目对(item_i，item_j)，如果项目item_i和项目item_j之间不存在边e_ij，则添加边e_ij，且该边e_ij为有向边，边e_ij的方向为时间戳较早的项目指向时间戳较晚的项目，并记边e_ij的权重wf_ij为1，并将项目item_i和项目item_j的较晚的时间戳添加到时间权重wt_ij的时间权重列表中；如果项目对中的两个项目item_i和item_j之间已存在边e_ij，则不再添加边，并把边e_ij对应的权重wf_ij加1，将项目item_i和项目item_j的较晚的时间戳添加到时间权重wt_ij的时间权重列表中。基于此，针对项目对(item_i，item_j)的边e_ij的权重w_ij的中频率权重wf_ij以及时间权重wt_ij的确定规则可以分别为：

其中，e_ij表示项目item_i和项目item_j之间的边，wf_ij表示为边e_ij对应的频率权重，wt_ij表示为边e_ij对应的时间权重。

基于此，动态时间图数据的权重用于反映全部用户历史购买行为中的有关联的项目对的出现次数以及项目对中两个项目转换的行为时间，也就是说，边e_ij的频率权重wf_ij为全部用户购买历史行为中的item_i转化为item_j的频率，时间权重为全部用户购买历史行为中的item_i转化为item_j的时间戳集合。这样构建的动态时间图数据不仅能够保留用户购买历史行为中的项目间的前后关系以及不同项目之间的相似性，还能够保留用户购买历史行为中项目的时间依存关系。

举例说明：数据样本包括如图2所示的用户1对应的用户历史行为序列，用户2对应的用户历史行为序列，用户3对应的用户历史行为序列以及用户4对应的用户历史行为序列，基于上述的动态时间图数据的生成过程，可以得到如图4所示的动态时间图数据。

此外，在实际应用中，静态图数据和动态时间图数据可以共享同一个存储结构。有向加权项目图是一个大型稀疏图，基于此可以采用邻接表的形式来存储。在邻接表中，每个顶点都拥有一个单链表，单链表中的节点元素是从该顶点出去的有向边相连的另一个顶点的相关信息，每个节点包含相连顶点、时间权重和频率权重。当图数据为静态图数据时，邻接表中节点的相连顶点和频率权重将会被激活；而当图数据为动态时间图数据时，邻接表中节点的相连顶点和时间权重将会被激活。

S30、基于所述静态图数据确定所述数据样本对应的静态图嵌入向量表，并基于所述动态时间图数据确定所述数据样本对应的动态图嵌入向量表。

具体地，所述静态图嵌入向量表包括若干嵌入向量，若干嵌入向量中每个嵌入向量对于一个项目，即基于所述静态图像嵌入向量表可以确定项目对应的嵌入向量。其中，静态图嵌入向量表中的各嵌入向量可以通过词向量训练程序Word2Vec，基于静态图数据进行词向量训练，生成各项目的所对应的嵌入向量，并将所述项目对应的嵌入向量，保存到静态图嵌入向量表中。此外，关于词向量训练算法，除了上述的Word2Vec算法之外，也可以使用如Glove或者FastText等其他的词向量算法和工具。总之，本说明书不限定词向量训练的方法和种类，本领域技术人员可根据实际需要，采用能够适用于申请场景的词向量算法和工具。

在本实施例的一个实现方式中，所述基于所述静态图数据确定所述数据样本对应的静态图嵌入向量表具体包括：

C10、获取所述静态图数据对应的顶点集合，根据所述顶点集合形成若干参考顶点序列；

C20、对于每个参考顶点序列，对该参考点序列进行随机游走以得到若干随机顶点序列；

C30、基于获取到的所有随机顶点序列进行词向量训练，生成每个顶点对应的静态图嵌入向量，以得到所述数据样本对应的静态图嵌入向量表。

具体地，在所述步骤C10中，所述顶点集合为静态图数据中所有顶点行程的集合，即对于静态图数据中的每个顶点，该顶点均包含与所述顶点集合中，并且对于顶点集合中的每个顶点，该顶点为所述静态图数据的一个顶点。对于若干参考顶点序列中每个参考顶点序列，该参考顶点序列包括顶点集合中的所有顶点，并且该个参考序列中的各顶点互不相同；并且若干参考顶点序列中各参考顶点序列中的各顶点的排列顺序可以不同。例如，数据样本如图2所示，顶点集合包括A、B、C、D、E以及F，参考顶点序列包括参考顶点序列A和参考顶点序列B，参考顶点序列A可以为A、B、C、D、E以及F，参考顶点训练B可以为A、C、D、B、E以及F。在本实施例的一个具体实现方式中，所述参考顶点序列为对顶点集合中的所有顶点进行随机排序得到，并且若干参考顶点序列中的每个参考顶点序列均为通过对所述对顶点集合中的所有顶点进行随机排序得到。例如，将顶点集合中的所有顶点进行T次随机排序，以得到T个参考顶点序列。

进一步，在所述步骤C20中，所述随机游走为抽象概念模型，通过随机游走可以确认大量的随机性事件的分布。可以理解的是，虽然随机游走在单个随机事件面前，可能会存在差异性，但是在大量随机事件面前，通过随机游走可以预测大量随机事件整体的特征相似性。基于此，随机游走可以用于捕捉有向加权项目图的拓扑结构，其中，随机游走可以选择静态图数据中的某个顶点作为第一步，然后在边上随机迁移。此外，为了截断随机游走，随机游走对应有游走序列的最大长度，其中，游走序列的最大长度用于通过随机游走方式得到的游走序列的序列长度。

进一步，在本实施例的一个具体实现方式中，对参考顶点序列进行随机游走以得到若干随机顶点序列的具体过程可以为：对于参考序列中的每个顶点，首先将该顶点作为随机游走的起点，按照预设转移概率移动至邻居顶点，其次，以随机游走一次后的顶点作为起点，按照预设转移概率移动至邻居顶点步骤，依次类推，直至随机游走满足预设条件，以得到该顶点对应的随机游走序列，例如，如图5所示。由此可知，对于每个参考顶点序列，通过随机游走的方式可以获取预设数量的随机顶点序列，其中，所述预设数量与参考顶点序列包括的顶点数量相同。

所述随机游走对应的预设条件包括随机游走最大长度，以及随机游走后的顶点按照静态图数据不存在相邻顶点。所述随机游走满足预设条件指的是所述随机游走满足所述随机游走长度达到随机游走最大长度，或者随机游走后的顶点按照静态图数据不存在相邻顶点。由此，随机顶点序列的序列长度小于或者等于随机游走最大长度。

所述预设概率可以根据顶点与相邻顶点之间的边的权重确定，顶点与相邻顶点之间的边的权重大时，预设概率大，反之，当顶点与相邻顶点之间的边的权重小时，预设概率小。在本实施例的一个具体实现方式中，所述预设概率与权重的对应关系可以为：

其中，out(v_i)表示从顶点v_i出去的所有的有向边的另一个顶点的集合，a表示是否停留在现顶点的超参数，w_ij表示为顶点v_i到顶点v_j的边e_ij对应的权重。

举例说明：随机游走的长度为12，每个顶点的随机游走数量为20，通过对静态图数据中的每个顶点的20次随机游走序列采样，得到长度最多为12的随机顶点序列，随机顶点序列中隐含项目间的高阶邻近关系。

进一步，在所述步骤C30中，在获取到随机顶点序列后，可以通过词向量训练程序Word2Vec对顶点(即项目)进行图嵌入，以得到各顶点对应的图嵌入向量。在本实施例中，可以采用Skip-Gram模型学习顶点的图嵌入向量，Skip-Gram模型的目标是最大化随机点序列中两个顶点的同时出现概率。由此，优化目标的数学表达为：

minimize_φlogPr({v_i-w,...,v_i+w)\v_i|φ(v_i))

其中，w为随机顶点序列的上下文节点的窗口大小，例如，20等；

为映射函数，用于将动态时间图数据中的顶点映射到d维的适合于机器学习任务的嵌入向量，其中，d＜＜|V|。此外，当各顶点之间为相互独立时，

进一步，在本实施例的一个实现方式中，为了提高Skip-Gram模型迭代速度太慢，可以采用引入负采样方法来加速顶点的词向量训练。在引入负采样方法后，优化目标的数学表达可以为：

其中，N(v_i')是v_i的负样本，σ(·)是sigmoid函数，其表达式可以为：

进一步，所述动态时间图嵌入向量表包括若干嵌入向量，若干嵌入向量中每个嵌入向量对于一个项目，即基于所述动态时间可以确定项目对应的嵌入向量。所述动态时间图嵌入向量表中的各嵌入向量可以通过词向量训练程序Word2Vec，基于动态时间图数据进行词向量训练，生成各项目的所对应的嵌入向量，并将所述项目对应的嵌入向量，保存到动态时间图嵌入向量表中。此外，关于词向量训练算法，除了上述的Word2Vec算法之外，也可以使用如Glove或者FastText等其他的词向量算法和工具。总之，本说明书不限定词向量训练的方法和种类，本领域技术人员可根据实际需要，采用能够适用于申请场景的词向量算法和工具。此外，值得说明的，所述动态时间图嵌入向量对应的词向量训练程序和所述静态图嵌入向量对应的词向量训练程序可以相同，也可以不同，在本实施例的一个实现方式中，所述动态时间图嵌入向量对应的词向量训练程序和所述静态图嵌入向量对应的词向量训练程序相同，这样不需要建立两个词向量训练程序，提高了图嵌入向量的获取速度。

在本实施例的一个具体实现方式中，所述动态时间图数据的构建过程具体包括：

D10、获取所述动态时间图数据对应的顶点集合，根据所述顶点集合形成若干参考顶点序列；

D20、对于每个参考顶点序列，对该参考点序列进行时态游走以得到若干随机顶点序列，其中，所述时态游走为以时序顺序为约束条件的随机游走；

D30、基于获取到的所有随机顶点序列进行词向量训练，生成每个顶点对应的动态图嵌入向量，以得到所述数据样本对应的动态图嵌入向量表。

在所述步骤D10中，所述顶点集合为动态时间图数据中所有顶点行程的集合，即对于动态时间图数据中的每个顶点，该顶点均包含与所述顶点集合中，并且对于顶点集合中的每个顶点，该顶点为所述动态时间图数据的一个顶点。对于若干参考顶点序列中每个参考顶点序列，该参考顶点序列包括顶点集合中的所有顶点，并且该个参考序列中的各顶点互不相同；并且若干参考顶点序列中各参考顶点序列中的各顶点的排列顺序可以不同。例如，数据样本如图2所示，顶点集合包括A、B、C、D、E以及F，参考顶点序列包括参考顶点序列A和参考顶点序列B，参考顶点序列A可以为A、B、C、D、E以及F，参考顶点训练B可以为A、C、D、B、E以及F。在本实施例的一个具体实现方式中，所述参考顶点序列为对顶点集合中的所有顶点进行随机排序得到，并且若干参考顶点序列中的每个参考顶点序列均为通过对所述对顶点集合中的所有顶点进行随机排序得到。例如，将顶点集合中的所有顶点进行T次随机排序，以得到T个参考顶点序列。

进一步，在所述步骤D20中，所述时态游走为以时序顺序为约束条件的随机游走。可以理解的是，在随机游走时需要遵循时序关系的约束条件，并且经过的边的时间戳为递增关系，并且对于顶点集合V中的两个任意的顶点v_i和v_j，如果存在一个从顶点v_i到顶点v_j的时态游走，那么顶点v_i和顶点v_j时态相连。

此外，由于时态游走过程中经过的边的时间戳为递增关系，从而通过时态游走得到的随机顶点序列中各顶点按照时间戳递增的顺序排列。可以理解的是，对于动态时间图数据G_T(V,E_T,τ)，从顶点v₁时态游走到v_k的随机顶点序列记为<v₁,...,v_m,...,v_k>，其中，

且τ(v_i-1,v_i)≤τ(v_i,v_i+1)。例如，随机游走中第一步对应的顶点的时间戳为t2，那么第二步对应的顶点的时间戳需要大于或者等于t2，例如，t4等。此外，由于时态游走过程中经过的边的时间戳为递增关系，从而通过时态游走得到的随机顶点序列中各顶点按照时间戳递增的顺序排列。

进一步，在动态时间图中，每条边e_ij(v_i,v_j)∈E_T与时间t＝τ(e_ij)＝τ(v_j)有关。开始顶点的选取为开始边的选取，在开始边选取时可以采用均匀分布或者加权分布的方式确定时间戳，然后将距离时间戳最近的边作为开始边。在边组中选取开始边时可以采用均匀分布、指数分布以及线性分布，相应的，所述开始边的转移概率写成数学形式为：

其中，e_start为开始边。

进一步，在进行时态游走时，边的选取可以采用均匀分布、指数分布以及线性分布中的一种。相应的，边的转移概率可以为：

其中，NE_T表示为边e_cur＝(v_i,v_j)中一个顶点v_j出去的所有的有向边的集合。均匀分别是一种无偏的邻近边选择，其本质就是从相邻边集合中等概率选择一条边。指数分布和线性分布均是有偏的邻近边选择。指数分布中的函数τ(·)如果是一个单调递增函数，那么指数分布是一种偏向于选择时间较晚出现的邻近边选择策略；如果函数τ(·)是一个单调递减函数，那么指数分布是一种偏向于选择接连发生边的邻近边选择策略。线性分布中的τ(·)是一个函数，其本身是一种偏向于时间较晚出现的邻近边选择策略。

举例说明：随机游走的长度为12，开始边和开始时间的选择无偏的方式，通过引入的时间态，根据时间戳的增加来追踪项目图中边的增加，从而捕获项目图的动态变化。动态环境下采样的随机游走序列不仅隐含项目间的高阶邻近关系，还因其依照严格的时序关系使得时序关系能够完美保留，并能够根据动态变化进行更多的时态游走从而满足系统的扩展性要求。

进一步，在所述步骤D30中，在获取到随机顶点序列后，可以通过词向量训练程序Word2Vec对顶点(即项目)进行图嵌入，以得到各顶点对应的图嵌入向量。在本实施例中，可以采用Skip-Gram模型学习顶点的图嵌入向量，Skip-Gram模型的目标是最大化随机点序列中两个顶点的同时出现概率。由此，优化目标的数学表达为：

minimize_flogPr(W_T＝{v_i-w,...,v_i+w)\v_i|f(v_i))

其中，w为随机顶点序列的上下文节点的窗口大小，

为映射函数，用于将动态时间图数据中的顶点映射到d维的适合于机器学习任务的表上向量，其中，d＜＜|V|。此外，当各顶点之间为相互独立时存在：

进一步，在本实施例的一个实现方式中，冷启动项目即没有用户交互的项目在有向加权图中的体现是呈现出了一个孤点。要为冷启动项目学习准确的嵌入仍然是一项挑战。为了解决冷启动问题，我们使用附加到冷启动项的辅助信息(例如，类别、子类别和品牌信息等)来增强项目的图嵌入。一般情况下，具有相似辅助信息的项目在嵌入空间中应该更靠近。基于此，对于孤点可以采用辅助信息嵌方式。具体而言，H表示嵌入矩阵，H⁰表示item_i的嵌入向量，

表示嵌入附在item_i上的第c类辅助信息。那么，对于具有种辅助信息的项目item_i，我们会有n+1个向量

其中，d是嵌入维数，其中，项目和嵌入信息的嵌入尺寸相同。此外，为了合并辅助信息，将item_i的n+1个嵌入向量连接起来，并添加一个具有平均池操作的层以汇总与item_i有关的所有嵌入:

其中，S_i是item_i的聚合嵌入。这样合并边信息，以使具有相似辅助信息的项目在嵌入空间中更接近。这样可以更准确地嵌入冷启动项，并提高离线和在线性能。

S40、基于所述静态图嵌入向量表以及所述动态图嵌入向量表，确定所述数据样本对应的图嵌入向量表。

具体地，将静态嵌入向量表与动态图嵌入向量表相关联存储，以得到所述数据样本对应的图嵌入向量表。对于每个项目，基于图嵌入向量表均可以得到该项目对应的静态嵌入向量以及动态图嵌入向量。

综上所述，本实施例提供了一种图嵌入向量的生成方法，所述图嵌入向量的生成方法包括获取待处理的数据样本；基于若干用户历史行为序列，确定所述数据样本对应的静态图数据以及动态时间图数据，基于所述静态图数据确定所述数据样本对应的静态图嵌入向量表，并基于所述动态时间图数据确定所述数据样本对应的动态图嵌入向量表；基于所述静态图嵌入向量表以及所述动态图嵌入向量表，确定所述数据样本对应的图嵌入向量表。本发明通过确定数据样本的静态图数据以及动态时间图数据，确定静态嵌入向量表和动态嵌入向量表，这样通过静态嵌入向量表和动态嵌入向量表可以扩大项目对应的嵌入向量的适用范围。

基于上述图嵌入向量的生成方法，本实施例提供了一种推荐网络模型的生成方法，如图6和7所示，所述方法包括：

N10、获取训练样本集；

N20、对于训练样本集中的每个训练样本，基于预设图嵌入向量表确定该训练样本对应的图嵌入向量，其中，所述图嵌入向量为基于如上述实施例所述的图嵌入向量的生成方法确定的；

N30、基于所述训练样本以及所述图嵌入向量，对预设网络模型进行训练，以得到推荐网络模型。

具体地，所述图嵌入向量的获取过程为推荐网络模型的预处理过程，这样将图嵌入过程与推荐网络模型的训练分离，可以提高推荐网络模型的训练过程。可以理解的是，所述图嵌入向量可以为预先获取的，并且确定图嵌入向量的过程与推荐网络模型的训练相互独立，将图嵌入过程是作为预处理，作用是预训练生成项目的嵌入向量，并且将项目对应的嵌入向量以及训练样本作为预设网络模型的输入向，之后的池化层会按照组的方式进行操作，并通过全连接层拼接在一起形成稠密的整体表示向量。在获得到稠密的整体表示向量后，使用全连接层来自动学习组合特征。

此外，预设网络模型中添加了注意力机制，如图8所示，注意力机制的过程可以为：首先是把u和v以及u-v的对应元素差值向量合并起来作为输入，然后输入全连接层以得到权重。在训练过程中，我们使用的目标函数是负对数似然函数，其定义为：

其中，Train是大小为N的训练集，x是预设网络模型的输入向，y∈{0,1}是属性标签，p(x)是softmax层之后的预设网络模型的输出项。

基于上述图嵌入向量的生成方法，本实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如上述实施例所述的图嵌入向量的生成方法中的步骤。

基于上述图嵌入向量的生成方法，本申请还提供了一种终端设备，如图9所示，其包括至少一个处理器(processor)20；显示屏21；以及存储器(memory)22，还可以包括通信接口(Communications Interface)23和总线24。其中，处理器20、显示屏21、存储器22和通信接口23可以通过总线24完成相互间的通信。显示屏21设置为显示初始设置模式中预设的用户引导界面。通信接口23可以传输信息。处理器20可以调用存储器22中的逻辑指令，以执行上述实施例中的方法。

此外，上述的存储器22中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。

存储器22作为一种计算机可读存储介质，可设置为存储软件程序、计算机可执行程序，如本公开实施例中的方法对应的程序指令或模块。处理器20通过运行存储在存储器22中的软件程序、指令或模块，从而执行功能应用以及数据处理，即实现上述实施例中的方法。

存储器22可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端设备的使用所创建的数据等。此外，存储器22可以包括高速随机存取存储器，还可以包括非易失性存储器。例如，U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等多种可以存储程序代码的介质，也可以是暂态存储介质。

此外，上述存储介质以及终端设备中的多条指令处理器加载并执行的具体过程在上述方法中已经详细说明，在这里就不再一一陈述。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种图嵌入向量的生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述图嵌入向量的生成方法，其特征在于，所述静态图数据中的权重用于反映若干用户历史行为中相关项目对的频率。

3.根据权利要求2所述图嵌入向量的生成方法，其特征在于，所述静态图数据的构建过程具体包括：

4.根据权利要求1所述图嵌入向量的生成方法，其特征在于，所述基于所述静态图数据确定所述数据样本对应的静态图嵌入向量表具体包括：

5.根据权利要求1所述图嵌入向量的生成方法，其特征在于，所述动态时间图数据中的权重用于反映若干用户历史行为中相关项目对的频率以及项目对中两个项目转换的行为时间。

6.根据权利要求5所述图嵌入向量的生成方法，其特征在于，所述动态时间图数据的构建过程具体包括：

7.根据权利要求1所述图嵌入向量的生成方法，其特征在于，所述基于所述动态时间图数据确定所述数据样本对应的动态图嵌入向量表具体包括：

8.一种推荐网络模型的生成方法，其特征在于，所述方法包括：

获取训练样本集；

对于训练样本集中的每个训练样本，基于预设图嵌入向量表确定该训练样本对应的图嵌入向量，其中，所述图嵌入向量为基于如权利要求1-7任一所述的图嵌入向量的生成方法确定的；

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如权利要求1～7任意一项所述的图嵌入向量的生成方法中的步骤，和/或以实现如权利要求8所述的推荐网络模型的生成方法中的步骤。

10.一种终端设备，其特征在于，包括：处理器、存储器及通信总线；所述存储器上存储有可被所述处理器执行的计算机可读程序；

所述通信总线实现处理器和存储器之间的连接通信；

所述处理器执行所述计算机可读程序时实现如权利要求1～7任意一项所述的图嵌入向量的生成方法中的步骤，和/或实现如权利要求8所述的推荐网络模型的生成方法中的步骤。