CN110032682A

CN110032682A - 一种信息推荐列表生成方法、装置及设备

Info

Publication number: CN110032682A
Application number: CN201910309766.0A
Authority: CN
Inventors: 林文清; 何峰; 程序; 张发强
Original assignee: Tencent Technology Shanghai Co Ltd
Current assignee: Tencent Technology Shanghai Co Ltd
Priority date: 2019-04-17
Filing date: 2019-04-17
Publication date: 2019-07-19
Anticipated expiration: 2039-04-17
Also published as: CN110032682B

Abstract

本发明公开了一种信息推荐列表生成方法、装置及设备，所述方法包括获取原始社交网络，并将所述原始社交网络分割为抽象社交网络；获取所述抽象社交网络中抽象节点的节点向量；在所述原始社交网络上传播所述抽象节点的节点向量，得到所述原始社交网络中原始节点的初始向量；基于所述原始节点的初始向量得到所述原始节点的最终特征向量；根据所述原始节点的最终特征向量生成信息推荐列表；根据所述信息推荐列表对当前原始节点进行信息推荐。本发明得到的信息推荐列表具有较高的准确性；从而使得信息推荐的效果中具有较高的用户点击率。

Description

一种信息推荐列表生成方法、装置及设备

技术领域

本发明涉及网络技术领域，尤其涉及一种信息推荐列表生成方法、装置及设备。

背景技术

近年来，随着网络技术的发展，在线社交网络已经深入到用户生活的方方面面；其中，在线社交网络中的游戏社交网络种类繁多，所述游戏社交网络属于一种允许用户与好友建立关系、并与好友竞争产生游戏数据统计量的社交网络。

为了便于游戏网络关系的建立，游戏网络服务可基于多种因素进行好友推荐。例如，游戏网络服务可以识别两个玩家的好友重叠度，并基于一个玩家的好友向另一个玩家进行好友推荐；另外，游戏网络服务可以从一个玩家的电子邮箱账号中获得联系人作为所述玩家的潜在推荐好友；游戏网络服务也可以允许玩家通过电子邮箱、用户身份等手动搜索其他好友玩家等等。虽然这些推荐方法中生成的好友推荐列表具有一定量的用户点击率；但是被点击确认成为游戏好友的概率并不高。

因此，需要提供一种能够具有较高的用户点击率、并提升建立关联关系的概率的信息推荐列表生成方案。

发明内容

为了解决现有技术中的问题，本发明提供了一种信息推荐列表生成方法、装置及设备，具体地：

一方面提供了一种信息推荐列表生成方法，所述方法包括：

获取原始社交网络，并将所述原始社交网络分割为抽象社交网络；所述原始社交网络包括原始节点，所述抽象社交网络包括与所述原始社交网络的分割结果相对应的抽象节点；

获取所述抽象社交网络中抽象节点的节点向量；

在所述原始社交网络上传播所述抽象节点的节点向量，得到所述原始社交网络中原始节点的初始向量；

基于所述原始节点的初始向量得到所述原始节点的最终特征向量；

根据所述原始节点的最终特征向量生成信息推荐列表；

根据所述信息推荐列表对当前原始节点进行信息推荐。

另一方面提供了一种信息推荐列表生成装置，所述装置包括：

抽象社交网络获取模块，用于获取原始社交网络，并将所述原始社交网络分割为抽象社交网络；所述原始社交网络包括原始节点，所述抽象社交网络包括与所述原始社交网络的分割结果相对应的抽象节点；

抽象节点向量获取模块，用于获取所述抽象社交网络中抽象节点的节点向量；

初始向量获取模块，用于在所述原始社交网络上传播所述抽象节点的节点向量，得到所述原始社交网络中原始节点的初始向量；

最终向量获取模块，用于基于所述原始节点的初始向量得到所述原始节点的最终特征向量；

信息推荐列表得到模块，用于根据所述原始节点的最终特征向量生成信息推荐列表。

进一步地，所述初始向量获取模块，包括：

第一预先特征向量确定单元，用于在所述原始社交网络上传播所述抽象节点的节点向量，以确定出所述抽象节点对应的分割结果中的原始节点的预先特征向量；

第二预先特征向量确定单元，用于获取所述原始节点的邻居节点集合，以及所述邻居节点集合中的其他原始节点的预先特征向量；

综合向量得到单元，用于根据所述原始节点的预先特征向量以及所述邻居节点集合中其他原始节点的预先特征向量，得到所述原始节点的综合向量；

初始向量得到单元，用于根据所述原始节点的综合向量以及所述原始节点的预先特征向量，确定出所述原始节点的初始向量。

进一步地，所述综合向量得到单元，包括：

邻居平均向量得到子单元，用于根据所述邻居节点集合中的其他原始节点的预先特征向量，得到所述原始节点的邻居平均向量；

综合向量得到子单元，用于由所述原始节点的邻居平均向量以及所述原始节点的预先特征向量，得到所述原始节点的综合向量。

一种具体地实施方式中，所述初始向量得到单元，可以包括：

欧氏距离获取子单元，用于获取所述原始节点的综合向量与所述原始节点的预先特征向量之间的欧氏距离；

初始向量得到子单元，用于在所述欧氏距离小于预设距离数值时，由所述原始节点的综合向量得到所述原始节点的初始向量。

进一步地，所述信息推荐列表得到模块，包括：

欧式距离得到单元，用于计算当前原始节点的最终特征向量与所述原始社交网络中其他原始节点的最终特征向量之间的欧式距离；

信息推荐列表构建单元，用于根据计算得到的欧式距离的排序结果，构建出所述当前原始节点的信息推荐列表。

进一步地，所述装置还包括权重值得到模块，所述权重值得到模块包括：

抽象连接边获取单元，用于获取所述抽象社交网络中的抽象连接边；其中，每个抽象连接边均具有对应的抽象节点组合；

原始连接边数量获取单元，用于获取所述抽象节点组合之间的原始连接边数量；

权重值得到单元，用于根据所述抽象节点组合之间的原始连接边数量，计算得到所述抽象连接边的权重值。

进一步地，所述抽象节点向量获取模块，包括：

随机游走序列集合获取单元，用于获取所述抽象节点的随机游走序列集合；

抽象节点向量得到模块，用于将所述抽象节点的随机游走序列集合输入网络表征学习算法中，得到所述抽象节点的节点向量；

其中，随机游走序列集合获取单元，包括：

步长获取子单元，用于获取预设游走步长；

游走序列得到子单元，用于根据所述预设游走步长对所述抽象节点进行随机游走，得到所述抽象节点的随机游走序列；

游走次数获取子单元，用于获取预设游走次数；

游走序列获取子单元，用于按照得到所述随机游走序列的方式，获取预设游走次数个随机游走序列；

游走序列集合得到子单元，用于由所述预设游走次数个随机游走序列，得到所述抽象节点的随机游走序列集合。

进一步地，所述游走序列得到子单元，包括：

权重值得到子单元，用于获取所述抽象节点关联的所有抽象连接边，并得到每个抽象连接边的权重值；

权重和得到子单元，用于根据各个抽象连接边的权重值得到所述抽象节点的权重和；

选取概率值得到子单元，用于根据所述抽象连接边的权重值以及所述抽象节点的权重和，计算得到所述抽象节点的下一抽象节点的选取概率值；

第一抽象节点确定子单元，用于根据随机参数以及所述下一抽象节点的选取概率值，确定出所述抽象节点的下一目标抽象节点；

第二抽象节点确定子单元，用于将所述下一目标抽象节点更新为新的抽象节点，并根据获取所述下一目标抽象节点的方式得到所述新的抽象节点的下一目标抽象节点；

序列得到子单元，用于依此获取预设数目个下一目标抽象节点，以得到满足所述随机游走序列长度的随机游走序列。

另一方面提供了一种设备，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方面所述的信息推荐列表生成方法。

本发明提供的一种信息推荐列表生成方法、装置及设备，具有的有益效果为：

本发明通过在原始社交网络上传播抽象社交网络中抽象节点的节点向量，得到所述原始社交网络中原始节点的初始向量；其中得到的初始向量的质量较好，进而使得基于所述原始节点的初始向量得到的最终特征向量具有较高的准确性；进一步使得由最终特征向量得到的信息推荐列表具有较高的准确性；从而使得根据所述信息推荐列表对当前原始节点进行信息推荐的效果中，具有较高的用户点击率。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本说明书实施例提供的信息推荐列表生成方法流程图；

图2(a)是本说明书实施例提供的一种原始社交网络结构示意图；

图2(b)是本说明书实施例提供的一种原始社交网络结构的分割结果示意图；

图3是本说明书实施例提供的由图2的原始社交网络结构得到的抽象社交网络的结构示意图；

图4是本说明书实施例提供的得到所述原始社交网络中原始节点的初始向量的步骤流程图；

图5是本说明书实施例提供的一种得到所述原始节点的初始向量的流程示意图；

图6是本说明书实施例提供的与图5中的流程步骤相对应的图形展示图；

图7是本说明书实施例提供的信息推荐列表生成方法为当前活跃玩家进行好友推荐列表的示意图；

图8是本说明书实施例提供的GPA和HARP的运行时间对比示意图；

图9是本说明书实施例提供的将本技术方案以及其他技术方案应用在穿越火线手游的好友召回点击率的数据柱状图；

图10是本说明书实施例提供的一种信息推荐列表生成装置的结构组成图；

图11是本说明书实施例提供的一种服务器设备的结构示意图。

具体实施方式

下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、 “第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明提出了一种用于信息推荐的技术方案；其中，本技术方案包括一种基于图分割的网络表征学习算法的初始化技术，以及，进一步根据初始化技术的计算结果获取信息推荐列表，由所述信息推荐列表实现信息推荐的技术内容。

其中，网络表征学习(network embedding或者network representationlearning)算法，是通过网络表征学习将网络中每个节点映射为一个长度固定的向量，称为节点向量。其中，节点向量的长度通常远远小于网络中节点的数量，并且一般由人为指定而作为输入参数。常见的网络表征学习算法，包括 DeepWalk、node2vec和LINE等等。

本说明书中的信息推荐技术能够应用到游戏社交网络的各种业务中。比如，王者荣耀的好友推荐、师徒推荐，以及穿越火线手游和QQ飞车端游的好友召回等等。其中，在游戏社交网络下的节点可以看做是游戏场景下的游戏玩家。

具体地，本说明书实施例提供了一种信息推荐列表生成方法，如图1所示，所述方法包括：

S202.获取原始社交网络，并将所述原始社交网络分割为抽象社交网络；所述原始社交网络包括原始节点，所述抽象社交网络包括与所述原始社交网络的分割结果相对应的抽象节点；

具体地，本实施例是将原始社交网络进行图分割得到网络区块，进一步将所述网络区块当作抽象节点，从而构建得到抽象社交网络。

本实施例中，基于图分割的算法对原始社交网络进行分割，能够使得到的抽象节点之间的边具有最小分割边数(minimal edge cut)的特点；因此可以更好地刻画出原始社交网络的整体结构。并且，本实施例基于图分割的技术能够减少计算量，避免多层次计算的繁琐。

详细地，若给定一个原始社交网络结构G＝(V,E)和一个整数k；其中，V是原始节点集合，E是原始连接边集合，k是将所述原始社交网络分割得到的子集数；如果原始节点u到原始节点v有原始连接边，则有(u,v)在E中。进一步地，利用图分割算法将原始节点集合V分割成k个子集V₁,V₂,…,V_k；其中，这些子集满足两个条件：任何两个子集没有交集；并且所有子集的并集等于所有原始节点集合V。对应地，也就是：

(1)对于任意的1≤i≤j≤k，则有

(2)∪_1≤i≤kV_i＝V。

其中，对于任意的1≤i≤k和1≤j≤k，子集V_i和子集V_j的分割边(edge cut) 集合为C_i,j＝{(u,v)|u∈V_i,v∈V_j}。因此，一个分割算法的分割边的总集合可以表示为C＝∪_1≤i,j≤kC_i,j。

进一步地，本实施例中可以采用原始节点数平衡的图分割算法，使得各个子集的大小都比较接近；则对应的的限制条件为其中 0＜ε＜1。并且，若采用原始节点数平衡的图分割算法，还能够最小化分割边总集合C的大小，即减少跨子集的原始边的数量，以减少后期的计算量。

其中，本实施例中可以采用METIS算法进行图分割，快速地计算出满足上述要求的子集V₁,V₂,…,V_k。也可以采用社区发现算法(community detection)、标签传播算法(labelpropagation)等其他图分割算法。

例如，图2(a)给出了一个原始社交网络结构图G＝(V,E)，所述原始社交网络结构图中包含12个原始节点和16条原始连接边。将原始社交网络结构图G 输入到图分割算法里，假设k＝4；则如图2(b)所示可以得到4个原始节点子集V₁＝{v₁,v₂,v₃,v₄}，V₂＝{v₅,v₆,v₇}，V₃＝{v₈,v₉}和V₄＝{v₁₀,v₁₁,v₁₂}。进一步地，从图2 (b)中可以得到，在该情况下的分割边总集合为 C＝{(v₄,v₅),(v₅,v₈),(v₅,v₁₀),(v₇,v₁₁),(v₉,v₁₀)}。

需要说明的是，本实施例中的每个分割边连接的两个原始节点均是来自不同的网络区块(或子集)中；也可以说，每个分割边中的两个原始节点是对应着不同的抽象节点的。

S204.获取所述抽象社交网络中抽象节点的节点向量；

具体地，在所述抽象社交网络中运行网络表征学习算法，从而得到所述抽象节点的节点向量。

详细地，一种可行的实施方式中，步骤S204获取所述抽象社交网络中抽象节点的节点向量，之前可以包括：

S4a.获取所述抽象社交网络中的抽象连接边；其中，每个抽象连接边均具有对应的抽象节点组合；

S4b.获取所述抽象节点组合之间的原始连接边数量；

S4c.根据所述抽象节点组合之间的原始连接边数量，计算得到所述抽象连接边的权重值。

其中，基于图分割算法可以输出k个子集V₁,V₂,…,V_k，进一步地，将每个子集看做一个抽象节点可以构建出一个抽象节点数为k的抽象社交网络 G^a＝(V^a,E^a)。具体来说，有如下两个步骤：

对于每个1≤i≤k，把子集V_i表示成一个抽象节点u_i。于是，得到一个抽象节点集合V^a＝{u₁,u₂,……,u_k}。对于任意的1≤i≤k和1≤j≤k，如果子集V_i和子集 V_j的分割边集合C_i,j不为空，则每个抽象节点组合(抽象节点u_i和抽象节点u_j) 之间建立一条抽象连接边(u_i,u_j)；进一步地，若设置抽象连接边(u_i,u_j)的权重 w(u_i,u_j)的大小为|C_i,j|；则根据抽象节点u_i和抽象节点u_j之间的原始连接边的数量可以得到所述抽象连接边的权重值。也就是说，本实施例中的抽象连接边(u_i,u_j) 是一条带权重的边，并且权重w(u_i,u_j)大小|C_i,j|为分割边集合对应的抽象连接边的权重值。

需要说明的是，k的取值可根据用户需求进行指定，也可以根据服务器内存大小进行设置，或者是设置为一个远远小于|V|的经验值

例如，图3展示了根据图2(b)的分割结果构建得到的抽象社交网络结构 G^a＝(V^a,E^a)，其中V^a包含4个抽象节点u₁,u₂,u₃,u₄，分别对应图分割得到的子集 V₁,V₂,V₃,V₄；对应地，该抽象社交网络具有4条抽象连接边；其中抽象连接边u₂,u₄的权重w(u₂,u₄)的大小是2，因为V₂和V₄有两条相互连接的原始连接边，即 |C_2，4|＝|{(v₅,v₁₀),(v₇,v₁₁)}|＝2。

一种具体的实施方式中，步骤S204获取所述抽象社交网络中抽象节点的节点向量，可以包括：

S4A.获取所述抽象节点的随机游走序列集合；

S4B.将所述抽象节点的随机游走序列集合输入网络表征学习算法中，得到所述抽象节点的节点向量；

具体地，本实施例能够按抽象连接边的权重值进行随机抽样或者随机选择，根据抽象连接边的权重分布生成符合分布的随机游走序列集合，将其作为 word2vec的输入；从而得到抽象社交网络中的每个抽象节点u的节点向量，表示为f^a(u)。

其中，随机游走就是在网络结构中以某个节点做起点，然后以一定的概率随机移动到其邻居位置，再从邻居位置随机移动，直到走t步(t是预先设定好的参数)，于是得到一个由t个“词”(节点)组成的“句子”(序列)。网络中的每个节点都要作为起点做随机游走，设有N个节点；且每个节点都要做r次随机游走，那么最后就可以得到N*r个“句子”，每个“句子”都是由t个“词” 组成。对应地，本实施例中的每个抽象节点都要进行随机游走，进而获取到每个抽象节点对应的随机游走序列集合。

进一步地，将所述随机游走序列集合中的每个随机游走序列均输入到网络表征学习算法中，进而得到所述抽象节点的节点向量。

比如：随机游走序列的集合是{<a,b,c>,<a,d,c>,<b,d,c>}，在计算的时候，先给4个原始节点a,b,c,d相应的预先特征向量，根据4个原始节点a,b,c,d 确定出所述随机游走序列的集合；然后采用梯度下降算法来优化目标函数，以确定出所述抽象节点的节点向量；所述目标函数是网络表征学习的目标函数，优化目标函数也就是最大化每个抽象节点与其相邻的抽象节点的似然相似度的过程。

具体地，步骤S4A获取所述抽象节点的随机游走序列集合，可以包括：

S41A.获取预设游走步长；

S41B.根据所述预设游走步长对所述抽象节点进行随机游走，得到所述抽象节点的随机游走序列；

S41C.获取预设游走次数；

S41D.按照得到所述随机游走序列的方式，获取预设游走次数个随机游走序列；

S41E.由所述预设游走次数个随机游走序列，得到所述抽象节点的随机游走序列集合。

本实施例中，若所述预设游走步长为t，则一个随机游走序列的长度为t；若所述预设游走次数为r，则一个抽象节点会对应有r个随机游走序列；由这r 个随机游走序列得到所述抽象节点的随机游走序列集合。

一种详细地实施方式中，步骤S41B得到所述抽象节点的随机游走序列，可以包括：

S411.获取所述抽象节点关联的所有抽象连接边，并得到每个抽象连接边的权重值；

S412.根据各个抽象连接边的权重值得到所述抽象节点的权重和；

其中，每个抽象节点均具有关联的抽象连接边，根据上述获取抽象连接边权重值的方式得到当前抽象节点关联的所有抽象连接边的权重值。进一步，根据求和计算方式将这所有的权重值相加得到所述抽象节点的权重和。

S413.根据所述抽象连接边的权重值以及所述抽象节点的权重和，计算得到所述抽象节点的下一抽象节点的选取概率值；

具体地，通过得到所述抽象节点的下一抽象节点的选取概率值；其中分母是当前抽象节点u的所述抽象节点的权重和，分子是所述抽象连接边(u,ui)的权重值。

其中，每个抽象连接边的端部均具有两个抽象节点；在该实施例中，以当前抽象节点来看，每个抽象连接边的一端为所述当前抽象节点，另一边为所述当前抽象节点的下一抽象节点。进而，本实施例将每个抽象连接边的权重值除以得到的权重和，可以计算出所述抽象节点的下一抽象节点的选取概率值。

S414.根据随机参数以及所述下一抽象节点的选取概率值，确定出所述抽象节点的下一目标抽象节点；

具体地，是先根据下一抽象节点的选取概率值获取每个下一抽象节点的前缀和，进一步将所述随机参数与得到的各个前缀和进行比较，在所述随机参数大于第一前缀和，并小于第二前缀和，则将所述第一前缀和对应的下一抽象节点作为所述抽象节点的下一目标抽象节点。

其中，所述随机参数为随机生成的[0-1]之间的随机数，比如为0.75；若每个下一抽象节点的选取概率值均为0.2；则在具有4个下一抽象节点的情况下，利用相关的前缀和(PrefixSum)算法进行计算，比如可以得到前缀和组成的数组序列：0.2，0.4，0.6，0.8；则通过比较可得0.6＜0.75＜0.8，则下一目标抽象节点为选取概率值为0.6所对应的那个下一抽象节点。

给出另一个示例：如果当前抽象节点具有三个下一抽象节点，对应的选取概率值依次为a＝0.1，b＝0.2，c＝0.7，则通过相关的前缀和(PrefixSum)算法进行计算，比如可以得到a,b,c对应的前缀和序列：0，0.1，0.3；其中所述随机参数是0.2，则因为0.2介于0.1和0.3之间，则所述下一目标抽象节点属于第二位的下一抽象节点。

S415.将所述下一目标抽象节点更新为新的抽象节点，并根据获取所述下一目标抽象节点的方式得到所述新的抽象节点的下一目标抽象节点；

S416.依此获取预设数目个下一目标抽象节点，以得到满足所述随机游走序列长度的随机游走序列。

进一步地，本实施例将下一目标抽象节点更新为新的抽象节点，进而确定出所述新的抽象节点的下一目标抽象节点；依此进行游走，从而得到满足随机游走序列长度的随机游走序列。

本说明书的一种实施例中通过考虑抽象连接边之间的权重值，使得随机游走的过程能够准确地确定出所述抽象连接边的下一目标抽象节点，从而得到更加准确有效的随机游走序列，提升原始节点的初始向量的准确性。

S206.在所述原始社交网络上传播所述抽象节点的节点向量，得到所述原始社交网络中原始节点的初始向量；

其中，在得到所述抽象节点的节点向量之后，将这些节点向量传入原始社交网络结构中，基于传播算法，经过多轮迭代计算，从而得到原始社交网络中的每个原始节点的初始向量。

对应地，一种可行的实施方式中，步骤S206得到所述原始社交网络中原始节点的初始向量，如图4所示，可以包括：

S402.在所述原始社交网络上传播所述抽象节点的节点向量，以确定出所述抽象节点对应的分割结果中的原始节点的预先特征向量；

S404.获取所述原始节点的邻居节点集合，以及所述邻居节点集合中的其他原始节点的预先特征向量；

具体地，对于原始社交网络中G＝(V,E)里的每个原始节点v∈V，如果图分割算法将v划分到一个子集V_i中(其中1≤i≤k)，则将子集V_i对应的抽象节点u_i的节点向量f^a(u_i)赋予所述子集中的原始节点v，作为所述原始节点的预先特征向量，所述预先特征向量可以表示为f(v)。进一步地，在确定出当前原始节点的邻居节点集合后，可以得到所述当前原始节点的邻居节点集合中包含的其他原始节点的预先特征向量。

给与说明的是，按照得到一个抽象节点对应的原始节点的预先特征向量的方式，可以得到其他抽象节点对应的原始节点v预先特征向量f(v')；进而可以得到所述原始特征网络中所有原始节点的预先特征向量。

其中，本实施例的邻居节点集合为与当前原始节点具有连接边的所有其他原始节点组成的节点集合。

S406.根据所述原始节点的预先特征向量以及所述邻居节点集合中其他原始节点的预先特征向量，得到所述原始节点的综合向量；

详细地，步骤S406得到所述原始节点的综合向量，可以包括：

S6a.根据所述邻居节点集合中的其他原始节点的预先特征向量，得到所述原始节点的邻居平均向量；

具体地，对于当前原始节点v∈V，可以计算出所述当前原始节点的邻居平均向量为

其中，nbr(v)是所述当前原始节点v的邻居节点集合。

S6b.由所述原始节点的邻居平均向量以及所述原始节点的预先特征向量，得到所述原始节点的综合向量。

其中，对每个原始节点v∈V，通过综合所述原始节点v的预先特征向量和所述原始节点的邻居平均向量，能够计算得到所述原始节点的综合向量：

也就是说，每个原始节点接收来自邻居的向量的变化，并且根据自己的预先特征向量做出了一个更新。

S408.根据所述原始节点的综合向量以及所述原始节点的预先特征向量，确定出所述原始节点的初始向量。

详细地，步骤S408确定出所述原始节点的初始向量，可以包括：

S8a.获取所述原始节点的综合向量与所述原始节点的预先特征向量之间的欧氏距离；

S8b.在所述欧氏距离小于预设距离数值时，由所述原始节点的综合向量得到所述原始节点的初始向量。

其中，本实施例中先计算当前原始节点的综合向量和所述原始节点的预先特征向量的欧式距离：

进一步将计算得到的欧式距离与预设距离数值参数进行比较，若计算得到的欧式距离小于所述预设距离数值，则可以认为综合向量与之前的预先特征向量的差别足够小，向量的传播趋近稳定；可以将所述综合向量作为所述原始节点的初始向量，以用于获取所述原始节点的最终特征向量。

其中，若计算得到的欧式距离大于所述预设距离参数，则将计算得到的综合向量更新为所述原始节点的预先特征向量；再通过步骤S6b计算得到所述原始节点的综合向量，进一步通过步骤S8a计算所述原始节点的综合向量与更新得到的原始节点的预先特征向量之间的欧式距离，进一步将计算得到的欧式距离与所述预设距离数值进行比较；若此时的欧式距离小于所述预设距离数值，则将该过程中的综合向量作为所述原始节点的初始向量。若计算得到的欧式距离仍然大于所述预设距离数值，则重复到上述更新预先特征向量的步骤，并以重复后续的计算过程，直至计算得到的欧式距离小于所述预设距离数值才停止计算。

如图5所示，给出了一种得到所述原始节点的初始向量的流程步骤；对应地，如图6所示，提供了相应的节点展示图。具体地，包括：

1.在原始社交网络结构G＝(V,E)上运行图分割算法；

2.在图分割算法得到的区块(或子集)上，把每个区块作为一个抽象节点，区块之间的边形成抽象连接边，构建得到抽象社交网络；

3.在抽象社交网络上运行网络表征学习算法得到抽象节点的节点向量；

4.在原社交网络结构G上传播抽象节点的节点向量，得到原始节点集合V里每个原始节点的初始向量。

需要说明的是，本技术方案涉及到向量传播得到原始节点初始向量的过程，也可以采用更复杂的向量融合方案；比如通过神经网络模型的方式进行原始节点的预先特征向量的更新，以使得向量的传播趋近稳定。

S208.基于所述原始节点的初始向量得到所述原始节点的最终特征向量；

具体地，将所述原始节点的初始向量输入到网络表征学习算法中，以得到所述原始节点的最终特征向量。

举例给与说明：若目标向量的长度k是3，一个初始向量是<0.2,0.3,0.5>；那所述初始向量经过表征学习算法计算后可以得到向量<0.15,0.35,0.5>，则向量<0.15,0.35,0.5>为所述初始向量对应的最终特征向量；其中，具体的计算过程可以采用梯度下降算法进行计算。

S210.根据所述原始节点的最终特征向量生成信息推荐列表；

一种可行的实施方式中，步骤S210由所述原始节点的最终特征向量得到所述信息推荐列表，可以包括：

S21a.计算当前原始节点的最终特征向量与所述原始社交网络中其他原始节点的最终特征向量之间的欧式距离；

S21b.根据计算得到的欧式距离的排序结果，构建出所述当前原始节点的信息推荐列表。

本实施例中在获取当前原始节点的信息推荐列表的情况下，是将当前原始节点的最终特征向量与所述原始社交网络中其他原始节点的最终特征向量依次进行欧式距离的计算；进一步将计算得到的欧式距离进行排序，其中，欧式距离越小，则表征所述欧式距离对应的这两个原始节点的相似度越高。

S212.根据所述信息推荐列表对当前原始节点进行信息推荐。

具体地，所述信息推荐列表可以从小到大进行排序，将位于排序靠前的预设位作为推荐信息，由服务器推荐给所述原始社交网络对应的客户端，以实现对当前原始节点的信息推荐。

本实施例基于图分割初始化技术计算得到原始社交网络中原始节点的初始向量；然后把原始节点的初始向量输入到网络表征学习算法中，得到每个原始节点的最终特征向量。然后基于这些最终特征向量，计算当前原始节点与其他的原始节点之间的欧式距离。最后将得到的欧式距离进行从小到大排序，能够得到当前原始节点的信息推荐列表；比如当前活跃玩家的好友推荐列表，如图7 所示。其中，本实施例基于图分割算法进行网络分割，能够很好的反映出原始社交网络的整体特点，并减少计算量；本实施例在通过抽象节点的节点向量传播得到原始节点的节点向量的过程中，基于抽象连接边的权重考虑能够进一步提升原始节点初始向量的质量，进而提升原始节点的节点向量的准确性，从而生成更有效的信息推荐列表；增强对应客户端的业务能力。

其中，本说明书提供了一些数据集，以验证本方案带来的高性能效果：

Enron(http://www.cs.cmu.edu/～enron)：电子邮件交流网络，有36692个节点，183831条边；

GRQC(http://snap.stanford.edu/data/ca-GrQc.html)：量子理论学术论文合作网络，有5242个节点，14496条边；

CM(http://snap.stanford.edu/data/ca-CondMat.html)：材料物理学术论文合作网络，有23133个节点，93497条边；

BlogCatalog(http://socialcomputing.asu.edu/datasets/BlogCatalog)：博客网络，有10312个节点，333983条边；

Wikipedia(www.mattmahoney.net/dc/textdata)：维基百科词汇网络，有4777 个节点，184812条边。

将本方案涉及到基于图分割的网络表征学习算法的初始化技术命名为GPA(Graph Partition based Algorithm)，进一步将GPA与另外两个方案进行对比，通过三个实验参数来验证本方案的性能；其中，另外两个方案为随机初始化方案(Random)以及基于多层网络压缩的初始化技术(HARP)；其中涉及到的三个实验参数为链路预测(linkprediction)、节点分类(node classification)、运行时间。

在实验中将GPA、Random和HARP得到的初始值作为节点向量的初始向量，输入到现有的网络结构表征学习算法中，比如node2vec、DeepWalk和LINE。

其中，表1展示了在链路预测实验中的效果。在这个实验中，我们从原始社交网络G中随机抽取一定数量(10％)的原始连接边，然后将这些原始连接边从原始社交网络G中去除，得到剩下的网络结构G’。然后，在G’上学习每个原始节点的节点向量，之后预测删除的原始连接边。其中，两个节点向量f(v) 和f(v')的余弦相似度(Cosine Similarity)是欧式距离(Euclidean Similarity)是||f(v)-f(v')||。从表1中可以发现，本技术方案GPA在所有数据集和所有相似度上都优于其他对比方案。

表1：链路预测的效果

其中，表2展示了原始社交网络中原始节点分类的效果。在这个实验中，每个原始节点上有多个标签，在原始社交网络G上学习每个原始节点的节点向量，然后把一部分(70％)原始节点作为训练集，另一部分(30％)原始节点作为测试集。采用多类别逻辑回归分类器(multi-class logistic regression classifier) 基于节点向量和训练集进行模型训练，然后预测测试集里原始节点的标签。可以发现，本方案GPA的效果也都优于其他两个对比方案。

表2：节点分类的效果

最后，我们对比了本方案GPA和HARP的运行时间。由于HARP需要多层次的计算，需要更多的计算量；而GPA并不需要多层迭代，并且节点向量的传播收敛速度较快；所以如图8所示，在所有数据集上GPA都比HARP的运行时间较少。

需要说明的是，本技术方案在实际应用中能够提升游戏社交网络分析的业务能力。比如，可以使用本技术方案计算游戏社交网络里每个节点(玩家)的节点向量，并根据这个向量来计算玩家之间的相似度，从而可以为玩家做好友推荐、师徒推荐、战队推荐、好友召回等业务。

图9展示了将本技术方案应用在穿越火线手游(CFM)好友召回的点击率效果的数据情况。在好友召回业务中，实现为每个活跃玩家设置一个长度有限 (比如10个)的推荐列表；其中，推荐列表上的对象是流失玩家，也就是为当前活跃玩家召回流失玩家的推荐列表。

基于本技术方案，首先计算CFM社交网络上每个玩家的节点向量初始向量，然后把这个初始向量输入到node2vec算法中，得到玩家最终节点向量。基于最终节点向量，计算当前活跃玩家与流失玩家之间的欧式距离相似度。然后，按欧式距离从小到大依次排序，制作当前活跃玩家的推荐列表。在图9的效果数据中可以看出，相较于现有方案，比如随机排序、按亲密度排序、按Personalized PageRank(PPR)排序、按PageRank(PR)排序和游戏策划提供的规则排序，本技术方案GPA取得的点击率是最高的。

本说明书实施例提供了一种信息推荐列表生成装置，如图10所示，所述装置包括：

抽象社交网络获取模块202，用于获取原始社交网络，并将所述原始社交网络分割为抽象社交网络；所述原始社交网络包括原始节点，所述抽象社交网络包括与所述原始社交网络的分割结果相对应的抽象节点；

抽象节点向量获取模块204，用于获取所述抽象社交网络中抽象节点的节点向量；

初始向量获取模块206，用于在所述原始社交网络上传播所述抽象节点的节点向量，得到所述原始社交网络中原始节点的初始向量；

最终向量获取模块208，用于基于所述原始节点的初始向量得到所述原始节点的最终特征向量；

信息推荐列表得到模块210，用于根据所述原始节点的最终特征向量生成信息推荐列表。

一种具体的实施方式中，所述初始向量获取模块206，可以包括：

一种具体地实施方式中，所述综合向量得到单元，可以包括：

一种具体地实施方式中，所述信息推荐列表得到模块，可以包括：

一种具体地实施方式中，所述装置还包括权重值得到模块，所述权重值得到模块包括：

一种具体地实施方式中，所述抽象节点向量获取模块，可以包括：

其中，随机游走序列集合获取单元，包括：

步长获取子单元，用于获取预设游走步长；

游走次数获取子单元，用于获取预设游走次数；

一种具体地实施方式中，所述游走序列得到子单元，包括：

需要说明的是，本实施例提供的装置实施例与上述方法实施例具有相同的发明构思，具体细节内容可以参照上述方法实施例，在此不作赘述。

本说明书实施例提供了一种设备，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方法实施例所述的信息推荐列表生成方法。

其中，本说明书实施例提供的一种服务器设备的结构示意图，请参考图11。该服务器用于实施上述实施例中提供的信息推荐列表生成方法。具体来讲：

所述服务器2000包括中央处理单元(CPU)2001、包括随机存取存储器 (RAM)2002和只读存储器(ROM)2003的系统存储器2004，以及连接系统存储器2004和中央处理单元2001的系统总线2005。所述服务器2000还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)2006，和用于存储操作系统2013、应用程序2014和其他程序模块2015的大容量存储设备2007。

所述基本输入/输出系统2006包括有用于显示信息的显示器2008和用于用户输入信息的诸如鼠标、键盘之类的输入设备2009。其中所述显示器2008和输入设备2009都通过连接到系统总线2005的输入输出控制器2010连接到中央处理单元2001。所述基本输入/输出系统2006还可以包括输入输出控制器2010 以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器2010还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备2007通过连接到系统总线2005的大容量存储控制器(未示出)连接到中央处理单元2001。所述大容量存储设备2007及其相关联的计算机可读介质为服务器2000提供非易失性存储。也就是说，所述大容量存储设备2007可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质 (未示出)。

不失一般性，所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术，CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器2004和大容量存储设备2007可以统称为存储器。

根据本发明的各种实施例，所述服务器2000还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器2000可以通过连接在所述系统总线2005上的网络接口单元2011连接到网络2012，或者说，也可以使用网络接口单元2011来连接到其他类型的网络或远程计算机系统(未示出)。

所述存储器还包括一个或者一个以上的程序，所述一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行；上述一个或者一个以上程序包含用于执行上述后台服务器侧的方法的指令，。

本发明的实施例还提供了一种计算机存储介质，所述存储介质可设置于客户端之中以保存用于实现方法实施例中一种信息推荐列表生成方法相关的至少一条指令、至少一段程序、代码集或指令集，该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现上述方法实施例提供的信息推荐列表生成方法。

可选地，在本实施例中，上述存储介质可以位于计算机网络的多个网络设备中的至少一个网络设备。可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM， RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是：上述本说明书实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中加载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置和服务器实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种信息推荐列表生成方法，其特征在于，所述方法包括：

获取所述抽象社交网络中抽象节点的节点向量；

根据所述原始节点的最终特征向量生成信息推荐列表。

2.根据权利要求1所述的信息推荐列表生成方法，其特征在于，所述得到所述原始社交网络中原始节点的初始向量，包括：

在所述原始社交网络上传播所述抽象节点的节点向量，以确定出所述抽象节点对应的分割结果中的原始节点的预先特征向量；

获取所述原始节点的邻居节点集合，以及所述邻居节点集合中的其他原始节点的预先特征向量；

根据所述原始节点的预先特征向量以及所述邻居节点集合中其他原始节点的预先特征向量，得到所述原始节点的综合向量；

根据所述原始节点的综合向量以及所述原始节点的预先特征向量，确定出所述原始节点的初始向量。

3.根据权利要求2所述的信息推荐列表生成方法，其特征在于，所述得到所述原始节点的综合向量，包括：

根据所述邻居节点集合中的其他原始节点的预先特征向量，得到所述原始节点的邻居平均向量；

由所述原始节点的邻居平均向量以及所述原始节点的预先特征向量，得到所述原始节点的综合向量。

4.根据权利要求2所述的信息推荐列表生成方法，其特征在于，所述确定出所述原始节点的初始向量，包括：

获取所述原始节点的综合向量与所述原始节点的预先特征向量之间的欧氏距离；

在所述欧氏距离小于预设距离数值时，由所述原始节点的综合向量得到所述原始节点的初始向量。

5.根据权利要求1所述的信息推荐列表生成方法，其特征在于，所述由所述原始节点的最终特征向量得到所述信息推荐列表，包括：

计算当前原始节点的最终特征向量与所述原始社交网络中其他原始节点的最终特征向量之间的欧式距离；

根据计算得到的欧式距离的排序结果，构建出所述当前原始节点的信息推荐列表。

6.根据权利要求1所述的信息推荐列表生成方法，其特征在于，所述获取所述抽象社交网络中抽象节点的节点向量，之前包括：

获取所述抽象社交网络中的抽象连接边；其中，每个抽象连接边均具有对应的抽象节点组合；

获取所述抽象节点组合之间的原始连接边数量；

根据所述抽象节点组合之间的原始连接边数量，计算得到所述抽象连接边的权重值。

7.根据权利要求1所述的信息推荐列表生成方法，其特征在于，所述获取所述抽象社交网络中抽象节点的节点向量，包括：

获取所述抽象节点的随机游走序列集合；

将所述抽象节点的随机游走序列集合输入网络表征学习算法中，得到所述抽象节点的节点向量；

其中，获取所述抽象节点的随机游走序列集合，包括：

获取预设游走步长；

根据所述预设游走步长对所述抽象节点进行随机游走，得到所述抽象节点的随机游走序列；

获取预设游走次数；

按照得到所述随机游走序列的方式，获取预设游走次数个随机游走序列；

由所述预设游走次数个随机游走序列，得到所述抽象节点的随机游走序列集合。

8.根据权利要求7所述的信息推荐列表生成方法，其特征在于，所述得到所述抽象节点的随机游走序列，包括：

获取所述抽象节点关联的所有抽象连接边，并得到每个抽象连接边的权重值；

根据各个抽象连接边的权重值得到所述抽象节点的权重和；

根据所述抽象连接边的权重值以及所述抽象节点的权重和，计算得到所述抽象节点的下一抽象节点的选取概率值；

根据随机参数以及所述下一抽象节点的选取概率值，确定出所述抽象节点的下一目标抽象节点；

将所述下一目标抽象节点更新为新的抽象节点，并根据获取所述下一目标抽象节点的方式得到所述新的抽象节点的下一目标抽象节点；

依此获取预设数目个下一目标抽象节点，以得到满足所述随机游走序列长度的随机游走序列。

9.一种信息推荐列表生成装置，其特征在于，所述装置包括：

10.一种设备，其特征在于，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至8任一所述的信息推荐列表生成方法。