CN112132326A

CN112132326A - 一种基于随机游走度惩罚机制的社交网络好友预测方法

Info

Publication number: CN112132326A
Application number: CN202010893847.2A
Authority: CN
Inventors: 杨旭华; 马钢峰; 许营坤; 叶蕾
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2020-08-31
Filing date: 2020-08-31
Publication date: 2020-12-25
Anticipated expiration: 2040-08-31
Also published as: CN112132326B

Abstract

一种基于随机游走度惩罚机制的社交网络好友预测方法，基于社交网络用户数据构建社交网络模型，通过改变随机游走采样概率来获得游走序列，在随机游走序列中依次选取用户，作为当前用户，设定滑动窗口，从中依次选取用户，作为训练的正样本，通过函数获得负采样集合，在利用节点与负样本嵌入的当前相似度作为负采样概率指标，得到训练的负样本，使用损失函数做损失。所得到的嵌入向量做内积，即为用户之间的相似度，相似度较高的即为预测的好友。本发明考虑了用户度大小以及当前的嵌入向量表示，提高了好友预测的准确性。

Description

一种基于随机游走度惩罚机制的社交网络好友预测方法

技术领域

本发明涉及社交网络预测领域，特别是指一种基于随机游走度惩罚机制的社交网络好友预测方法。

背景技术

由于网络技术的飞速发展，如今，互联网早已惠及人们生活、工作、学习等各个方面。线上社交逐渐变得不可忽视，在社会交流中占据了较大的比重。网络中的用户以及用户之间的联系形成了庞大的社交网络。为用户推荐可能认识的好友或潜在的相似好友，对于补全社交网络以及促进用户交流，具有非常大的实际价值和研究价值。

网络表征学习旨在将离散数据映射为连续低维向量表征。作为一种无监督的网络学习算法，十分适合社交网络数据。表征学习所得到的用户低维向量具有一定的意义：向量的每一维数字表示都隐藏着该用户的一些特征信息，向量之间的相似性比较也可以很好地反映用户之间的相似度，为用户推荐提供了依据。因此，将社交网络的结构信息，嵌入到低维空间向量能很好地对用户关系进行存储和分析。

然而，如何学习得到可信赖的，表达能力强的用户向量表征仍是一个难点问题。主流的网络表征方法存在内存占用较大或时间复杂度较高的问题。

发明内容

为了克服传统的社交网络方法预测好友精确度不高的问题，本发明提出一种通过提升用户向量表征来提高好友预测性能的基于随机游走度惩罚机制的社交网络好友预测方法，考虑了用户度大小对随机游走的影响，实现自适应的负采样，使用浅层网络，提出了一种基于度惩罚随机游走的社交网络好友预测方法，有效的提升了用户向量的表示性能，提升了社交网络好友预测的准确度。

本发明解决其技术问题所采用的技术方案是：

一种基于随机游走度惩罚机制的社交网络好友预测方法，包括如下步骤：

步骤一：根据社交网络用户数据建立社交网络G＝(V,E)，其中，V＝{v₁,v₂,...v_N}表示节点集合，每个节点表示一个用户，E为连边集合，N表示用户数，d_i表示节点i的度，即用户i直接相连的好友数；

步骤二：任选一个节点v_i,计算v_i随机游走到任意邻居节点v_j的概率

其中，λ是一个可调参数，Γ_i表示节点i的邻居节点集合。从节点v_i出发，按概率P_walk随机游走R步，得到随机游走节点序列

步骤三：在随机游走节点序列L中每次选取1个节点，作为训练节点k，取节点k在随机游走序列L中至多前s个与后s个节点，作为训练节点k的正样本，其中s为可调参数，按照此方法得到L中每个节点的正样本；

步骤四：计算负样本的采样概率

其中负采样集合N_neg为不在随机游走序列L下的节点集合，u为节点的嵌入向量表示，通过p_ij从N_neg中采集节点，作为训练节点k的负样本；

步骤五：计算损失函数

其中u_k表示训练节点k的嵌入向量表示，u_p表示k的正样本，u_w表示k的负样本，σ表示sigmoid函数；

步骤六：重复步骤二到步骤五，直到损失函数收敛则算法中止，得到所有节点的嵌入向量u，针对任意无连边节点对，计算相应的嵌入向量内积，按照降序排列，取前B个内积最大节点对，所对应用户对即为预测的好友，B≤Y，其中Y表示网络中无连边节点对的数量。

本发明的技术构思为：利用大度惩罚，能够提高低度节点被游走到的概率，同时通过节点相似性自适应选取负样本，提高了社交网络好友预测的准确性。

本发明的有益效果为：考虑了用户度大小以及当前的嵌入向量表示，使得最终好友预测结果准确率较高，拥有较强的性能。

附图说明

图1为模型训练示意图，L为某次考虑度惩罚下的随机游走序列，设定滑动窗口大小为2，节点4为当前用户，则节点2、3、5、6为滑动窗口内的其余用户，即正样本集，N_neg中的用户为处理过的可选取的负样本集。

具体实施方式

下面结合附图对本发明做进一步说明。

参照图1，一种基于随机游走度惩罚机制的社交网络好友预测方法，包括如下步骤：

步骤一：根据社交网络用户数据建立社交网络G＝(V,E)，如图1中的网络所示，其中，V＝{v₁,v₂,...v_N}表示节点集合，每个节点表示一个用户，E为连边集合，N表示用户数，d_i表示节点i的度，即用户i直接相连的好友数；

其中，λ是一个可调参数，Γ_i表示节点i的邻居节点集合。从节点v_i出发，按概率P_walk随机游走R步，以图1为例，得到随机游走节点序列

步骤四：计算负样本的采样概率

其中负采样集合N_neg为不在随机游走序列L下的节点集合，如图1所示，u为节点的嵌入向量表示，通过p_ij从N_neg中采集节点，作为训练节点k的负样本；

步骤五：计算损失函数

步骤六：重复步骤二到步骤五，直到损失函数收敛则算法中止，得到所有节点的嵌入向量u，针对任意无连边节点对，计算相应的嵌入向量内积，按照降序排列，取前B个内积最大节点对，所对应的用户对即为相互推荐的好友，B≤Y，其中Y表示网络中无连边节点对的数量。

如上所述，本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内，对本发明作出的任何修改和改变，都落入本发明的保护范围。