CN112132326A - 一种基于随机游走度惩罚机制的社交网络好友预测方法 - Google Patents

一种基于随机游走度惩罚机制的社交网络好友预测方法 Download PDF

Info

Publication number
CN112132326A
CN112132326A CN202010893847.2A CN202010893847A CN112132326A CN 112132326 A CN112132326 A CN 112132326A CN 202010893847 A CN202010893847 A CN 202010893847A CN 112132326 A CN112132326 A CN 112132326A
Authority
CN
China
Prior art keywords
node
random walk
nodes
social network
negative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010893847.2A
Other languages
English (en)
Other versions
CN112132326B (zh
Inventor
杨旭华
马钢峰
许营坤
叶蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010893847.2A priority Critical patent/CN112132326B/zh
Publication of CN112132326A publication Critical patent/CN112132326A/zh
Application granted granted Critical
Publication of CN112132326B publication Critical patent/CN112132326B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

一种基于随机游走度惩罚机制的社交网络好友预测方法,基于社交网络用户数据构建社交网络模型,通过改变随机游走采样概率来获得游走序列,在随机游走序列中依次选取用户,作为当前用户,设定滑动窗口,从中依次选取用户,作为训练的正样本,通过函数获得负采样集合,在利用节点与负样本嵌入的当前相似度作为负采样概率指标,得到训练的负样本,使用损失函数做损失。所得到的嵌入向量做内积,即为用户之间的相似度,相似度较高的即为预测的好友。本发明考虑了用户度大小以及当前的嵌入向量表示,提高了好友预测的准确性。

Description

一种基于随机游走度惩罚机制的社交网络好友预测方法
技术领域
本发明涉及社交网络预测领域,特别是指一种基于随机游走度惩罚机制的社交网络好友预测方法。
背景技术
由于网络技术的飞速发展,如今,互联网早已惠及人们生活、工作、学习等各个方面。线上社交逐渐变得不可忽视,在社会交流中占据了较大的比重。网络中的用户以及用户之间的联系形成了庞大的社交网络。为用户推荐可能认识的好友或潜在的相似好友,对于补全社交网络以及促进用户交流,具有非常大的实际价值和研究价值。
网络表征学习旨在将离散数据映射为连续低维向量表征。作为一种无监督的网络学习算法,十分适合社交网络数据。表征学习所得到的用户低维向量具有一定的意义:向量的每一维数字表示都隐藏着该用户的一些特征信息,向量之间的相似性比较也可以很好地反映用户之间的相似度,为用户推荐提供了依据。因此,将社交网络的结构信息,嵌入到低维空间向量能很好地对用户关系进行存储和分析。
然而,如何学习得到可信赖的,表达能力强的用户向量表征仍是一个难点问题。主流的网络表征方法存在内存占用较大或时间复杂度较高的问题。
发明内容
为了克服传统的社交网络方法预测好友精确度不高的问题,本发明提出一种通过提升用户向量表征来提高好友预测性能的基于随机游走度惩罚机制的社交网络好友预测方法,考虑了用户度大小对随机游走的影响,实现自适应的负采样,使用浅层网络,提出了一种基于度惩罚随机游走的社交网络好友预测方法,有效的提升了用户向量的表示性能,提升了社交网络好友预测的准确度。
本发明解决其技术问题所采用的技术方案是:
一种基于随机游走度惩罚机制的社交网络好友预测方法,包括如下步骤:
步骤一:根据社交网络用户数据建立社交网络G=(V,E),其中,V={v1,v2,...vN}表示节点集合,每个节点表示一个用户,E为连边集合,N表示用户数,di表示节点i的度,即用户i直接相连的好友数;
步骤二:任选一个节点vi,计算vi随机游走到任意邻居节点vj的概率
Figure BDA0002657786670000021
其中,λ是一个可调参数,Γi表示节点i的邻居节点集合。从节点vi出发,按概率Pwalk随机游走R步,得到随机游走节点序列
Figure BDA0002657786670000022
步骤三:在随机游走节点序列L中每次选取1个节点,作为训练节点k,取节点k在随机游走序列L中至多前s个与后s个节点,作为训练节点k的正样本,其中s为可调参数,按照此方法得到L中每个节点的正样本;
步骤四:计算负样本的采样概率
Figure BDA0002657786670000023
其中负采样集合Nneg为不在随机游走序列L下的节点集合,u为节点的嵌入向量表示,通过pij从Nneg中采集节点,作为训练节点k的负样本;
步骤五:计算损失函数
Figure BDA0002657786670000024
其中uk表示训练节点k的嵌入向量表示,up表示k的正样本,uw表示k的负样本,σ表示sigmoid函数;
步骤六:重复步骤二到步骤五,直到损失函数收敛则算法中止,得到所有节点的嵌入向量u,针对任意无连边节点对,计算相应的嵌入向量内积,按照降序排列,取前B个内积最大节点对,所对应用户对即为预测的好友,B≤Y,其中Y表示网络中无连边节点对的数量。
本发明的技术构思为:利用大度惩罚,能够提高低度节点被游走到的概率,同时通过节点相似性自适应选取负样本,提高了社交网络好友预测的准确性。
本发明的有益效果为:考虑了用户度大小以及当前的嵌入向量表示,使得最终好友预测结果准确率较高,拥有较强的性能。
附图说明
图1为模型训练示意图,L为某次考虑度惩罚下的随机游走序列,设定滑动窗口大小为2,节点4为当前用户,则节点2、3、5、6为滑动窗口内的其余用户,即正样本集,Nneg中的用户为处理过的可选取的负样本集。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1,一种基于随机游走度惩罚机制的社交网络好友预测方法,包括如下步骤:
步骤一:根据社交网络用户数据建立社交网络G=(V,E),如图1中的网络所示,其中,V={v1,v2,...vN}表示节点集合,每个节点表示一个用户,E为连边集合,N表示用户数,di表示节点i的度,即用户i直接相连的好友数;
步骤二:任选一个节点vi,计算vi随机游走到任意邻居节点vj的概率
Figure BDA0002657786670000031
其中,λ是一个可调参数,Γi表示节点i的邻居节点集合。从节点vi出发,按概率Pwalk随机游走R步,以图1为例,得到随机游走节点序列
Figure BDA0002657786670000032
步骤三:在随机游走节点序列L中每次选取1个节点,作为训练节点k,取节点k在随机游走序列L中至多前s个与后s个节点,作为训练节点k的正样本,其中s为可调参数,按照此方法得到L中每个节点的正样本;
步骤四:计算负样本的采样概率
Figure BDA0002657786670000041
其中负采样集合Nneg为不在随机游走序列L下的节点集合,如图1所示,u为节点的嵌入向量表示,通过pij从Nneg中采集节点,作为训练节点k的负样本;
步骤五:计算损失函数
Figure BDA0002657786670000042
其中uk表示训练节点k的嵌入向量表示,up表示k的正样本,uw表示k的负样本,σ表示sigmoid函数;
步骤六:重复步骤二到步骤五,直到损失函数收敛则算法中止,得到所有节点的嵌入向量u,针对任意无连边节点对,计算相应的嵌入向量内积,按照降序排列,取前B个内积最大节点对,所对应的用户对即为相互推荐的好友,B≤Y,其中Y表示网络中无连边节点对的数量。
如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (1)

1.一种基于随机游走度惩罚机制的社交网络好友预测方法,其特征在于:包括如下步骤:
步骤一:根据社交网络用户数据建立社交网络G=(V,E),其中,V={v1,v2,...vN}表示节点集合,每个节点表示一个用户,E为连边集合,N表示用户数,di表示节点i的度,即用户i直接相连的好友数;
步骤二:任选一个节点vi,计算vi随机游走到任意邻居节点vj的概率
Figure FDA0002657786660000011
其中,λ是一个可调参数,Γi表示节点i的邻居节点集合。从节点vi出发,按概率Pwalk随机游走R步,得到随机游走节点序列
Figure FDA0002657786660000012
步骤三:在随机游走节点序列L中每次选取1个节点,作为训练节点k,取节点k在随机游走序列L中至多前s个与后s个节点,作为训练节点k的正样本,其中s为可调参数,按照此方法得到L中每个节点的正样本;
步骤四:计算负样本的采样概率
Figure FDA0002657786660000013
其中负采样集合Nneg为不在随机游走序列L下的节点集合,u为节点的嵌入向量表示,通过pij从Nneg中采集节点,作为训练节点k的负样本;
步骤五:计算损失函数
Figure FDA0002657786660000014
其中uk表示训练节点k的嵌入向量表示,up表示k的正样本,uw表示k的负样本,σ表示sigmoid函数;
步骤六:重复步骤二到步骤五,直到损失函数收敛则算法中止,得到所有节点的嵌入向量u,针对任意无连边节点对,计算相应的嵌入向量内积,按照降序排列,取前B个内积最大节点对,所对应的用户对即为相互推荐的好友,B≤Y,其中Y表示网络中无连边节点对的数量。
CN202010893847.2A 2020-08-31 2020-08-31 一种基于随机游走度惩罚机制的社交网络好友预测方法 Active CN112132326B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010893847.2A CN112132326B (zh) 2020-08-31 2020-08-31 一种基于随机游走度惩罚机制的社交网络好友预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010893847.2A CN112132326B (zh) 2020-08-31 2020-08-31 一种基于随机游走度惩罚机制的社交网络好友预测方法

Publications (2)

Publication Number Publication Date
CN112132326A true CN112132326A (zh) 2020-12-25
CN112132326B CN112132326B (zh) 2023-12-01

Family

ID=73847691

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010893847.2A Active CN112132326B (zh) 2020-08-31 2020-08-31 一种基于随机游走度惩罚机制的社交网络好友预测方法

Country Status (1)

Country Link
CN (1) CN112132326B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745105A (zh) * 2014-01-06 2014-04-23 中国科学院计算技术研究所 一种社交网络中用户属性的预测方法及系统
WO2016090877A1 (zh) * 2014-12-09 2016-06-16 深圳大学 一种广义最大度随机游走图抽样算法
CN108647800A (zh) * 2018-03-19 2018-10-12 浙江工业大学 一种基于节点嵌入的在线社交网络用户缺失属性预测方法
CN110347881A (zh) * 2019-06-19 2019-10-18 西安交通大学 一种基于路径回溯图嵌入的群体发现方法
CN110414665A (zh) * 2019-05-21 2019-11-05 浙江工业大学 一种基于深度神经网络的网络表示学习方法
CN111310822A (zh) * 2020-02-12 2020-06-19 山西大学 一种基于pu学习和随机游走的链接预测方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745105A (zh) * 2014-01-06 2014-04-23 中国科学院计算技术研究所 一种社交网络中用户属性的预测方法及系统
WO2016090877A1 (zh) * 2014-12-09 2016-06-16 深圳大学 一种广义最大度随机游走图抽样算法
CN108647800A (zh) * 2018-03-19 2018-10-12 浙江工业大学 一种基于节点嵌入的在线社交网络用户缺失属性预测方法
CN110414665A (zh) * 2019-05-21 2019-11-05 浙江工业大学 一种基于深度神经网络的网络表示学习方法
CN110347881A (zh) * 2019-06-19 2019-10-18 西安交通大学 一种基于路径回溯图嵌入的群体发现方法
CN111310822A (zh) * 2020-02-12 2020-06-19 山西大学 一种基于pu学习和随机游走的链接预测方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
成天英;王茜;袁丁;: "基于几何邻居的半监督节点分类", 计算机应用研究, no. 09, pages 41 - 45 *
李宏涛;何克清;王健;彭珍连;田刚;: "基于概念格和随机游走的社交网朋友推荐算法", 四川大学学报(工程科学版), no. 06, pages 131 - 141 *
肖迎元;张红玉;: "基于用户潜在特征的社交网络好友推荐方法", 计算机科学, no. 03, pages 224 - 228 *

Also Published As

Publication number Publication date
CN112132326B (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
Rozemberczki et al. Gemsec: Graph embedding with self clustering
CN111523047B (zh) 基于图神经网络的多关系协同过滤算法
WO2022083624A1 (zh) 一种模型的获取方法及设备
CN112214685A (zh) 一种基于知识图谱的个性化推荐方法
CN111709474A (zh) 一种融合拓扑结构和节点属性的图嵌入链路预测方法
CN110826338B (zh) 一种单选择门与类间度量的细粒度语义相似识别的方法
CN112100514B (zh) 一种基于全局注意力机制表征学习的好友推荐方法
CN111414461A (zh) 一种融合知识库与用户建模的智能问答方法及系统
CN112084373B (zh) 一种基于图嵌入的多源异构网络用户对齐方法
CN113094822A (zh) 一种机械设备剩余寿命预测方法和系统
CN112559764A (zh) 一种基于领域知识图谱的内容推荐方法
CN112686376A (zh) 一种基于时序图神经网络的节点表示方法及增量学习方法
CN115270007B (zh) 一种基于混合图神经网络的poi推荐方法及系统
CN113222139A (zh) 神经网络训练方法和装置、设备,及计算机存储介质
CN109948242A (zh) 基于特征哈希的网络表示学习方法
CN112507245B (zh) 基于图神经网络的社交网络好友推荐方法
CN111709519B (zh) 一种深度学习并行计算架构方法及其超参数自动配置优化
Li et al. Fitcnn: A cloud-assisted lightweight convolutional neural network framework for mobile devices
CN112132326A (zh) 一种基于随机游走度惩罚机制的社交网络好友预测方法
CN114117945B (zh) 基于用户-服务交互图的深度学习云服务QoS预测方法
CN110020379B (zh) 一种基于深度动态网络嵌入表示模型的链路预测方法
CN114625886A (zh) 基于知识图谱小样本关系学习模型的实体查询方法及系统
CN115620046A (zh) 一种基于半监督性能预测器的多目标神经架构搜索方法
CN114625969A (zh) 一种基于交互近邻会话的推荐方法
CN114647789A (zh) 一种推荐模型的确定方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant