CN112132326A - 一种基于随机游走度惩罚机制的社交网络好友预测方法 - Google Patents
一种基于随机游走度惩罚机制的社交网络好友预测方法 Download PDFInfo
- Publication number
- CN112132326A CN112132326A CN202010893847.2A CN202010893847A CN112132326A CN 112132326 A CN112132326 A CN 112132326A CN 202010893847 A CN202010893847 A CN 202010893847A CN 112132326 A CN112132326 A CN 112132326A
- Authority
- CN
- China
- Prior art keywords
- node
- random walk
- nodes
- social network
- negative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005295 random walk Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 title claims abstract description 19
- 239000013598 vector Substances 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000005070 sampling Methods 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 abstract description 6
- 238000012512 characterization method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Abstract
一种基于随机游走度惩罚机制的社交网络好友预测方法,基于社交网络用户数据构建社交网络模型,通过改变随机游走采样概率来获得游走序列,在随机游走序列中依次选取用户,作为当前用户,设定滑动窗口,从中依次选取用户,作为训练的正样本,通过函数获得负采样集合,在利用节点与负样本嵌入的当前相似度作为负采样概率指标,得到训练的负样本,使用损失函数做损失。所得到的嵌入向量做内积,即为用户之间的相似度,相似度较高的即为预测的好友。本发明考虑了用户度大小以及当前的嵌入向量表示,提高了好友预测的准确性。
Description
技术领域
本发明涉及社交网络预测领域,特别是指一种基于随机游走度惩罚机制的社交网络好友预测方法。
背景技术
由于网络技术的飞速发展,如今,互联网早已惠及人们生活、工作、学习等各个方面。线上社交逐渐变得不可忽视,在社会交流中占据了较大的比重。网络中的用户以及用户之间的联系形成了庞大的社交网络。为用户推荐可能认识的好友或潜在的相似好友,对于补全社交网络以及促进用户交流,具有非常大的实际价值和研究价值。
网络表征学习旨在将离散数据映射为连续低维向量表征。作为一种无监督的网络学习算法,十分适合社交网络数据。表征学习所得到的用户低维向量具有一定的意义:向量的每一维数字表示都隐藏着该用户的一些特征信息,向量之间的相似性比较也可以很好地反映用户之间的相似度,为用户推荐提供了依据。因此,将社交网络的结构信息,嵌入到低维空间向量能很好地对用户关系进行存储和分析。
然而,如何学习得到可信赖的,表达能力强的用户向量表征仍是一个难点问题。主流的网络表征方法存在内存占用较大或时间复杂度较高的问题。
发明内容
为了克服传统的社交网络方法预测好友精确度不高的问题,本发明提出一种通过提升用户向量表征来提高好友预测性能的基于随机游走度惩罚机制的社交网络好友预测方法,考虑了用户度大小对随机游走的影响,实现自适应的负采样,使用浅层网络,提出了一种基于度惩罚随机游走的社交网络好友预测方法,有效的提升了用户向量的表示性能,提升了社交网络好友预测的准确度。
本发明解决其技术问题所采用的技术方案是:
一种基于随机游走度惩罚机制的社交网络好友预测方法,包括如下步骤:
步骤一:根据社交网络用户数据建立社交网络G=(V,E),其中,V={v1,v2,...vN}表示节点集合,每个节点表示一个用户,E为连边集合,N表示用户数,di表示节点i的度,即用户i直接相连的好友数;
步骤二:任选一个节点vi,计算vi随机游走到任意邻居节点vj的概率
步骤三:在随机游走节点序列L中每次选取1个节点,作为训练节点k,取节点k在随机游走序列L中至多前s个与后s个节点,作为训练节点k的正样本,其中s为可调参数,按照此方法得到L中每个节点的正样本;
步骤四:计算负样本的采样概率
其中负采样集合Nneg为不在随机游走序列L下的节点集合,u为节点的嵌入向量表示,通过pij从Nneg中采集节点,作为训练节点k的负样本;
步骤六:重复步骤二到步骤五,直到损失函数收敛则算法中止,得到所有节点的嵌入向量u,针对任意无连边节点对,计算相应的嵌入向量内积,按照降序排列,取前B个内积最大节点对,所对应用户对即为预测的好友,B≤Y,其中Y表示网络中无连边节点对的数量。
本发明的技术构思为:利用大度惩罚,能够提高低度节点被游走到的概率,同时通过节点相似性自适应选取负样本,提高了社交网络好友预测的准确性。
本发明的有益效果为:考虑了用户度大小以及当前的嵌入向量表示,使得最终好友预测结果准确率较高,拥有较强的性能。
附图说明
图1为模型训练示意图,L为某次考虑度惩罚下的随机游走序列,设定滑动窗口大小为2,节点4为当前用户,则节点2、3、5、6为滑动窗口内的其余用户,即正样本集,Nneg中的用户为处理过的可选取的负样本集。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1,一种基于随机游走度惩罚机制的社交网络好友预测方法,包括如下步骤:
步骤一:根据社交网络用户数据建立社交网络G=(V,E),如图1中的网络所示,其中,V={v1,v2,...vN}表示节点集合,每个节点表示一个用户,E为连边集合,N表示用户数,di表示节点i的度,即用户i直接相连的好友数;
步骤二:任选一个节点vi,计算vi随机游走到任意邻居节点vj的概率
步骤三:在随机游走节点序列L中每次选取1个节点,作为训练节点k,取节点k在随机游走序列L中至多前s个与后s个节点,作为训练节点k的正样本,其中s为可调参数,按照此方法得到L中每个节点的正样本;
步骤四:计算负样本的采样概率
其中负采样集合Nneg为不在随机游走序列L下的节点集合,如图1所示,u为节点的嵌入向量表示,通过pij从Nneg中采集节点,作为训练节点k的负样本;
步骤六:重复步骤二到步骤五,直到损失函数收敛则算法中止,得到所有节点的嵌入向量u,针对任意无连边节点对,计算相应的嵌入向量内积,按照降序排列,取前B个内积最大节点对,所对应的用户对即为相互推荐的好友,B≤Y,其中Y表示网络中无连边节点对的数量。
如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。
Claims (1)
1.一种基于随机游走度惩罚机制的社交网络好友预测方法,其特征在于:包括如下步骤:
步骤一:根据社交网络用户数据建立社交网络G=(V,E),其中,V={v1,v2,...vN}表示节点集合,每个节点表示一个用户,E为连边集合,N表示用户数,di表示节点i的度,即用户i直接相连的好友数;
步骤二:任选一个节点vi,计算vi随机游走到任意邻居节点vj的概率
步骤三:在随机游走节点序列L中每次选取1个节点,作为训练节点k,取节点k在随机游走序列L中至多前s个与后s个节点,作为训练节点k的正样本,其中s为可调参数,按照此方法得到L中每个节点的正样本;
步骤四:计算负样本的采样概率
其中负采样集合Nneg为不在随机游走序列L下的节点集合,u为节点的嵌入向量表示,通过pij从Nneg中采集节点,作为训练节点k的负样本;
步骤六:重复步骤二到步骤五,直到损失函数收敛则算法中止,得到所有节点的嵌入向量u,针对任意无连边节点对,计算相应的嵌入向量内积,按照降序排列,取前B个内积最大节点对,所对应的用户对即为相互推荐的好友,B≤Y,其中Y表示网络中无连边节点对的数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010893847.2A CN112132326B (zh) | 2020-08-31 | 2020-08-31 | 一种基于随机游走度惩罚机制的社交网络好友预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010893847.2A CN112132326B (zh) | 2020-08-31 | 2020-08-31 | 一种基于随机游走度惩罚机制的社交网络好友预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112132326A true CN112132326A (zh) | 2020-12-25 |
CN112132326B CN112132326B (zh) | 2023-12-01 |
Family
ID=73847691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010893847.2A Active CN112132326B (zh) | 2020-08-31 | 2020-08-31 | 一种基于随机游走度惩罚机制的社交网络好友预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112132326B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745105A (zh) * | 2014-01-06 | 2014-04-23 | 中国科学院计算技术研究所 | 一种社交网络中用户属性的预测方法及系统 |
WO2016090877A1 (zh) * | 2014-12-09 | 2016-06-16 | 深圳大学 | 一种广义最大度随机游走图抽样算法 |
CN108647800A (zh) * | 2018-03-19 | 2018-10-12 | 浙江工业大学 | 一种基于节点嵌入的在线社交网络用户缺失属性预测方法 |
CN110347881A (zh) * | 2019-06-19 | 2019-10-18 | 西安交通大学 | 一种基于路径回溯图嵌入的群体发现方法 |
CN110414665A (zh) * | 2019-05-21 | 2019-11-05 | 浙江工业大学 | 一种基于深度神经网络的网络表示学习方法 |
CN111310822A (zh) * | 2020-02-12 | 2020-06-19 | 山西大学 | 一种基于pu学习和随机游走的链接预测方法及装置 |
-
2020
- 2020-08-31 CN CN202010893847.2A patent/CN112132326B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745105A (zh) * | 2014-01-06 | 2014-04-23 | 中国科学院计算技术研究所 | 一种社交网络中用户属性的预测方法及系统 |
WO2016090877A1 (zh) * | 2014-12-09 | 2016-06-16 | 深圳大学 | 一种广义最大度随机游走图抽样算法 |
CN108647800A (zh) * | 2018-03-19 | 2018-10-12 | 浙江工业大学 | 一种基于节点嵌入的在线社交网络用户缺失属性预测方法 |
CN110414665A (zh) * | 2019-05-21 | 2019-11-05 | 浙江工业大学 | 一种基于深度神经网络的网络表示学习方法 |
CN110347881A (zh) * | 2019-06-19 | 2019-10-18 | 西安交通大学 | 一种基于路径回溯图嵌入的群体发现方法 |
CN111310822A (zh) * | 2020-02-12 | 2020-06-19 | 山西大学 | 一种基于pu学习和随机游走的链接预测方法及装置 |
Non-Patent Citations (3)
Title |
---|
成天英;王茜;袁丁;: "基于几何邻居的半监督节点分类", 计算机应用研究, no. 09, pages 41 - 45 * |
李宏涛;何克清;王健;彭珍连;田刚;: "基于概念格和随机游走的社交网朋友推荐算法", 四川大学学报(工程科学版), no. 06, pages 131 - 141 * |
肖迎元;张红玉;: "基于用户潜在特征的社交网络好友推荐方法", 计算机科学, no. 03, pages 224 - 228 * |
Also Published As
Publication number | Publication date |
---|---|
CN112132326B (zh) | 2023-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rozemberczki et al. | Gemsec: Graph embedding with self clustering | |
CN111523047B (zh) | 基于图神经网络的多关系协同过滤算法 | |
WO2022083624A1 (zh) | 一种模型的获取方法及设备 | |
CN112214685A (zh) | 一种基于知识图谱的个性化推荐方法 | |
CN111709474A (zh) | 一种融合拓扑结构和节点属性的图嵌入链路预测方法 | |
CN110826338B (zh) | 一种单选择门与类间度量的细粒度语义相似识别的方法 | |
CN112100514B (zh) | 一种基于全局注意力机制表征学习的好友推荐方法 | |
CN111414461A (zh) | 一种融合知识库与用户建模的智能问答方法及系统 | |
CN112084373B (zh) | 一种基于图嵌入的多源异构网络用户对齐方法 | |
CN113094822A (zh) | 一种机械设备剩余寿命预测方法和系统 | |
CN112559764A (zh) | 一种基于领域知识图谱的内容推荐方法 | |
CN112686376A (zh) | 一种基于时序图神经网络的节点表示方法及增量学习方法 | |
CN115270007B (zh) | 一种基于混合图神经网络的poi推荐方法及系统 | |
CN113222139A (zh) | 神经网络训练方法和装置、设备,及计算机存储介质 | |
CN109948242A (zh) | 基于特征哈希的网络表示学习方法 | |
CN112507245B (zh) | 基于图神经网络的社交网络好友推荐方法 | |
CN111709519B (zh) | 一种深度学习并行计算架构方法及其超参数自动配置优化 | |
Li et al. | Fitcnn: A cloud-assisted lightweight convolutional neural network framework for mobile devices | |
CN112132326A (zh) | 一种基于随机游走度惩罚机制的社交网络好友预测方法 | |
CN114117945B (zh) | 基于用户-服务交互图的深度学习云服务QoS预测方法 | |
CN110020379B (zh) | 一种基于深度动态网络嵌入表示模型的链路预测方法 | |
CN114625886A (zh) | 基于知识图谱小样本关系学习模型的实体查询方法及系统 | |
CN115620046A (zh) | 一种基于半监督性能预测器的多目标神经架构搜索方法 | |
CN114625969A (zh) | 一种基于交互近邻会话的推荐方法 | |
CN114647789A (zh) | 一种推荐模型的确定方法和相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |