CN113779385A - 基于复杂网络图嵌入的好友关注度度量排序方法及系统 - Google Patents

基于复杂网络图嵌入的好友关注度度量排序方法及系统 Download PDF

Info

Publication number
CN113779385A
CN113779385A CN202110972650.2A CN202110972650A CN113779385A CN 113779385 A CN113779385 A CN 113779385A CN 202110972650 A CN202110972650 A CN 202110972650A CN 113779385 A CN113779385 A CN 113779385A
Authority
CN
China
Prior art keywords
user
friend
attention
users
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110972650.2A
Other languages
English (en)
Inventor
傅晨波
陈殊杭
夏镒楠
邱君瀚
胡剑波
陈康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202110972650.2A priority Critical patent/CN113779385A/zh
Publication of CN113779385A publication Critical patent/CN113779385A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于复杂网络图嵌入的好友关注度度量排序方法,包括:步骤S1,获取并清理数据集;S2,构建用户间的社交网络;S3,基于随机游走等算法采样模型所需的超边;S4,基于图嵌入生成特征向量,再通过改进后的OLA‑srec模型生成用户间关注度;S5,按关注度对用户朋友进行排序,并计算用户最优好友数;本发明还包括基于复杂网络图嵌入的好友关注度度量排序系统,包括:预处理模块、网络构建模块、图嵌入模块、关注度计算模块、最优好友数量计算及关注度排序模块;本发明可以从数据集中提取用户的有效朋友和用户对相应朋友的关注度,可结合多种社会化推荐模型并提升相应的推荐效果,同时提升了模型整体的鲁棒性和不同数据集的适应性。

Description

基于复杂网络图嵌入的好友关注度度量排序方法及系统
技术领域
本发明涉及数据挖掘和网络节点处理技术,尤其涉及一种复杂网络里关键节点关注度排序的方法和处理系统。
背景技术
近年来,随着信息技术和计算机技术的迅速发展,网络科学在生活中的各个领域发挥着重要作用,如今这些网络的规模愈发庞大和复杂,分析的难度和应用的价值也相应地越来越大。因此评判一个网络里某些关键节点与其他节点的重要程度和关注度,已成为网络科学领域的研究重点,且在各类网络如通信网络,电力网络,社交网络和交通网络中有着重要作用。如在社交网络里,好友关注度在推荐系统、用户之间的相关性和预测用户的行为模式上有着重要的作用,因为用户节点的重要程度和关注程度是各不相同的,有些用户是某领域上的意见领袖用户,而有些用户只是普通的网民,所以合理的有效关注度排序可以有助于评估当前用户节点对整个社交网络的重要性程度以及后续对处理网络的分划如社区划分等工作,同时也有助于提升算法的性能和模型的效果。例如,在交通网络中,不同交通枢纽节点的重要程度也是各不相同,存在一些如收费站等车流量较大的节点,也存在郊外十字路口等车流量较少的节点,因此,区分并排序这两类节点对其他节点的重要性程度乃至对整个交通网络的重要性程度在交通网络分析上有着重要的作用。然而使用传统的算法来估计和排序节点间的关注度和重要程度,其结果存在一定误差,同时该类算法的泛化能力不一定强。
节点间的关注度和重要程度是区分网络中不同节点重要程度的一种评判指标。合理的关注度排序,可以有效评估不同节点的重要程度,同时有助于后续处理网络的分划工作。此外,结合影响力扩散模型,可以进一步的模拟出该用户的影响力大小。
专利CN202010820264.7提出了一种运用量子领域的网络节点重要性排序的方法,主要核心是利用量子叠加特性提高计算效率,但是其计算开销和时间复杂度依旧很大。
发明内容
本发明要克服现有技术的上述缺点,提供一种基于复杂网络图嵌入的好友关注度度量排序方法和系统。
本发明结合当前主流的图嵌入及随机游走等机器学习算法,以及有限注意力机制等社交网络的相关模型,通过改动原有算法的部分参数的计算方法,即使用由机器学习算法生成的用户特征向量以及结合注意力机制模型得到的用户相关系数,并依据该系数对当前网络的用户节点的好友进行排序。
本发明实现上述发明目的所采用的技术方案如下:
基于复杂网络图嵌入的好友关注度度量排序方法,包括以下步骤:
S1:获取一种带有评分机制的数据集并清洗该数据集;
S2:通过用户间的社交关系以及用户自身的历史记录,以用户及其评价行为作为节点、用户间的好友关系作为连边,构建出超图网络;
S3:基于LBSN2vec算法生成用户特征向量与物品特征向量;
S4:通过改进后的OLA-srec模型计算出对每个好友的关注度;
S5:根据用户对每个好友的关注度大小,对用户好友进行排序,同时由关注度的正负来计算相应用户的最优好友数量。
优选的,所述步骤S1中:对获取的数据集文件进行清洗操作,使用交叉筛选技术来删除朋友数量过少的冷启动用户和朋友数量过多的名人用户;具体操作为:首先删除当前不满足条件的用户;接着检查是否出现不满足条件的用户,再删除新出现的不满足条件的用户;反复迭代,直至不再出现不满足条件的用户;此步骤有助于在避免冷启动用户和名人用户对整体网络干扰的同时减少后续的计算开销;因为冷启动用户一般对整体的网络分析没有任何作用甚至因为其自身特征与一般用户存在较大差异会降低模型最终的评估效果,而名人用户则对大部分的网络节点都有较大的影响,可是这种影响在分析一般用户时会对模型的效果产生干扰,无法有效地评估模型。
优选的,所述步骤S2中:由于改进前的OLA-rec模型使用矩阵分解和EM 算法来生成计算后续关注度所需的变量,其算法流程较为复杂、中间所涉及的变量也较多,难以控制,因而它的可复现性和移植性也相对较差。因此,本发明改进了原模型中的向量生成模块,即使用了复杂网络图嵌入来生成后续计算所需的变量,不仅能简化算法的流程,在一定程度上还可以提升模型的效果。
首先根据用户的好友关系作为连边来构建用户的社交网络,网络中的每个节点代表用户,然后在用户节点的基础上插入用户的行为历史记录节点,形成与相应的用户节点形成一种超图边;其中超图边上的用户行为历史记录节点对应用户曾经的某个具体行为;为了提高后续步骤中提取特征的效果,此步骤采取了一种超图的拓扑网络构建方法:朋友边体现了其社交特征、作为超边的行为边体现用户自身的行为特征。
优选的,所述步骤S3中:
S3.1:基于一种即走即停的随机游走采样算法,采样相应数量的超边,在用户的好友边上执行经典随机游走算法,与此同时从对应的用户行为超边上采样行为历史节点,其中,用户的好友边是指当前用户与其存在交互的用户节点所构成的连边,用户行为边是指当前用户与其相应的行为节点所构成的连边,此外,使用可调参数α控制每种类型边的比例,由此得到超边样本训练集,
Es=2W (1)
Efr=2Wα (2)
Efi=2W(1-α) (3)
其中Es是所有边的数量,Efr为朋友边的数量,Efi为用户行为边的数量,W 为滑动窗口的长度;此步骤中的即走即停的随机游走采样算法较于一般的随机游走算法可以有效地同时提取两种边的特征,并且在提取的同时可以最大程度的保留各自边的独立性,因而也很方便控制两种边的比例来调整模型;此外,基于滑动窗口的方法可以保证每个用户节点特征可以得到公平地采集,即提高了特征的提取效率。
S3.2:在步骤S3.1得到的超边训练集上使用LBSN图嵌入和梯度下降算法得到用户特征向量和行为特征向量,在余弦坐标系下,通过最小化超图节点与最佳拟合向量之间的误差来保持n个节点的接近性,(4)式为优化目标函数,
Figure BDA0003226452890000031
Figure BDA0003226452890000032
其中
Figure BDA0003226452890000033
是当前的用户节点向量,
Figure BDA0003226452890000034
为最佳拟合向量,Θ为当前的优化目标;
此外,使用了负采样技术,即加入负样本节点和拟合直线之间的最大余弦值,由于负采样是一种基于概率的加速技术,故需要优化期望。
因此在采集到的n个节点
Figure BDA0003226452890000035
的优化函数更正如下:
Figure BDA0003226452890000036
其中γ表示负样本数,
Figure BDA0003226452890000041
Figure BDA0003226452890000042
的期望,
Figure BDA0003226452890000043
为负采样得到的节点向量,之后,再对式(6)的目标函数使用随机梯度下降算法进行优化求解,
Figure BDA0003226452890000044
Figure BDA0003226452890000045
式(7)和式(8)为随机梯度下降算法中对应的向量梯度;
在此步骤中,之所以使用余弦相似性来保持节点与拟合线的相似性是因为余弦相似性不受向量的范数维数影响,可以避免此后的计算中向量范数的影响;并且,负采样技术可以有效地减少计算量,提高计算效率。
优选的,所述步骤S4中:通过改进后的OLA-srec模型计算出用户对每个好友的关注度,该算法的计算步骤为:
βiu=L/C·d(Uu,Ui) (9)
Figure BDA0003226452890000046
Figure 100002_1
其中βiu为中间变量,L为利普斯顿常数,Uu,Ui为用户u和i的特征向量, C为经验参数,k为用户的好友总数,αiu为用户i对朋友u的关注度,d(Uu,Ui) 为用户i和用户u之间的欧式距离,λ也为中间变量,此外,L/C的比值可定义为LC率,用于计算中间变量βiu
首先根据步骤S3.2所得的用户的特征向量来计算用户与其朋友之间的欧式距离,再根据(9)式计算中间参数βiu,并且以80-120作为L/C的可选范围,在实验中,再初始化λ和α为1/|F(i)|,其中|F(i)|为用户实际的好友数,再依据(10) 式和(11)式依此迭代来更新λ和α,其中,循环条件为λk>βi,k+1和k≤|F(i)|;最终,当循环结束后,可得到的α为用户之间的相关系数矩阵。
优选的,所述步骤S5中:根据S4计算所得的用户的关注度结果,以关注度的大小对用户好友的重要程度递减进行排序,同时将关注度大于等于0的人数作为当前用户的最优好友数。
实现本发明的基于复杂网络图嵌入的好友关注度度量排序系统,包括:预处理模块、网络构建模块、图嵌入模块、关注度计算模块和最优好友数量计算排序及关注度排序模块;
所述预处理模块对获取的数据集文件进行清洗操作,即使用交叉筛选的技术删去数据集中朋友数量的过多或过少的两种极端用户;
所述网络构建模块是首先以用户节点的好友关系作为连边构成用户的社交网络,再使用户节点与该用户的行为节点相连作为表示用户行为的超图边;
所述图嵌入模块利用随机游走等算法采样模型所需的超边,即采用随机游走停留方法来采样相应数量的超边,在用户的好友边和相应用户的行为超边上分布执行经典随机游走算法和负采样提取算法来获得超边集,再在所得的超边集上使用LBSN图嵌入和梯度下降算法来得到用户特征向量和物品特征向量;
所述关注度计算模块利用改进后的OLA-srec模型通过图嵌入模块生成的特征向量来得到生成用户间关注度;
所述最优好友数量计算及关注度排序模块依据关注度计算模块生成的用户的好友关注度,对用户好友进行降序排序,再将关注度正负来计算用户的最优好友数;
所述的预处理模块、网络构建模块、图嵌入模块、关注度计算模块、最优好友数量计算及关注度排序模块按先后顺序依次连接。
本发明的有益效果为:
(1).与其他的关注度模型相比,本发明提出了一种新的关注度度量方法;一方面,因为个体的注意力都是有限的,不可能对每个其他物体都有关注度或者相同的关注度,准确地说,一般人往往只会接收自己朋友的信息而忽略其他信息,以往的模型算法却忽略了这点,在计算量增大的同时,却不能提高甚至降低了模型的准确度;另一方面,在一些考虑到有效关注度的模型中,他们对于关注度这一特征的提取不够精准,模型的效果有待提升;因此,本发明通过同时结合LBSN超图嵌入和有效关注度的计算及排序来划分出用户的最优好友数,并以最优好友数的整体关注度作为用户最终的关注度情况;同时,LBSN超图嵌入在学习用户相似性特征的同时也考虑了用户行为的一些特征,能更有效的提取相关特征,提升模型的效果。此外,改进前的OLA-rec模型用于计算后续关注度所需的变量的算法流程较为复杂、在针对不同的数据集训练具体的不同模型时需要调整的较多变量,因而它的可复现性和迁移性相对较差。为此,本发明使用了复杂网络图嵌入来作为原模型中的向量生成模块,作为一种端到端的模型组块,可以只改动少许参数就可以适应多种不同的模型及数据集;这样不仅可以简化算法的流程还可以降低它的复现难度以及提高模型算法的迁移性。
(2).在如今商业化的信息时代中,推荐给用户感兴趣的内容可以使用户们获得更好的个性化服务、减少用户的搜索时间,商家也可以增加用户粘性来获取利润;因此,学界和工业界涌现出了大量的推荐算法,然而,大多数推荐算法却只能适用某一类型或某几个类型的数据,本发明通过改进从好友列表中提取需要数据的这一流程,可以直接计算出好友的关注度从而给每位好友赋不同的权重,因而只需要改动部分的算法流程就能得到较好的效果;鉴于如今的推荐算法大多基于好友关系及好友的信息,因此本发明的适用范围广,能较好的应用于各类算法,在提升各类算法效果的同时也增加了它们的鲁棒性;
(3).通过对复杂网络中的用户节点进行关注度排序,在社交网络,我们可以较为容易的区分出一个社交网络里真正的意见领袖,易于分析、比较,后续可以进一步研究这些意见领袖对整个用户网络的影响,具有较大科研和商业价值;
(4).本发明同时还可以运用于交通网络,大型项目协作网络。如在交通网络中,通过“关注度”排序,可以较为简便的区分出对整个交通网络影响大的交通节点枢纽。进一步,可以在一些潜在效益较高的小节点加大建设,或者新建一些交通节点来提升网络的效率。
附图说明
图1是本发明的方法的流程图;
图2是执行随机游走停留的示意图;
图3是本发明的系统结构示意图;
图4是模型效果比对图。
具体实施方式
为了提高此类算法的效率,本发明结合了当前主流的图嵌入及随机游走等机器学习算法,以及有限注意力机制等社交网络的相关模型,通过改动原有算法的部分参数的计算方法,即使用由机器学习算法生成的用户特征向量以及结合注意力机制模型得到的用户相关系数,并依据该系数对当前网络的用户节点的好友进行排序。
本发明实现上述发明目的所采用的技术方案如下:
基于复杂网络图嵌入的好友关注度度量排序方法,包括以下步骤:
S1:获取一种带有评分机制的数据集并清洗该数据集;
S2:通过用户间的社交关系以及用户自身的历史记录,以用户及其评价行为作为节点、用户间的好友关系作为连边,构建出超图网络;
S3:基于LBSN2vec算法生成用户特征向量与物品特征向量;
S4:通过改进后的OLA-srec模型计算出对每个好友的关注度;
S5:根据用户对每个好友的关注度大小,对用户好友进行排序,同时由关注度的正负来计算相应用户的最优好友数量。
步骤S1中:对获取的数据集文件进行清洗操作,使用交叉筛选技术来删除朋友数量过少的冷启动用户和朋友数量过多的名人用户。具体操作为:首先删除当前不满足条件的用户;接着检查是否出现不满足条件的用户,再删除新出现的不满足条件的用户;反复迭代,直至不再出现不满足条件的用户。
步骤S2中:首先根据用户的好友关系作为连边来构建用户的社交网络,网络中的每个节点代表用户,然后在用户节点的基础上插入用户的行为历史记录节点,形成与相应的用户节点形成一种超图边。其中超图边上的用户行为历史记录节点对应用户曾经的某个具体行为。
步骤S3具体包括:
S3.1:基于一种即走即停的随机游走采样算法,采样相应数量的超边,在用户的好友边上执行经典随机游走算法,与此同时从对应的用户行为超边上采样行为历史节点,其中,用户的好友边是指当前用户与其存在交互的用户节点所构成的连边,用户行为边是指当前用户与其相应的行为节点所构成的连边,此外,使用可调参数α控制每种类型边的比例,由此得到超边样本训练集,
Es=2W (1)
Efr=2Wα (2)
Efi=2W(1-α) (3) 其中Es是所有边的数量,Efr为朋友边的数量,Efi为用户行为边的数量,W 为滑动窗口的长度;
S3.2:在步骤S3.1得到的超边训练集上使用LBSN图嵌入和梯度下降算法得到用户特征向量和行为特征向量,在余弦坐标系下,通过最小化超图节点与最佳拟合向量之间的误差来保持n个节点的接近性,(4)式为优化目标函数,
Figure BDA0003226452890000071
Figure BDA0003226452890000081
其中
Figure BDA0003226452890000082
是当前的用户节点向量,
Figure BDA0003226452890000083
为最佳拟合向量,Θ为当前的优化目标;
此外,使用了负采样技术,即加入负样本节点和拟合直线之间的最大余弦值,由于负采样是一种基于概率的加速技术,故需要优化期望。
因此在采集到的n个节点
Figure BDA0003226452890000084
的优化函数更正如下:
Figure BDA0003226452890000085
其中γ表示负样本数,
Figure BDA0003226452890000086
Figure BDA0003226452890000087
的期望,
Figure BDA0003226452890000088
为负采样得到的节点向量,之后,再对式(6)的目标函数使用随机梯度下降算法进行优化求解,
Figure BDA0003226452890000089
Figure BDA00032264528900000810
式(7)和式(8)为随机梯度下降算法中对应的向量梯度;
步骤S4中:通过改进后的OLA-srec模型计算出用户对每个好友的关注度,该算法的计算步骤为:
βiu=L/C·d(Uu,Ui) (9)
Figure BDA00032264528900000811
Figure 2
其中βiu为中间变量,L为利普斯顿常数,Uu,Ui为用户u和i的特征向量, C为经验参数,k为用户的好友总数,αiu为用户i对朋友u的关注度,d(Uu,Ui) 为用户i和用户u之间的欧式距离,λ也为中间变量,此外,L/C的比值可定义为LC率,用于计算中间变量βiu
首先根据步骤S3.2所得的用户的特征向量来计算用户与其朋友之间的欧式距离,再根据(9)式计算中间参数βiu,并且以80-120作为L/C的可选范围,在实验中,再初始化λ和α为1/|F(i)|,其中|F(i)|为用户实际的好友数,再依据(10) 式和(11)式依此迭代来更新λ和α,其中,循环条件为λk>βi,k+1和k≤|F(i)|;最终,当循环结束后,可得到的α为用户之间的相关系数矩阵。
步骤S5中:根据S4计算所得的用户的关注度结果,以关注度的大小对用户好友的重要程度递减进行排序,同时将关注度大于等于0的人数作为当前用户的最优好友数。
实现本发明的基于复杂网络图嵌入的好友关注度度量排序系统,包括:预处理模块、网络构建模块、图嵌入模块、关注度计算模块、最优好友数量计算及关注度排序模块。
所述预处理模块对获取的数据集文件进行清洗操作,即使用交叉筛选的技术删去数据集中朋友数量的过多或过少的两种极端用户,具体包括:
对获取的数据集文件进行清洗操作,使用交叉筛选技术来删除朋友数量过少的冷启动用户和朋友数量过多的名人用户。具体操作为:首先删除当前不满足条件的用户;接着检查是否出现不满足条件的用户,再删除新出现的不满足条件的用户;反复迭代,直至不再出现不满足条件的用户。
所述网络构建模块是首先以用户节点的好友关系作为连边构成用户的社交网络,再使用户节点与该用户的行为节点相连作为表示用户行为的超图边,具体包括:
首先根据用户的好友关系作为连边来构建用户的社交网络,网络中的每个节点代表用户,然后在用户节点的基础上插入用户的行为历史记录节点,形成与相应的用户节点形成一种超图边。其中超图边上的用户行为历史记录节点对应用户曾经的某个具体行为。
所述图嵌入模块利用随机游走等算法采样模型所需的超边,即采用随机游走停留方法来采样相应数量的超边,在用户的好友边和相应用户的行为超边上分布执行经典随机游走算法和负采样提取算法来获得超边集,再在所得的超边集上使用LBSN图嵌入和梯度下降算法来得到用户特征向量和物品特征向量,具体包括:
S3.1:基于一种即走即停的随机游走采样算法,采样相应数量的超边,在用户的好友边上执行经典随机游走算法,与此同时从对应的用户行为超边上采样行为历史节点,其中,用户的好友边是指当前用户与其存在交互的用户节点所构成的连边,用户行为边是指当前用户与其相应的行为节点所构成的连边,此外,使用可调参数α控制每种类型边的比例,由此得到超边样本训练集,
Es=2W (1)
Efr=2Wα (2)
Efi=2W(1-α) (3)
其中Es是所有边的数量,Efr为朋友边的数量,Efi为用户行为边的数量,W 为滑动窗口的长度;
S3.2:在步骤S3.1得到的超边训练集上使用LBSN图嵌入和梯度下降算法得到用户特征向量和行为特征向量,在余弦坐标系下,通过最小化超图节点与最佳拟合向量之间的误差来保持n个节点的接近性,(4)式为优化目标函数,
Figure BDA0003226452890000101
Figure BDA0003226452890000102
其中
Figure BDA0003226452890000103
是当前的用户节点向量,
Figure BDA0003226452890000104
为最佳拟合向量,Θ为当前的优化目标;
此外,使用了负采样技术,即加入负样本节点和拟合直线之间的最大余弦值,由于负采样是一种基于概率的加速技术,故需要优化期望。
因此在采集到的n个节点
Figure BDA0003226452890000105
的优化函数更正如下:
Figure BDA0003226452890000106
其中γ表示负样本数,
Figure BDA0003226452890000107
Figure BDA0003226452890000108
的期望,
Figure BDA0003226452890000109
为负采样得到的节点向量,之后,再对式(6)的目标函数使用随机梯度下降算法进行优化求解,
Figure BDA00032264528900001010
Figure BDA00032264528900001011
式(7)和式(8)为随机梯度下降算法中对应的向量梯度;
所述关注度计算模块利用改进后的OLA-srec模型通过图嵌入模块生成的特征向量来得到生成用户间关注度,具体包括:
通过改进后的OLA-srec模型计算出用户对每个好友的关注度,该算法的计算步骤为:
βiu=L/C·d(Uu,Ui) (9)
Figure BDA0003226452890000111
Figure 3
其中βiu为中间变量,L为利普斯顿常数,Uu,Ui为用户u和i的特征向量, C为经验参数,k为用户的好友总数,αiu为用户i对朋友u的关注度,d(Uu,Ui) 为用户i和用户u之间的欧式距离,λ也为中间变量,此外,L/C的比值可定义为LC率,用于计算中间变量βiu
首先根据步骤S3.2所得的用户的特征向量来计算用户与其朋友之间的欧式距离,再根据(9)式计算中间参数βiu,并且以80-120作为t/C的可选范围,在实验中,再初始化λ和α为1/|F(i)|,其中|F(i)|为用户实际的好友数,再依据(10) 式和(11)式依此迭代来更新λ和α,其中,循环条件为λk>βi,k+1和k≤|F(i)|;最终,当循环结束后,可得到的α为用户之间的相关系数矩阵。
所述最优好友数量计算及关注度排序模块依据关注度计算模块生成的用户的好友关注度,对用户好友进行降序排序,再以关注度正负来计算用户的最优好友数,具体包括:
根据S4计算所得的用户的关注度结果,以关注度的大小对用户好友的重要程度递减进行排序,同时将关注度大于等于0的人数作为当前用户的最优好友数。
所述的预处理模块、网络构建模块、图嵌入模块、关注度计算模块、最优好友数量计算及关注度排序模块按先后顺序依次连接。
如上所述为本发明以Yelp数据集为例,此数据集为人们对所在城市的相应餐馆的评分,并存在好友属性特征。因此再进行预处理之后,依据深度随机游走, LBSN算法和图嵌入模型与社交网络模型计算出用户间的关注度,并依此进行排序,得到了人员间的排序。并依据此排序结果,结合了social-rec模型,给出用户的推荐。如图4所示,在比较了其余的两个推荐模型后,可以看出,改进后的方法,其效果有所提升。
本发明可以从数据集中提取用户的有效朋友和用户对相应朋友的关注度,可结合多种社会化推荐模型并提升相应的推荐效果,同时提升了模型整体的鲁棒性和不同数据集的适应性
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (7)

1.基于复杂网络图嵌入的好友关注度度量排序方法,其特征在于:包括以下步骤:
S1:获取一种带有评分机制的数据集并清洗该数据集;
S2:通过用户间的社交关系以及用户自身的历史记录,以用户及其评价行为作为节点、用户间的好友关系作为连边,构建出超图网络;
S3:基于LBSN2vec算法生成用户特征向量与物品特征向量;
S4:通过改进后的OLA-srec模型计算出对每个好友的关注度;
S5:根据用户对每个好友的关注度大小,对用户好友进行排序,同时由关注度的正负来计算相应用户的最优好友数量。
2.如权利要求1所述的基于复杂网络图嵌入的好友关注度度量排序方法,其特征在于:所述步骤S1包括:对获取的数据集文件进行清洗操作,使用交叉筛选技术来删除朋友数量过少的冷启动用户和朋友数量过多的名人用户,具体操作为:首先删除当前不满足条件的用户;接着检查是否出现不满足条件的用户,再删除新出现的不满足条件的用户;反复迭代,直至不再出现不满足条件的用户。
3.如权利要求1所述的基于复杂网络图嵌入的好友关注度度量排序方法,其特征在于:所述步骤S2包括:
首先根据用户的好友关系作为连边来构建用户的社交网络,网络中的每个节点代表用户,然后在用户节点的基础上插入用户的行为历史记录节点,形成与相应的用户节点形成一种超图边;其中超图边上的用户行为历史记录节点对应用户曾经的某个具体行为。
4.如权利要求1所述的基于复杂网络图嵌入的好友关注度度量排序方法,其特征在于:所述步骤S3包括:
S3.1:基于一种即走即停的随机游走采样算法,采样相应数量的超边,在用户的好友边上执行经典随机游走算法,与此同时从对应的用户行为超边上采样行为历史节点,其中,用户的好友边是指当前用户与其存在交互的用户节点所构成的连边,用户行为边是指当前用户与其相应的行为节点所构成的连边,此外,使用可调参数α控制每种类型边的比例,由此得到超边样本训练集,
Es=2W (1)
Efr=2Wα (2)
Efi=2W(1-α) (3)
其中Es是所有边的数量,Efr为朋友边的数量,Efi为用户行为边的数量,W为滑动窗口的长度;
S3.2:在步骤S3.1得到的超边训练集上使用LBSN图嵌入和梯度下降算法得到用户特征向量和行为特征向量,在余弦坐标系下,通过最小化超图节点与最佳拟合向量之间的误差来保持n个节点的接近性,(4)式为优化目标函数,
Figure FDA0003226452880000021
Figure FDA0003226452880000022
其中
Figure FDA0003226452880000023
是当前的用户节点向量,
Figure FDA0003226452880000024
为最佳拟合向量,Θ为当前的优化目标;
此外,使用了负采样技术,即加入负样本节点和拟合直线之间的最大余弦值,因此在采集到的n个节点
Figure FDA0003226452880000025
的优化函数更正如下:
Figure FDA0003226452880000026
其中γ表示负样本数,
Figure FDA0003226452880000027
Figure FDA0003226452880000028
的期望,
Figure FDA0003226452880000029
为负采样得到的节点向量,之后,再对式(6)的目标函数使用随机梯度下降算法进行优化求解,
Figure FDA00032264528800000210
Figure FDA00032264528800000211
式(7)和式(8)为随机梯度下降算法中对应的向量梯度。
5.如权利要求1所述的基于复杂网络图嵌入的好友关注度度量排序方法,其特征在于:步骤S4所述的通过改进后的OLA-srec模型计算出用户对每个好友的关注度的计算步骤为:
βiu=L/C·d(Uu,Ui) (9)
Figure FDA0003226452880000031
Figure 1
其中βiu为中间变量,L为利普斯顿常数,Uu,Ui为用户u和i的特征向量,C为经验参数,k为用户的好友总数,αiu为用户i对朋友u的关注度,d(Uu,Ui)为用户i和用户u之间的欧式距离,λ也为中间变量,此外,L/C的比值可定义为LC率;
首先根据步骤S3.2所得的用户的特征向量来计算用户与其朋友之间的欧式距离,再根据(9)式计算中间参数βiu,并且以80-120作为L/C的可选范围,再初始化λ和α为1/|F(i)|,其中|F(i)|为用户实际的好友数,再依据(10)式和(11)式依此迭代来更新λ和α,其中,循环条件为λk>βi,k+1和k≤|F(i)|;最终,当循环结束后,可得到的α为用户之间的相关系数矩阵。
6.如权利要求1所述的基于复杂网络图嵌入的好友关注度度量排序方法,其特征在于:所述步骤S5包括:
根据S4步骤计算所得的用户的关注度结果,以关注度的大小对用户好友的重要程度递减进行排序,同时将关注度大于等于0的人数作为当前用户的最优好友数。
7.实现权利要求1所述的基于复杂网络图嵌入的好友关注度度量排序系统,包括:预处理模块、网络构建模块、图嵌入模块、关注度计算模块、最优好友数量计算及关注度排序模块;
所述预处理模块对获取的数据集文件进行清洗操作,即使用交叉筛选的技术删去数据集中朋友数量的过多或过少的两种极端用户;
所述网络构建模块是首先以用户节点的好友关系作为连边构成用户的社交网络,再使用户节点与该用户的行为节点相连作为表示用户行为的超图边;
所述图嵌入模块利用随机游走等算法采样模型所需的超边,即采用随机游走停留方法来采样相应数量的超边,在用户的好友边和相应用户的行为超边上分布执行经典随机游走算法和负采样提取算法来获得超边集,再在所得的超边集上使用LBSN图嵌入和梯度下降算法来得到用户特征向量和物品特征向量;
所述关注度计算模块利用改进后的OLA-srec模型通过图嵌入模块生成的特征向量来得到生成用户间关注度;
所述最优好友数量计算及关注度排序模块依据关注度计算模块生成的用户的好友关注度,对用户好友进行降序排序,再将关注度正负来计算用户的最优好友数;
所述的预处理模块、网络构建模块、图嵌入模块、关注度计算模块、最优好友数量计算及关注度排序模块按先后顺序依次连接。
CN202110972650.2A 2021-08-24 2021-08-24 基于复杂网络图嵌入的好友关注度度量排序方法及系统 Pending CN113779385A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110972650.2A CN113779385A (zh) 2021-08-24 2021-08-24 基于复杂网络图嵌入的好友关注度度量排序方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110972650.2A CN113779385A (zh) 2021-08-24 2021-08-24 基于复杂网络图嵌入的好友关注度度量排序方法及系统

Publications (1)

Publication Number Publication Date
CN113779385A true CN113779385A (zh) 2021-12-10

Family

ID=78838696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110972650.2A Pending CN113779385A (zh) 2021-08-24 2021-08-24 基于复杂网络图嵌入的好友关注度度量排序方法及系统

Country Status (1)

Country Link
CN (1) CN113779385A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115223271A (zh) * 2022-06-28 2022-10-21 东软睿驰汽车技术(沈阳)有限公司 车辆剩余信息误差的关注度获得方法及相关装置
CN116775988A (zh) * 2023-05-17 2023-09-19 广州大学 基于超图嵌入的poi推荐方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100514A (zh) * 2020-08-31 2020-12-18 浙江工业大学 一种基于全局注意力机制表征学习的社交网络服务平台好友推荐方法
CN112100332A (zh) * 2020-09-14 2020-12-18 腾讯科技(深圳)有限公司 词嵌入表示学习方法及装置、文本召回方法及装置
CN112132326A (zh) * 2020-08-31 2020-12-25 浙江工业大学 一种基于随机游走度惩罚机制的社交网络好友预测方法
CN112270570A (zh) * 2020-11-03 2021-01-26 重庆邮电大学 一种基于特征组合与表示学习的点击转化率预测方法
CN112989064A (zh) * 2021-03-16 2021-06-18 重庆理工大学 一种聚合知识图神经网络和自适应注意力的推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100514A (zh) * 2020-08-31 2020-12-18 浙江工业大学 一种基于全局注意力机制表征学习的社交网络服务平台好友推荐方法
CN112132326A (zh) * 2020-08-31 2020-12-25 浙江工业大学 一种基于随机游走度惩罚机制的社交网络好友预测方法
CN112100332A (zh) * 2020-09-14 2020-12-18 腾讯科技(深圳)有限公司 词嵌入表示学习方法及装置、文本召回方法及装置
CN112270570A (zh) * 2020-11-03 2021-01-26 重庆邮电大学 一种基于特征组合与表示学习的点击转化率预测方法
CN112989064A (zh) * 2021-03-16 2021-06-18 重庆理工大学 一种聚合知识图神经网络和自适应注意力的推荐方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115223271A (zh) * 2022-06-28 2022-10-21 东软睿驰汽车技术(沈阳)有限公司 车辆剩余信息误差的关注度获得方法及相关装置
CN115223271B (zh) * 2022-06-28 2024-05-07 东软睿驰汽车技术(沈阳)有限公司 车辆剩余信息误差的关注度获得方法及相关装置
CN116775988A (zh) * 2023-05-17 2023-09-19 广州大学 基于超图嵌入的poi推荐方法及装置

Similar Documents

Publication Publication Date Title
CN108875916B (zh) 一种基于gru神经网络的广告点击率预测方法
CN111159425A (zh) 一种基于历史关系和双图卷积网络的时态知识图谱表示方法
CN100367300C (zh) 一种基于人工神经网络的特征选择方法
CN111506835B (zh) 一种融合用户时间特征和个性特征的数据特征提取方法
CN106649658B (zh) 针对用户角色无差异对待和数据稀疏的推荐系统及方法
CN112001422B (zh) 一种基于深度贝叶斯学习的图像标记估计方法
CN113779385A (zh) 基于复杂网络图嵌入的好友关注度度量排序方法及系统
CN113807422B (zh) 融合多特征信息的加权图卷积神经网络评分预测模型
CN109471982B (zh) 一种基于用户和服务聚类QoS感知的Web服务推荐方法
CN115270007B (zh) 一种基于混合图神经网络的poi推荐方法及系统
CN105024886B (zh) 一种基于用户元数据的快速Web服务QoS预测方法
CN109741301A (zh) 一种更快的基于深度学习的密集目标计数方法
CN108228684A (zh) 聚类模型的训练方法、装置、电子设备和计算机存储介质
CN109411093A (zh) 一种基于云计算的智慧医疗大数据分析处理方法
CN111488498A (zh) 基于图神经网络的“节点-图”跨层图匹配方法及系统
CN114625969A (zh) 一种基于交互近邻会话的推荐方法
CN115051929A (zh) 基于自监督目标感知神经网络的网络故障预测方法及装置
CN111259264A (zh) 一种基于生成对抗网络的时序评分预测方法
CN113111256A (zh) 基于深度知识图谱的生产工单推荐方法
CN117194742A (zh) 一种工业软件组件推荐方法及系统
CN117194765A (zh) 一种兴趣感知的双通道图对比学习会话推荐方法
CN110070120B (zh) 基于判别采样策略的深度度量学习方法及系统
CN116208399A (zh) 一种基于元图的网络恶意行为检测方法及设备
CN113868597B (zh) 一种用于年龄估计的回归公平性度量方法
CN114021011A (zh) 一种基于自注意力机制的下一个兴趣点推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination