CN112507246B - 一种融合全局和局部社会兴趣影响的社会推荐方法 - Google Patents

一种融合全局和局部社会兴趣影响的社会推荐方法 Download PDF

Info

Publication number
CN112507246B
CN112507246B CN202011466134.4A CN202011466134A CN112507246B CN 112507246 B CN112507246 B CN 112507246B CN 202011466134 A CN202011466134 A CN 202011466134A CN 112507246 B CN112507246 B CN 112507246B
Authority
CN
China
Prior art keywords
user
layer
embedding
interest
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011466134.4A
Other languages
English (en)
Other versions
CN112507246A (zh
Inventor
宋长皓
王博
蒋沁学
陈根华
黄博帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202011466134.4A priority Critical patent/CN112507246B/zh
Publication of CN112507246A publication Critical patent/CN112507246A/zh
Application granted granted Critical
Publication of CN112507246B publication Critical patent/CN112507246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种融合全局和局部社会兴趣影响的社会推荐方法,包括数据解析模块、模型训练模块和预测分析模块;数据解析模块用于解析蕴含在文本和图片中的用户及物品相关属性向量;模型训练模块用于构建获取社交网络和兴趣网络中节点嵌入向量的模型;模型训练模块包括嵌入层、融合层和影响兴趣扩散层;通过数据解析模块中获取的用户和物品的侧面信息作为内容特性,结合嵌入层随机初始化的用户和物品的自由嵌入,融合层将内容特性和自由嵌入融合在一起;在影响兴趣扩散层内设置有一个具有若干层次的注意力结构,能够有效地扩散更高层次的社会和兴趣网络;预测分析模块,在扩散过程达到稳定后,输出层预测每个未观察到的用户对物品的偏好得分。

Description

一种融合全局和局部社会兴趣影响的社会推荐方法
技术领域
本发明属于推荐领域中的数据挖掘、拓扑结构分析方向,特别是涉及一种融合全局和局部社会兴趣影响的社会推荐方法。
背景技术
如今检索的信息量越来越大。然而,用户很难选择他们想要的有价值的资源。真正需要的是能够帮助找到感兴趣资源的新技术。其中最成功的技术之一是推荐系统,一种个性化信息过滤技术,用于预测某个用户是否会喜欢某个特定的物品(预测问题)或识别某个用户感兴趣的N个物品集合(Top-N推荐问题)[1]
推荐系统的模型大概可以分成三类,基于内容的推荐,协同过滤和混合推荐[2]。其中协同过滤(Collaborative Filtering)[3]算法是推荐算法中最为流行的算法,基本思想是通过用户和物品的历史选择信息找到相似的用户或者相似的物品进行推荐。基于内容的推荐[4,5,6]主要基于用户和物品的辅助信息进行比较,辅助信息有许多种类,如文本、图像和视频等[7,8]都可以用作辅助信息。混合模型指将两种或两种以上的推荐算法相结合的推荐系统[9,10]
利用社会关系和用户画像建立推荐系统是近年来备受关注的问题[11,12,13]。这些社交推荐系统的开发是基于这样一种现象,即用户通常通过周围的人,如同学、朋友或同事来获取和传播信息,这意味着用户潜在的社会关系可以在帮助他们过滤信息[14]方面发挥重要作用。因此,社会关系已被证明有助于提高推荐效果[15,16]。在一系列关于社会推荐的研究任务中,核心任务是通过用户的社会关系辅助得到用户和物品的潜在特征表示。如今推荐系统技术发展迅速,主要有两种不同的表示技术。
第一种主要是矩阵分解技术[17,18],传统的矩阵分解技术通过学习用户和物品的向量表示来预测用户的评分,如概率矩阵分解(PMF)[19]等。SoRec[20]通过引入因子向量来学习用户社会关系矩阵,SocialMF[21]认为用户的向量表示受用户的朋友影响,SocReg[22]将用户和朋友的相似度形式化为正则项约束,STE[23]将用户的个人品味和朋友品味结合在一起,进一步还有工作将用户的隐式兴趣[24]、消费矩阵[25]等结合,在工业界和学术界都起到了很好的效果。
第二种方法主要是受到深度学习在自然语言处理、语音识别以及图像等领域的发展,基于深度学习从用户的历史选择信息或者用户和物品的辅助信息或者两者结合进行特征抽取进而学习得到用户和物品的潜在特征表示。在最近的工作中,Xin Wang等[26]提出通过Attention机制来获取用户对不同朋友的注意力权重大小,Chong Chen等[27]在Attention模型的基础上,同时建模了用户对朋友的注意力和朋友对用户的影响力大小,Wenqi Fan等[28]将生成对抗网络引入推荐系统中,通过判别器和生成器共同学习用户-物品表示和用户-用户社会关系,由于图神经网络(GNN)[29]具有强大的图数据学习能力,Wenqi Fan等[30]通过GNN来捕获异质性网络中的丰富信息来提高推荐准确率。
本发明通过将不同类型的属性嵌入到统一空间中,融合来自不同嵌入向量的影响来预测用户购买物品的概率。这种预测与相似性的联系的想法与社会学中的同质性理论密切相关。为了解释社会网络中个体之间的相似性,同质性理论提出了两个原则:选择和影响。选择原则通过假设人与其他人相似来解释社会联系的相似性,并且影响原则假设相似性源于人们随着时间的推移变得更加与他们的朋友相似的事实。与影响原则相比,选择原则更直观,人们倾向于选择在结构或语义属性上与自己相似的朋友。
但是,影响力在建立社会联系方面也起着重要作用。社会学中的同质性理论表明人们在现有关系上相互影响。通过这种方式,一个人的邻居的将影响一个人的新朋友的选择。心理学研究也支持影响和选择在人们选择行为中的共同作用。在心理学中,影响和选择的区别可以理解为两种动机:内在动机和外在动机,它们共同驱动选择行为。内在动机是由人的内在兴趣决定的,外在动机来自于外在的影响。
为将邻居的影响作用引入推荐任务。目前的主要挑战有:
(1)社交网络的实际情况是复杂的,用户之间的影响可能并不仅仅是单方面影响,而更有可能是互相影响,有些情况下双方之间的影响力也是不同的。影响在社交网络之间也是可以传播扩散的,而目前对社交网络的研究都没有完全模拟出真实情况。
(2)协同过滤的思想是相同的用户可能具有相似的爱好,但在实际情况中具有相似爱好的人们不一定相同,可能会有多种因素影响用户的选择;具有显示关系的社会推荐依赖于人们社交网络中的各种社会关系,但在实际推荐场景中获取人们之间社会关系的必要性和难度都是个值得考虑的问题。因此在显式关系和隐式关系间的选择也是值得考虑的问题。
[参考文献]
[1]Bigdeli,E.,and Bahmani,Z.Comparing accuracy of cosine-basedsimilarity and correlation-based similarity algorithms in tourism recommendersystems.In Management of Innovation and Technology,2008.ICMIT 2008.4th IEEEInternational Conference on(21-24 2008),pp.469-474.
[2]Zhang S,Yao L,Sun A,et al.Deep Learning based Recommender System:ASurvey and New Perspectives[J].2017.
[3]R.Salakhutdinov,A.Mnih,and G.Hinton.Restricted Boltzmann machinesfor collaborative filtering.In ICML,2007.
[4]S.Li,J.Kawale,and Y.Fu.Deep collaborative filtering viamarginalized denoising auto-encoder.In Proceedings of the 24th ACMInternational on Conference on Information and Knowledge Management,CIKM’15,pages 811–820,New York,NY,USA,2015.ACM.
[5]J.McAuley and J.Leskovec.Hidden factors and hidden topics:Understanding rating dimensions with review text.In Proceedings of the 7thACM Conference on Recommender Systems,RecSys’13,pages 165–172,New York,NY,USA,2013.ACM.
[6]C.Wang and D.M.Blei.Collaborative topic modeling for recommendingscientific articles.In Proceedings of the 17th ACM SIGKDD InternationalConference on Knowledge Discovery and Data Mining,KDD’11,pages 448–456.ACMPress,August 2011.
[7]Lang K.NewsWeeder:Learning to Filter Netnews[J].Machine LearningProceedings 1995,1995:331-339.
[8]Rendle S,Freudenthaler C,Gantner Z,et al.BPR:Bayesian personalizedranking from implicit feedback[J].2012:452-461.
[9]Robin Burke.Hybrid Recommender Systems:Survey and Experiments[J].User Modeling and User-Adapted Interaction,2002,12(4):331-370.
[10]Burke R.Recommender Systems:An Introduction,by Dietmar Jannach,Markus Zanker,Alexander Felfernig,and Gerhard Friedrich[J].InternationalJournal of Humana computer Interaction,2012,28(1):72-73.
[11]Hao Ma,Dengyong Zhou,Chao Liu,Michael R Lyu,and IrwinKing.2011.Recommender systems with social regularization.In Proceedings ofthe fourth ACM international conference on Web Search and Data Mining.ACM,287–296.
[12]Jiliang Tang,Xia Hu,Huiji Gao,and Huan Liu.2013.Exploiting localand global social context for recommendation..In IJCAI,Vol.13.2712–2718.
[13]Jiliang Tang,Suhang Wang,Xia Hu,Dawei Yin,Yingzhou Bi,Yi Chang,and Huan Liu.2016.Recommendation with Social Dimensions.In AAAI.251–257.
[14]Paul Resnick and Hal R Varian.1997.Recommender systems.Commun.ACM40,3(1997),56–58.
[15]Wenqi Fan,Qing Li,and Min Cheng.2018.Deep Modeling of SocialRelations for Recommendation.In AAAI.
[16]Jiliang Tang,Xia Hu,and Huan Liu.2013.Social recommendation:areview.Social Network Analysis and Mining 3,4(2013),1113–1133.
[17]Lee,D.D.,and Seung,H.S.2001.Algorithms for non-negative matrixfactorization.In Advances in neural information processing systems,556–562.
[18]Srebro,N.;Rennie,J.;and Jaakkola,T.S.2004.Maximum margin matrixfactorization.In Advances in neural information processing systems,1329–1336.
[19]A.Mnih and R.R.Salakhutdinov,“Probabilistic matrixfactorization,”in Proc.of NIPS,2008,pp.1257–1264.
[20]Ma,H.,Yang,H.,Lyu,M.R.,King,I.(2008).SoRec:Social recommendationusing probabilistic matrix factorization.In Proceeding of the 17th ACMConference on Information Knowledge Management vol.08(pp.0–9).
[21]Jamali,M.(2010).A Matrix Factorization Technique with TrustPropagation for Recommendation in Social Networks Categories and SubjectDescriptors.In The fourth ACM conference on Recommender systems(pp.135–142).no.978–1–60558–906–0
[22]H.Ma,D.Zhou,C.Liu,M.R.Lyu,and I.King,“Recommender systems withsocial regularization,”in Proc.ACM WSDM,2011,pp.287–296
[23]Ma,H.,King,I.,Lyu,M.R.(2011).Learning to Recommend with SocialTrust Ensemble.In SIGIR’09 Proceedings of the 32nd International ACM SIGIRConference(pp.203–210).
[24]Yu-sheng,L.I.,Mei-na,S.,Jun-de,S.(2014).Social recommendationalgorithm fusing user interest social network.The Journal of ChinaUniversities of Posts and Telecommunications,21,26–33.
[25]Zhang,Z.,&Liu,H.(2015).Social recommendation model combiningtrust propagation and sequential behaviors.Applied Intelligence,43(3),695–706
[26]Xin Wang,Wenwu Zhu,Chenghao Liu.2019.Social Recommendation withOptimal Limited Attention.In The 25th ACM SIGKDD Conference on KnowledgeDiscovery and Data Mining(KDD'19)
[27]Chong Chen,Min Zhang,Yiqun Liu,and Shaoping Ma.2019.SocialAttentional Memory Network:Modeling Aspect and Friend-level Differences inRecommendation.In The eleventh ACM International Conference on Web Search andData Mining.
[28]Fan,W.,Derr,T.,Ma,Y.,et al.(2019)Deep Adversarial SocialRecommendation.Proceedings of the 28th International Joint Conference onArtificial Intelligence Main Track,Macau,1351-1357.
[29]
Figure BDA0002832800020000051
Defferrard,Xavier Bresson,and Pierre Vandergheynst.2016.Convolutional neural networks on graphs with fast localized spectralfiltering.In Advances in Neural Information Processing Systems.3844–3852.
[30]Wenqi Fan,Yao Ma,Qing Li,Yuan He,Eric Zhao,Jiliang Tang,and DaweiYin.2019.Graph Neural Networks for Social Recommendation.In The World WideWeb Conference.ACM,417–426.
发明内容
本发明的目的是为了克服现有技术中的不足,提供一种融合全局和局部社会兴趣影响的社会推荐方法。
本发明的目的是通过以下技术方案实现的:
一种融合全局和局部社会兴趣影响的社会推荐方法,包括数据解析模块、模型训练模块和预测分析模块;
所述数据解析模块用于解析蕴含在文本和图片中的用户及物品相关属性向量;由于丰富的评论信息与用户和物品关联,通过gensim工具学习每个单词在word2vec模型中的嵌入表示;然后对每个用户和物品学习到的单词向量进行平均,得到每个用户和物品的特征向量;对于图片,将图片发送给VGG16卷积神经网络,并将VGG16中最后一个连接层的4096维作为图像的特征表示;对于每个用户的特征表示是指用户在训练数据中喜欢的图像特征表示的平均值;而后将解析出来的数据作为用户和物品的侧面信息输入到模型训练模块中;
所述模型训练模块用于构建获取社交网络和兴趣网络中节点嵌入向量的模型;模型训练模块包括嵌入层、融合层和影响兴趣扩散层;具体来说,通过数据解析模块中获取的用户和物品的侧面信息作为内容特性,结合嵌入层随机初始化的用户和物品的自由嵌入,融合层将内容特性和自由嵌入融合在一起;在影响兴趣扩散层内设置有一个具有若干层次的注意力结构,能够有效地扩散更高层次的社会和兴趣网络;
所述预测分析模块,在扩散过程达到稳定后,输出层预测每个未观察到的用户对物品的偏好得分。
与现有技术相比,本发明的技术方案所带来的有益效果是:
(1)利用观察到的邻居关系和用户和物品的文本和图片属性,本发明为每个用户和物品训练一个具有他/她邻居社会与兴趣影响的联合嵌入向量。通过文本和图片中丰富的侧面信息,用户和物品的特征能够得到更好的学习。
(2)本发明不是使用邻居的恒定影响分数,而是模拟每个邻居对该用户的特殊影响。为此我们学习了节点级注意力机制和图级注意力机制。节点级注意力机制用来区分用户的每个邻居对用户的不同影响,图注意力机制用来区分社交网络和兴趣网络对用户产生的不同影响。
(3)本发明模拟了网络嵌入训练中邻居的显式和隐式影响。显式影响被建模在多个级别上,能更充分地建模用户对用户和用户对物品之间的影响关系;隐式影响通过探索未知关系带来的影响来提高推荐的精准度和鲁棒性。具体来说,我们通过流行度建模了物品对用户的全局影响力,结合局部影响力能显著的提高模型效果。最后,对于在评分矩阵中未评分的任何一对用户和物品,本发明通过计算它们的嵌入向量之间的内积来预测用户对物品的评分。
附图说明
图1是融合全局和局部社会兴趣影响的社会推荐方法示例图。
图2是融合全局和局部社会兴趣影响的社会推荐方法整体框架图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,用户在两种行为网络中起着核心作用:用户-用户社交网络和用户-物品兴趣网络。一方面,用户自然地形成一个全局递归的社交扩散过程的社交图。每个用户不仅受到直接的社会邻居的影响,还受到以自我为中心的高阶社会网络结构的影响。例如,虽然用户u1与u5不直接相连,但是在社交推荐过程中u1可能会受到u5的很大影响,因为有两条二级路径:u1→u2→u5和u1→u4→u5。在推荐过程中,简单地将社会网络结构简化为一阶社会邻居并不能很好地捕捉到这些高阶社会影响效应。另一方面,基于相似用户对相似物品感兴趣的假设,每个用户潜在的兴趣不仅体现在其所评分的物品上,还受到相似用户对物品的兴趣的影响。例如,虽然用户u1没有通过直接的边连接显示对物品v3的兴趣,但是相似的用户u2(因为他们与物品v1有共同的兴趣)对物品v3的项目兴趣显示为:u1→v1→u2→v3,因此v3对于学习u1的表示也很有用。综上所述,考虑用户和物品的高阶结构是具有研究意义的。
本发明中提供了一种融合全局和局部社会兴趣影响的社会推荐方法。即基于网络嵌入的方法来进行评分矩阵预测,每个用户的每个用户邻居具有多重社会关系影响,每个用户的每个物品邻居也具有多重兴趣影响。图2展示了本发明的整体结构,主要包括数据解析模块、模型训练模块、预测分析模块三个部分。
在社会推荐中,有两个实体集合,用户集U(|U|=M)和物品集V(|V|=N),用户在社交平台上会有两种行为:与其他用户建立社交联系和展示物品兴趣。这两种行为可以定义为两个矩阵:一个社会关系矩阵
Figure BDA0002832800020000071
和用户兴趣矩阵
Figure BDA0002832800020000072
在社会关系矩阵S中,若用户a信任或追随用户b,则sba=1,否则为0.使用Sa=[b|sba=1]代表用户a的信任集合。在用户兴趣矩阵R中,rai=1代表用户a对物品i感兴趣,即隐式反馈,否则为0.使用Ra=[i|rai=1]代表用户a消费过的物品集合,Ri=[a|ria=1]代表消费过物品i的用户集合。
用户的两类行为构建成两种图,用户的社会网络被定义为一个有向图GS=<U,S>,U代表了社会网络中所有的用户结点,若用无向图表示,则用户a和b的关系是双向的,即sab=1Λsba=1.用户兴趣网络被定义为一个无向二部图网络GI=<U∪V,R>.
此外,每个用户a都与一个实值属性有关(如用户画像),在用户特征矩阵
Figure BDA0002832800020000073
中记为xa.同理每个物品i也都与有自己的属性向量(如文本表示、可视化表示),在物品属性矩阵
Figure BDA0002832800020000074
中记为yi.最终将基于图的社会推荐问题形式化为:
给定用户社交网络GS和兴趣网络GI,可以形式化成一个异质性网络G=GS∪GI=<U∪V,X,Y,R,S>.因此,基于图的社会推荐问题转化为给定图G,目标是预测用户对物品的未知偏好:
Figure BDA0002832800020000077
其中
Figure BDA0002832800020000076
代表用户对物品的预测偏好。
1数据解析模块
数据解析模块用于解析蕴含在文本和图片中的用户及物品相关属性向量。具体来说,由于丰富的评论信息与用户和物品关联,本发明通过流行的gensim工具来学习每个单词在word2vec模型中的嵌入表示。然后对每个用户和物品学习到的单词向量进行平均,得到每个用户和物品的特征向量。对于图片来说,将图片发送给VGG16卷积神经网络,并将VGG16中最后一个连接层的4096维作为图像的特征表示。对于每个用户,他的特征表示是她在训练数据中喜欢的图像特征表示的平均值。而后将解析出来的数据作为用户和物品的侧面信息输入到模型训练模块中。
2模型训练模块
2.1嵌入层
通过相应的自由向量表示对用户和物品进行编码。设
Figure BDA0002832800020000075
分别代表用户和物品的D维自由潜在嵌入矩阵,给定用户a的一个one-hot表示,嵌入层可以执行索引操作选择出用户a的自由潜在嵌入向量pa,同理给定物品i的一个one-hot表示,也可以选择出物品i的自由潜在嵌入向量qi,分别对应矩阵中的某一行转置。
2.2融合层
对于每个用户a,融合层将其自由潜在嵌入向量pa和相关特征向量xa作为输入,输出融合后的向量
Figure BDA0002832800020000081
作为用户的初始兴趣向量,从不同类型数据中捕获了用户的兴趣。融合层可建模为
Figure BDA0002832800020000082
其中W1为转换矩阵,g(x)为转换函数。为了避免混淆省略了偏差项。该融合层可以泛化为许多种类的融合操作,如拼接操作
Figure BDA0002832800020000083
将W1设置成单位矩阵,g(x)设置为恒等函数即可。
类似的,对于每个物品i,融合层将其自由潜在嵌入向量qi和相关特征向量yi融合在一起,物品的初始兴趣向量
Figure BDA0002832800020000084
最终可建模为
Figure BDA0002832800020000085
2.3影响和兴趣扩散层
通过输入用户和物品的初始潜在向量,递归地对用户的潜在偏好和物品的潜在偏好在图G中动态的传播进行分层卷积建模。具体来说,在k+1层时,将第k层的用户a的嵌入向量
Figure BDA0002832800020000086
和物品i嵌入向量
Figure BDA0002832800020000087
作为输入,这些层递归的输出传播更新后的嵌入向量
Figure BDA0002832800020000088
Figure BDA0002832800020000089
这个迭代步骤从k=0开始当递归达到一个预定义的深度k时结束。
对于每个物品i,给定第k层嵌入
Figure BDA00028328000200000810
第k+1层的更新嵌入
Figure BDA00028328000200000811
可建模为
Figure BDA00028328000200000812
Figure BDA00028328000200000813
其中Ri=[a|ria=1]代表所有评价过物品i的用户集合。
Figure BDA00028328000200000814
是用户a的第k层嵌入向量。
Figure BDA00028328000200000815
是物品i从用户兴趣图GI中聚合邻居用户嵌入的结果。
Figure BDA00028328000200000816
代表聚合权重。因此,每个物品的下一层更新嵌入表示为融合了聚合邻居的嵌入和物品自身在当前层的嵌入。在融合方法上尝试了加法和拼接,选择了效果比较好的加法作为融合方式。
因为不同用户对物品的兴趣权重不同,因此本发明利用注意力网络来学习对应的权重,聚合权重
Figure BDA00028328000200000817
可建模为
Figure BDA00028328000200000818
其中,使用多层感知器(MLP)学习与第k层相关的用户和物品嵌入的节点注意力权重。之后,将聚合权重标准化
Figure BDA00028328000200000819
使用指数函数来确保每个注意力权重大于0。
对于每个用户a,令
Figure BDA0002832800020000091
代表他的第k层潜在向量。由于用户在社交网络GS和兴趣网络GI中都扮演着核心角色,因此用户的第k+1层更新向量受两方面影响:社交网络影响和兴趣网络影响。令
Figure BDA0002832800020000092
代表在第k+1层社会邻居的影响聚合嵌入,
Figure BDA0002832800020000093
代表在第k+1层感兴趣的物品邻居影响聚合嵌入。因此每个用户的更新嵌入
Figure BDA0002832800020000094
可建模为
Figure BDA0002832800020000095
Figure BDA0002832800020000096
在建模物品邻居影响聚合嵌入时,考虑将群体层面的宏观影响加入模型中。具体体现在每个物品本身具有流行度,流行度会对用户产生固有影响。物品i的流行度可以通过与物品i交互过的用户数量来量化,即集合Ri。则每个物品的流行度指数popi可建模为
Figure BDA0002832800020000097
其中|Ri|代表集合Ri中的元素个数,这里使用的是物品i的流行度与总流行度的比值来建模,为了防止有流行度为0的物品采用了平滑操作。
在获得所有物品的流行度指数后,为了个性化流行物品对特定用户的影响,在每一层影响迭代后计算当前用户向量与物品的相似度。直观的计算方式是选用余弦相似度,则不同物品对当前用户的流行度影响权重
Figure BDA0002832800020000098
可建模为
Figure BDA0002832800020000099
在最终迭代用户兴趣时,将兴趣网络扩散的结果与宏观影响结果融合在一起,通过参数λ权衡两者的比例,最终物品邻居影响聚合嵌入
Figure BDA00028328000200000910
可建模为
Figure BDA00028328000200000911
其中用户兴趣网络只聚合了与用户有交互的物品影响,宏观影响聚合了全部物品对用户的影响。
因此,每个用户的下一层更新嵌入表示为融合了他的邻居聚合影响嵌入
Figure BDA00028328000200000912
兴趣聚合影响嵌入
Figure BDA00028328000200000913
和他自身在当前层的嵌入。其中,
Figure BDA00028328000200000914
代表了用户b对用户a在社交网络中第k+1层的影响权重,
Figure BDA00028328000200000915
代表了物品i对用户a在兴趣网络中第k+1层的影响权重。
事实上,
Figure BDA00028328000200000916
Figure BDA00028328000200000917
三组权重自然呈现出一个两层的多层次结构。具体来说,社会影响强度和兴趣强度可以被视为节点级权重,该权重建模每个用户如何平衡每个图中的不同相邻节点。
Figure BDA00028328000200000918
为学习融合来自不同图的信息的图级权重。具体地说,图级权重非常重要,因为它们模拟了每个用户如何平衡社会影响和历史记录,以便进行用户嵌入。不同的用户会有所不同,有些用户更容易受到社交网络的影响,而另一些用户的兴趣是相当稳定的。因此,每个用户在图形注意层中的权重也需要进行个性化调整。
由于这三组权重代表了一个多层次的结构,因此使用一个多层次的注意网络来建模注意权重。具体来说,图注意力网络的设计是为了在更新用户a的不同图的嵌入(
Figure BDA0002832800020000101
Figure BDA0002832800020000102
)时,学习各个方面的贡献权重。设计节点注意力网络是为了分别学习每个社交图和每个兴趣图中的注意力权重。具体来说,社会影响权重
Figure BDA0002832800020000103
建模为
Figure BDA0002832800020000104
在上面的方程中,社会影响强度
Figure BDA0002832800020000105
需要相关的两个用户嵌入在第k层作为输入,将这些特征发送到MLP中,学习特征之间的复杂关系,进行社会影响力学习。为了避免混淆,省略了下面所有注意力建模的规范化步骤。
类似的,兴趣影响权重
Figure BDA0002832800020000106
以相关用户嵌入和物品嵌入作为输入
Figure BDA0002832800020000107
在获得两组节点级注意力权重后,输出的节点注意力权重被送入图注意力网络中,可以将图注意力权重建模为
Figure BDA0002832800020000108
Figure BDA0002832800020000109
在上式中,对于每个用户a,图的注意层权重不仅依赖于用户的嵌入
Figure BDA00028328000200001010
还依赖于从节点注意网络中学习得到的加权表示。令
Figure BDA00028328000200001011
使得学习的方面重要性得分是针对每个用户定制的,区分了影响扩散效应和兴趣扩散效应在用户嵌入更新过程中的重要性。
3预测分析模块
在扩散层迭代K轮后,可以得到在用户u和物品i在第k轮的嵌入集合
Figure BDA00028328000200001012
Figure BDA00028328000200001013
其中k=[0,1,2…K].因此对于每个用户a,他的最终嵌入向量可以表示为
Figure BDA00028328000200001014
即将他的每一层嵌入表示都拼接起来。类似的,每个物品i的最终嵌入向量表示为
Figure BDA00028328000200001015
Figure BDA00028328000200001016
最终预测的评分被建模为最终用户和物品嵌入之间的内积
Figure BDA00028328000200001017
具体的,本实施例在Yelp和Flickr两个真实数据集上进行实验。Yelp是一个著名的基于位置的在线社交网络,用户可以在这里与他人交朋友并评论餐馆。其中Yelp数据集是公开的。原始数据集包含用户之间的社交网络,以及用户对位置的评价值,范围从[1,5]。Flickr是一个基于图片的在线社交分享平台,用户可以根据自己的喜好分享图片。在本发明中使用的是抓取发布的社交图片推荐数据集,其中包含了社交网络结构和用户对图片的评价记录。
对于Yelp数据集,由于原始评分以详细的值呈现,将原始评分转换为二进制值。如果额定值大于3,将其转换为1,否则等于0。对于这两个数据集,过滤掉了少于2个评分记录和2个社交链接的用户,并删除了评分少于2次的条目。然后随机选取每个用户的5%的记录作为测试集,剩余数据的10%将被保留作为验证。之后,使用85%的原始数据进行训练。在表1中概述了这两个数据集的特征。
表1数据集信息统计
Figure BDA0002832800020000111
对于推荐结果的评价,本实施例使用了命中率(HR)和标准化折现累积增益(NDCG)两个广泛使用的指标。具体来说,HR衡量的是排名前n的热门项目所占的百分比,而NDCG则更注重排名最靠前的项目。由于本发明关注的是具有大项目集的推荐性能,为了评估性能,对于每个用户,随机选择1000个未被用户交互的未被评分的项目作为负样本。然后将这些伪负样本和相应的正样本(在测试集中)混合,以选择Top-N潜在的候选样本。为了减少这个过程中的不确定性,重复这个过程5次,并报告平均结果。
在Top-N推荐中,HR是一种常用的衡量召回率的指标,计算公式为:
Figure BDA0002832800020000112
分母是所有的测试集合,分子表示每个用户Top-N列表中属于测试集合的个数的总和。
推荐系统中CG表示将每个推荐结果相关性的分值累加后作为整个推荐列表的得分:
Figure BDA0002832800020000113
其中,reli表示位置i的推荐结果的相关性,k表示推荐列表的大小。
CG没有考虑每个推荐结果处于不同位置对整个推荐结果的影响,例如,总是希望相关性大大的结果排在前面,相关性低的排在前面会影响用户体验。
DCG在CG的基础上引入了位置影响因素,计算公式如下:
Figure BDA0002832800020000121
从上面的式子可以得出:1)推荐结果的相关性越大,DCG越大。2)相关性好的排在推荐列表前面的话,推荐效果越好,DCG越大。
DCG针对不同的推荐列表之间很难进行横向评估,而本发明评估一个推荐系统不可能仅使用一个用户的推荐列表及相应结果进行评估,而是对整个测试集中的用户及其推荐列表结果进行评估。那么,不同用户的推荐列表的评估分数就需要进行归一化,也就是NDCG。
IDCG表示推荐系统某一用户返回的最好推荐结果列表,即假设返回结果按照相关性排序,最相关的结果放在最前面,此序列的DCG为IDCG。因此DCG的值介于(0,IDCG],故NDCG的值介于(0,1],那么用户u的NDCGu@k定义为:
Figure BDA0002832800020000122
表2、表3是在Top-N取10时,本发明在Yelp和Flickr数据集上Dimension分别取16、32、64时的实验效果。表4、表5是在Dimension取64时,本发明在Yelp和Flickr数据集上Top-N分别取5、10、15时的实验效果。并将相应的效果与目前已有的传统推荐模型BPR、FM,社会推荐模型SocialMF、TrustSVD、ContextMF、CNSR和基于图的推荐模型GraphRec、PinSage、NGCF、DiffNet和DiffNet++等进行了比较,其中DiffNet-nf和DiffNet++-nf表示不使用侧面信息的模型。
表2基于Yelp数据集的HR与NDCG性能指标(N=10)
Figure BDA0002832800020000123
Figure BDA0002832800020000131
表3基于Flickr数据集的HR与NDCG性能指标(N=10)
Figure BDA0002832800020000132
表4基于Yelp数据集的HR与NDCG性能指标(D=64)
Figure BDA0002832800020000133
Figure BDA0002832800020000141
表5基于Flickr数据集的HR与NDCG性能指标(D=64)
Figure BDA0002832800020000142
由性能评估结果可知,在两个数据集中Top-N、Dimension取不同值的情况下,本发明相对于基线模型都取得了显著改善。
本发明并不限于上文描述的实施方式。以上对具体实施方式的描述旨在描述和说明本发明的技术方案,上述的具体实施方式仅仅是示意性的,并不是限制性的。在不脱离本发明宗旨和权利要求所保护的范围情况下,本领域的普通技术人员在本发明的启示下还可做出很多形式的具体变换,这些均属于本发明的保护范围之内。

Claims (1)

1.一种融合全局和局部社会兴趣影响的社会推荐方法,其特征在于,包括数据解析模块、模型训练模块和预测分析模块;
所述数据解析模块用于解析蕴含在文本和图片中的用户及物品相关属性向量;由于丰富的评论信息与用户和物品关联,通过gensim工具学习每个单词在word2vec模型中的嵌入表示;然后对每个用户和物品学习到的单词向量进行平均,得到每个用户和物品的特征向量;对于图片,将图片发送给VGG16卷积神经网络,并将VGG16中最后一个连接层的4096维作为图像的特征表示;对于每个用户的特征表示是指用户在训练数据中喜欢的图像特征表示的平均值;而后将解析出来的数据作为用户和物品的侧面信息输入到模型训练模块中;
所述模型训练模块用于构建获取社交网络和兴趣网络中节点嵌入向量的模型;模型训练模块包括嵌入层、融合层和影响兴趣扩散层;具体来说,通过数据解析模块中获取的用户和物品的侧面信息作为内容特性,结合嵌入层随机初始化的用户和物品的自由嵌入,融合层将内容特性和自由嵌入融合在一起;在影响兴趣扩散层内设置有一个具有若干层次的注意力结构,能够有效地扩散更高层次的社会和兴趣网络;
所述预测分析模块,在扩散过程达到稳定后,输出层预测每个未观察到的用户对物品的偏好得分;
所述嵌入层,通过相应的自由向量表示对用户和物品进行编码;设
Figure FDA0003736498110000013
分别代表用户和物品的D维自由潜在嵌入矩阵,给定用户a的一个one-hot表示,嵌入层能够执行索引操作选择出用户a的自由潜在嵌入向量pa,同理给定物品i的一个one-hot表示,选择出物品i的自由潜在嵌入向量qi,分别对应矩阵中的某一行转置;
所述融合层,对于每个用户a,融合层将其自由潜在嵌入向量pa和相关特征向量xa作为输入,输出融合后的向量
Figure FDA0003736498110000014
作为用户的初始兴趣向量,从不同类型数据中捕获了用户的兴趣;融合层建模为
Figure FDA0003736498110000011
其中W1为转换矩阵,g(x)为转换函数;
对于每个物品i,融合层将其自由潜在嵌入向量qi和相关特征向量yi融合在一起,物品的初始兴趣向量
Figure FDA0003736498110000015
建模为
Figure FDA0003736498110000012
所述影响兴趣扩散层,通过输入用户和物品的初始潜在向量,递归地对用户的潜在偏好和物品的潜在偏好在图G中动态的传播进行分层卷积建模;在k+1层时,将第k层的用户a的嵌入向量
Figure FDA0003736498110000017
和物品i嵌入向量
Figure FDA0003736498110000019
作为输入,这些层递归的输出传播更新后的嵌入向量
Figure FDA0003736498110000016
Figure FDA0003736498110000018
迭代步骤从k=0开始当递归达到一个预定义的深度k时结束;
对于每个物品i,给定第k层嵌入
Figure FDA00037364981100000216
第k+1层的更新嵌入
Figure FDA00037364981100000217
建模为
Figure FDA0003736498110000021
Figure FDA0003736498110000022
其中Ri=[a|ria=1]代表所有评价过物品i的用户集合;
Figure FDA00037364981100000218
是用户a的第k层嵌入向量;
Figure FDA00037364981100000215
是物品i从用户兴趣图GI中聚合邻居用户嵌入的结果;
Figure FDA00037364981100000219
代表聚合权重;因此,每个物品的下一层更新嵌入表示为融合了聚合邻居的嵌入和物品自身在当前层的嵌入;
利用注意力网络学习对应的权重,聚合权重
Figure FDA00037364981100000214
建模为
Figure FDA0003736498110000023
其中,使用多层感知器学习与第k层相关的用户和物品嵌入的节点注意力权重;之后,将聚合权重标准化
Figure FDA0003736498110000024
使用指数函数确保每个注意力权重大于0;
对于每个用户a,令
Figure FDA00037364981100000211
代表他的第k层潜在向量;用户的第k+1层更新向量受社交网络影响和兴趣网络影响;令
Figure FDA00037364981100000212
代表在第k+1层社会邻居的影响聚合嵌入,
Figure FDA00037364981100000213
代表在第k+1层感兴趣的物品邻居影响聚合嵌入;因此每个用户的更新嵌入
Figure FDA00037364981100000210
建模为
Figure FDA0003736498110000025
Figure FDA0003736498110000026
在建模物品邻居影响聚合嵌入时,考虑将群体层面的宏观影响加入模型中;具体体现在每个物品本身具有流行度,流行度对用户产生固有影响;物品i的流行度通过与物品i交互过的用户数量来量化,即集合Ri;则每个物品的流行度指数popi建模为
Figure FDA0003736498110000027
其中|Ri|代表集合Ri中的元素个数,使用物品i的流行度与总流行度的比值建模,防止有流行度为0的物品采用了平滑操作;
获得所有物品的流行度指数后,在每一层影响迭代后计算当前用户向量与物品的相似度;直观的计算方式是选用余弦相似度,不同物品对当前用户的流行度影响权重
Figure FDA0003736498110000029
建模为
Figure FDA0003736498110000028
在最终迭代用户兴趣时,将兴趣网络扩散的结果与宏观影响结果融合在一起,通过参数λ权衡两者的比例,最终物品邻居影响聚合嵌入
Figure FDA0003736498110000036
建模为
Figure FDA0003736498110000031
其中用户兴趣网络只聚合了与用户有交互的物品影响,宏观影响聚合了全部物品对用户的影响;
每个用户的下一层更新嵌入表示为融合了他的邻居聚合影响嵌入
Figure FDA0003736498110000035
兴趣聚合影响嵌入
Figure FDA0003736498110000033
和他自身在当前层的嵌入;其中,
Figure FDA0003736498110000034
代表了用户b对用户a在社交网络中第k+1层的影响权重,
Figure FDA0003736498110000037
代表了物品i对用户a在兴趣网络中第k+1层的影响权重;
Figure FDA0003736498110000038
Figure FDA0003736498110000039
三组权重自然呈现出一个两层的多层次结构,
Figure FDA00037364981100000310
为学习融合来自不同图的信息的图级权重;使用一个多层次的注意网络来建模上述权重;
对于每个用户a,图的注意层权重不仅依赖于用户的嵌入
Figure FDA00037364981100000311
还依赖于从节点注意网络中学习得到的加权表示;令
Figure FDA0003736498110000032
CN202011466134.4A 2020-12-13 2020-12-13 一种融合全局和局部社会兴趣影响的社会推荐方法 Active CN112507246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011466134.4A CN112507246B (zh) 2020-12-13 2020-12-13 一种融合全局和局部社会兴趣影响的社会推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011466134.4A CN112507246B (zh) 2020-12-13 2020-12-13 一种融合全局和局部社会兴趣影响的社会推荐方法

Publications (2)

Publication Number Publication Date
CN112507246A CN112507246A (zh) 2021-03-16
CN112507246B true CN112507246B (zh) 2022-09-13

Family

ID=74972913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011466134.4A Active CN112507246B (zh) 2020-12-13 2020-12-13 一种融合全局和局部社会兴趣影响的社会推荐方法

Country Status (1)

Country Link
CN (1) CN112507246B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113158071A (zh) * 2021-03-19 2021-07-23 广东工业大学 一种基于图神经网络的知识社交推荐方法、系统和设备
CN113849725B (zh) * 2021-08-19 2022-03-29 齐鲁工业大学 一种基于图注意力对抗网络的社会化推荐方法及系统
CN113918832B (zh) * 2021-10-22 2022-09-27 重庆理工大学 基于社交关系的图卷积协同过滤推荐系统
CN114238439B (zh) * 2021-12-14 2023-03-28 四川大学 一种基于联合嵌入的任务驱动关系型数据视图推荐方法
CN116127204B (zh) * 2023-04-17 2023-07-18 中国科学技术大学 多视角用户画像方法、多视角用户画像系统、设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055713A (zh) * 2016-07-01 2016-10-26 华南理工大学 基于用户兴趣和社交主题提取的社交网络用户推荐方法
CN110851491A (zh) * 2019-10-17 2020-02-28 天津大学 基于多重邻居节点的多重语义影响的网络链接预测方法
CN111177781A (zh) * 2019-12-30 2020-05-19 北京航空航天大学 一种基于异构信息网络嵌入的差分隐私推荐方法
CN111681067A (zh) * 2020-04-17 2020-09-18 清华大学 基于图注意力网络的长尾商品推荐方法及系统
CN111931903A (zh) * 2020-07-09 2020-11-13 北京邮电大学 一种基于双层图注意力神经网络的网络对齐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055713A (zh) * 2016-07-01 2016-10-26 华南理工大学 基于用户兴趣和社交主题提取的社交网络用户推荐方法
CN110851491A (zh) * 2019-10-17 2020-02-28 天津大学 基于多重邻居节点的多重语义影响的网络链接预测方法
CN111177781A (zh) * 2019-12-30 2020-05-19 北京航空航天大学 一种基于异构信息网络嵌入的差分隐私推荐方法
CN111681067A (zh) * 2020-04-17 2020-09-18 清华大学 基于图注意力网络的长尾商品推荐方法及系统
CN111931903A (zh) * 2020-07-09 2020-11-13 北京邮电大学 一种基于双层图注意力神经网络的网络对齐方法

Also Published As

Publication number Publication date
CN112507246A (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN112507246B (zh) 一种融合全局和局部社会兴趣影响的社会推荐方法
Jiang et al. Social recommendation with cross-domain transferable knowledge
CN112214685B (zh) 一种基于知识图谱的个性化推荐方法
Isinkaye et al. Recommendation systems: Principles, methods and evaluation
Huang et al. Social friend recommendation based on multiple network correlation
Yang et al. Like like alike: joint friendship and interest propagation in social networks
Zhong et al. Comsoc: adaptive transfer of user behaviors over composite social network
Sun et al. Personalized clothing recommendation combining user social circle and fashion style consistency
Sang et al. Context-dependent propagating-based video recommendation in multimodal heterogeneous information networks
CN112650929B (zh) 一种融入评论信息的图神经网络推荐方法
Rakesh et al. Linked variational autoencoders for inferring substitutable and supplementary items
Guo et al. Flickr group recommendation using rich social media information
CN110119478B (zh) 一种结合多种用户反馈数据的基于相似度的物品推荐方法
Huang et al. Neural embedding collaborative filtering for recommender systems
CN112417313A (zh) 一种基于知识图卷积网络的模型混合推荐方法
Miao et al. Joint prediction of rating and popularity for cold-start item by sentinel user selection
Yang et al. Inferring substitutable and complementary products with Knowledge-Aware Path Reasoning based on dynamic policy network
Zhang et al. Recommendation system in social networks with topical attention and probabilistic matrix factorization
Li et al. Random walk based distributed representation learning and prediction on social networking services
Alsalama A hybrid recommendation system based on association rules
Liu et al. Siga: social influence modeling integrating graph autoencoder for rating prediction
Chen et al. A probabilistic linguistic and dual trust network-based user collaborative filtering model
Shirgahi et al. Trust estimation of the semantic web using semantic web clustering
Indira et al. Visual and buying sequence features-based product image recommendation using optimization based deep residual network
Aggarwal et al. Social and trust-centric recommender systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant