CN108573062A - 一种基于异构社交关系的个性化推荐方法 - Google Patents
一种基于异构社交关系的个性化推荐方法 Download PDFInfo
- Publication number
- CN108573062A CN108573062A CN201810390241.XA CN201810390241A CN108573062A CN 108573062 A CN108573062 A CN 108573062A CN 201810390241 A CN201810390241 A CN 201810390241A CN 108573062 A CN108573062 A CN 108573062A
- Authority
- CN
- China
- Prior art keywords
- user
- line
- parameter
- social networks
- trust
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000000694 effects Effects 0.000 claims abstract description 43
- 238000009826 distribution Methods 0.000 claims description 62
- 230000004044 response Effects 0.000 claims description 18
- 239000004744 fabric Substances 0.000 claims description 7
- 238000009795 derivation Methods 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 230000006399 behavior Effects 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 238000012614 Monte-Carlo sampling Methods 0.000 description 1
- 244000097202 Rathbunia alamosensis Species 0.000 description 1
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000021824 exploration behavior Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000005755 formation reaction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于异构社交关系的个性化推荐方法,首先,根据活动社交网络上用户关系和用户行为,分别提取出线上社交关系和线下社交关系,其中线上社交关系包括线上信任系数和线上信任强度线下社交关系包括线下信任系数和线下信任强度采用杰卡德系数来计算出有关联的用户之间的线上信任强度和线下信任强度然后结合用户的历史行为,构建基于泊松因子分解的联合概率产生模型,使用变分推断方法推断模型参数的迭代公式,最后使用坐标上升算法估计出每个参数的取值;最后计算用户对每个活动的评分,并根据评分值从大到小进行排序,则排名较高的活动是用户喜爱的活动,并把这些个性化的活动推荐给用户。
Description
技术领域
本发明涉及一种个性化的推荐方法,尤其是一种基于异构社交关系的个性化推荐方法。
背景技术
互联网中包含现实世界中的大部分信息,尤其是进入Web2.0时代以来,用户产生内容成为主要的信息源,网络中的信息呈指数级速度增长,这个世界进入了“信息爆炸”的时代。一方面,信息非常丰富,另一方面,海量的信息导致了“信息过载”问题。用户难以快速地找到自己需要的信息。比如,淘宝网上每天的在线商品数超过8亿件,用户面临选择困难。帮助用户快速地发现需要的信息,成为互联网时代迫切需要解决的问题。信息检索和推荐系统技术应用而生。信息检索是指用户提供查询关键字,系统根据内容信息和相互之间的链接关系返回排序后的信息。但是,在很多情况下,用户无法提供准确的搜索关键字,因为用户自身可能也不是很明确对什么样的信息感兴趣。为了提供更好的用户体验,需要设计更智能的算法,避免或减少用户的干预和努力。即,利用推荐系统技术,向用户自动地推荐感兴趣的信息。各种在线服务在向用户提供感兴趣信息的同时,也收集了很多用户的行为数据,充分利用这些历史行为数据,可以对用户进行个性化的推荐。
传统的推荐系统只是考虑“用户-物品”二元关系,随着技术的发展,研究人员认识到用户之间的社会关系有助于提升推荐的性能,从而衍生出社会化推荐。社会化推荐是在传统推荐系统的基础上,把用户之间的社会关系信息(比如微博数据中的关注关系,科技论文中的合作关系等)融入到推荐模型中,从而提高推荐系统的性能。近年来,社会化推荐已成为推荐系统研究领域较为活跃的研究方向之一。
MaHao等人通过共享用户潜在特征空间的方式来连接社交网络结构和用户-物品评分矩阵;Jamali等人使用组合信任的方式来同时建模个人兴趣和好友的偏好;ZouBenyou等人提出了一种基于主题的张量分解的用户信任推荐算法,用来挖掘用户选取不同物品时对不同朋友的信任程度。
然而,传统的社会化推荐方法认为用户之间的社交关系是同构的。进而把用户之间的社交关系转化为用户之间的信任程度,对不同用户的信任程度可能对用户的兴趣偏好有重要引导性影响,以及这种引导性影响是如何对用户的行为产生影响,综合权衡这些影响因素的作用效果,改善最终的推荐结果,提高社会化推荐系统的性能。
无论是在现实世界,还是在虚拟的社交网络中,用户之间的异构社交关系是普遍存在的。比如,在现实世界中,用户A和用户B之间可能既是同学关系,也是老乡关系;用户C和用户D之间可能既是论文合作关系,也是师生关系。在微博空间,如Twitter、新浪微博,用户E和线下好友f可能既是关注关系(如用户E关注线下好友f),也是粉丝关系(如用户E和线下好友f共同关注用户G)。而基于活动的社交网络,如Meetup、豆瓣同城,可以连接线上虚拟的社交网络和线下真实的世界,用户可以在线上加入共同的兴趣小组,用户之间形成了线上社交关系,用户也可以在线下面对面地参与活动,进而结交真正的朋友,从而用户之间建立了线下好友关系。
在某些情形下,用户可能更加信任某一种社交关系下的用户,而在另外一些情况下,用户可能更加信任具有多种社交关系的用户。充分利用用户之间异构的社交关系可以提升推荐系统的性能,仅依赖于一种社交关系的推荐模型必然会存在信息缺失问题。
发明内容
本发明的技术任务是针对以上现有技术的不足,而提供一种基于异构社交关系的个性化推荐方法。
本发明解决其技术问题所采用的技术方案是:一种基于异构社交关系的个性化推荐方法,其中包括用户u、用户的数量U;线上好友v、线上好友的数量V;用户u的线下好友f、线下好友的数量F;线上信任系数线下信任系数线上信任强度线下信任强度活动i、用户u参加活动的历史行为数据yui、除用户u以外,其他用户对活动的响应
步骤一:根据活动社交网络上的用户关系和用户行为,分别提取出线上社交关系和线下社交关系,进而计算出有关联的用户之间的线上信任强度和线下信任强度。
步骤二:结合用户的历史行为,构建基于泊松因子分解的联合概率产生模型,其中联合概率产生模型为HTPF模型,使用变分推断方法推断模型参数的迭代公式,最后使用坐标上升算法估计出每个参数的取值。
步骤三:计算用户对每个活动的评分,并根据评分值从大到小进行排序,则排名较高的活动可能是用户喜爱的活动,把这些个性化的活动推荐给用户。
在步骤一中,用户u和线上好友v在线上共同加入了一个兴趣小组(group),则他们具有线上信任关系,信任系数记作而用户u和线下好友f在线下共同参与了一个活动(event),则用户u和线下好友f构建了隐式的信任关系,称为线下信任关系,信任系数记作 和是未知的,需要根据观察数据进行估计。
信任关系中,不同用户之间具有不一样的影响力,称之为信任强度。对于线上信任网络,用户u和线上好友v共同加入的兴趣小组越多,则他们之间的线上信任强度越大,对于线下信任网络,用户u和线下好友f共同响应的活动越多,则他们之间的线下信任强度越大。本方法使用杰卡德系数来计算用户之间的信任强度。
在步骤二中,结合用户的历史行为,构建基于泊松因子分解的联合概率产生模型,使用变分推断方法推断模型参数的迭代公式,最后使用坐标上升算法估计出每个参数的取值,具体过程为:
在基于活动的社交网络上,用户u在线上对活动i作出积极的响应,即yui=1,则认为用户u会在线下参加或参与活动i,用户u是否对活动i做出积极的响应不仅受个人兴趣的影响,而且受信任好友的影响,直觉上,对于用户u,不同的信任好友对他的影响是不一样的。用户u与好友之间的信任关系越强,好友对他的影响也会越强。
用户的历史行为数据yui的分布可用基于泊松因子分解的联合概率产生模型(Heterogeneous Trust Poisson Factorization,简称为HTPF模型)来模拟,具体表示为:
其中,表示除用户u之外的其他用户对活动i的响应,为了完成对未知变量的估计,本方法假设用户的偏好θu、活动的属性βi、线上信任系数和线下信任系数均服从其各自形状和尺度超参数的Gamma分布。这是因为Gamma分布和Poisson分布同属于一个分布族,而Gamma分布是Poisson分布的共轭先验,这使得用贝叶斯的方式学习模型参数非常方便。另外,Gamma先验非常适用于用户、活动和信任系数的稀疏表示。
参数推断和预测
为了使用上述模型进行推荐,需要解决的关键问题是后验推断。可以把后验推断问题转化为一个优化问题。
A:辅助变量
本方法利用条件共轭模型的结论来进行HTPF模型的推导。为便于公式推导和算法的描述,需要增加一些辅助变量,从而,产生了一个HTPF模型的变形公式。没有这些辅助变量,HTPF模型不是一个条件共轭模型。
多个独立的泊松随机变量的和仍然服从泊松分布,且其尺度参数等于各个独立的泊松分布的尺度值之和。分别为(用户u,活动i)、(用户u,线上好友v)和(用户u,线下好友f)引入辅助变量 和则HTPF模型公式可分别变换为,
其中,
并且,V=|Non(u)|,F=|Noff(u)|,对应含义分别是用户u的线上好友和线下好友的数量。
B:平均场变分族
本方法采用平均场变分族。在平均场变分族中,每个隐变量是独立的,并且仅受其自己变分参数的控制。平均场分布族为,
平均场分布族中的每个因子的分布被设置为与它的完全条件的分布一致。接下来,首先计算完全条件,然后推导出变分参数。
C:完全条件
在模型中,给定观察数据和其它的隐变量,一个完全条件是一个隐变量的条件分布。模型中,所有隐变量的完全条件都可以被计算出来。在HTPF模型中,θuk、βik、和的完全条件分别是一个Gamma分布,即,
因为,多个泊松之和的条件分布是一个多项分布,并且,这个多项分布的参数是对应的多个泊松分布尺度参数的归一化集合。因此,的完全条件服从多项分布。也就是,zui~Mult(yui,ψui),其中
另外,需要进行归一化,使得ψui的各个分量之和为1。
D:变分参数
因为变分分布族中每个因子的分布与它的完全条件一致,并且,θuk,βik,和的完全条件是Gamma分布,所以,它们的变分参数是对应的Gamma分布的参数,即,θuk~Gamma(γuk,a,γuk,b),βik~Gamma(γik,a,γik,b)和相似地,可以推导出的变分分布,即zui~Mult(yui,φui),其中,
根据条件共轭模型,每个变分参数等于完全条件中对应参数的期望。对于变分Gamma分布,θuk、βik,和的变分参数(即,形状参数和尺度参数)的闭包更新公式分别如下。
对于变分多项式分布,和的变分参数更新公式如下,
其中u=1,…,U;i=1,…,I;k=1,…,K;v=1,…,V;f=1,…,F。Ψ(·)是digamma函数。和应该联合起来进行归一化,使得它们的和为1。
E:坐标上升算法
使用坐标上升算法更新变分参数,基本思想是,每次更新参数中的一维,通过多次的迭代以达到优化函数的目的,最终获得局部最优解。
本方法的时间复杂度主要取决于用户对活动的响应数量N(N<<U×I),向量维度K,线上信任网络中用户的好友的数量V(V<<U),线下信任网络中用户的好友的数量F(F<<U)。令M=max{K,V,M},最后,本方法的时间复杂度为O(N×M)。本方法对于稀疏的响应数据是非常有效的。
在步骤三中:计算用户对每个活动的评分,并进行评分值从大到小进行排序,则排名较高的活动可能是用户喜爱的活动,把这些活动推荐给用户,具体实现过程为:
HTPF模型是一个基于隐参数(θuk,θik,和)和观测数据(和yui)的贝叶斯概率模型。为了给用户推荐活动,需要根据给定的观测数据来估计隐参数的后验分布。一旦后验分布被确定,就可以用下面公式来预测用户u对每一个未响应活动i的评分
按照评分值从大到小进行排序,最后,向用户推荐top-n个活动。
本发明由于采取以上技术方案,其具有以下优点:①挖掘社交网络中存在的异构社交关系,计算用户之间的信任强度,结合用户的社交行为进行建模,构建一个概率泊松因子分解产生模型。②采用了泊松因子分解技术,相对于当前主流的基于正态分布的因子分解技术,该技术更善于表现稀疏的数据,建模用户和活动的长尾现象,弱化缺失项的影响等。③设计了坐标上升算法用于推断模型参数。该算法对于稀疏的用户行为数据是非常有效的。本发明可以很容易地扩展到各种类型的用户决策行为中,如,微博转发行为预测、论文合作预测等。
本发明的优点:基于活动的社交网络(EBSNs)是一个相对新兴的社交网络,现阶段,学术界只有相对少量的文献是关于活动推荐的研究。文献Liu Xingjie等人首先指出EBSNs连接线上和线下社交世界,并用网络拓扑结构来探索活动推荐;DuRong提出基于传统的奇异值分解的多因子近邻算法来预测用户对活动的响应;Pham等人提出一个图模型的方式,把EBSNs中所涉及的向用户推荐活动、向用户推荐兴趣小组和向组推荐标签整合到一个框架;Macedo等人分别基于社会关系、内容、位置和时间建立推荐模型,然后把得到的评分和活动的响应数量组合为一个向量,进一步利用排序学习的方式训练用户对活动的偏好;ZhangWei等人提出协同贝叶斯泊松因子分解模型,同时建模社交关系、内容、组织和位置信息;这些文献,主要考虑尽可能多地融合多种因素(如线上好友、组织者、地点、时间等)进行活动推荐,而忽略了对异构社交关系的分析和利用,不能对用户进行更准确的建模。QiaoZhi等人组合异构社交和位置信息进行活动推荐,但它使用了基于高斯似然的矩阵因子分解模型,不能很好地捕获活动推荐中的隐性反馈。
本发明提出的基于泊松因子分解的联合概率产生模型可同时探索和利用用户的线上和线下社交活动。一方面,泊松因子分解模型适合于建模稀疏的数据,另一方面,模型强调了好友之间不同的信任强度会对用户带来不同的影响,并把信任强度和信任系数整合到模型框架中。采用坐标上升算法推断模型参数。最后,在真实数据集上做实验评估所提出模型的性能。实验结果表明提出的模型在推荐结果的准确率等性能指标上优于其它现有的方法。
附图说明
图1是本发明的HTPF模型图。
具体实施方式
下面结合说明书附图对本发明做以下详细说明。
如图所示:
一、根据用户在社交网络上的用户关系和用户行为,分别提取出线上社交关系和线下社交关系,进而计算出有关联的用户之间的线上信任强度和线下信任强度,具体过程为:
1.1用户u和线上好友v在线上共同加入了一个兴趣小组(group),则他们具有线上信任关系,信任关系中,不同用户之间具有不一样的影响力,称之为信任强度,对于线上信任网络,用户u和线上好友v共同加入的兴趣小组越多,则他们之间的线上信任强度越大,本方法使用杰卡德系数来计算用户之间的信任强度,即,
其中,G(u)和G(v)分别表示用户u和线上好友v在线上所加入的兴趣小组的集合。
1.2用户u和用户f在线下共同参与了一个活动(event),则用户u和用户f构建了隐式的信任关系,称为线下信任关系,类似地,不同用户之间具有不一样的信任强度。对于线下信任网络,用户u和用户f共同响应的活动越多,则他们之间的线下信任强度越大。使用杰卡德系数来计算用户之间的信任强度。即,
其中,E(u)和E(f)分别表示用户u和用户f所参加的活动的集合。
二、结合用户的历史行为,构建基于泊松因子分解的联合概率产生模型,使用变分推断方法推断模型参数的迭代公式,最后使用坐标上升算法估计出每个参数的取值,具体过程为:
2.1在基于活动的社交网络上,用户u在线上对活动i作出积极的响应,即yui=1,则认为用户u会在线下参加或参与活动i,用户u是否对活动i做出积极的响应不仅受个人兴趣的影响,而且受信任好友的影响。也就是说,如果活动i和用户u的历史兴趣偏好不一致,但用户u的信任好友对活动i作出了响应,那么用户u也可能参加活动i。直觉上,对于用户u,不同的信任好友对他的影响是不一样的。用户u与好友之间的信任关系越强,好友对他的影响也会越强。对于任意两个用户,如,用户u和线上好友v,他们之间的线上信任系数记作而线下信任系数记作 和是未知的,需要根据用户的历史行为数据进行估计。用户u对应一个K维非负向量θu,表示用户的偏好;活动i也对应一个K维非负向量βi,表示活动i的属性。θu和βi是未知的变量,需要根据用户的历史行为数据来估计。
2.2令Non(u)和Noff(u)分别表示用户u的线上和线下信任网络中的好友集合。用户的历史行为数据yui的分布可用基于泊松因子分解的联合概率产生模型来模拟,具体表示为:
其中,表示除用户u之外的其他用户对活动i的响应.为了完成对未知变量的估计,本方法假设用户的偏好θu、活动的属性βi、线上信任系数和线下信任系数均服从其各自形状和尺度超参数的Gamma分布。这是因为Gamma分布和Poisson分布同属于一个分布族,而Gamma分布是Poisson分布的共轭先验,这使得用贝叶斯的方式学习模型参数非常方便。另外,Gamma先验非常适用于用户、活动和信任系数的稀疏表示。具体来说,通过设置形状参数(即,λua,λia,λδa和λτa)为一个很小的数值,绝大多数产生值会接近于零。λub,λib,λδb和λτb为对应的尺度参数。
HTPF模型的产生过程描述如下:
Step 1.对用户u=1,…,U和组件k=1,…,K,抽样潜在因子
θuk~Gamma(λua,λub)
Step 2.对活动i=1,…,I和组件k=1,…,K,抽样潜在因子
βik~Gamma(λia,λib)
Step 3.对用户u的线上信任网络中的好友v=1,…,V,抽样潜在因子
Step 4.对用户u的线下信任网络中的好友f=1,…,F,抽样潜在因子
Step 5.对观察数据(用户u,活动i),用公式(1)抽样响应yui.
HTPF模型中使用的主要符号如表1所示.
表1 HTPF模型中使用的主要符号
2.3参数推断和预测
为了使用上述模型进行推荐,需要解决的关键问题是后验推断。所有潜在因子的Gamma先验记作λ。给定和那么后验分布
但公式(2)不能被准确地推断。本方法采用变分法推断来近似后验分布。因为变分法相对于马尔科夫链蒙特卡洛抽样具有较好的扩展性。变分法推断首先定义一个隐变量上的有参分布族,即q(Θ|γ),来逼近后验,然后估计近似于p(Θ|Y,λ)的q(Θ|γ)的参数。
基于凸性的变分法推导的基本思想是利用Jensen不等式来获取对数似然的证据下限。
公式(3)中,logp(Y|λ)和的差别是q(Θ|γ)和p(Θ,Y|λ)的KL散度。即,
公式(4)表明,最大化证据下限等价于最小化q(Θ|γ)和p(Θ,Y|λ)的KL散度,这样,后验推断问题转化为一个优化问题。
2.3.1辅助变量
本方法利用条件共轭模型的结论来进行HTPF模型的推导。为便于公式推导和算法的描述,需要增加一些辅助变量,从而,产生了一个HTPF模型的变形公式。没有这些辅助变量,HTPF模型不是一个条件共轭模型。
多个独立的泊松随机变量的和仍然服从泊松分布,且其尺度参数等于各个独立的泊松分布的尺度值之和。分别为(用户u,活动i)、(用户u,线上好友v)和(用户u,线下好友f)引入辅助变量 和则公式(1)可分别变换为,
其中,
并且,V=|Non(u)|,F=|Noff(u)|
增加辅助变量之后,变分分布q(Θ|γ)转变成了q(Θ,Z|γ,φ),其中Z和φ分别表示所有增加的辅助变量和参数。
2.3.2平均场变分族。
本方法采用平均场变分族,在平均场变分族中,每个隐变量是独立的,并且仅受其自己变分参数的控制。为便于描述,这里忽略参数γ和φ,平均场分布族为。
平均场分布族中的每个因子的分布被设置为与它的完全条件(completeconditional)的分布一致。接下来,首先计算完全条件,然后推导出变分参数。
2.3.3完全条件。
在模型中,给定观察数据和其它的隐变量,一个完全条件是一个隐变量的条件分布,模型中,所有隐变量的完全条件都可以被计算出来。在HTPF模型中,用户偏好因子θuk的完全条件是一个Gamma分布,如公式(7)所示。
类似地,可以计算出βik、和的完全条件。
因为,多个泊松之和的条件分布是一个多项分布,并且,这个多项分布的参数是对应的多个泊松分布尺度参数的归一化集合。因此,的完全条件服从多项分布,也就是,zui~Mult(yui,ψui),其中
另外,需要进行归一化,使得ψui的各个分量之和为1。
2.3.4变分参数
因为变分分布族中每个因子的分布与它的完全条件一致,并且,θuk,βik,和的完全条件是Gamma分布,所以,它们的变分参数是对应的Gamma分布的参数,即,θuk~Gamma(γuk,a,γuk,b),βik~Gamma(γik,a,γik,b)和相似地,可以推导出的变分分布,即zui~Mult(yui,φui),其中,
根据条件共轭模型,每个变分参数等于完全条件中对应参数的期望,对于变分Gamma分布,本说明书以θuk为例推导变分参数(即,形状参数γuk,a和尺度参数γuk,b)的闭包更新公式。
βik,和的变分参数更新公式可以相似地推导出来,结果如下:
对于变分多项式分布,本说明书以为例推导的变分参数更新公式,推导如下,
其中u=1,…,U;i=1,…,I;k=1,…,K;Ψ(·)是digamma函数;Gq[·]=exp(Eq[log(·)])表示几何期望。同理,
其中v=1,…,V;f=1,…,F。和应该联合起来进行归一化,使得它们的和为1。
2.4坐标上升算法
使用坐标上升算法更新变分参数,从而获得局部最优解。如算法1所示。
算法1.HTPF模型参数的推断算法
输入:用户对活动的响应数据Y={yui|u=1,...,U;i=1,...,I},线上信任网络中用户之间的关系强度数据线下信任网络中用户之间的关系强度数据超参数λ={λua,λub,λia,λib,λδa,λδa,λτa,λτa}
输出:变分参数γ={γuk,a,γuk,b,γik,a,γik,b,γuv,a,γuv,b,γuf,a,γuf,b}
算法1的时间复杂度主要取决于用户对活动的响应数量N(N<<U×I),向量维度K,线上信任网络中用户的好友的数量V(V<<U),线下信任网络中用户的好友的数量F(F<<U)。令M=max{K,V,M},最后,算法1的时间复杂度为O(N×M)。算法1对于稀疏的响应数据是非常有效的。
三、计算用户对每个活动的评分,并进行评分值从大到小进行排序,则排名较高的活动可能是用户喜爱的活动,把这些活动推荐给用户,具体为:
HTPF模型是一个基于隐参数(θuk,βik 和)和观测数据( 和yui)的贝叶斯概率模型。为了给用户推荐活动,需要根据给定的观测数据来估计隐参数的后验分布。一旦后验分布被确定,就可以用公式(22)来预测用户u对每一个未响应活动i的评分,然后按照评分进行排序,最后,向用户推荐top-n个活动。
下面通过定性分析比较本发明的基于异构社交关系的个性化推荐方法相对于传统方法的优势:
在面向活动的社交网络上,用户u是否对活动i做出积极的响应不仅受个人兴趣的影响,而且受信任好友的影响。对于用户u,不同的信任好友对他的影响是不一样的。用户u与好友之间的信任关系越强,好友对他的影响也会越强。在社交网络上,用户之间存在着异构的社交关系,即线上社交关系和线下社交关系。本方法把异构的社交关系下用户之间的信任强度、信任稀疏、用户的历史行为建模到一个概率框架中,从而使得本方法相对于传统的方法可以获得较高的准确率。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (3)
1.一种基于异构社交关系的个性化推荐方法,其特征在于:包括用户u、用户的数量U;线上好友v、线上好友的数量V;用户u的线下好友f、线下好友的数量F;线上信任系数线下信任系数线上信任强度线下信任强度活动i、用户u参加活动的历史行为数据yui、除用户u以外,其他用户对活动的响应
实施步骤如下:
步骤一:根据活动社交网络上用户关系和用户行为,分别提取出线上社交关系和线下社交关系,其中线上社交关系包括线上信任系数和线上信任强度线下社交关系包括线下信任系数和线下信任强度采用杰卡德系数来计算出有关联的用户之间的线上信任强度和线下信任强度
步骤二:结合用户的历史行为,构建基于泊松因子分解的联合概率产生模型,使用变分推断方法推断模型参数的迭代公式,最后使用坐标上升算法估计出每个参数的取值;
步骤三:计算用户对每个活动的评分,并根据评分值从大到小进行排序,则排名较高的活动是用户喜爱的活动,并把这些个性化的活动推荐给用户。
2.根据权利要求1所述的一种基于异构社交关系的个性化推荐方法,其特征在于:在步骤二中,首先,设用户u的偏好为θu、活动i的属性为βi、线上信任系数和线下信任系数均服从其各自形状和尺度超参数的Gamma分布,则用户u的历史行为数据的分布用基于泊松因子分解的联合概率产生模型来模拟,具体表示为:
然后,进行参数推断和预测,具体步骤如下:
A:辅助变量,
多个独立的泊松随机变量的和仍然服从泊松分布,且其尺度参数等于各个独立的泊松分布的尺度值之和,然后引入辅助变量和从而产生了一个联合概率产生模型的变形公式,利用条件共轭模型的结论来进行联合概率产生模型的推导;则联合概率产生模型公式可分别变换为:
其中,
并且,V=|Non(u)|,F=|Noff(u)|;
B:平均场变分族
采用平均场变分族,在平均场变分族中,每个隐变量是独立的,并且仅受其自己变分参数的控制,平均场分布族为,
平均场分布族中的每个因子的分布被设置为与它的完全条件的分布一致,接下来,首先计算完全条件,然后推导出变分参数;
C:完全条件
在联合概率产生模型中,给定观察数据和其它的隐变量,一个完全条件是一个隐变量的条件分布,所有隐变量的完全条件都可以被计算出来,在联合概率产生模型中,θuk、βik、和的完全条件分别是一个Gamma分布,即,
由的完全条件服从多项分布,得出,zui~Mult(yui,ψui),其中
对进行归一化,使得ψui的各个分量之和为1。
D:变分参数
通过,θuk,βik,和的完全条件是Gamma分布,导出的变分分布,即zui~Mult(yui,φui),其中,
根据条件共轭模型,每个变分参数等于完全条件中对应参数的期望,对于变分Gamma分布,θuk、βik,和的变分参数的闭包更新公式分别如下,
对于变分多项式分布,和的变分参数更新公式如下,
其中u=1,…,U;i=1,…,I;k=1,…,K;v=1,…,V;f=1,…,F;Ψ(·)是digamma函数,和应该联合起来进行归一化,使得它们的和为1;
E:坐标上升算法
使用坐标上升算法更新变分参数,每次更新参数中的一维,通过多次的迭代以达到优化函数的目的,最终获得局部最优解;
在步骤三中,联合概率产生模型是一个基于隐参数(θuk,βik,和)和观测数据(和yui)的贝叶斯概率模型,根据给定的观测数据来估计隐参数的后验分布,接着就可以用来预测用户u对每一个未响应活动i的评分;接着按照评分值从大到小进行排序,最后,向用户u推荐top-n个活动i。
3.根据权利要求1或2所述的一种基于异构社交关系的个性化推荐方法,其特征在于:所述联合概率产生模型为基于异构信任关系的泊松因子分解模型Heterogeneous TrustPoisson Factorization,简称HTPF模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810390241.XA CN108573062A (zh) | 2018-04-27 | 2018-04-27 | 一种基于异构社交关系的个性化推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810390241.XA CN108573062A (zh) | 2018-04-27 | 2018-04-27 | 一种基于异构社交关系的个性化推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108573062A true CN108573062A (zh) | 2018-09-25 |
Family
ID=63574352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810390241.XA Withdrawn CN108573062A (zh) | 2018-04-27 | 2018-04-27 | 一种基于异构社交关系的个性化推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108573062A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109523012A (zh) * | 2018-10-11 | 2019-03-26 | 上海交通大学 | 基于变分解耦合方式对符号有向网络的表达学习方法 |
CN110149595A (zh) * | 2019-05-10 | 2019-08-20 | 北京工业大学 | 一种基于hmm的异构网络用户行为预测方法 |
CN110909146A (zh) * | 2019-11-29 | 2020-03-24 | 支付宝(杭州)信息技术有限公司 | 用于推送反问标签的标签推送模型训练方法、装置及设备 |
CN111475738A (zh) * | 2020-05-22 | 2020-07-31 | 哈尔滨工程大学 | 一种基于元路径的异质社交网络位置锚链接识别方法 |
CN114637888A (zh) * | 2022-05-18 | 2022-06-17 | 深圳市华曦达科技股份有限公司 | 一种视频推送方法及装置 |
-
2018
- 2018-04-27 CN CN201810390241.XA patent/CN108573062A/zh not_active Withdrawn
Non-Patent Citations (2)
Title |
---|
SHAOQING WANG ET AL.: ""Learn to Recommend Local Event Using Heterogeneous Social Networks"", 《WEB TECHNOLOGIES AND APPLICATIONS》 * |
王绍卿 等: ""联合建模异构社交和内容信息的活动推荐模型"", 《软件学报》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109523012A (zh) * | 2018-10-11 | 2019-03-26 | 上海交通大学 | 基于变分解耦合方式对符号有向网络的表达学习方法 |
CN109523012B (zh) * | 2018-10-11 | 2021-06-04 | 上海交通大学 | 基于变分解耦合方式对符号有向网络的表达学习方法 |
CN110149595A (zh) * | 2019-05-10 | 2019-08-20 | 北京工业大学 | 一种基于hmm的异构网络用户行为预测方法 |
CN110149595B (zh) * | 2019-05-10 | 2021-01-08 | 北京工业大学 | 一种基于hmm的异构网络用户行为预测方法 |
CN110909146A (zh) * | 2019-11-29 | 2020-03-24 | 支付宝(杭州)信息技术有限公司 | 用于推送反问标签的标签推送模型训练方法、装置及设备 |
CN111475738A (zh) * | 2020-05-22 | 2020-07-31 | 哈尔滨工程大学 | 一种基于元路径的异质社交网络位置锚链接识别方法 |
CN111475738B (zh) * | 2020-05-22 | 2022-05-17 | 哈尔滨工程大学 | 一种基于元路径的异质社交网络位置锚链接识别方法 |
CN114637888A (zh) * | 2022-05-18 | 2022-06-17 | 深圳市华曦达科技股份有限公司 | 一种视频推送方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108573062A (zh) | 一种基于异构社交关系的个性化推荐方法 | |
Chen et al. | Context-aware collaborative topic regression with social matrix factorization for recommender systems | |
Ling et al. | Estimation and testing for unit root processes with GARCH (1, 1) errors: theory and Monte Carlo evidence | |
CN107153713A (zh) | 社交网络中基于节点间相似性的重叠社区检测方法及系统 | |
Wang et al. | Diversified and scalable service recommendation with accuracy guarantee | |
CN111428127B (zh) | 融合主题匹配与双向偏好的个性化事件推荐方法及系统 | |
Xiong et al. | Affective impression: Sentiment-awareness POI suggestion via embedding in heterogeneous LBSNs | |
Nobahari et al. | ISoTrustSeq: a social recommender system based on implicit interest, trust and sequential behaviors of users using matrix factorization | |
Yuan et al. | A minimum adjustment cost consensus framework considering harmony degrees and trust propagation for social network group decision making | |
Ge et al. | Estimating local information trustworthiness via multi-source joint matrix factorization | |
Wang et al. | Hybrid customer requirements rating method for customer-oriented product design using QFD | |
Raman et al. | Understanding the bibliometric patterns of publications in IEEE access | |
Shafik et al. | Recommendation system comparative analysis: internet of things aided networks | |
Zhang et al. | An interpretable and scalable recommendation method based on network embedding | |
Liu et al. | A generative node-attribute network model for detecting generalized structure and semantics | |
CN110795640B (zh) | 一种弥补群组成员差异的自适应组推荐方法 | |
Idrissi et al. | A new hybrid-enhanced recommender system for mitigating cold start issues | |
CN110377841B (zh) | 一种应用在协同过滤方法中的相似度计算方法及系统 | |
CN109213869A (zh) | 基于多源数据的热点技术预测方法 | |
CN108133407B (zh) | 一种基于软集决策规则分析的电子商务推荐技术及系统 | |
Deng et al. | Adaptive personalized recommendation based on adaptive learning | |
CN115481325A (zh) | 基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统 | |
CN115168653A (zh) | 基于领域间和领域内关系的跨领域推荐方法及系统 | |
Ji et al. | Using category and keyword for personalized recommendation: A scalable collaborative filtering algorithm | |
Khalid et al. | Influence model of evasive decision makers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20180925 |
|
WW01 | Invention patent application withdrawn after publication |