CN105761151A - 一种基于联合概率矩阵分解的移动社会化推荐方法 - Google Patents

一种基于联合概率矩阵分解的移动社会化推荐方法 Download PDF

Info

Publication number
CN105761151A
CN105761151A CN201610074241.XA CN201610074241A CN105761151A CN 105761151 A CN105761151 A CN 105761151A CN 201610074241 A CN201610074241 A CN 201610074241A CN 105761151 A CN105761151 A CN 105761151A
Authority
CN
China
Prior art keywords
sigma
user
matrix
degree
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610074241.XA
Other languages
English (en)
Inventor
熊丽荣
王玲燕
刘坚
汤颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201610074241.XA priority Critical patent/CN105761151A/zh
Publication of CN105761151A publication Critical patent/CN105761151A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Algebra (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

基于联合概率矩阵分解UPMF的移动社会化推荐方法,分三个步骤:第一步,基于用户评分信息构建评分矩阵,并进行归一化处理;第二步,基于用户社会化网络信息构建信任矩阵,包含直接信任度和间接信任度的计算;第三步,基于联合概率矩阵分解算法UPMF,结合用户评分矩阵和信任矩阵进行联合推荐。

Description

一种基于联合概率矩阵分解的移动社会化推荐方法
技术领域
本发明属于服务推荐领域。
现有技术
随着移动互联网信息和服务的日益增长,“移动信息过载”问题给移动用户带来很大的信息负担。移动推荐系统通过获取和预测潜在移动用户偏好过滤不相关的信息,为用户提供满足其个性化需求的结果,已逐渐成为缓解“移动信息过载”的有效手段。
现有的移动推荐系统主要基于传统互联网推荐模型,采用协同过滤推荐、基于内容的推荐、混合推荐等算法,存在数据稀疏性、冷启动和推荐精度低等问题。为了提高推荐精度,一些研究者将用户上下文信息,例如时间、位置、周围人员、网络条件等引入到推荐系统中;为了缓解数据稀疏性和冷启动问题,部分研究将社会化信息引入到推荐系统中,利用显示的社会化网络或者隐式的社会化群体行为对信息内容进行推荐。
为了进一步解决数据稀疏性和冷启动问题,一些现代的推荐系统采用矩阵分解MF技术进行推荐。传统的矩阵分解算法包括奇异值分解SVD、非负矩阵分解NMF,概率矩阵分解PMF等,这些算法通过将一个高维矩阵分解为两个或多个低维矩阵的乘积实现维度规约,方便于在一个低维空间研究高维数据的性质,然而这些方法只能结合单方面信息进行两维分解。联合概率矩阵分解UPMF可以结合多个上下文信息进行联合推荐,具有更好的灵活性和推荐性能,目前已有的UPMF方法结合用户评分信息和社会化网络信息进行推荐,在计算用户之间的信任度时,需要用户显著地标识与其他用户的信任关系,增加了操作的复杂性,同时也并未考虑到用户之间的间接信任关系对推荐性能的影响。
发明内容
本发明要克服现有技术上的上述缺点,提供一种基于联合概率矩阵分解UPMF的移动社会化推荐方法,结合用户评分信息和社会化网络信息进行联合推荐。同时,提出一种符合移动社会化网络特点的信任度计算方法,该方法仅根据社会化网络结构信息构建信任矩阵,降低了移动用户对信任度的主动标识,并引入间接信任关系提高信任矩阵密度,进一步提高推荐性能。
本发明的技术方案共分三个步骤:第一步,基于用户评分信息构建评分矩阵,并进行归一化处理;第二步,基于用户社会化网络信息构建信任矩阵,包含直接信任度和间接信任度的计算;第三步,基于联合概率矩阵分解算法UPMF,结合用户评分矩阵和信任矩阵进行联合推荐。
基于联合概率矩阵分解UPMF的移动社会化推荐方法具体步骤如下:
1.基于用户评分信息构建评分矩阵;
现有的推荐系统大多采用整型评分值1到Rmax表示用户的喜欢程度,为了不失一般性,将整型评分值映射到[0,1]区间,具体计算公式如(1)所示:
rij=f(Rij)=(Rij-1)/(Rmax-1)(1)
其中Rij代表移动用户ui对服务sj的整型评分值,rij是映射得到的评分值,rij∈[0,1]。
2.基于用户社会化网络信息构建信任矩阵;
本发明考虑到移动社会化网络多为群组结构的特点,提出一种符合该特点的信任度计算方法,包含直接信任度和间接信任度的计算。假设目标用户u1创建了群组msn11,并添加u2、u3、u4作为其群组成员,则认为用户u1和u2、u3、u4之间存在直接信任关系,u2、u3、u4是用户u1的邻居;同理,假设用户u5创建了群组msn51,并添加u3、u4作为其群组成员,则u3、u4是用户u5的邻居。尽管用户u1和u5之间没有直接信任关系,但存在共同的邻居u3和u4,则认为u1和u5之间存在间接信任关系,即u1和u5互为间接邻居。
相关概念定义如下:
相关度:用户之间的相关度主要依赖于用户之间是否具有直接或间接信任关系,若用户之间具有直接信任关系,则其(直接)相关度取决于邻居在目标用户所有创建的移动网络中出现的频率;若用户之间具有间接信任关系,则其(间接)相关度取决于用户双方共同好友的比例。
可信度:用户的可信度指用户在整个移动社会化网络中的可信程度,若用户的邻居数量越多,则其可信度越低,反之,若用户作为他人邻居的次数越多,则其可信度越高。
2.1直接信任度计算;
若用户ui和uk之间存在直接信任关系,即uk是ui的邻居,则直接信任度值如公式(2)所示:
DT u i - > u k = &alpha; &CenterDot; ds i k + ( 1 - &alpha; ) &CenterDot; t i k , 0 < &alpha; < 1 - - - ( 2 )
其中,α为直接相关度在信任度计算中所占的权重,dsik为用户ui对uk的直接相关度,具体公式如(3)所示:
ds i k = | msn u k &Element; msn i | | msn i | - - - ( 3 )
其中|msni|是用户ui创建的移动社会化网络数量,是用户ui创建的移动社会化网络中包含用户uk的网络数量。
tik为用户ui对uk的可信度计算公式,具体如公式(4)所示:
t i k = | N - ( u k ) | | N + ( u i ) | + | N - ( u k ) | - - - ( 4 )
其中N-(uk)是在整个社会化网络中信任用户uk的用户集合,即将uk作为邻居的用户集合,|N-(uk)|是用户uk的入度,即信任用户uk的用户集合大小;N+(ui)是用户ui在整个社会化网络中的邻居集合,|N+(ui)|是用户ui的出度,即用户ui的邻居集合大小。
2.2间接信任度计算;
若用户ui和uk之间存在间接信任关系,则间接信任度值如公式(5)所示:
IDT u i - > u k = &beta; &CenterDot; is i k + ( 1 - &beta; ) &CenterDot; t i k , 0 < &beta; < 1 - - - ( 5 )
其中,β为间接相关度在信任度计算中所占的权重,isik为用户ui对uk的间接相关度,具体公式如(6)所示:
is i k = | N + ( u i ) &cap; N + ( u k ) | | N + ( u i ) | - - - ( 6 )
其中|N+(ui)∩N+(uk)|为用户ui和uk在整个移动社会化网络中的共同邻居数量。tik为用户ui对uk的可信度,具体如公式(4)所示。
3.基于联合概率矩阵分解算法UPMF的移动社会化推荐;
本发明采用联合概率矩阵分解算法UPMF,结合步骤1求得的评分矩阵R=[rij]m×n和步骤2求得的信任矩阵S=[sik]m×m进行联合推荐,其中m为用户的数量,n为服务的数量。R可以分解为用户因子矩阵U∈Rl×m的转置和服务因子矩阵V∈Rl×n的乘积,S可以分解为用户因子矩阵U的转置和信任因子矩阵Z∈Rl×m的乘积,R和S共享用户因子矩阵U,其中Ri×j代表i×j的矩阵。Ui为U的第i列,Vj为V的第j列,Zk为Z的第k列,通过求解Ui和Vj重构得到评分矩阵R中空缺的rij,进而完成推荐。
具体步骤如下:
(31)求解潜在特征向量Ui和Vj
本方法以最大化联合后验概率为目标函数,基于梯度下降方法学习得到用户潜在特征向量Ui和服务潜在特征向量Vj
具体步骤如下:
S1.假设Ui,Vj和Zk先验概率服从高斯分布且相互独立,即:
p ( U | &sigma; U 2 ) = &Pi; i = 1 m N ( U i | 0 , &sigma; U 2 I ) - - - ( 7 )
p ( V | &sigma; V 2 ) = &Pi; j = 1 n N ( V j | 0 , &sigma; V 2 I ) - - - ( 8 )
p ( Z | &sigma; Z 2 ) = &Pi; k = 1 m N ( Z k | 0 , &sigma; Z 2 I ) - - - ( 9 )
其中N(x|μ,σ2)表示均值为μ,方差为σ2的高斯分布的概率密度函数,I表示单位矩阵。
S2.基于假设的潜在特征向量,分别求解R和S的条件概率分布
在给定用户ui、服务vj的潜在特征向量Ui,Vj后,用户ui对服务vj的评分值rij满足均值为方差为的正态分布且相互独立。评分矩阵R的条件概率分布如公式(10)所示:
p ( R | U , V , &sigma; R 2 ) = &Pi; i = 1 m &Pi; j = 1 n &lsqb; N ( r i j | g ( U i T V j ) , &sigma; R 2 ) &rsqb; I i j R - - - ( 10 )
其中是指示函数,当用户ui评分过服务vj否则,是逻辑斯蒂函数,将值映射到[0,1]。
同理,在给定潜在特征向量Ui,Zk后,信任矩阵S的条件概率分布如公式(11)所示:
p ( S | U , Z , &sigma; S 2 ) = &Pi; i = 1 m &Pi; k = 1 n &lsqb; N ( s i k | g ( U i T Z k ) , &sigma; S 2 ) &rsqb; I i k S - - - ( 11 )
其中,是指示函数,当用户ui与zk有关联关系时,否则,
S3.以最大化联合后验概率为目标函数
求解U,V,Z的后验分布函数。具体公式如(12)所示:
ln p ( U , V , Z | S , R , &sigma; S 2 , &sigma; R 2 , &sigma; U 2 , &sigma; V 2 , &sigma; Z 2 ) = - 1 2 &sigma; R 2 &Sigma; i = 1 m &Sigma; j = 1 n I i j R ( r i j - g ( U i T V j ) ) 2 - 1 2 &sigma; S 2 &Sigma; i = 1 m &Sigma; k = 1 m I i k S ( s i k - g ( U i T Z k ) ) 2 - 1 2 &sigma; U 2 &Sigma; i = 1 m U i T U i - - 1 2 &sigma; V 2 &Sigma; j = 1 n V j T V j - - 1 2 &sigma; Z 2 &Sigma; k = 1 m Z k T Z k - 1 2 ( ( &Sigma; i = 1 m &Sigma; j = 1 n I i j R ) ln&sigma; R 2 + ( &Sigma; i = 1 m &Sigma; k = 1 m I i k S ) ln&sigma; S 2 ) - 1 2 ( m l ln&sigma; U 2 + n l ln&sigma; V 2 + m l ln&sigma; Z 2 ) + C - - - ( 12 )
其中,C是常量。最大化公式(12)可视为无约束优化问题,最小化公式(13)等价于最大化公式(12):
E ( R , S , U , V , Z ) = 1 2 &Sigma; i = 1 m &Sigma; j = 1 n I i j R ( r i j - g ( U i T V j ) ) 2 + &lambda; S 2 &Sigma; i = 1 m &Sigma; k = 1 m I i k S ( s i k - g ( U i T Z k ) ) 2 + &lambda; U 2 | | U | | F 2 + &lambda; V 2 | | V | | F 2 + &lambda; Z 2 | | Z | | F 2 - - - ( 13 )
其中 &lambda; S = &sigma; R 2 / &sigma; S 2 , &lambda; U = &sigma; R 2 / &sigma; U 2 , &lambda; V = &sigma; R 2 / &sigma; V 2 , &lambda; Z = &sigma; R 2 / &sigma; Z 2 , ||·||F是弗罗贝尼乌斯范数。S4.基于梯度下降法求解潜在特征向量
公式(13)的局部最小值可由梯度下降法求得。参数Ui,Vj,Zk的梯度下降公式如下所示:
&part; E &part; U i = &Sigma; j = 1 n I i j R g &prime; ( U i T V j ) ( g ( U i T V j ) - r i j ) V j + &lambda; S &Sigma; k = 1 m I i k S g &prime; ( U i T Z k ) ( g ( U i T Z k ) - s i k ) Z k + &lambda; U U i - - - ( 14 )
&part; E &part; V j = &Sigma; i = 1 m I i j R g &prime; ( U i T V j ) ( g ( U i T V j ) - r i j ) U i + &lambda; V V j - - - ( 15 )
&part; E &part; Z k = &lambda; S &Sigma; i = 1 m I i k S g &prime; ( U i T Z k ) ( g ( U i T Z k ) - s i k ) U i + &lambda; Z Z k - - - ( 16 )
(32)根据潜在特征向量Ui和Vj重构得到rij
根据用户潜在特征向量Ui和服务潜在特征向量Vj,采用公式(17)重构得到rij
r i j = U i T V j - - - ( 17 )
(33)根据重构得到的评分矩阵进行服务推荐
根据步骤(32)补全评分矩阵中的空缺项,并依据评分值大小向目标用户推荐相应的服务。
本发明描述了一种基于联合概率矩阵分解UPMF的移动社会化推荐方法,结合用户的评分矩阵和基于社会化关系构建的信任矩阵进行联合推荐,进一步缓解了数据稀疏性和冷启动问题。在构建信任矩阵时,提出一种符合移动社会化网络特点的信任度计算方法,引入间接信任关系增加信任矩阵密度,进而提高了推荐准确率。
本发明的优点如下:
(1)思路新颖。本发明将联合概率矩阵分解方法UPMF应用于移动社会化推荐,提出一种符合移动社会化网络特点的信任度计算方法,结合用户的评分信息和信任信息进行联合推荐,进一步缓解了数据稀疏性和冷启动问题,提高了推荐精度。
(2)实现简单。本发明包含的评分矩阵构建,信任度计算以及联合概率矩阵分解算法UPMF实现起来比较简单。
(3)推荐精度高。本发明在构建信任矩阵时引入间接信任关系增加信任矩阵密度,进一步提高了推荐精度。
附图说明
图1为本发明的流程图。
图2为本发明的移动社会化推荐案例示例情况。
图3为本发明的基于UPMF的移动社会化推荐图模型。
具体实施方式
本发明所述的基于联合概率矩阵分解UPMF的移动社会化推荐方法如附图1所示,主要包含数据处理模块和基于UPMF的推荐引擎模块。其中数据处理模块主要负责对移动用户的评分信息和社会化网络信息进行处理,包含评分值映射和信任度计算两个子模块。评分值映射负责将整型评分值映射到[0,1]区间,信任度计算则负责计算用户之间的直接信任度和间接信任度。基于UPMF的推荐引擎模块采用UPMF方法,结合评分矩阵和信任矩阵信息进行联合推荐,主要包含缺失评分值重构和Top-k服务推荐两个子模块。其中缺失评分值重构通过计算用户潜在特征向量和服务潜在特征向量重构获得,Top-k服务推荐则根据重构得到的评分值大小,向目标用户进行服务推荐。
具体步骤如下:
1.基于用户评分信息构建评分矩阵
现有的推荐系统大多采用整型评分值1到Rmax表示用户的喜欢程度,为了不失一般性,将整型评分值映射到[0,1]区间,具体计算公式如(1)所示:
rij=f(Rij)=(Rij-1)/(Rmax-1)(1)
其中Rij代表移动用户ui对服务sj的整型评分值,rij是映射得到的评分值,rij∈[0,1]。
2.基于用户社会化网络信息构建信任矩阵
本发明考虑到移动社会化网络多为群组结构的特点,提出一种符合该特点的信任度计算方法,包含直接信任度和间接信任度的计算。假设目标用户u1创建了群组msn11,并添加u2、u3、u4作为其群组成员,则认为用户u1和u2、u3、u4之间存在直接信任关系,u2、u3、u4是用户u1的邻居;同理,假设用户u5创建了群组msn51,并添加u3、u4作为其群组成员,则u3、u4是用户u5的邻居。尽管用户u1和u5之间没有直接信任关系,但存在共同的邻居u3和u4,则认为u1和u5之间存在间接信任关系,即u1和u5互为间接邻居。
2.1直接信任度计算
若用户ui和uk之间存在直接信任关系,即uk是ui的邻居,则直接信任度值如公式(2)所示:
DT u i - > u k = &alpha; &CenterDot; ds i k + ( 1 - &alpha; ) &CenterDot; t i k , 0 < &alpha; < 1 - - - ( 2 )
其中,α为直接相关度在信任度计算中所占的权重,dsik为用户ui对uk的直接相关度,具体公式如(3)所示:
ds i k = | msn u k &Element; msn i | | msn i | - - - ( 3 )
其中|msni|是用户ui创建的移动社会化网络数量,是用户ui创建的移动社会化网络中包含用户uk的网络数量。
tik为用户ui对uk的可信度计算公式,具体如公式(4)所示:
t i k = | N - ( u k ) | | N + ( u i ) | + | N - ( u k ) | - - - ( 4 )
其中N-(uk)是在整个社会化网络中信任用户uk的用户集合,即将uk作为邻居的用户集合,|N-(uk)|是用户uk的入度,即信任用户uk的用户集合大小;N+(ui)是用户ui在整个社会化网络中的邻居集合,|N+(ui)|是用户ui的出度,即用户ui的邻居集合大小。
2.2间接信任度计算
若用户ui和uk之间存在间接信任关系,则间接信任度值如公式(5)所示:
IDT u i - > u k = &beta; &CenterDot; is i k + ( 1 - &beta; ) &CenterDot; t i k , 0 < &beta; < 1 - - - ( 5 )
其中,β为间接相关度在信任度计算中所占的权重,isik为用户ui对uk的间接相关度,具体公式如(6)所示:
is i k = | N + ( u i ) &cap; N + ( u k ) | | N + ( u i ) | - - - ( 6 )
其中|N+(ui)∩N+(uk)|为用户ui和uk在整个移动社会化网络中的共同邻居数量。tik为用户ui对uk的可信度,具体如公式(4)所示。
3.基于联合概率矩阵分解算法UPMF的移动社会化推荐
本发明采用联合概率矩阵分解算法UPMF,结合步骤1求得的评分矩阵R=[rij]m×n和步骤2求得的信任矩阵S=[sik]m×m进行联合推荐,其中m为用户的数量,n为服务的数量。R可以分解为用户因子矩阵U∈Rl×m的转置和服务因子矩阵V∈Rl×n的乘积,S可以分解为用户因子矩阵U的转置和信任因子矩阵Z∈Rl×m的乘积,R和S共享用户因子矩阵U,其中Ri×j代表i×j的矩阵。Ui为U的第i列,Vj为V的第j列,Zk为Z的第k列,通过求解Ui和Vj重构得到评分矩阵R中空缺的rij,进而完成推荐。
具体步骤如下:
(1)求解潜在特征向量Ui和Vj
本方法以最大化联合后验概率为目标函数,基于梯度下降方法学习得到用户潜在特征向量Ui和服务潜在特征向量Vj
具体步骤如下:
1)假设Ui,Vj和Zk先验概率服从高斯分布且相互独立,即:
p ( U | &sigma; U 2 ) = &Pi; i = 1 m N ( U i | 0 , &sigma; U 2 I ) - - - ( 7 )
p ( V | &sigma; V 2 ) = &Pi; j = 1 n N ( V j | 0 , &sigma; V 2 I ) - - - ( 8 )
p ( Z | &sigma; Z 2 ) = &Pi; k = 1 m N ( Z k | 0 , &sigma; Z 2 I ) - - - ( 9 )
其中N(x|μ,σ2)表示均值为μ,方差为σ2的高斯分布的概率密度函数,I表示单位矩阵。
2)基于假设的潜在特征向量,分别求解R和S的条件概率分布
在给定用户ui、服务vj的潜在特征向量Ui,Vj后,用户ui对服务vj的评分值rij满足均值为方差为的正态分布且相互独立。评分矩阵R的条件概率分布如公式(10)所示:
p ( R | U , V , &sigma; R 2 ) = &Pi; i = 1 m &Pi; j = 1 n &lsqb; N ( r i j | g ( U i T V j ) , &sigma; R 2 ) &rsqb; I i j R - - - ( 10 )
其中是指示函数,当用户ui评分过服务vj否则,g(x)=1/(1+e-x)是逻辑斯蒂函数,将值映射到[0,1]。
同理,在给定潜在特征向量Ui,Zk后,信任矩阵S的条件概率分布如公式(11)所示:
p ( S | U , Z , &sigma; S 2 ) = &Pi; i = 1 m &Pi; k = 1 n &lsqb; N ( s i k | g ( U i T Z k ) , &sigma; S 2 ) &rsqb; I i k S - - - ( 11 )
其中,是指示函数,当用户ui与zk有关联关系时,否则,
3)以最大化联合后验概率为目标函数
求解U,V,Z的后验分布函数。具体公式如(12)所示:
ln p ( U , V , Z | S , R , &sigma; S 2 , &sigma; R 2 , &sigma; U 2 , &sigma; V 2 , &sigma; Z 2 ) = - 1 2 &sigma; R 2 &Sigma; i = 1 m &Sigma; j = 1 n I i j R ( r i j - g ( U i T V j ) ) 2 - 1 2 &sigma; S 2 &Sigma; i = 1 m &Sigma; k = 1 m I i k S ( s i k - g ( U i T Z k ) ) 2 - 1 2 &sigma; U 2 &Sigma; i = 1 m U i T U i - - 1 2 &sigma; V 2 &Sigma; j = 1 n V j T V j - - 1 2 &sigma; Z 2 &Sigma; k = 1 m Z k T Z k - 1 2 ( ( &Sigma; i = 1 m &Sigma; j = 1 n I i j R ) ln&sigma; R 2 + ( &Sigma; i = 1 m &Sigma; k = 1 m I i k S ) ln&sigma; S 2 ) - 1 2 ( m l ln&sigma; U 2 + n l ln&sigma; V 2 + m l ln&sigma; Z 2 ) + C - - - ( 12 )
其中,C是常量。最大化公式(12)可视为无约束优化问题,最小化公式(13)等价于最大化公式(12):
E ( R , S , U , V , Z ) = 1 2 &Sigma; i = 1 m &Sigma; j = 1 n I i j R ( r i j - g ( U i T V j ) ) 2 + &lambda; S 2 &Sigma; i = 1 m &Sigma; k = 1 m I i k S ( s i k - g ( U i T Z k ) ) 2 + &lambda; U 2 | | U | | F 2 + &lambda; V 2 | | V | | F 2 + &lambda; Z 2 | | Z | | F 2 - - - ( 13 )
其中 &lambda; S = &sigma; R 2 / &sigma; S 2 , &lambda; U = &sigma; R 2 / &sigma; U 2 , &lambda; V = &sigma; R 2 / &sigma; V 2 , &lambda; Z = &sigma; R 2 / &sigma; Z 2 , ||·||F是弗罗贝尼乌斯范数。
4)基于梯度下降法求解潜在特征向量
公式(13)的局部最小值可由梯度下降法求得。参数Ui,Vj,Zk的梯度下降公式如下所示:
&part; E &part; U i = &Sigma; j = 1 n I i j R g &prime; ( U i T V j ) ( g ( U i T V j ) - r i j ) V j + &lambda; S &Sigma; k = 1 m I i k S g &prime; ( U i T Z k ) ( g ( U i T Z k ) - s i k ) Z k + &lambda; U U i - - - ( 14 )
&part; E &part; V j = &Sigma; i = 1 m I i j R g &prime; ( U i T V j ) ( g ( U i T V j ) - r i j ) U i + &lambda; V V j - - - ( 15 )
&part; E &part; Z k = &lambda; S &Sigma; i = 1 m I i k S g &prime; ( U i T Z k ) ( g ( U i T Z k ) - s i k ) U i + &lambda; Z Z k - - - ( 16 )
(2)根据潜在特征向量Ui和Vj重构得到rij
根据用户潜在特征向量Ui和服务潜在特征向量Vj,采用公式(17)重构得到rij
r i j = U i T V j - - - ( 17 )
(3)根据重构得到的评分矩阵进行服务推荐
根据步骤(2)补全评分矩阵中的空缺项,并依据评分值大小向目标用户推荐相应的服务。

Claims (1)

1.基于联合概率矩阵分解UPMF的移动社会化推荐方法,具体步骤如下:
步骤1.基于用户评分信息构建评分矩阵;
采用整型评分值1到Rmax表示用户的喜欢程度,为了不失一般性,将整型评分值映射到[0,1]区间,具体计算公式如(1)所示:
rij=f(Rij)=(Rij-1)/(Rmax-1)(1)
其中Rij代表移动用户ui对服务sj的整型评分值,rij是映射得到的评分值,rij∈[0,1];
步骤2.基于用户社会化网络信息构建信任矩阵;
提出一种符合群组结构特点的信任度计算方法,包含直接信任度和间接信任度的计算;假设目标用户u1创建了群组msn11,并添加u2、u3、u4作为其群组成员,则认为用户u1和u2、u3、u4之间存在直接信任关系,u2、u3、u4是用户u1的邻居;同理,假设用户u5创建了群组msn51,并添加u3、u4作为其群组成员,则u3、u4是用户u5的邻居;尽管用户u1和u5之间没有直接信任关系,但存在共同的邻居u3和u4,则认为u1和u5之间存在间接信任关系,即u1和u5互为间接邻居;
相关概念定义如下:
相关度:用户之间的相关度主要依赖于用户之间是否具有直接或间接信任关系,若用户之间具有直接信任关系,则其(直接)相关度取决于邻居在目标用户所有创建的移动网络中出现的频率;若用户之间具有间接信任关系,则其(间接)相关度取决于用户双方共同好友的比例;
可信度:用户的可信度指用户在整个移动社会化网络中的可信程度,若用户的邻居数量越多,则其可信度越低,反之,若用户作为他人邻居的次数越多,则其可信度越高;
21.直接信任度计算;
若用户ui和uk之间存在直接信任关系,即uk是ui的邻居,则直接信任度值如公式(2)所示:
DT u i - > u k = &alpha; &CenterDot; ds i k + ( 1 - &alpha; ) &CenterDot; t i k , 0 < &alpha; < 1 - - - ( 2 )
其中,α为直接相关度在信任度计算中所占的权重,dsik为用户ui对uk的直接相关度,具体公式如(3)所示:
ds i k = | msn u k &Element; msn i | | msn i | - - - ( 3 )
其中|msni|是用户ui创建的移动社会化网络数量,是用户ui创建的移动社会化网络中包含用户uk的网络数量;
tik为用户ui对uk的可信度计算公式,具体如公式(4)所示:
t i k = | N - ( u k ) | | N + ( u i ) | + | N - ( u k ) | - - - ( 4 )
其中N-(uk)是在整个社会化网络中信任用户uk的用户集合,即将uk作为邻居的用户集合,|N-(uk)|是用户uk的入度,即信任用户uk的用户集合大小;N+(ui)是用户ui在整个社会化网络中的邻居集合,|N+(ui)|是用户ui的出度,即用户ui的邻居集合大小;
22.间接信任度计算;
若用户ui和uk之间存在间接信任关系,则间接信任度值如公式(5)所示:
IDT u i - > u k = &beta; &CenterDot; is i k + ( 1 - &beta; ) &CenterDot; t i k , 0 < &beta; < 1 - - - ( 5 )
其中,β为间接相关度在信任度计算中所占的权重,isik为用户ui对uk的间接相关度,具体公式如(6)所示:
is i k = | N + ( u i ) &cap; N + ( u k ) | | N + ( u i ) | - - - ( 6 )
其中|N+(ui)∩N+(uk)|为用户ui和uk在整个移动社会化网络中的共同邻居数量;tik为用户ui对uk的可信度,具体如公式(4)所示;
步骤3.基于联合概率矩阵分解算法UPMF的移动社会化推荐;
采用联合概率矩阵分解算法UPMF,结合步骤1求得的评分矩阵R=[rij]m×n和步骤2求得的信任矩阵S=[sik]m×m进行联合推荐,其中m为用户的数量,n为服务的数量;R可以分解为用户因子矩阵U∈Rl×m的转置和服务因子矩阵V∈Rl×n的乘积,S可以分解为用户因子矩阵U的转置和信任因子矩阵Z∈Rl×m的乘积,R和S共享用户因子矩阵U,其中Ri×j代表i×j的矩阵。Ui为U的第i列,Vj为V的第j列,Zk为Z的第k列,通过求解Ui和Vj重构得到评分矩阵R中空缺的rij,进而完成推荐;
具体步骤如下:
(31)求解潜在特征向量Ui和Vj
以最大化联合后验概率为目标函数,基于梯度下降方法学习得到用户潜在特征向量Ui和服务潜在特征向量Vj
具体步骤如下:
S1.假设Ui,Vj和Zk先验概率服从高斯分布且相互独立,即:
p ( U | &sigma; U 2 ) = &Pi; i = 1 m N ( U i | 0 , &sigma; U 2 I ) - - - ( 7 )
p ( V | &sigma; V 2 ) = &Pi; j = 1 m N ( V j | 0 , &sigma; V 2 I ) - - - ( 8 )
p ( Z | &sigma; Z 2 ) = &Pi; k = 1 m N ( Z k | 0 , &sigma; Z 2 I ) - - - ( 9 )
其中N(x|μ,σ2)表示均值为μ,方差为σ2的高斯分布的概率密度函数,I表示单位矩阵;
S2.基于假设的潜在特征向量,分别求解R和S的条件概率分布;
在给定用户ui、服务vj的潜在特征向量Ui,Vj后,用户ui对服务vj的评分值rij满足均值为方差为的正态分布且相互独立;评分矩阵R的条件概率分布如公式(10)所示:
p ( R | U , V , &sigma; R 2 ) = &Pi; i = 1 m &Pi; j = 1 n &lsqb; N ( r i j | g ( U i T V j ) , &sigma; R 2 ) &rsqb; I l j R - - - ( 10 )
其中是指示函数,当用户ui评分过服务vj否则,g(x)=1/(1+e-x)是逻辑斯蒂函数,将值映射到[0,1];
同理,在给定潜在特征向量Ui,Zk后,信任矩阵S的条件概率分布如公式(11)所示:
p ( S | U , Z , &sigma; S 2 ) = &Pi; i = 1 m &Pi; k = 1 m &lsqb; N ( s i k | g ( U i T Z k ) , &sigma; S 2 ) &rsqb; I i k S - - - ( 11 )
其中,是指示函数,当用户ui与zk有关联关系时,否则,
S3.以最大化联合后验概率为目标函数
求解U,V,Z的后验分布函数;具体公式如(12)所示:
ln p ( U , V , Z | S , R , &sigma; S 2 , &sigma; R 2 , &sigma; U 2 , &sigma; V 2 , &sigma; Z 2 ) = - 1 2 &sigma; R 2 &Sigma; i = 1 m &Sigma; j = 1 n I i j R ( r i j - g ( U i T V j ) ) 2 - 1 2 &sigma; S 2 &Sigma; i = 1 m &Sigma; k = 1 m I i k S ( s i k - g ( U i T Z k ) ) 2 - 1 2 &sigma; U 2 &Sigma; i = 1 m U i T U i - 1 2 &sigma; V 2 &Sigma; j = 1 n V j T V j - 1 2 &sigma; Z 2 &Sigma; k = 1 m Z k T Z k - 1 2 ( ( &Sigma; i = 1 m &Sigma; j = 1 n I i j R ) ln&sigma; R 2 + ( &Sigma; i = 1 m &Sigma; k = 1 m I i k S ) ln&sigma; S 2 ) = 1 2 ( m l ln&sigma; U 2 + n l ln&sigma; V 2 + m l ln&sigma; Z 2 ) + C - - - ( 12 )
其中,C是常量;最大化公式(12)可视为无约束优化问题,最小化公式(13)等价于最大化公式(12):
E ( R , S , U , V , Z ) = 1 2 &Sigma; i = 1 m &Sigma; j = 1 n I i j R ( r i j - g ( U i T V j ) ) 2 + &lambda; S 2 &Sigma; i = 1 m &Sigma; k = 1 m I i k S ( s i k - g ( U i T Z k ) ) 2 + &lambda; U 2 | | U | | F 2 + &lambda; V 2 | | V | | F 2 + &lambda; Z 2 | | Z | | F 2 - - - ( 13 )
其中 &lambda; S = &sigma; R 2 / &sigma; S 2 , &lambda; U = &sigma; R 2 / &sigma; U 2 , &lambda; V = &sigma; R 2 / &sigma; V 2 , &lambda; Z = &sigma; R 2 / &sigma; Z 2 , ||·||F是弗罗贝尼乌斯范数;
S4.基于梯度下降法求解潜在特征向量;
公式(13)的局部最小值可由梯度下降法求得;参数Ui,Vj,Zk的梯度下降公式如下所示:
&part; E &part; U i = &Sigma; j = 1 n I i j R g &prime; ( U i T V j ) ( g ( U i T V j ) - r i j ) V j + &lambda; S &Sigma; k = 1 m I i k S g &prime; ( U i T Z k ) ( g ( U i T Z k ) - s i k ) Z k + &lambda; U U i - - - ( 14 )
&part; E &part; V j = &Sigma; i = 1 m I i j R g &prime; ( U i T V j ) ( g ( U i T V j ) - r i j ) U i + &lambda; V V j - - - ( 15 )
&part; E &part; Z k = &lambda; S &Sigma; i = 1 m I i k S g &prime; ( U i T Z k ) ( g ( U i T Z k ) - s i k ) U i + &lambda; Z Z k - - - ( 16 )
(32)根据潜在特征向量Ui和Vj重构得到rij
根据用户潜在特征向量Ui和服务潜在特征向量Vj,采用公式(17)重构得到rij
r i j = U i T V j - - - ( 17 )
(33)根据重构得到的评分矩阵进行服务推荐
根据步骤(32)补全评分矩阵中的空缺项,并依据评分值大小向目标用户推荐相应的服务。
CN201610074241.XA 2016-02-02 2016-02-02 一种基于联合概率矩阵分解的移动社会化推荐方法 Pending CN105761151A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610074241.XA CN105761151A (zh) 2016-02-02 2016-02-02 一种基于联合概率矩阵分解的移动社会化推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610074241.XA CN105761151A (zh) 2016-02-02 2016-02-02 一种基于联合概率矩阵分解的移动社会化推荐方法

Publications (1)

Publication Number Publication Date
CN105761151A true CN105761151A (zh) 2016-07-13

Family

ID=56329622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610074241.XA Pending CN105761151A (zh) 2016-02-02 2016-02-02 一种基于联合概率矩阵分解的移动社会化推荐方法

Country Status (1)

Country Link
CN (1) CN105761151A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874355A (zh) * 2016-12-28 2017-06-20 浙江浙大网新集团有限公司 同时融入社交关系和用户相似度的协同过滤方法
CN106980648A (zh) * 2017-02-27 2017-07-25 南京邮电大学 一种基于概率矩阵分解结合相似度的个性化推荐方法
CN107507073A (zh) * 2017-09-14 2017-12-22 中国人民解放军信息工程大学 基于信任扩展和列表级排序学习的服务推荐方法
CN110321494A (zh) * 2019-06-26 2019-10-11 北京交通大学 基于矩阵分解与网络嵌入联合模型的社会化推荐方法
CN110851701A (zh) * 2019-09-25 2020-02-28 浙江工业大学 一种基于用户上下文耦合相似度的概率矩阵分解推荐方法
CN110955829A (zh) * 2019-11-19 2020-04-03 江西财经大学 融合信任度和度量因子矩阵分解的兴趣点推荐方法及系统
CN112069417A (zh) * 2020-08-24 2020-12-11 北京神舟航天软件技术有限公司 一种工作分解结构wbs模板推荐方法
CN112883289A (zh) * 2021-04-16 2021-06-01 河北工程大学 一种基于社交信任和标签语义相似度的pmf推荐方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874355A (zh) * 2016-12-28 2017-06-20 浙江浙大网新集团有限公司 同时融入社交关系和用户相似度的协同过滤方法
CN106980648A (zh) * 2017-02-27 2017-07-25 南京邮电大学 一种基于概率矩阵分解结合相似度的个性化推荐方法
CN106980648B (zh) * 2017-02-27 2021-07-27 南京邮电大学 一种基于概率矩阵分解结合相似度的个性化推荐方法
CN107507073A (zh) * 2017-09-14 2017-12-22 中国人民解放军信息工程大学 基于信任扩展和列表级排序学习的服务推荐方法
CN110321494A (zh) * 2019-06-26 2019-10-11 北京交通大学 基于矩阵分解与网络嵌入联合模型的社会化推荐方法
CN110321494B (zh) * 2019-06-26 2021-08-31 北京交通大学 基于矩阵分解与网络嵌入联合模型的社会化推荐方法
CN110851701A (zh) * 2019-09-25 2020-02-28 浙江工业大学 一种基于用户上下文耦合相似度的概率矩阵分解推荐方法
CN110955829A (zh) * 2019-11-19 2020-04-03 江西财经大学 融合信任度和度量因子矩阵分解的兴趣点推荐方法及系统
CN110955829B (zh) * 2019-11-19 2023-05-23 江西财经大学 融合信任度和度量因子矩阵分解的兴趣点推荐方法及系统
CN112069417A (zh) * 2020-08-24 2020-12-11 北京神舟航天软件技术有限公司 一种工作分解结构wbs模板推荐方法
CN112883289A (zh) * 2021-04-16 2021-06-01 河北工程大学 一种基于社交信任和标签语义相似度的pmf推荐方法
CN112883289B (zh) * 2021-04-16 2022-05-06 河北工程大学 一种基于社交信任和标签语义相似度的pmf推荐方法

Similar Documents

Publication Publication Date Title
Li et al. Effective tourist volume forecasting supported by PCA and improved BPNN using Baidu index
CN105761151A (zh) 一种基于联合概率矩阵分解的移动社会化推荐方法
CN104731962B (zh) 一种社交网络中基于相似社团的好友推荐方法及系统
CN105117422B (zh) 智能社交网络推荐系统
Alaeddini et al. A probabilistic model for predicting the probability of no-show in hospital appointments
Shabri et al. Streamflow forecasting using least-squares support vector machines
Koop et al. Efficient posterior simulation for cointegrated models with priors on the cointegration space
Li et al. Interval programming models for matrix games with interval payoffs
Chen et al. Recommender system based on social trust relationships
CN111091247A (zh) 基于深度神经网络模型融合的电力负荷预测方法、装置
Chen et al. Research on location fusion of spatial geological disaster based on fuzzy SVM
Bedi et al. CitEnergy: A BERT based model to analyse Citizens’ Energy-Tweets
Sun et al. Multi-step ahead tourism demand forecasting: The perspective of the learning using privileged information paradigm
Subbiah et al. A review of short term load forecasting using deep learning
Tao et al. New evidence for Romania regarding dynamic causality between military expenditure and sustainable economic growth
Li et al. Mining boundary effects in areally referenced spatial data using the Bayesian information criterion
Wang et al. Knowledge fusion enhanced graph neural network for traffic flow prediction
CN102831219A (zh) 一种应用于社区发现的可覆盖聚类算法
Wang et al. Generalized RCINAR (p) process with signed thinning operator
Truquet et al. On the quasi-likelihood estimation for random coefficient autoregressions
Bhatnagar et al. Role of machine learning in sustainable engineering: a review
Wang et al. Reveal the hidden layer via entity embedding in traffic prediction
Aghayi et al. A robust optimization approach to overall profit efficiency with data uncertainty: application on bank industry
You et al. A hotel ranking model through online reviews with aspect-based sentiment analysis
Zhang et al. Recommendation using DMF-based fine tuning method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160713