CN109918576B - 一种基于联合概率矩阵分解的微博关注推荐方法 - Google Patents
一种基于联合概率矩阵分解的微博关注推荐方法 Download PDFInfo
- Publication number
- CN109918576B CN109918576B CN201910018970.7A CN201910018970A CN109918576B CN 109918576 B CN109918576 B CN 109918576B CN 201910018970 A CN201910018970 A CN 201910018970A CN 109918576 B CN109918576 B CN 109918576B
- Authority
- CN
- China
- Prior art keywords
- user
- matrix
- relationship
- influence
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 115
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 17
- 230000003993 interaction Effects 0.000 claims abstract description 31
- 230000007774 longterm Effects 0.000 claims abstract description 19
- 230000006399 behavior Effects 0.000 claims description 23
- 230000009471 action Effects 0.000 claims description 7
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于联合概率矩阵分解的微博关注推荐方法,包括步骤1、读取用户关系信息和用户交互行为信息;步骤2、由所述用户关系信息构建用户关系矩阵;步骤3、由所述用户交互行为信息构建长期影响力矩阵,将长期影响力矩阵作为用户影响力矩阵;步骤4、对用户关系矩阵和用户影响力矩阵进行联合概率矩阵分解,得到用户潜在特征矩阵和影响力潜在特征矩阵,对用户潜在特征矩阵和影响力潜在特征矩阵內积得到用户关系强度矩阵,根据用户关系强度矩阵提取用户关系强度列表,根据用户关系强度列表进行推荐。本发明考虑交互行为的时效性,能得到个性化的推荐结果,在一定程度上缓解了数据稀疏性问题,能够提供更好的推荐结果。
Description
技术领域
本发明涉及一种微博关注推荐方法,特别是涉及一种基于联合概率矩阵分解的微博关注推荐方法。
背景技术
社交网络庞大的用户基数以及极快的增长速度,产生了海量的社交网络数据。截至2017年,新浪微博月活跃人数已接近3亿,每天产生超过一亿条微博,月增长用户超过2000万。如何有效利用这些数据为用户推荐好友,缓解信息过载,成为一个亟需解决的难题。
现有技术已有将传统的推荐技术应用于社交网络推荐中。例如,从关联关系出发,假设存在关联关系的对象更容易受到同一用户关注,利用对象间的关联关系进行推荐。又如,将在线社交网络中存在着不同于直接连接的弱依赖关系,以及社交网络具有异质性,两者结合起来应用于社交网络关注推荐。也有技术方案通过挖掘社交关系,建立局部信任和全局信任,并利用信任的传播性质对信任关系进行建模,最后综合考虑相似关系和信任关系筛选邻居节点进行推荐。还有的方案考虑了用户之间的交互行为,通过用户间的关注关系强度、交互频率、个体兴趣计算用户之间的关联兴趣,并基于此产生推荐列表。但是上述方法仅考虑了用户之间的静态的关注关系和交互频率,并不能准确衡量用户之间的关系强度,导致推荐结果被接受概率低。
发明内容
针对上述现有技术的缺陷,本发明提供了一种基于联合概率矩阵分解的微博关注推荐方法,以缓解数据稀疏性问题,能够提供更好的推荐结果。
本发明技术方案如下:一种基于联合概率矩阵分解的微博关注推荐方法,包括以下步骤:
步骤1、读取用户关系信息和用户交互行为信息;
步骤2、由所述用户关系信息构建用户关系矩阵;
步骤3、由所述用户交互行为信息构建长期影响力矩阵,将长期影响力矩阵作为用户影响力矩阵;
步骤4、对用户关系矩阵和用户影响力矩阵进行联合概率矩阵分解,得到用户潜在特征矩阵和影响力潜在特征矩阵,对用户潜在特征矩阵和影响力潜在特征矩阵內积得到用户关系强度矩阵,根据用户关系强度矩阵提取用户关系强度列表,根据用户关系强度列表进行推荐;
所述用户关系矩阵为S(v)={(u1,w1),(u2,w2),...,(un,wn)},其中v,ui,i=1,2,...,n为用户,n为数据中与用户v相似的用户数目;wi,i=1,2,...,n为用户ui与v的关系相似度在v所有相似用户中的权重,
其中Sim(ui,v)为用户ui与v的双向关系相似度的线性加权相似度,所述双向关系相似度为粉丝关系相似度和关注关系相似度;
所述长期影响力矩阵基于公式更新,其中In1表示更新后的长期影响力矩阵;Iol是更新前的长期影响力矩阵;In是基于最新的交互行为构建的影响力矩阵;N是矩阵中总的交互行为数目,所述Inl,Iol,In基于构建,TL表示矩阵构建时间点,
Action(u,v,s,i)=α1Like(u,v,s,i)+α2Retweet(u,v,s,i)+α3Comment(u,v,s,i),
m为用户u所发微博的总数,t是矩阵建立时的时间,s是数据的获取的时间长度,α1,α2,α3为权重系数,Like(u,v,s,i)是用户v对u的第i条微博点赞,Retweet(u,v,s,i)是用户v对u的第i条微博转发,Comment(u,v,s,i)用户v对u的第i条微博评论。
进一步的,所述步骤2中由所述用户关系信息构建用户关系矩阵后,判断用户v是否在线,如果用户在线进入步骤3’,如果用户不在线进入所述步骤3,
所述步骤3’为由所述用户交互行为信息构建短期影响力矩阵,将短期影响力矩阵作为用户影响力矩阵,进入步骤4,
Action(u,v,s,i)=α1Like(u,v,s,i)+α2Retweet(u,v,s,i)+α3Comment(u,v,s,i),
m为用户u在时间S内所发微博的总数,t是矩阵建立时的时间,α1,α2,α3为权重系数,Like(u,v,s,i)是用户v对u的第i条微博点赞,Retweet(u,v,s,i)是用户v对u的第i条微博转发,Comment(u,v,s,i)用户v对u的第i条微博评论,t0是矩阵建立的初始时间;hl是影响力的半衰期。
进一步的,所述时间S由以下公式确定
MinDays,MaxDays,MinActionNums,MaxActionNums为常量,RAN是近期交互行为数目。
进一步的,所述Sim(u,v)=λSimI(u,v)+(1-λ)SimO(u,v),
其中SimI(u,v)是用户u与v的粉丝关系相似度;SimO(u,v)是用户u与v的关注关系相似度;NI(u)和NI(v)分别表示用户u与v的粉丝用户的集合;NO(u)和NO(v)分别表示用户u与v的关注用户的集合,λ是粉丝相似度的权值。
进一步的,所述根据用户关系强度列表进行推荐是将用户关系强度列表中用户关系强度数值最大的前N个用户ui推荐给用户v。
本发明所提供的技术方案的优点在于:引入遗忘函数来差异性地对待不同时间的交互行为,考虑交互行为的时效性建立了用户影响力模型,结合静态关注关系,并引入联合概率矩阵分解方法,从而得到个性化的推荐结果,在一定程度上缓解了数据稀疏性问题,能够提供更好的推荐结果。
附图说明
图1为本发明基于联合概率矩阵分解的微博关注推荐方法流程示意图。
图2为UPMFF模型示意图。
具体实施方式
下面结合实施例对本发明作进一步说明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等同形式的修改均落于本申请所附权利要求所限定的范围内。
请结合图1所示,实施例所涉及的基于联合概率矩阵分解的微博关注推荐方法是这样的:
步骤1:读取用户关系信息和用户交互行为信息;
步骤2:由所述用户关系信息构建用户关系矩阵,考虑节点共同邻居的数目,节点相似度正比于共同邻居数目。综合考虑节点出度相似度和入度相似度,对两种相似度的计算如下:
其中SimI(u,v)是用户u与v的粉丝关系相似度;SimO(u,v)是用户u与v的关注关系相似度;NI(u)和NI(v)分别表示用户u与v的粉丝用户的集合;NO(u)和NO(v)分别表示用户u与v的关注用户的集合。
使用双向关系线性加权来计算最终的关系相似度
Sim(u,v)=λSimI(u,v)+(1-λ)SimO(u,v)
λ是粉丝相似度的权值,在此基础上,引入用户相似度权重,
其中Sim(ui,v)为用户ui与v的双向关系相似度的线性加权相似度,双向关系相似度为粉丝关系相似度和关注关系相似度,n为数据中与用户v相似的用户数目,最终用户v的用户关系矩阵为S(v)={(u1,w1),(u2,w2),...,(un,wn)}。
判断用户v是否在线,如果用户在线,进入步骤3’,如果用户不在线,进入步骤3。
步骤3’引入遗忘函数来差异性地对待不同时间的交互行为。定义遗忘函数如下:
t是矩阵建立时的时间,t0是矩阵建立的初始时间,hl是影响力的半衰期,是影响力衰退到初始值一半时所用的时间。当t=t0时,F(t)=1;当t-t0=hl时,F(t)=1/2。
短期影响力模型指定了一个大小为S的时间窗口,覆盖了用于建模的用户交互行为。为了确定时间窗口的大小,定义了四个常量:MinDays,MaxDays,MinActionNums,MaxActionNums,并采用如下策略计算S:
RAN是近期交互行为数目。基于三种交互行为建立的短期影响力如下所示:
Action(u,v,s,i)=α1Like(u,v,s,i)+α2Retweet(u,v,s,i)+α3Comment(u,v,s,i)
其中,m为用户u在时间S内所发微博的总数,t是矩阵建立时的时间,α1,α2,α3为三种交互行为的权重系数,Like(u,v,s,i)是用户v对u的第i条微博点赞,Retweet(u,v,s,i)是用户v对u的第i条微博转发,Comment(u,v,s,i)用户v对u的第i条微博评论;Action(u,v,s,i)是用户v对u的第i条微博的交互行为。用户u对v的影响力权重如下
ui表示对v产生影响的用户;n是数据集中对v产生影响的用户数目。
步骤3,为了模拟影响力的变化过程,当有新的交互行为发生时,系统会为这些交互行为生成新的影响力模型向量。长期影响力矩阵基于公式更新,其中Inl表示更新后的长期影响力矩阵;Iol是更新前的长期影响力矩阵;In是基于最新的交互行为构建的影响力矩阵;N是矩阵中总的交互行为数目,Inl,Iol,In基于构建,TL表示矩阵构建时间点。
不同于短期影响力模型,长期影响力模型中遗忘函数半衰期不再是一个常量。长期影响力的衰减速度会随着时间的流逝而逐渐变慢,也就是半衰期会随着时间增长而变长,构造了新的遗忘函数如下
t是当前的时间;t0是矩阵建立时的时间,hl0是半衰期的初始值,dacc表示模型建立后到当前所经历的时间,常量dw表示dacc对遗忘速度的影响程度,通过控制dacc和dw来控制长期影响力模型的衰落速度,
Action(u,v,s,i)=α1Like(u,v,s,i)+α2Retweet(u,v,s,i)+α3Comment(u,v,s,i)
m为用户u所发微博的总数,t是矩阵建立时的时间,s是数据的获取的时间长度,α1,α2,α3为权重系数,Like(u,v,s,i)是用户v对u的第i条微博点赞,Retweet(u,v,s,i)是用户v对u的第i条微博转发,Comment(u,v,s,i)用户v对u的第i条微博评论。将长期影响力矩阵作为用户影响力矩阵,进入步骤4。
步骤4:基于联合概率矩阵分解的微博关注推荐模型,请结合图2所示,
假设Ui、Vj和Fk的先验概率均服从高斯分布且相互独立,即:
其中,N(x|μ,σ2)表示均值为μ,方差为σ2的正态分布的概率密度函数,E为单位矩阵。
同理,在确定Ui和Fk后,关系相似度矩阵S的条件概率如下式所示:
推荐被接受的概率与静态的关注关系以及交互强度相关,所以UPMFF模型将基于交互行为的用户影响力矩阵和基于用户关系的用户关系矩阵进行联合分解,得到用户潜在特征矩阵和影响力潜在特征矩阵,对用户潜在特征矩阵和影响力潜在特征矩阵內积得到用户关系强度矩阵,根据用户关系强度矩阵提取用户关系强度列表,将用户关系强度列表中用户关系强度数值最大的前N个用户ui推荐给用户v。
使用scrapy爬虫从新浪微博爬取了五个月(2018.1~2018.5)的微博数据。对这些数据进行简单处理:去除了一些交互次数小于10次或者关系数小于10的用户。采用F1-Measure作为算法评估标准,F1-Measure综合了信息检索领域中查准率和查全率两种评估指标,F1-Measure值越大表明推荐准确率越高。实验结果表明,本实施例算法推荐准确率高于SoRec、PMF和NMF算法。
Claims (5)
1.一种基于联合概率矩阵分解的微博关注推荐方法,其特征在于,包括以下步骤:
步骤1:读取用户关系信息和用户交互行为信息;
步骤2:由所述用户关系信息构建用户关系矩阵;
步骤3、由所述用户交互行为信息构建长期影响力矩阵,将长期影响力矩阵作为用户影响力矩阵;
步骤4、对用户关系矩阵和用户影响力矩阵进行联合概率矩阵分解,得到用户潜在特征矩阵和影响力潜在特征矩阵,对用户潜在特征矩阵和影响力潜在特征矩阵內积得到用户关系强度矩阵,根据用户关系强度矩阵提取用户关系强度列表,根据用户关系强度列表进行推荐;
所述用户关系矩阵为S(v)={(u1,w1),(u2,w2),...,(un,wn)},其中v,ui,i=1,2,...,n为用户,n为数据中与用户v相似的用户数目;wi,i=1,2,...,n为用户ui与v的关系相似度在v所有相似用户中的权重,
其中Sim(ui,v)为用户ui与v的双向关系相似度的线性加权相似度,所述双向关系相似度为粉丝关系相似度和关注关系相似度;
所述长期影响力矩阵基于公式更新,其中Inl表示更新后的长期影响力矩阵;Iol是更新前的长期影响力矩阵;In是基于最新的交互行为构建的影响力矩阵;N是矩阵中总的交互行为数目,所述Inl,Iol,In基于构建,TL表示矩阵构建时间点,
Action(u,v,s,i)=α1Like(u,v,s,i)+α2Retweet(u,v,s,i)+α3Comment(u,v,s,i),
m为用户u所发微博的总数,t是矩阵建立时的时间,s是数据的获取的时间长度,α1,α2,α3为权重系数,Like(u,v,s,i)是用户v对u的第i条微博点赞,Retweet(u,v,s,i)是用户v对u的第i条微博转发,Comment(u,v,s,i)用户v对u的第i条微博评论。
2.根据权利要求1所述的基于联合概率矩阵分解的微博关注推荐方法,其特征在于,所述步骤2中由所述用户关系信息构建用户关系矩阵后,判断用户v是否在线,如果用户在线进入步骤3’,如果用户不在线进入所述步骤3,
所述步骤3’为由所述用户交互行为信息构建短期影响力矩阵,将短期影响力矩阵作为用户影响力矩阵,进入步骤4,
Action(u,v,s,i)=α1Like(u,v,s,i)+α2Retweet(u,v,s,i)+α3Comment(u,v,s,i),
m为用户u在时间S内所发微博的总数,t是矩阵建立时的时间,α1,α2,α3为权重系数,Like(u,v,s,i)是用户v对u的第i条微博点赞,Retweet(u,v,s,i)是用户v对u的第i条微博转发,Comment(u,v,s,i)用户v对u的第i条微博评论。
5.根据权利要求1所述的基于联合概率矩阵分解的微博关注推荐方法,其特征在于,所述根据用户关系强度列表进行推荐是将用户关系强度列表中用户关系强度数值最大的前N个用户ui推荐给用户v。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910018970.7A CN109918576B (zh) | 2019-01-09 | 2019-01-09 | 一种基于联合概率矩阵分解的微博关注推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910018970.7A CN109918576B (zh) | 2019-01-09 | 2019-01-09 | 一种基于联合概率矩阵分解的微博关注推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109918576A CN109918576A (zh) | 2019-06-21 |
CN109918576B true CN109918576B (zh) | 2021-01-05 |
Family
ID=66960147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910018970.7A Active CN109918576B (zh) | 2019-01-09 | 2019-01-09 | 一种基于联合概率矩阵分解的微博关注推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109918576B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113240052A (zh) * | 2021-06-09 | 2021-08-10 | 上海冰鉴信息科技有限公司 | 一种业务信息分类方法及装置 |
CN119311954B (zh) * | 2024-12-17 | 2025-04-11 | 济南霆盈智能装备科技有限公司 | 一种教学课件智能推荐方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101105795A (zh) * | 2006-10-27 | 2008-01-16 | 北京搜神网络技术有限责任公司 | 基于网络行为的个性化推荐方法和系统 |
CN102122291A (zh) * | 2011-01-18 | 2011-07-13 | 浙江大学 | 一种基于树形日志模式分析的博客好友推荐方法 |
CN105260390A (zh) * | 2015-09-11 | 2016-01-20 | 合肥工业大学 | 一种面向群组的基于联合概率矩阵分解的项目推荐方法 |
CN106294758A (zh) * | 2016-09-23 | 2017-01-04 | 华南师范大学 | 基于用户认知度变化的协同推荐方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080077574A1 (en) * | 2006-09-22 | 2008-03-27 | John Nicholas Gross | Topic Based Recommender System & Methods |
WO2011049612A1 (en) * | 2009-10-20 | 2011-04-28 | Lisa Morales | Method and system for online shopping and searching for groups of items |
-
2019
- 2019-01-09 CN CN201910018970.7A patent/CN109918576B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101105795A (zh) * | 2006-10-27 | 2008-01-16 | 北京搜神网络技术有限责任公司 | 基于网络行为的个性化推荐方法和系统 |
CN102122291A (zh) * | 2011-01-18 | 2011-07-13 | 浙江大学 | 一种基于树形日志模式分析的博客好友推荐方法 |
CN105260390A (zh) * | 2015-09-11 | 2016-01-20 | 合肥工业大学 | 一种面向群组的基于联合概率矩阵分解的项目推荐方法 |
CN106294758A (zh) * | 2016-09-23 | 2017-01-04 | 华南师范大学 | 基于用户认知度变化的协同推荐方法 |
Non-Patent Citations (3)
Title |
---|
Social friend interest similarity in microblog and its implication;YuY等;《International Journal of Control&Automation》;20151231;正文第931-936页 * |
social network user recommendation method based on dynamic influence;熊孝全等;《15th International conference,WISA 2018》;20181231;正文第455-465页 * |
一种结合推荐对象间关联关系的社会化推荐算法;郭磊等;《计算机学报》;20141231;正文第219-228页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109918576A (zh) | 2019-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110503531B (zh) | 时序感知的动态社交场景推荐方法 | |
US10515424B2 (en) | Machine learned query generation on inverted indices | |
Backstrom et al. | Supervised random walks: predicting and recommending links in social networks | |
TW202139045A (zh) | 基於隱私保護確定目標業務模型的方法及裝置 | |
CN112231592B (zh) | 基于图的网络社团发现方法、装置、设备以及存储介质 | |
CN112966763A (zh) | 一种分类模型的训练方法、装置、电子设备及存储介质 | |
CN104281882A (zh) | 基于用户特征的预测社交网络信息流行度的方法及系统 | |
CN107122455A (zh) | 一种基于微博的网络用户增强表示方法 | |
CN110162711B (zh) | 一种基于网络嵌入法的资源智能推荐方法及系统 | |
CN113343091A (zh) | 面向产业和企业的科技服务推荐计算方法、介质及程序 | |
CN114548296B (zh) | 一种基于自适应框架的图卷积推荐方法及相关装置 | |
CN113408706A (zh) | 训练用户兴趣挖掘模型、用户兴趣挖掘的方法和装置 | |
CN106651427B (zh) | 基于用户行为的数据关联方法 | |
US9594756B2 (en) | Automated ranking of contributors to a knowledge base | |
CN109918576B (zh) | 一种基于联合概率矩阵分解的微博关注推荐方法 | |
Chen et al. | Mining hidden non-redundant causal relationships in online social networks | |
CN117787500A (zh) | 一种基于大数据分析的选课推荐方法和系统 | |
CN112257959A (zh) | 用户风险预测方法、装置、电子设备及存储介质 | |
CN115344794A (zh) | 一种基于知识图谱语义嵌入的旅游景点推荐方法 | |
Zarezade et al. | Recurrent spatio-temporal modeling of check-ins in location-based social networks | |
CN111177526A (zh) | 网络意见领袖识别方法及装置 | |
CN112052995A (zh) | 基于融合情感倾向主题的社交网络用户影响力预测方法 | |
CN117056595A (zh) | 一种交互式的项目推荐方法、装置及计算机可读存储介质 | |
CN111026863A (zh) | 客户行为预测方法、装置、设备及介质 | |
Gong | Analysis of internet public opinion popularity trend based on a deep neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |