CN107122852A - 一种基于pmf的微博用户兴趣预测方法 - Google Patents
一种基于pmf的微博用户兴趣预测方法 Download PDFInfo
- Publication number
- CN107122852A CN107122852A CN201710272626.1A CN201710272626A CN107122852A CN 107122852 A CN107122852 A CN 107122852A CN 201710272626 A CN201710272626 A CN 201710272626A CN 107122852 A CN107122852 A CN 107122852A
- Authority
- CN
- China
- Prior art keywords
- user
- social
- matrix
- pmf
- user interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 239000011159 matrix material Substances 0.000 claims abstract description 44
- 230000006399 behavior Effects 0.000 claims description 31
- 238000005065 mining Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 abstract 4
- 238000009412 basement excavation Methods 0.000 abstract 1
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于PMF的微博用户兴趣预测方法,包括以下步骤:S1:获取微博用户发文行为、社交圈信息以及社交关系的原始数据;S2:对用户、用户发文行为和社交圈信息的原始数据进行自动化文本标记,建立用户兴趣主题矩阵,对社交关系的原始数据进行社交关系挖掘后得到用户与用户之间的社交信任关系矩阵;S3:对所述S2进行相应的时序建模,形成用户发文行为时序模型和用户社交圈信息时序模型;S4:将所述S2和所述S3中的用户发文行为时序模型、用户社交圈信息时序模型和社交信任矩阵代入SC‑PMF预测模型,得出微博用户兴趣预测结果。本发明融合了用户历史行为、用户社交信任关系、用户社交圈中博文信息等因素,解决冷启动问题。
Description
技术领域
本发明属于社交网络信息分析技术领域,具体涉及一种基于PMF的微博用户兴趣预 测方法。
背景技术
关于微博用户兴趣预测,比较成熟的一系列办法是基于概率图模型的概率矩阵分解 方法。它能够简洁地表示复杂的概率分布,有效地计算边缘和条件分布,方便地学习概率模型中的参数和超参数,而其中的概率矩阵分解法经常被用于预测用户的兴趣与推 荐。
2008年R.Salakhutdinov等人针对传统的协同过滤算法不能解决大量稀疏的数据集的推荐与冷启动问题,提出了概率矩阵分解(PMF)方法。在大量稀疏非平衡数据集Netflix上做实验,证明了PMF在非平衡数据集上的有效性。同年,Ma H等人将PMF应 用到社交网络与社会化推荐中,并对方法的复杂度与预测精度进行了详细分析。2010 年Jamali M等人结合社交网络的特点,考虑了用户与用户之间的社交信任关系的基础 上提出了社交矩阵分解(Social-PMF)模型。该模型推动了PMF在社会化推荐上的应用 前景。2013年孙光福等人提出了一种对用户时序行为进行建模的方法,并将该方法与社 交概率矩阵分解(Social-PMF)相结合,对微博用户兴趣进行了预测。实验证明这种建 模方式比传统的基于标签信息的推荐算法更加有效。Bao等人分考虑到用户兴趣是随时 间发生变化的这一基本事实,提出了一种针对用户短时兴趣的TS-PMF方法。该方法相 较于之前的兴趣预测方法都有精度上的提升。
以上研究在建立微博用户兴趣预测模型时都忽略了用户社交圈中的博文信息对用 户未来的兴趣以及行为的影响。
发明内容
针对上述问题,本发明在进行用户兴趣预测时,融合了用户历史行为、用户社交信任关系、用户社交圈中博文信息等因素,提出了一种基于PMF的微博用户兴趣预测方法。
本发明提供了如下的技术方案:
一种基于PMF的微博用户兴趣预测方法,包括以下步骤:
S1:获取微博用户发文行为、社交圈信息以及社交关系的原始数据;
S2:对用户、用户发文行为和社交圈信息的原始数据进行自动化文本标记,建立用户兴趣主题矩阵,对社交关系的原始数据进行社交关系挖掘后得到用户与用户之间的社交信任关系矩阵;
S3:对所述S2中自动化文本标记后的数据进行相应的时序建模,形成用户发文行为时序模型和用户社交圈信息时序模型;
S4:将所述S2和所述S3中的用户发文行为时序模型、用户社交圈信息时序模型和社交信任矩阵代入SC-PMF预测模型,得出微博用户兴趣预测结果。
优选的,所述S2中对用户、用户发文行为和社交圈信息的原始数据进行自动化文本标记,分别标记为用户F、用户发文行为U和社交圈信息V,建立用户兴趣主题矩阵R, 得到用户与用户之间的社交信任关系矩阵F∈Rn×n。
优选的,所述S3中的用户发文行为时序模型为U∈Rd×n,所述用户社交圈信息时序模型为V∈Rd×m,其中d是隐含特征维数。
优选的,所述S4中的SC-PMF预测模型包括如下步骤:
S41:输入用户数据集、隐含特征维数、相关参数和最大迭代次数;
S42:输出时间段N+1中的用户兴趣矩阵,并且设置遗忘函数分析用户兴趣变化的零矩阵;
S43:初始化设置用户发文行为、社交圈信息和损失函数,并计算设置遗忘函数分析用户兴趣变化的零矩阵的平均矩阵;
S44:采用梯度下降计算更新数据后的损失函数,得到新的用户发文行为、社交圈信息,并根据预测近似矩阵得出预测的用户兴趣矩阵,从而得出微博用户兴趣预测结果。
优选的,所述S41中的用户数据集包括两组用户兴趣主题矩阵的集合和用户 {R11,R12,…R1N},{R21,R22,…R2N},F1,F2,隐含特征维数d,相关参数为 θ,β,λ,更新参数为α,收敛参数为ε,最大迭代次数为K,所述 S42中的遗忘函数为
优选的,所述S44中采用梯度下降计算损失函数为:
其中, 指示函数,如果Rij=1,则否则g(x)=1/(1+exp(-x)):logistic 函数,能够使得预测评分在[0,1]之间,所述预测近似矩阵为
本发明的有益效果是:本发明提出了一个综合了用户历史行为信息、社交信任及传 播关系、时序变化因素以及用户社交圈信息的微博用户兴趣预测方法(SC-PMF),并在微博数据集上设计实验验证了该模型的有效性;本发明提出的微博用户兴趣预测方法(SC-PMF)显著提高了Top-n预测准确率,为后续的推荐等研究工作奠定了基础;同时, 对于在微博上不经常发博文的用户,可以通过对他们的社交圈信息的分析,一定程度上 解决冷启动问题;该方法在社交平台的推荐中有很大的应用空间。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施 例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明的流程示意图;
图2是本发明的SC-PMF算法流程示意图。
具体实施方式
如图1所示,一种基于PMF的微博用户兴趣预测方法,包括以下步骤:
S1:获取微博用户发文行为、社交圈信息以及社交关系的原始数据;
S2:对用户、用户发文行为和社交圈信息的原始数据进行自动化文本标记,建立用户兴趣主题矩阵,对社交关系的原始数据进行社交关系挖掘后得到用户与用户之间的社交信任关系矩阵;
S3:对S2中自动化文本标记后的数据进行相应的时序建模,形成用户发文行为时序模型和用户社交圈信息时序模型;
S4:将S2和S3中的用户发文行为时序模型、用户社交圈信息时序模型和社交信任矩阵代入SC-PMF预测模型,得出微博用户兴趣预测结果。
进一步地,S2中对用户、用户发文行为和社交圈信息的原始数据进行自动化文本标 记,分别标记为用户F、用户发文行为U和社交圈信息V,建立用户兴趣主题矩阵R,得 到用户与用户之间的社交信任关系矩阵F∈Rn×n。S3中的用户发文行为时序模型为 U∈Rd×n,用户社交圈信息时序模型为V∈Rd×m,其中d是隐含特征维数。
如图2所示,S4中的SC-PMF预测模型包括如下步骤:
S41:输入用户数据集、隐含特征维数、相关参数和最大迭代次数;
S42:输出时间段N+1中的用户兴趣矩阵,并且设置遗忘函数分析用户兴趣变化的零矩阵;
S43:初始化设置用户发文行为U、社交圈信息V和损失函数,并计算设置遗忘函数分析用户兴趣变化的零矩阵的平均矩阵;
S44:采用梯度下降计算更新数据后的损失函数,得到新的用户发文行为U、社交圈信息V,并根据预测近似矩阵得出预测的用户兴趣矩阵,从而得出微博用户兴趣预测结 果。
进一步地,S41中用户数据集包括两组用户兴趣主题矩阵的集合和用户 {R11,R12,…R1N},{R21,R22,…R2N},F1,F2,隐含特征维数d,相关参数为θ,β,λ,更新参数为α,收敛参数为ε,最大迭代次数为K,S42 中的遗忘函数为
S44中采用梯度下降计算损失函数为:
其中, 指示函数,如果Rij=1,则否则g(x)=1/(1+exp(-x)):logistic函数,能够使得预测评分在[0,1]之间,预测近似矩阵为
如图2所示,SC-PMF可有如下两种算法:
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施 例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的 精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围 之内。
Claims (6)
1.一种基于PMF的微博用户兴趣预测方法,其特征在于,包括以下步骤:
S1:获取微博用户发文行为、社交圈信息以及社交关系的原始数据;
S2:对用户、用户发文行为和社交圈信息的原始数据进行自动化文本标记,建立用户兴趣主题矩阵,对社交关系的原始数据进行社交关系挖掘后得到用户与用户之间的社交信任关系矩阵;
S3:对所述S2中自动化文本标记后的数据进行相应的时序建模,形成用户发文行为时序模型和用户社交圈信息时序模型;
S4:将所述S2和所述S3中的用户发文行为时序模型、用户社交圈信息时序模型和社交信任矩阵代入SC-PMF预测模型,得出微博用户兴趣预测结果。
2.根据权利要求1所述的一种基于PMF的微博用户兴趣预测方法,其特征在于,所述S2中对用户、用户发文行为和社交圈信息的原始数据进行自动化文本标记,分别标记为用户F、用户发文行为U和社交圈信息V,建立用户兴趣主题矩阵R,得到用户与用户之间的社交信任关系矩阵F∈Rn×n。
3.根据权利要求2所述的一种基于PMF的微博用户兴趣预测方法,其特征在于,所述S3中的用户发文行为时序模型为U∈Rd×n,所述用户社交圈信息时序模型为V∈Rd×m,其中d是隐含特征维数。
4.根据权利要求3所述的一种基于PMF的微博用户兴趣预测方法,其特征在于,所述S4中的SC-PMF预测模型包括如下步骤:
S41:输入用户数据集、隐含特征维数、相关参数和最大迭代次数;
S42:输出时间段N+1中的用户兴趣矩阵,并且设置遗忘函数分析用户兴趣变化的零矩阵;
S43:初始化设置用户发文行为、社交圈信息和损失函数,并计算设置遗忘函数分析用户兴趣变化的零矩阵的平均矩阵;
S44:采用梯度下降计算更新数据后的损失函数,得到新的用户发文行为、社交圈信息,并根据预测近似矩阵得出预测的用户兴趣矩阵,从而得出微博用户兴趣预测结果。
5.根据权利要求4所述的一种基于PMF的微博用户兴趣预测方法,其特征在于,所述S41中用户数据集包括两组用户兴趣主题矩阵的集合和用户{R11,R12,…R1N},{R21,R22,…R2N},F1,F2,隐含特征维数d,相关参数为θ,β,λ,更新参数为α,收敛参数为ε,最大迭代次数为K,所述S42中的遗忘函数为
6.根据权利要求4所述的一种基于PMF的微博用户兴趣预测方法,其特征在于,所述S44中采用梯度下降计算损失函数为:
其中,指示函数,如果Rij=1,则否则g(x)=1/(1+exp(-x)):logistic函数,能够使得预测评分在[0,1]之间,所述预测近似矩阵为
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710272626.1A CN107122852A (zh) | 2017-04-24 | 2017-04-24 | 一种基于pmf的微博用户兴趣预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710272626.1A CN107122852A (zh) | 2017-04-24 | 2017-04-24 | 一种基于pmf的微博用户兴趣预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107122852A true CN107122852A (zh) | 2017-09-01 |
Family
ID=59724826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710272626.1A Pending CN107122852A (zh) | 2017-04-24 | 2017-04-24 | 一种基于pmf的微博用户兴趣预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107122852A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299321A (zh) * | 2018-08-31 | 2019-02-01 | 出门问问信息科技有限公司 | 一种曲目推荐方法及装置 |
CN111026943A (zh) * | 2019-11-12 | 2020-04-17 | 山东大学 | 利用多源社交网络的合作学习进行用户兴趣分析方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070005654A1 (en) * | 2005-05-20 | 2007-01-04 | Avichai Schachar | Systems and methods for analyzing relationships between entities |
CN102129463A (zh) * | 2011-03-11 | 2011-07-20 | 北京航空航天大学 | 一种融合项目相关性的基于pmf的协同过滤推荐系统 |
CN103399858A (zh) * | 2013-07-01 | 2013-11-20 | 吉林大学 | 基于信任的社会化协同过滤推荐方法 |
CN104915444A (zh) * | 2015-06-29 | 2015-09-16 | 北京邮电大学 | 信息推荐方法及装置 |
CN106126549A (zh) * | 2016-06-16 | 2016-11-16 | 传化公路港物流有限公司 | 一种基于概率矩阵分解的社区信任推荐方法及其系统 |
CN106547901A (zh) * | 2016-11-08 | 2017-03-29 | 周口师范学院 | 一种基于能量优化的微博用户转发行为预测方法 |
-
2017
- 2017-04-24 CN CN201710272626.1A patent/CN107122852A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070005654A1 (en) * | 2005-05-20 | 2007-01-04 | Avichai Schachar | Systems and methods for analyzing relationships between entities |
CN102129463A (zh) * | 2011-03-11 | 2011-07-20 | 北京航空航天大学 | 一种融合项目相关性的基于pmf的协同过滤推荐系统 |
CN103399858A (zh) * | 2013-07-01 | 2013-11-20 | 吉林大学 | 基于信任的社会化协同过滤推荐方法 |
CN104915444A (zh) * | 2015-06-29 | 2015-09-16 | 北京邮电大学 | 信息推荐方法及装置 |
CN106126549A (zh) * | 2016-06-16 | 2016-11-16 | 传化公路港物流有限公司 | 一种基于概率矩阵分解的社区信任推荐方法及其系统 |
CN106547901A (zh) * | 2016-11-08 | 2017-03-29 | 周口师范学院 | 一种基于能量优化的微博用户转发行为预测方法 |
Non-Patent Citations (2)
Title |
---|
HONGYUN BAO AND ETC: "A new temporal and social PMF-based method to predict users" interests in micro-blogging", 《 DECISION SUPPORT SYSTEMS》 * |
陈婷等: "社交网络环境下基于信任的推荐算法", 《软件学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299321A (zh) * | 2018-08-31 | 2019-02-01 | 出门问问信息科技有限公司 | 一种曲目推荐方法及装置 |
CN109299321B (zh) * | 2018-08-31 | 2021-07-09 | 出门问问信息科技有限公司 | 一种曲目推荐方法及装置 |
CN111026943A (zh) * | 2019-11-12 | 2020-04-17 | 山东大学 | 利用多源社交网络的合作学习进行用户兴趣分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108875916B (zh) | 一种基于gru神经网络的广告点击率预测方法 | |
CN111309824B (zh) | 实体关系图谱显示方法及系统 | |
CN103077247B (zh) | 一种社交网络中的朋友关系传递树的建立方法 | |
CN108540320B (zh) | 基于信令挖掘用户满意度的评估方法 | |
CN110462604A (zh) | 基于设备使用关联互联网设备的数据处理系统和方法 | |
CN103955842B (zh) | 一种面向大规模媒体数据的在线广告推荐系统及方法 | |
CN108334638B (zh) | 基于长短期记忆神经网络与兴趣迁移的项目评分预测方法 | |
CN111177473B (zh) | 人员关系分析方法、装置和可读存储介质 | |
CN104281882A (zh) | 基于用户特征的预测社交网络信息流行度的方法及系统 | |
CN109523021A (zh) | 一种基于长短时记忆网络的动态网络结构预测方法 | |
CN106022708A (zh) | 一种预测员工离职的方法 | |
CN111127246A (zh) | 一种输电线路工程造价的智能预测方法 | |
CN108133390A (zh) | 用于预测用户行为的方法和装置以及计算设备 | |
CN111046171B (zh) | 一种基于细粒度标注数据的情感判别方法 | |
US20230351153A1 (en) | Knowledge graph reasoning model, system, and reasoning method based on bayesian few-shot learning | |
CN113761375A (zh) | 基于神经网络的消息推荐方法、装置、设备及存储介质 | |
CN114780742B (zh) | 一种灌区流量调度知识图谱问答系统构建与使用方法 | |
CN107122852A (zh) | 一种基于pmf的微博用户兴趣预测方法 | |
KR101522306B1 (ko) | 유사도 특성을 이용한 메타휴리스틱 알고리즘에 기반한 시스템 및 그 제어방법 | |
CN114969528A (zh) | 基于能力评测的用户画像和学习路径推荐方法、装置及设备 | |
CN117993772A (zh) | 一种基于知识图谱的众包数据采集方法、系统及电子设备 | |
CN112669073A (zh) | 一种用户留存预测方法、装置、电子设备及存储介质 | |
CN106575418A (zh) | 建议的关键词 | |
CN115952438B (zh) | 社交平台用户属性预测方法、系统、移动设备及存储介质 | |
Yan et al. | User recommendation with tensor factorization in social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170901 |