CN108647344A - 一种融合时间间隔与调和用户熵权重的推送算法 - Google Patents

一种融合时间间隔与调和用户熵权重的推送算法 Download PDF

Info

Publication number
CN108647344A
CN108647344A CN201810458875.4A CN201810458875A CN108647344A CN 108647344 A CN108647344 A CN 108647344A CN 201810458875 A CN201810458875 A CN 201810458875A CN 108647344 A CN108647344 A CN 108647344A
Authority
CN
China
Prior art keywords
user
weight
entropy
entropy weight
reconciliation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810458875.4A
Other languages
English (en)
Inventor
陈子茜
邵良杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning Technical University
Original Assignee
Liaoning Technical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Technical University filed Critical Liaoning Technical University
Priority to CN201810458875.4A priority Critical patent/CN108647344A/zh
Publication of CN108647344A publication Critical patent/CN108647344A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics

Landscapes

  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种融合时间间隔与调和用户熵权重的推送算法,首先,对评分矩阵R赋予时间间隔权重后得到新的评分矩阵;进一步,根据信息熵的理论,确定用户u的信息熵;第三步,确定用户u的熵权重;第四步,将上述进行调整,得到调和后的用户熵权重;第五步,改进得到基于用户熵权重的用户间相似度;第六步,将基于时间间隔与调和的用户熵权重作为约束因子融合到Funk‑SVD,同时优化损失函数;第七步,通过随机梯度下降法对上述损失函数进行优化;第八步,通过融合了基于时间间隔与调和的用户熵权重作为约束因子融合到的Funk‑SVD,得到目标用户u对物体i的预测评分;第九步,根据上述预测评分,选择分数较高的物品推荐给用户。

Description

一种融合时间间隔与调和用户熵权重的推送算法
技术领域
本发明涉及计算机领域,具有涉及种融合了时间间隔与调和用户熵权重的推送算法。
背景技术
在现如今这个数据爆炸的时代下,人们时时刻刻都被不计其数的信息包围着,信息过载为所有信息的使用者都带来了极大的考验。推荐系统俨然成为了当今非常重要的一种服务形式。推荐算法有很多种,其中协同过滤算法因为易于实现,并且不需要完全掌握物品内容的相关信息,成为了推荐系统中应用最为广泛应用的推荐算法,但随着数据规模的不断扩大,在协同过滤过程中出现了评分矩阵中存在噪声数据和评分矩阵过于稀疏等问题,从而影响了推荐结果的精确度。
为了提升推荐准确度,人们从改进计算相似度准确性的角度进行研究,利用如聚类、引入权重等方式来提升推荐精度,尽管这些学者对推荐算法提出了很多改进,并且取得了一定的成功,但是他们的方法都是直接利用了评分矩阵中的数据,忽略了评分矩阵中的评分数据的可靠性,也就是说,评分矩阵中用户评分的准确性和评分的真实性其实是有待考证的,这种情况下,选择信任度更高的近邻在预测评分时才会获取更准确的评分值。
所以选择利用信息熵计算评价指标权重原理计算用户的熵权重,并经过调和使用户的熵权重更加合理,更进一步改进计算用户间相似度的方法,最后将基于时间间隔和调和的用户熵权重的近邻模型作为约束因子融入到Funk-SVD算法中,这样能够在选取到更准确的邻居用户的同时得到用户和物品的潜在信息,并且能够大大降低评分矩阵的稀疏度,进一步提升推荐的质量。
发明内容
本发明之目的就是为了解决上述“进一步提升推荐的质量”的问题。
为了实现本发明之目的拟采用以下技术予以实现,一种融合时间间隔与调和用户熵权重的推送算法,其特征在于:
已知用户u对物品i的评分数据表征矩阵R,用户u对项目i评分的时间间隔为
第一步,对评分矩阵R赋予时间间隔权重后得到新的评分矩阵
第二步,根据信息熵的理论,确定用户u的信息熵
第三步,根据上述确定的信息熵确定用户u的熵权重
第四步,根据当前用户u的熵权重占所有m个用户的熵权重的平均值的权重比例,将上述进行调整,得到调和后的用户熵权重
第五步,在余弦相似度的基础上进行改进得到基于用户熵权重的用户间相似度
第六步,将基于时间间隔与调和的用户熵权重作为约束因子融合到Funk-SVD,同时优化损失函数;
第七步,通过随机梯度下降法对上述损失函数进行优化得到代表用户潜在特征向量的矩阵和代表物品潜在特征向量的矩阵
第八步,通过融合了基于时间间隔与调和的用户熵权重作为约束因子融合到的Funk-SVD,得到目标用户u对物体i的预测评分
第九步,根据上述预测评分,选择分数较高的物品推荐给用户。
进一步,所述的根据下式得出
其中
式中,为用户和项目之间因时间间隔得到的权重,为用户对所有项目评价时间间隔的平均值,以作为判断用户对项目评分时间间隔长短的基准。
进一步,所述的用户u的信息熵由下式得出
其中,n是被评价的物品的数目,是每个分数在该用户的所有评分中出现的频率,且是归一化系数。
进一步,所述的熵权重由下式得出
其中,为用户u的信息熵,m为用户的数目,且
进一步,所述的经过调和的用户熵权重由下式得到
其中,是所有用户的熵权重的平均值, g为调和系数。
进一步,所述的由下式得出
其中, 表示目标用户u与邻居用户v的余弦相似度,表示用户u和用户v对物品的评分向量,表示基于熵权重的用户v的评分向量,表示邻居用户v的熵权重。
进一步,所述的Funk-SVD模型是将用户-物品矩阵分解为含有用户和物品潜在特征向量的用户矩阵和物品矩阵
进一步,所述的优化损失函数为
进一步,所述的
其中,为用户u对物品i的预测评分,为代表用户潜在特征向量的矩阵的转置,为代表物品潜在特征向量的矩阵。
本发明的有益之处在于:
通过基于时间间隔与调和的用户熵权能够更准确的计算出用户与邻居间的相似性,获得更准确的相似度矩阵,再将其作为约束因子融入到Funk-SVD算法中,不仅能够有效降低矩阵的稀疏性,并且能够使推荐的准确率有所提高。
附图说明
图1示意了本发明算法流程图,也是本发明的摘要示意图。
具体实施方式
下面根据附图对本发明进行详细描述。
一种融合时间间隔与调和用户熵权重的推送算法,其特征在于:
已知用户u对物品i的评分数据表征矩阵R,用户u对项目i评分的时间间隔为
第一步,对评分矩阵R赋予时间间隔权重后得到新的评分矩阵
所述的根据下式得出
其中
式中,为用户和项目之间因时间间隔得到的权重,为用户对所有项目评价时间间隔的平均值,以作为判断用户对项目评分时间间隔长短的基准。
第二步,根据信息熵的理论,确定用户u的信息熵
所述的用户u的信息熵由下式得出
其中,n是被评价的物品的数目,是每个分数在该用户的所有评分中出现的频率,且是归一化系数。若有一名用户的评分是非常随意评出的,所有评分都为5分,那么根据式上可以计算出该用户的信息熵为0,显然该用户的可信任度很低。而如果用户的评分的差异度较大,则可以说明该用户的的评分比较客观,能够按照对物品的实际感受来进行评分,该用户的信息熵值则会更大。
第三步,根据上述确定的信息熵确定用户u的熵权重
所述的熵权重由下式得出
其中,为用户u的信息熵,m为用户的数目,且,对贡献更小的用户赋予更低的熵权重,反之相反,这样能够更加客观的计算出用户对推荐过程的贡献大小,由此选择更值得信任的邻居。
第四步,根据当前用户u的熵权重占所有m个用户的熵权重的平均值的权重比例,将上述进行调整,得到调和后的用户熵权重
所述的经过调和的用户熵权重由下式得到
其中,是所有用户的熵权重的平均值, g为调和系数,为了降低过高的熵权重,以所有用户的熵权重的平均值为标准,将上式求出的用户熵权重乘以它占所有用户熵权重平均值的比例倒数,此时,这样对过高的用户熵权重便起到了限制的作用;同理,如果某用户的熵权重过低,此时,也能够很好的对过低的熵权重作出调整。
第五步,在余弦相似度的基础上进行改进得到基于用户熵权重的用户间相似度
所述的由下式得出
其中, 表示目标用户u与邻居用户v的余弦相似度,表示用户u和用户v对物品的评分向量,表示基于熵权重的用户v的评分向量,表示邻居用户v的熵权重。
第六步,将基于时间间隔与调和的用户熵权重作为约束因子融合到Funk-SVD,同时优化损失函数;
所述的Funk-SVD模型是将用户-物品矩阵分解为含有用户和物品潜在特征向量的用户矩阵和物品矩阵
所述的优化损失函数为
第七步,通过随机梯度下降法对上述损失函数进行优化得到代表用户潜在特征向量的矩阵和代表物品潜在特征向量的矩阵
第八步,通过融合了基于时间间隔与调和的用户熵权重作为约束因子融合到的Funk-SVD,得到目标用户u对物体i的预测评分
所述的
其中,为用户u对物品i的预测评分,为代表用户潜在特征向量的矩阵的转置,为代表物品潜在特征向量的矩阵。
第九步,根据上述预测评分,选择分数较高的物品推荐给用户。
以上所述的仅是本发明的实施例,方案中公知的具体方法或特性等常识在此未作过多的描述。应当指出,对于本技术领域人员来说,在不脱离本发明的前提下,还可以进行若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以权力要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims (9)

1.一种融合时间间隔与调和用户熵权重的推送算法,其特征在于:
已知用户u对物品i的评分数据表征矩阵R,用户u对项目i评分的时间间隔为
第一步,对评分矩阵R赋予时间间隔权重后得到新的评分矩阵
第二步,根据信息熵的理论,确定用户u的信息熵
第三步,根据上述确定的信息熵确定用户u的熵权重
第四步,根据当前用户u的熵权重占所有m个用户的熵权重的平均值的权重比例,将上述进行调整,得到调和后的用户熵权重
第五步,在余弦相似度的基础上进行改进得到基于用户熵权重的用户间相似度
第六步,将基于时间间隔与调和的用户熵权重作为约束因子融合到Funk-SVD,同时优化损失函数;
第七步,通过随机梯度下降法对上述损失函数进行优化得到代表用户潜在特征向量的矩阵和代表物品潜在特征向量的矩阵
第八步,通过融合了基于时间间隔与调和的用户熵权重作为约束因子融合到的Funk-SVD,得到目标用户u对物体i的预测评分
第九步,根据上述预测评分,选择分数较高的物品推荐给用户。
2.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法,其特征在于:
所述的根据下式得出
其中
式中,为用户和项目之间因时间间隔得到的权重,为用户对所有项目评价时间间隔的平均值,以作为判断用户对项目评分时间间隔长短的基准。
3.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法,其特征在于:
所述的用户u的信息熵由下式得出
其中,n是被评价的物品的数目,是每个分数在该用户的所有评分中出现的频率,且是归一化系数。
4.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法,其特征在于:
所述的熵权重由下式得出
其中,为用户u的信息熵,m为用户的数目,且
5.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法,其特征在于:
所述的经过调和的用户熵权重由下式得到
其中,是所有用户的熵权重的平均值, g为调和系数。
6.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法,其特征在于:
所述的由下式得出
其中, 表示目标用户u与邻居用户v的余弦相似度,表示用户u和用户v对物品的评分向量,表示基于熵权重的用户v的评分向量,表示邻居用户v的熵权重。
7.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法,其特征在于:
所述的Funk-SVD模型是将用户-物品矩阵分解为含有用户和物品潜在特征向量的用户矩阵和物品矩阵
8.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法,其特征在于:
所述的优化损失函数为
9.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法,其特征在于:
所述的
其中,为用户u对物品i的预测评分,为代表用户潜在特征向量的矩阵的转置,为代表物品潜在特征向量的矩阵。
CN201810458875.4A 2018-05-15 2018-05-15 一种融合时间间隔与调和用户熵权重的推送算法 Pending CN108647344A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810458875.4A CN108647344A (zh) 2018-05-15 2018-05-15 一种融合时间间隔与调和用户熵权重的推送算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810458875.4A CN108647344A (zh) 2018-05-15 2018-05-15 一种融合时间间隔与调和用户熵权重的推送算法

Publications (1)

Publication Number Publication Date
CN108647344A true CN108647344A (zh) 2018-10-12

Family

ID=63755455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810458875.4A Pending CN108647344A (zh) 2018-05-15 2018-05-15 一种融合时间间隔与调和用户熵权重的推送算法

Country Status (1)

Country Link
CN (1) CN108647344A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111652282A (zh) * 2020-04-30 2020-09-11 中国平安财产保险股份有限公司 基于大数据的用户偏好分析方法、装置及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111652282A (zh) * 2020-04-30 2020-09-11 中国平安财产保险股份有限公司 基于大数据的用户偏好分析方法、装置及电子设备
CN111652282B (zh) * 2020-04-30 2023-08-08 中国平安财产保险股份有限公司 基于大数据的用户偏好分析方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN107729444B (zh) 一种基于知识图谱的个性化旅游景点推荐方法
CN104935963B (zh) 一种基于时序数据挖掘的视频推荐方法
CN105635762B (zh) 一种基于深度信念网络的视频热度预测方法及其系统
CN110110094A (zh) 基于社交网络知识图谱的跨网络人物关联方法
CN105207821B (zh) 一种面向业务的网络综合性能评估方法
CN107944740A (zh) 基于区块链技术的能力评价方法
CN107491813A (zh) 一种基于多目标优化的长尾群组推荐方法
CN109271582A (zh) 一种基于带属性元路径的个性化信息推荐方法
CN105630901A (zh) 一种知识图谱表示学习方法
CN107391670A (zh) 一种融合协同过滤和用户属性过滤的混合推荐方法
CN109902235A (zh) 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法
CN106534976B (zh) Iptv视频业务中用户满意度的智能化预测方法
CN107885778A (zh) 一种基于动态临近点谱聚类的个性化推荐方法
US9147009B2 (en) Method of temporal bipartite projection
CN105678590B (zh) 一种面向社交网络基于云模型的topN推荐方法
CN109508428A (zh) 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法
CN107562947A (zh) 一种移动时空感知下动态即时推荐服务模型建立方法
CN108470075A (zh) 一种面向排序预测的社会化推荐方法
CN104239496A (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN106980646A (zh) 基于流行度对用户兴趣的影响机制分析及其在推荐算法中应用的方法
CN111324807A (zh) 基于信任度的协同过滤推荐方法
CN110598968A (zh) 一种基于改进物元可拓模型的电网投资效益评价方法
CN109840702A (zh) 一种基于多核融合的新项目协同推荐方法
CN109635200B (zh) 一种基于中介真值程度度量和用户的协同过滤推荐方法
CN108629671A (zh) 一种融合用户行为信息的餐馆推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181012