CN108647344A

CN108647344A - 一种融合时间间隔与调和用户熵权重的推送算法

Info

Publication number: CN108647344A
Application number: CN201810458875.4A
Authority: CN
Inventors: 陈子茜; 邵良杉
Original assignee: Liaoning Technical University
Current assignee: Liaoning Technical University
Priority date: 2018-05-15
Filing date: 2018-05-15
Publication date: 2018-10-12

Abstract

一种融合时间间隔与调和用户熵权重的推送算法，首先，对评分矩阵R赋予时间间隔权重后得到新的评分矩阵；进一步，根据信息熵的理论，确定用户u的信息熵；第三步，确定用户u的熵权重；第四步，将上述进行调整，得到调和后的用户熵权重；第五步，改进得到基于用户熵权重的用户间相似度；第六步，将基于时间间隔与调和的用户熵权重作为约束因子融合到Funk‑SVD，同时优化损失函数；第七步，通过随机梯度下降法对上述损失函数进行优化；第八步，通过融合了基于时间间隔与调和的用户熵权重作为约束因子融合到的Funk‑SVD，得到目标用户u对物体i的预测评分；第九步，根据上述预测评分，选择分数较高的物品推荐给用户。

Description

一种融合时间间隔与调和用户熵权重的推送算法

技术领域

本发明涉及计算机领域，具有涉及种融合了时间间隔与调和用户熵权重的推送算法。

背景技术

在现如今这个数据爆炸的时代下，人们时时刻刻都被不计其数的信息包围着，信息过载为所有信息的使用者都带来了极大的考验。推荐系统俨然成为了当今非常重要的一种服务形式。推荐算法有很多种，其中协同过滤算法因为易于实现，并且不需要完全掌握物品内容的相关信息，成为了推荐系统中应用最为广泛应用的推荐算法，但随着数据规模的不断扩大，在协同过滤过程中出现了评分矩阵中存在噪声数据和评分矩阵过于稀疏等问题，从而影响了推荐结果的精确度。

为了提升推荐准确度，人们从改进计算相似度准确性的角度进行研究，利用如聚类、引入权重等方式来提升推荐精度，尽管这些学者对推荐算法提出了很多改进，并且取得了一定的成功，但是他们的方法都是直接利用了评分矩阵中的数据，忽略了评分矩阵中的评分数据的可靠性，也就是说，评分矩阵中用户评分的准确性和评分的真实性其实是有待考证的，这种情况下，选择信任度更高的近邻在预测评分时才会获取更准确的评分值。

所以选择利用信息熵计算评价指标权重原理计算用户的熵权重，并经过调和使用户的熵权重更加合理，更进一步改进计算用户间相似度的方法，最后将基于时间间隔和调和的用户熵权重的近邻模型作为约束因子融入到Funk-SVD算法中，这样能够在选取到更准确的邻居用户的同时得到用户和物品的潜在信息，并且能够大大降低评分矩阵的稀疏度，进一步提升推荐的质量。

发明内容

本发明之目的就是为了解决上述“进一步提升推荐的质量”的问题。

为了实现本发明之目的拟采用以下技术予以实现，一种融合时间间隔与调和用户熵权重的推送算法，其特征在于：

已知用户u对物品i的评分数据表征矩阵R，用户u对项目i评分的时间间隔为，

第一步，对评分矩阵R赋予时间间隔权重后得到新的评分矩阵；

第二步，根据信息熵的理论，确定用户u的信息熵；

第三步，根据上述确定的信息熵确定用户u的熵权重；

第四步，根据当前用户u的熵权重占所有m个用户的熵权重的平均值的权重比例，将上述进行调整，得到调和后的用户熵权重；

第五步，在余弦相似度的基础上进行改进得到基于用户熵权重的用户间相似度；

第六步，将基于时间间隔与调和的用户熵权重作为约束因子融合到Funk-SVD，同时优化损失函数；

第七步，通过随机梯度下降法对上述损失函数进行优化得到代表用户潜在特征向量的矩阵和代表物品潜在特征向量的矩阵；

第八步，通过融合了基于时间间隔与调和的用户熵权重作为约束因子融合到的Funk-SVD，得到目标用户u对物体i的预测评分；

第九步，根据上述预测评分，选择分数较高的物品推荐给用户。

进一步，所述的根据下式得出

其中

式中，为用户和项目之间因时间间隔得到的权重，为用户对所有项目评价时间间隔的平均值，以作为判断用户对项目评分时间间隔长短的基准。

进一步，所述的用户u的信息熵由下式得出

其中，n是被评价的物品的数目，是每个分数在该用户的所有评分中出现的频率，且是归一化系数。

进一步，所述的熵权重由下式得出

其中，为用户u的信息熵，m为用户的数目，且。

进一步，所述的经过调和的用户熵权重由下式得到

其中，是所有用户的熵权重的平均值， g为调和系数。

进一步，所述的由下式得出

其中，表示目标用户u与邻居用户v的余弦相似度，和表示用户u和用户v对物品的评分向量，表示基于熵权重的用户v的评分向量，表示邻居用户v的熵权重。

进一步，所述的Funk-SVD模型是将用户-物品矩阵分解为含有用户和物品潜在特征向量的用户矩阵和物品矩阵。

进一步，所述的优化损失函数为

进一步，所述的为

其中，为用户u对物品i的预测评分，为代表用户潜在特征向量的矩阵的转置，为代表物品潜在特征向量的矩阵。

本发明的有益之处在于：

通过基于时间间隔与调和的用户熵权能够更准确的计算出用户与邻居间的相似性，获得更准确的相似度矩阵，再将其作为约束因子融入到Funk-SVD算法中，不仅能够有效降低矩阵的稀疏性，并且能够使推荐的准确率有所提高。

附图说明

图1示意了本发明算法流程图，也是本发明的摘要示意图。

具体实施方式

下面根据附图对本发明进行详细描述。

一种融合时间间隔与调和用户熵权重的推送算法，其特征在于：

所述的根据下式得出

其中

第二步，根据信息熵的理论，确定用户u的信息熵；

所述的用户u的信息熵由下式得出

其中，n是被评价的物品的数目，是每个分数在该用户的所有评分中出现的频率，且是归一化系数。若有一名用户的评分是非常随意评出的，所有评分都为5分，那么根据式上可以计算出该用户的信息熵为0，显然该用户的可信任度很低。而如果用户的评分的差异度较大，则可以说明该用户的的评分比较客观，能够按照对物品的实际感受来进行评分，该用户的信息熵值则会更大。

第三步，根据上述确定的信息熵确定用户u的熵权重；

所述的熵权重由下式得出

其中，为用户u的信息熵，m为用户的数目，且，对贡献更小的用户赋予更低的熵权重，反之相反，这样能够更加客观的计算出用户对推荐过程的贡献大小，由此选择更值得信任的邻居。

所述的经过调和的用户熵权重由下式得到

其中，是所有用户的熵权重的平均值， g为调和系数，为了降低过高的熵权重，以所有用户的熵权重的平均值为标准，将上式求出的用户熵权重乘以它占所有用户熵权重平均值的比例倒数，此时，这样对过高的用户熵权重便起到了限制的作用；同理，如果某用户的熵权重过低，此时，也能够很好的对过低的熵权重作出调整。

所述的由下式得出

所述的Funk-SVD模型是将用户-物品矩阵分解为含有用户和物品潜在特征向量的用户矩阵和物品矩阵。

所述的优化损失函数为

第八步，通过融合了基于时间间隔与调和的用户熵权重作为约束因子融合到的Funk-SVD，得到目标用户u对物体i的预测评分。

所述的为

以上所述的仅是本发明的实施例，方案中公知的具体方法或特性等常识在此未作过多的描述。应当指出，对于本技术领域人员来说，在不脱离本发明的前提下，还可以进行若干变形和改进，这些也应该视为本发明的保护范围，这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以权力要求的内容为准，说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims

1.一种融合时间间隔与调和用户熵权重的推送算法，其特征在于：

第二步，根据信息熵的理论，确定用户u的信息熵；

第三步，根据上述确定的信息熵确定用户u的熵权重；

2.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法，其特征在于：

所述的根据下式得出

其中

3.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法，其特征在于：

所述的用户u的信息熵由下式得出

4.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法，其特征在于：

所述的熵权重由下式得出

其中，为用户u的信息熵，m为用户的数目，且。

5.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法，其特征在于：

所述的经过调和的用户熵权重由下式得到

其中，是所有用户的熵权重的平均值， g为调和系数。

6.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法，其特征在于：

所述的由下式得出

7.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法，其特征在于：

8.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法，其特征在于：

所述的优化损失函数为

。

9.根据权利要求1所述的一种融合时间间隔与调和用户熵权重的推送算法，其特征在于：

所述的为