CN103412865B

CN103412865B - 网站项目的通知方法和系统

Info

Publication number: CN103412865B
Application number: CN201310226586.9A
Authority: CN
Inventors: 郑梓力
Original assignee: Guangzhou Vipshop Information And Technology Co Ltd
Current assignee: Guangzhou Pinwei Software Co Ltd
Priority date: 2013-06-07
Filing date: 2013-06-07
Publication date: 2016-08-31
Anticipated expiration: 2033-06-07
Also published as: CN103412865A

Abstract

本发明涉及网站通知的相关技术领域，特别是涉及一种网站项目的通知方法和系统，所述方法包括：获取多个用户对多个项目的兴趣度评分；确定与目标项目的近邻项目集合；根据目标用户对近邻项目的兴趣度评分，确定目标用户对目标项目的预测评分；如果目标用户对目标项目的预测评分超出预设评分阈值，则向目标用户发送目标项目通知。本发明的评分预测方法的推荐效果比现有技术更佳，推荐商品的质量等到很大提高。

Description

网站项目的通知方法和系统

技术领域

本发明涉及网站通知的相关技术领域，特别是涉及一种网站项目的通知方法和系统。

背景技术

现在电商网站为了增加销售额和提升用户体验，都非常重视对用户的个性化推荐，而最流行的推荐算法就是协同过滤算法（Collaborative FilteringAlgorithm）。

协同过滤是通过一大群人的行为记录过滤信息，可分为基于用户（User-based）和基于项目（Item-based）两类算法。基于用户的协同过滤算法是通过寻找目标用户的相似的用户群，然后根据这个用户群对目标项目的评分来预测目标用户的对该项目的评分。而基于项目的协同过滤算法是通过找到和目标项目相似的项目群，然后根据目标用户对这些项目的评分来预测该用户对目标项目的评分。

基于用户的协同过滤算法适合用户数较小或项目更迭频繁的场合。而基于项目的协同过滤算法更适合项目数明显少于用户数或项目较为稳定的推荐场景，由于项目之间的相似性比较稳定，可以离线计算，在一定程度上解决了实时推荐的问题。而且基于项目的协同过滤算法能够对推荐结果做出较好的解释，提高了推荐的可测量性。所以在电子商务网站中的推荐系统，通常都以基于项目的协同过滤算法作为推荐算法的基础。而本发明要解决的是电子商务网站的项目推荐问题，用户数比项目数高几个数量级，所以采用基于项目的协同过滤算法更为合理。

基于项目的协同过滤技术基于的假设是：如果很多用户对两个项目的评分相似，则这两个项目的相似度会比较高，而用户对相似项目的打分也比较相近。基于项目的协同过滤推荐算法的过程主要分为两部分：

1、计算项目相关度：根据用户的评分记录，计算项目之间的相关度。一般用到的相似性度量方法有：余弦相似性、Pearson相关系数和修正的余弦相似性，它们的计算方式见下表：

2、预测评分：根据用户对目标项i的K个最近邻居的评分，结合近邻项目与目标项目的相似度，预测用户对项目i的评分，如下式：

P_{u, i} = \frac{Σ_{j &Element; S (i)} sim (i, j) * R_{u, j}}{Σ_{j &Element; S (i)} | sim (i, j) |}

其中P_u,i为用户u对项目i的预测评分，S(i)是项目i的K近邻集，即与项目i最相似的K个项目。

最后可以根据预测的评分来挑选用户感兴趣的TopN商品生成推荐列表。

然而现有的相似性计算方法不够准确，而项目相似性和后续进行预测评分的基础，所以会影响最后的推荐质量；预测评分公式没有考虑到近邻项的总体评价情况，造成预测评分产生偏差。

发明内容

基于此，有必要针对现有技术的网站项目的推荐质量较低的技术问题，提供一种网站项目的通知方法及系统。

一种网站项目的通知方法，包括：

获取多个用户对多个项目的兴趣度评分；

确定与目标项目的近邻项目集合，所述近邻项目集合为与目标项目相似度最高的K个其他项目，所述目标项目与所述其他项目的相似度由用户并集中的用户对目标项目及所述其他项目的兴趣度评分计算，所述并集为目标项目与其中一个其他项目具有兴趣度评分的用户的并集，目标项目或所述其他项目中未具有所述并集中的用户的兴趣度评分采用组合加权评分方法填补；

根据目标用户对近邻项目的兴趣度评分，确定目标用户对目标项目的预测评分；

如果目标用户对目标项目的预测评分超出预设评分阈值，则向目标用户发送目标项目通知。

在其中一个实施例中，所述获取多个用户对多个项目的兴趣度评分的步骤，具体包括：

获取用户对每个项目的购买次数buy、喜欢过次数like和订阅次数subs；

兴趣度评分R＝log(n_buy*buy+n_like*like+n_subs*subs)+n_R，其中n_buy为预设的购买次数权重，n_like为预设的喜欢过次数权重，n_subs为预设的订阅次数权重，n_R为兴趣度权重。

在其中一个实施例中，所述确定与目标项目的近邻项目集合的步骤，具体包括：

计算目标项目i与所有其他项目的相似度，其中，目标项目i与任一其他项目j的相似度计算如下：

确定目标项目i与其他项目j有过兴趣度评分记录的用户集合分别为U_i和U_j；

计算目标项目i与其他项目j的相似度为：

sim (i, j) = \frac{Σ_{u &Element; U_{i} \cup U_{i}} (R_{u, i} - \overset{&OverBar;}{R_{u}}) (R_{u, j} - \overset{&OverBar;}{R_{u}})}{\sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, i} - \overset{&OverBar;}{R_{u}})}^{2}} \sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, j} - \overset{&OverBar;}{R_{u}})}^{2}}} \cdot \frac{\min (η, | U_{i} \cap U_{j} |)}{η},

其中|U_i∩U_j|为目标项目i和其他项目j的共同兴趣度评分用户数，η为预设的用户数阈值是用户u的平均兴趣度评分，R_u,i为用户u对目标项目i的修正评分，R_u,i为用户u对其他项目j的修正评分；

其中R_u,i采用如下方式计算：

如果具有用户u对目标项目i的兴趣度评分R_u,i，则R_u,i＝R_u,i；

如果不具有用户u对目标项目i的兴趣度评分，则R_u,i＝r_u,i，其中r_u,i为用户u对目标项目i的组合加权评分：

r_{u, i} = \sqrt{r_{u} \cdot r_{i}},

其中r_u为用户u的平均加权评分，

r_{u} = \overset{&OverBar;}{R_{u}} + \frac{Σ_{k &Element; I_{u}} (R_{u, k} - \overset{&OverBar;}{R_{i}})}{| I_{u} |},

I_u是具有用户u的兴趣度评分的项目集合，|I_u|为项目集合I_u的项目个数，R_u,k为用户u对项目集合I_u的项目k的兴趣度评分，是目标项目i收到的平均兴趣度评分，其中r_i为目标项目i的平均加权评分，|U_i|为用户集合U_i的用户个数；R_k,i为用户k对目标项目i的兴趣度评分；

其中R_u,j采用如下方式计算：

如果具有用户u对其他项目j的兴趣度评分R_u,j，则R_u,j＝R_u,j；

如果不具有用户u对目标项目j的兴趣度评分，则R_u,j＝r_u,j，其中r_u,j为用户u对其他项目j的组合加权评分：

r_{u, j} = \sqrt{r_{u} \cdot r_{j}},

其中r_i为其他项目j的平均加权评分，

r_{i} = \overset{&OverBar;}{R_{j}} + \frac{Σ_{k &Element; U_{j}} (R_{k, j} - \overset{&OverBar;}{R_{u}})}{| U_{j} |},

是其他项目j收到的平均兴趣度评分，|U_j|为用户集合U_j的用户个数；R_k,j为用户k对其他项目j的兴趣度评分；

确定与目标项目i的相似度最高的K个项目作为目标项目i的近邻项目集合。

在其中一个实施例中，所述根据目标用户对近邻项目的兴趣度评分，确定目标用户对目标项目的预测评分的步骤，具体包括：

目标用户v对目标项目i的预测评分P_v,i为：

P_{v, i} = \overset{&OverBar;}{R_{i}} + \frac{Σ_{l &Element; S (i)} sim (i, l) * (R_{v, l} - \overset{&OverBar;}{R_{l}})}{Σ_{l &Element; S (i)} | sim (i, l) |},

其中S(i)是目标项目i的近邻项目集合，其中R_v,l为目标用户v对近邻项目集合中其中一个近邻项目l的兴趣度评分，是近邻项目l收到的平均兴趣度评分。

在其中一个实施例中，所述目标用户为对所述目标项目为具有兴趣度评分的用户。

一种网站项目的通知系统，包括：

兴趣度评分模块，用于获取多个用户对多个项目的兴趣度评分；

近邻项目集合模块，用于确定与目标项目的近邻项目集合，所述近邻项目集合为与目标项目相似度最高的K个其他项目，所述目标项目与所述其他项目的相似度由用户并集中的用户对目标项目及所述其他项目的兴趣度评分计算，所述并集为目标项目与其中一个其他项目具有兴趣度评分的用户的并集，目标项目或所述其他项目中未具有所述并集中的用户的兴趣度评分采用组合加权评分方法填补；

预测评分模块，用于根据目标用户对近邻项目的兴趣度评分，确定目标用户对目标项目的预测评分；

目标项目通知模块，用于如果目标用户对目标项目的预测评分超出预设评分阈值，则向目标用户发送目标项目通知。

在其中一个实施例中，所述兴趣度评分模块，具体包括：

兴趣度行为获取子模块，用于获取用户对每个项目的购买次数buy、喜欢过次数like和订阅次数subs；

兴趣度评分计算子模块，用于计算兴趣度评分R：

R＝log(n_buy*buy+n_like*like+n_subs*subs)+n_R，其中n_buy为预设的购买次数权重，n_like为预设的喜欢过次数权重，n_subs为预设的订阅次数权重，n_R为兴趣度权重。

在其中一个实施例中，所述近邻项目集合模块，具体包括：

相似度计算子模块，用于计算目标项目i与所有其他项目的相似度，其中，目标项目i与任一其他项目j的相似度计算如下：

计算目标项目i与其他项目j的相似度为：

sim (i, j) = \frac{Σ_{u &Element; U_{i} \cup U_{i}} (R_{u, i} - \overset{&OverBar;}{R_{u}}) (R_{u, j} - \overset{&OverBar;}{R_{u}})}{\sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, i} - \overset{&OverBar;}{R_{u}})}^{2}} \sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, j} - \overset{&OverBar;}{R_{u}})}^{2}}} \cdot \frac{\min (η, | U_{i} \cap U_{j} |)}{η},

其中|U_i∩U_j|为目标项目i和其他项目j的共同兴趣度评分用户数，η为预设的用户数阈值，是用户u的平均兴趣度评分，R_u,i为用户u对目标项目i的修正评分，R_u,i为用户u对其他项目j的修正评分；

其中R_u,i采用如下方式计算：

r_{u, i} = \sqrt{r_{u} \cdot r_{i}},

其中r_u为用户u的平均加权评分，

r_{u} = \overset{&OverBar;}{R_{u}} + \frac{Σ_{k &Element; I_{u}} (R_{u, k} - \overset{&OverBar;}{R_{i}})}{| I_{u} |},

其中R_u,j采用如下方式计算：

r_{u, j} = \sqrt{r_{u} \cdot r_{j}},

其中r_i为其他项目j的平均加权评分，

r_{i} = \overset{&OverBar;}{R_{j}} + \frac{Σ_{k &Element; U_{j}} (R_{k, j} - \overset{&OverBar;}{R_{u}})}{| U_{j} |},

近邻项目确定子模块，用于确定与目标项目i的相似度最高的K个项目作为目标项目i的近邻项目集合。

在其中一个实施例中，所述预测评分模块，具体用于：

目标用户v对目标项目i的预测评分P_v,i为：

P_{v, i} = \overset{&OverBar;}{R_{i}} + \frac{Σ_{l &Element; S (i)} sim (i, l) * (R_{v, l} - \overset{&OverBar;}{R_{l}})}{Σ_{l &Element; S (i)} | sim (i, l) |},

上述的网站项目的通知方法及系统，计算项目相似度时，考虑的是两个项目的评分用户的并集，使用组合加权评分方法去填补评分空缺项。与现有的协同过滤技术计算项目相似度时考虑的是项目的评分用户的交集，更适合高度稀疏的现实数据，而且引入共同评分用户数阈值调整项目的相似度，更加能反映项目的相似度。同时现有技术的评分预测公式只考虑用户对目标项目的近邻项目的评分，而没有考虑到其他用户对目标项目的评分情况，以及近邻项目评分的总体情况，这使得预测评分过度依赖目标用户已有的评分数据，这会导致预测评分产生较大的偏差。所以本发明的评分预测方法的推荐效果比现有技术更佳，推荐商品的质量等到很大提高。

同时，本发明使用修正的余弦相似度公式计算两个项目的相似度，再考虑项目共同评分用户数，引入共同评分阈值调整项目的相似度。而现有技术使用的相似度计算方法一般为余弦相似性、Pearson相关系数和修正的余弦相似性，而且没有考虑项目的共同评分用户数。另外，本发明计算用户对指定项目的预测评分时，本发明把目标用户对近邻项目的评分与近邻项目获得的平均评分的偏差为加权相加项，并以目标项目的平均评分为基准。而现有的协同过滤技术把用户对近邻项目的评分作为加权相加项。因此，本发明的计算结果能得到进一步的提高，网站项目的推荐质量也得到大大提高。

同时，本发明利用用户历史行为数据生成用户对项目的评分，根据用户的购买、订阅以及“喜欢”按钮的点击记录评估用户对项目的兴趣度评分。本发明的评分方式综合考虑用户的多种行为，对用户的兴趣度评估更加全面、客观和切合业务逻辑，而且最后得到的数据分布适合分析和输入到推荐算法中。而现有的协同过滤技术直接使用用户对项目的打分数据，带有一定的用户主观性。

附图说明

图1为本发明的一种网站项目的通知方法的工作流程图；

图2为本发明一种网站项目的通知系统的模块结构图。

具体实施方式

下面结合附图和具体实施例对本发明做进一步详细的说明。

如图1所示为本发明的一种网站项目的通知方法的工作流程图，包括：

步骤S101，获取多个用户对多个项目的兴趣度评分；

步骤S102，确定与目标项目的近邻项目集合，所述近邻项目集合为与目标项目相似度最高的K个其他项目，所述目标项目与所述其他项目的相似度由用户并集中的用户对目标项目及所述其他项目的兴趣度评分计算，所述并集为目标项目与其中一个其他项目具有兴趣度评分的用户的并集，目标项目或所述其他项目中未具有所述并集中的用户的兴趣度评分采用组合加权评分方法填补；

步骤S103，根据目标用户对近邻项目的兴趣度评分，确定目标用户对目标项目的预测评分；

步骤S104，如果目标用户对目标项目的预测评分超出预设评分阈值，则向目标用户发送目标项目通知。

本领域普通技术人员在阅读本专利后，可以确定步骤S101的具体步骤。在其中一个实施例中，所述步骤S101，具体包括：

本实施例利用用户历史行为数据生成用户对项目的评分，根据用户的购买、订阅以及“喜欢”按钮的点击记录评估用户对项目的兴趣度评分。因此，其数据与用户的需求更为接近

对于相似度的计算，本领域普通技术人员在阅读本专利后可以提出具体的实现方式。在其中一个实施例中，所述步骤S102，具体包括：

计算目标项目i与其他项目j的相似度为：

sim (i, j) = \frac{Σ_{u &Element; U_{i} \cup U_{i}} (R_{u, i} - \overset{&OverBar;}{R_{u}}) (R_{u, j} - \overset{&OverBar;}{R_{u}})}{\sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, i} - \overset{&OverBar;}{R_{u}})}^{2}} \sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, j} - \overset{&OverBar;}{R_{u}})}^{2}}} \cdot \frac{\min (η, | U_{i} \cap U_{j} |)}{η},

其中R_u,i采用如下方式计算：

r_{u, i} = \sqrt{r_{u} \cdot r_{i}},

其中r_u为用户u的平均加权评分，

r_{u} = \overset{&OverBar;}{R_{u}} + \frac{Σ_{k &Element; I_{u}} (R_{u, k} - \overset{&OverBar;}{R_{i}})}{| I_{u} |},

I_u是具有用户u的兴趣度评分的项目集合，|I_u|为项目集合I_u的项目个数，R_uk为用户u对项目集合I_u的项目k的兴趣度评分，是目标项目i收到的平均兴趣度评分，其中r_i为目标项目i的平均加权评分，|U_i|为用户集合U_i的用户个数；R_k,i为用户k对目标项目i的兴趣度评分；

其中R_u,j采用如下方式计算：

r_{u, j} = \sqrt{r_{u} \cdot r_{j}},

其中r_i为其他项目j的平均加权评分，

r_{i} = \overset{&OverBar;}{R_{j}} + \frac{Σ_{k &Element; U_{j}} (R_{k, j} - \overset{&OverBar;}{R_{u}})}{| U_{j} |},

本实施例计算项目相似度时，考虑的是两个项目的评分用户的并集，使用组合加权评分方法去填补评分空缺项，再使用修正的余弦相似度公式计算两个项目的相似度，再考虑项目共同评分用户数，引入共同评分阈值调整项目的相似度。而现有的协同过滤技术计算项目相似度时考虑的是项目的评分用户的交集，使用的相似度计算方法一般为余弦相似性、Pearson相关系数和修正的余弦相似性，而且没有考虑项目的共同评分用户数。

在其中一个实施例中，步骤S103，具体包括：

目标用户v对目标项目i的预测评分P_v,i为：

P_{v, i} = \overset{&OverBar;}{R_{i}} + \frac{Σ_{l &Element; S (i)} sim (i, l) * (R_{v, l} - \overset{&OverBar;}{R_{l}})}{Σ_{l &Element; S (i)} | sim (i, l) |},

本实施例把目标用户对近邻项目的评分与近邻项目获得的平均评分的偏差为加权相加项，并以目标项目的平均评分为基准。而现有的协同过滤技术把用户对近邻项目的评分作为加权相加项

对于每天新上线的项目，网站都需要挑选一部分可能对上线项目可能感兴趣的用户，对他们发送项目的上线信息，提醒他们准时访问网站对感兴趣的商品进行抢购。现有的用户挑选策略都是挑选对目标项目有过行为的用户，即对该项目的商品有过购买、放入购物车、订阅等行为的用户。但这种策略推荐的都是本来对目标项目就感兴趣的用户，忽略了其他没有对该项目产生过行为但具有有潜在兴趣的用户。

为了发掘目标项目更多潜在用户，开拓用户的项目兴趣，和为了避免与常规策略抽取的用户重复，本实施例的目标用户为对所述目标项目为具有兴趣度评分的用户。其中，通知方法，可以采用短信通知的方式。

如图2所示为本发明一种网站项目的通知系统的模块结构图，包括：

兴趣度评分模块210，用于获取多个用户对多个项目的兴趣度评分；

近邻项目集合模块220，用于确定与目标项目的近邻项目集合，所述近邻项目集合为与目标项目相似度最高的K个其他项目，所述目标项目与所述其他项目的相似度由用户并集中的用户对目标项目及所述其他项目的兴趣度评分计算，所述并集为目标项目与其中一个其他项目具有兴趣度评分的用户的并集，目标项目或所述其他项目中未具有所述并集中的用户的兴趣度评分采用组合加权评分方法填补；

预测评分模块230，用于根据目标用户对近邻项目的兴趣度评分，确定目标用户对目标项目的预测评分；

目标项目通知模块240，用于如果目标用户对目标项目的预测评分超出预设评分阈值，则向目标用户发送目标项目通知。

在其中一个实施例中，所述兴趣度评分模块210，具体包括：

兴趣度行为获取子模块211，用于获取用户对每个项目的购买次数buy、喜欢过次数like和订阅次数subs；

兴趣度评分计算子模块212，用于计算兴趣度评分R：

在其中一个实施例中，所述近邻项目集合模块220，具体包括：

相似度计算子模块221，用于计算目标项目i与所有其他项目的相似度，其中，目标项目i与任一其他项目j的相似度计算如下：

计算目标项目i与其他项目j的相似度为：

sim (i, j) = \frac{Σ_{u &Element; U_{i} \cup U_{i}} (R_{u, i} - \overset{&OverBar;}{R_{u}}) (R_{u, j} - \overset{&OverBar;}{R_{u}})}{\sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, i} - \overset{&OverBar;}{R_{u}})}^{2}} \sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, j} - \overset{&OverBar;}{R_{u}})}^{2}}} \cdot \frac{\min (η, | U_{i} \cap U_{j} |)}{η},

其中R_u,i采用如下方式计算：

r_{u, i} = \sqrt{r_{u} \cdot r_{i}},

其中r_u为用户u的平均加权评分，

r_{u} = \overset{&OverBar;}{R_{u}} + \frac{Σ_{k &Element; I_{u}} (R_{u, k} - \overset{&OverBar;}{R_{i}})}{| I_{u} |},

其中R_u,j采用如下方式计算：

r_{u, j} = \sqrt{r_{u} \cdot r_{j}},

其中r_i为其他项目j的平均加权评分，

r_{i} = \overset{&OverBar;}{R_{j}} + \frac{Σ_{k &Element; U_{j}} (R_{k, j} - \overset{&OverBar;}{R_{u}})}{| U_{j} |},

近邻项目确定子模块222，用于确定与目标项目i的相似度最高的K个项目作为目标项目i的近邻项目集合。

在其中一个实施例中，所述预测评分模块230，具体用于：

目标用户v对目标项目i的预测评分P_v,i为：

P_{v, i} = \overset{&OverBar;}{R_{i}} + \frac{Σ_{l &Element; S (i)} sim (i, l) * (R_{v, l} - \overset{&OverBar;}{R_{l}})}{Σ_{l &Element; S (i)} | sim (i, l) |},

作为一个例子，为一个网站品牌的通知方法。

该例子中，网站从成立到现在的用户行为数据都保存在数据库里，包括用户的购买记录、订阅记录以及品牌“喜欢”按钮的点击记录。而评价用户对某个品牌的偏好程度就是根据用户对该品牌的购买次数（buy）、喜欢过次数（like）以及订阅次数（subs）这三个指标来衡量。根据经验，评估这三个指标对用户兴趣度不同的代表程度，给它们赋予不同的权重，给出下述的兴趣度评分公式：

R＝log(0.3*buy+0.3*like+0.4*subs)+6 （1）

R就是用户对品牌的兴趣度评分，如果用户对品牌没有发生过上述的三种行为，则该用户对该品牌兴趣度评分为0。依据该公式和相关的用户网站行为记录就可以得到用户对品牌的评分数据，可表示成一个n×m阶的矩阵，m行代表m个用户，n列代表n个品牌，第u行第i列的元素R_u,i代表用户u对品牌i的评分：

	Brand₁	…	Brand_j	…	Brand_n
						User₁	R_1,1	…	R_1,i	…	R_1,m
…	…	…	…	…	…
						User_u	R_u,1	…	R_u,i	…	R_u,n
…	…	…	…	…	…
						User_n	R_n,1	…	R_n,i	…	R_m,n

计算品牌相似度。

对于两个品牌i与j，记对它们有过评分记录的用户集合分别为U_i和U_j。计算品牌i与j的相似性时，传统的三种相似性度量只考虑两者的共同评分用户集合（即U_i与U_j的交集U_i∩U_j），因为这种方法受数据的稀疏性影响比较大，所以本算法考虑的是两个评分用户集合的并集U_i∪U_j。但并集中存在用户对品牌i或j没有评分数据，称为空缺项，如何填补这些空缺项成为计算相似度的关键。本发明采用的填补方式是组合加权评分法。

组合加权评分由用户平均加权评分和品牌加权评分两部分组成。对用户u∈U_i∪U_j-U_i，即品牌i未经用户u评分。用户u的平均加权评分r_u如下式：

r_{u} = \overset{&OverBar;}{R_{u}} + \frac{Σ_{k &Element; I_{u}} (R_{u, k} - \overset{&OverBar;}{R_{i}})}{| I_{u} |} - - - (2)

其中是用户u的平均评分，是品牌i收到的平均评分，I_u是经用户u评分的品牌集合，则用户的平均加权评分r_u是该用户平均评分与用户各项评分相对于未评分品牌i平均评分的平均偏差之和。品牌i的平均加权评分r_i如下式：

r_{i} = \overset{&OverBar;}{R_{i}} + \frac{Σ_{k &Element; U_{i}} (R_{k, i} - \overset{&OverBar;}{R_{u}})}{| U_{i} |} - - - (3)

即品牌的平均加权评分r_i是品牌i的平均评分与各用户对该品牌的评分与用户u的平均评分的平均偏差之和。结合r_u与r_i，可求用户u对品牌i的组合加权评分r_u,i：

r_{u, i} = \sqrt{r_{u} \cdot r_{i}} = \sqrt{(\overset{&OverBar;}{R_{u}} + \frac{Σ_{k &Element; I_{u}} (R_{u, k} - \overset{&OverBar;}{R_{i}})}{| I_{u} |}) (\overset{&OverBar;}{R_{i}} + \frac{Σ_{k &Element; U_{i}} (R_{k, i} - \overset{&OverBar;}{R_{u}})}{| U_{i} |})} - - - (4)

对U_i∪U_j中未对品牌i或j未有评分记录的用户，根据上式来估计他们的缺失评分，这样品牌i和j对U_i∪U_j中的每个用户都对应一个评分值，然后可以根据这些评分值去计算品牌i和j的相似度，本发明使用的是修正的余弦相似度，计算公式如下：

si m (i, j) = \frac{Σ_{u &Element; U_{i} \cup U_{i}} (R_{u, i} - \overset{&OverBar;}{R_{u}}) (R_{u, j} - \overset{&OverBar;}{R_{u}})}{\sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, i} - \overset{&OverBar;}{R_{u}})}^{2}} \sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, j} - \overset{&OverBar;}{R_{u}})}^{2}}} - - - (5) \cdot

其中当R_u,i存在时，R_u,i＝R_u,i，否则，R_u,i＝r_u,i。

而由于上述的相似度计算公式并没有考虑两个品牌的共同评分用户数，这是一个衡量相似度的重要因素，所以引入共同评分阈值η来调整品牌的相似性，修改后的相似度公式如下：

sim (i, j) = \frac{Σ_{u &Element; U_{i} \cup U_{i}} (R_{u, i} - \overset{&OverBar;}{R_{u}}) (R_{u, j} - \overset{&OverBar;}{R_{u}})}{\sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, i} - \overset{&OverBar;}{R_{u}})}^{2}} \sqrt{Σ_{u &Element; U_{i} \cup U_{i}} {(R_{u, j} - \overset{&OverBar;}{R_{u}})}^{2}}} \cdot \frac{\min (η, | U_{i} \cap U_{j} |)}{η} - - - (6)

其中|U_i∩U_j|就是品牌i和j的共同评分用户数，min(η,|U_i∩U_j|)就是取共同用户数与阈值η的最小值。

评分预测。

为了使预测更加准确，本发明使用一种优化的预测评分策略：先确定近邻集的大小K，以目标品牌获得的平均评分作为基准评分，然后寻找目标品牌的近邻品牌集合（即与目标品牌相似度最高的K个品牌组成的集合），再以品牌相似性作为权重结合目标用户对近邻品牌的评分与近邻品牌获得的平均评分的偏差，最后通过基准评分和加权组合的偏差评分来预测目标用户对目标品牌的评分，如下所示：

P_{u, i} = \overset{&OverBar;}{R_{i}} + \frac{Σ_{j &Element; S (i)} sim (i, j) * (R_{u, j} - \overset{&OverBar;}{R_{j}})}{Σ_{j &Element; S (i)} | sim (i, j) |} - - - (7)

其中P_u,i是用户u对品牌i的预测评分，S(i)是品牌i的近邻品牌集合。

依据评分生成短信营销目标用户。

对于每天新上线的品牌，网站都需要挑选一部分可能对上线品牌可能感兴趣的用户，对他们发送品牌的上线信息，提醒他们准时访问网站对感兴趣的商品进行抢购。以往的用户挑选策略都是挑选对目标品牌有过行为的用户，即对该品牌的商品有过购买、放入购物车、订阅等行为的用户。但这种策略推荐的都是本来对目标品牌就感兴趣的用户，忽略了其他没有对该品牌产生过行为但具有有潜在兴趣的用户。

为了发掘目标品牌更多潜在用户，开拓用户的品牌兴趣，和为了避免与常规策略抽取的用户重复，本发明首先筛选掉对目标品牌有评分记录的用户，然后根据式子（7）预测其他用户对目标品牌的评分，最后挑选预测评分最高的若干个用户作为网站的短信营销对象。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种网站项目的通知方法，其特征在于，包括：

获取多个用户对多个项目的兴趣度评分；

如果目标用户对目标项目的预测评分超出预设评分阈值，则向目标用户发送目标项目通知；

所述确定与目标项目的近邻项目集合的步骤，具体包括：

计算目标项目i与其他项目j的相似度为：

其中|U_i∩U_j|为目标项目i和其他项目j的共同兴趣度评分用户数，η为预设的用户数阈值，是用户u的平均兴趣度评分，为用户u对目标项目i的修正评分，为用户u对其他项目j的修正评分；

其中采用如下方式计算：

如果具有用户u对目标项目i的兴趣度评分R_u,i，则

如果不具有用户u对目标项目i的兴趣度评分，则其中r_u,i为用户u对目标项目i的组合加权评分：

其中r_u为用户u的平均加权评分，I_u是具有用户u的兴趣度评分的项目集合，|I_u|为项目集合I_u的项目个数，R_u,k为用户u对项目集合I_u的项目k的兴趣度评分，是目标项目i收到的平均兴趣度评分，其中r_i为目标项目i的平均加权评分，|U_i|为用户集合U_i的用户个数；R_k,i为用户k对目标项目i的兴趣度评分；

其中采用如下方式计算：

如果具有用户u对其他项目j的兴趣度评分R_u,j，则

如果不具有用户u对目标项目j的兴趣度评分，则其中r_u,j为用户u对其他项目j的组合加权评分：

其中r_i为其他项目j的平均加权评分，是其他项目j收到的平均兴趣度评分，|U_j|为用户集合U_j的用户个数；R_k,j为用户k对其他项目j的兴趣度评分；

2.根据权利要求1所述的网站项目的通知方法，其特征在于，所述获取多个用户对多个项目的兴趣度评分的步骤，具体包括：

3.根据权利要求1所述的网站项目的通知方法，其特征在于，所述根据目标用户对近邻项目的兴趣度评分，确定目标用户对目标项目的预测评分的步骤，具体包括：

目标用户v对目标项目i的预测评分P_v,i为：

4.根据权利要求1所述的网站项目的通知方法，其特征在于，所述目标用户为对所述目标项目为具有兴趣度评分的用户。

5.一种网站项目的通知系统，其特征在于，包括：

目标项目通知模块，用于如果目标用户对目标项目的预测评分超出预设评分阈值，则向目标用户发送目标项目通知；

所述近邻项目集合模块，具体包括：

计算目标项目i与其他项目j的相似度为：

其中采用如下方式计算：

如果具有用户u对目标项目i的兴趣度评分R_u,i，则

其中采用如下方式计算：

如果具有用户u对其他项目j的兴趣度评分R_u,j，则

6.根据权利要求5所述的网站项目的通知系统，其特征在于，所述兴趣度评分模块，具体包括：

兴趣度评分计算子模块，用于计算兴趣度评分R：

7.根据权利要求5所述的网站项目的通知系统，其特征在于，所述预测评分模块，具体用于：

目标用户v对目标项目i的预测评分P_v,i为：

8.根据权利要求5所述的网站项目的通知系统，其特征在于，所述目标用户为对所述目标项目为具有兴趣度评分的用户。