CN103412865B - 网站项目的通知方法和系统 - Google Patents

网站项目的通知方法和系统 Download PDF

Info

Publication number
CN103412865B
CN103412865B CN201310226586.9A CN201310226586A CN103412865B CN 103412865 B CN103412865 B CN 103412865B CN 201310226586 A CN201310226586 A CN 201310226586A CN 103412865 B CN103412865 B CN 103412865B
Authority
CN
China
Prior art keywords
user
item
interest
degree
project
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310226586.9A
Other languages
English (en)
Other versions
CN103412865A (zh
Inventor
郑梓力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Pinwei Software Co Ltd
Original Assignee
Guangzhou Vipshop Information And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Vipshop Information And Technology Co Ltd filed Critical Guangzhou Vipshop Information And Technology Co Ltd
Priority to CN201310226586.9A priority Critical patent/CN103412865B/zh
Publication of CN103412865A publication Critical patent/CN103412865A/zh
Application granted granted Critical
Publication of CN103412865B publication Critical patent/CN103412865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及网站通知的相关技术领域,特别是涉及一种网站项目的通知方法和系统,所述方法包括:获取多个用户对多个项目的兴趣度评分;确定与目标项目的近邻项目集合;根据目标用户对近邻项目的兴趣度评分,确定目标用户对目标项目的预测评分;如果目标用户对目标项目的预测评分超出预设评分阈值,则向目标用户发送目标项目通知。本发明的评分预测方法的推荐效果比现有技术更佳,推荐商品的质量等到很大提高。

Description

网站项目的通知方法和系统
技术领域
本发明涉及网站通知的相关技术领域,特别是涉及一种网站项目的通知方法和系统。
背景技术
现在电商网站为了增加销售额和提升用户体验,都非常重视对用户的个性化推荐,而最流行的推荐算法就是协同过滤算法(Collaborative FilteringAlgorithm)。
协同过滤是通过一大群人的行为记录过滤信息,可分为基于用户(User-based)和基于项目(Item-based)两类算法。基于用户的协同过滤算法是通过寻找目标用户的相似的用户群,然后根据这个用户群对目标项目的评分来预测目标用户的对该项目的评分。而基于项目的协同过滤算法是通过找到和目标项目相似的项目群,然后根据目标用户对这些项目的评分来预测该用户对目标项目的评分。
基于用户的协同过滤算法适合用户数较小或项目更迭频繁的场合。而基于项目的协同过滤算法更适合项目数明显少于用户数或项目较为稳定的推荐场景,由于项目之间的相似性比较稳定,可以离线计算,在一定程度上解决了实时推荐的问题。而且基于项目的协同过滤算法能够对推荐结果做出较好的解释,提高了推荐的可测量性。所以在电子商务网站中的推荐系统,通常都以基于项目的协同过滤算法作为推荐算法的基础。而本发明要解决的是电子商务网站的项目推荐问题,用户数比项目数高几个数量级,所以采用基于项目的协同过滤算法更为合理。
基于项目的协同过滤技术基于的假设是:如果很多用户对两个项目的评分相似,则这两个项目的相似度会比较高,而用户对相似项目的打分也比较相近。基于项目的协同过滤推荐算法的过程主要分为两部分:
1、计算项目相关度:根据用户的评分记录,计算项目之间的相关度。一般用到的相似性度量方法有:余弦相似性、Pearson相关系数和修正的余弦相似性,它们的计算方式见下表:
2、预测评分:根据用户对目标项i的K个最近邻居的评分,结合近邻项目与目标项目的相似度,预测用户对项目i的评分,如下式:
P u , i = Σ j ∈ S ( i ) sim ( i , j ) * R u , j Σ j ∈ S ( i ) | sim ( i , j ) |
其中Pu,i为用户u对项目i的预测评分,S(i)是项目i的K近邻集,即与项目i最相似的K个项目。
最后可以根据预测的评分来挑选用户感兴趣的TopN商品生成推荐列表。
然而现有的相似性计算方法不够准确,而项目相似性和后续进行预测评分的基础,所以会影响最后的推荐质量;预测评分公式没有考虑到近邻项的总体评价情况,造成预测评分产生偏差。
发明内容
基于此,有必要针对现有技术的网站项目的推荐质量较低的技术问题,提供一种网站项目的通知方法及系统。
一种网站项目的通知方法,包括:
获取多个用户对多个项目的兴趣度评分;
确定与目标项目的近邻项目集合,所述近邻项目集合为与目标项目相似度最高的K个其他项目,所述目标项目与所述其他项目的相似度由用户并集中的用户对目标项目及所述其他项目的兴趣度评分计算,所述并集为目标项目与其中一个其他项目具有兴趣度评分的用户的并集,目标项目或所述其他项目中未具有所述并集中的用户的兴趣度评分采用组合加权评分方法填补;
根据目标用户对近邻项目的兴趣度评分,确定目标用户对目标项目的预测评分;
如果目标用户对目标项目的预测评分超出预设评分阈值,则向目标用户发送目标项目通知。
在其中一个实施例中,所述获取多个用户对多个项目的兴趣度评分的步骤,具体包括:
获取用户对每个项目的购买次数buy、喜欢过次数like和订阅次数subs;
兴趣度评分R=log(nbuy*buy+nlike*like+nsubs*subs)+nR,其中nbuy为预设的购买次数权重,nlike为预设的喜欢过次数权重,nsubs为预设的订阅次数权重,nR为兴趣度权重。
在其中一个实施例中,所述确定与目标项目的近邻项目集合的步骤,具体包括:
计算目标项目i与所有其他项目的相似度,其中,目标项目i与任一其他项目j的相似度计算如下:
确定目标项目i与其他项目j有过兴趣度评分记录的用户集合分别为Ui和Uj
计算目标项目i与其他项目j的相似度为:
sim ( i , j ) = Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) ( R u , j - R u ‾ ) Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) 2 Σ u ∈ U i ∪ U i ( R u , j - R u ‾ ) 2 · min ( η , | U i ∩ U j | ) η , 其中|Ui∩Uj|为目标项目i和其他项目j的共同兴趣度评分用户数,η为预设的用户数阈值是用户u的平均兴趣度评分,Ru,i为用户u对目标项目i的修正评分,Ru,i为用户u对其他项目j的修正评分;
其中Ru,i采用如下方式计算:
如果具有用户u对目标项目i的兴趣度评分Ru,i,则Ru,i=Ru,i
如果不具有用户u对目标项目i的兴趣度评分,则Ru,i=ru,i,其中ru,i为用户u对目标项目i的组合加权评分:
r u , i = r u · r i , 其中ru为用户u的平均加权评分, r u = R u ‾ + Σ k ∈ I u ( R u , k - R i ‾ ) | I u | , Iu是具有用户u的兴趣度评分的项目集合,|Iu|为项目集合Iu的项目个数,Ru,k为用户u对项目集合Iu的项目k的兴趣度评分,是目标项目i收到的平均兴趣度评分,其中ri为目标项目i的平均加权评分,|Ui|为用户集合Ui的用户个数;Rk,i为用户k对目标项目i的兴趣度评分;
其中Ru,j采用如下方式计算:
如果具有用户u对其他项目j的兴趣度评分Ru,j,则Ru,j=Ru,j
如果不具有用户u对目标项目j的兴趣度评分,则Ru,j=ru,j,其中ru,j为用户u对其他项目j的组合加权评分:
r u , j = r u · r j , 其中ri为其他项目j的平均加权评分, r i = R j ‾ + Σ k ∈ U j ( R k , j - R u ‾ ) | U j | , 是其他项目j收到的平均兴趣度评分,|Uj|为用户集合Uj的用户个数;Rk,j为用户k对其他项目j的兴趣度评分;
确定与目标项目i的相似度最高的K个项目作为目标项目i的近邻项目集合。
在其中一个实施例中,所述根据目标用户对近邻项目的兴趣度评分,确定目标用户对目标项目的预测评分的步骤,具体包括:
目标用户v对目标项目i的预测评分Pv,i为:
P v , i = R i ‾ + Σ l ∈ S ( i ) sim ( i , l ) * ( R v , l - R l ‾ ) Σ l ∈ S ( i ) | sim ( i , l ) | , 其中S(i)是目标项目i的近邻项目集合,其中Rv,l为目标用户v对近邻项目集合中其中一个近邻项目l的兴趣度评分,是近邻项目l收到的平均兴趣度评分。
在其中一个实施例中,所述目标用户为对所述目标项目为具有兴趣度评分的用户。
一种网站项目的通知系统,包括:
兴趣度评分模块,用于获取多个用户对多个项目的兴趣度评分;
近邻项目集合模块,用于确定与目标项目的近邻项目集合,所述近邻项目集合为与目标项目相似度最高的K个其他项目,所述目标项目与所述其他项目的相似度由用户并集中的用户对目标项目及所述其他项目的兴趣度评分计算,所述并集为目标项目与其中一个其他项目具有兴趣度评分的用户的并集,目标项目或所述其他项目中未具有所述并集中的用户的兴趣度评分采用组合加权评分方法填补;
预测评分模块,用于根据目标用户对近邻项目的兴趣度评分,确定目标用户对目标项目的预测评分;
目标项目通知模块,用于如果目标用户对目标项目的预测评分超出预设评分阈值,则向目标用户发送目标项目通知。
在其中一个实施例中,所述兴趣度评分模块,具体包括:
兴趣度行为获取子模块,用于获取用户对每个项目的购买次数buy、喜欢过次数like和订阅次数subs;
兴趣度评分计算子模块,用于计算兴趣度评分R:
R=log(nbuy*buy+nlike*like+nsubs*subs)+nR,其中nbuy为预设的购买次数权重,nlike为预设的喜欢过次数权重,nsubs为预设的订阅次数权重,nR为兴趣度权重。
在其中一个实施例中,所述近邻项目集合模块,具体包括:
相似度计算子模块,用于计算目标项目i与所有其他项目的相似度,其中,目标项目i与任一其他项目j的相似度计算如下:
确定目标项目i与其他项目j有过兴趣度评分记录的用户集合分别为Ui和Uj
计算目标项目i与其他项目j的相似度为:
sim ( i , j ) = Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) ( R u , j - R u ‾ ) Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) 2 Σ u ∈ U i ∪ U i ( R u , j - R u ‾ ) 2 · min ( η , | U i ∩ U j | ) η , 其中|Ui∩Uj|为目标项目i和其他项目j的共同兴趣度评分用户数,η为预设的用户数阈值,是用户u的平均兴趣度评分,Ru,i为用户u对目标项目i的修正评分,Ru,i为用户u对其他项目j的修正评分;
其中Ru,i采用如下方式计算:
如果具有用户u对目标项目i的兴趣度评分Ru,i,则Ru,i=Ru,i
如果不具有用户u对目标项目i的兴趣度评分,则Ru,i=ru,i,其中ru,i为用户u对目标项目i的组合加权评分:
r u , i = r u · r i , 其中ru为用户u的平均加权评分, r u = R u ‾ + Σ k ∈ I u ( R u , k - R i ‾ ) | I u | , Iu是具有用户u的兴趣度评分的项目集合,|Iu|为项目集合Iu的项目个数,Ru,k为用户u对项目集合Iu的项目k的兴趣度评分,是目标项目i收到的平均兴趣度评分,其中ri为目标项目i的平均加权评分,|Ui|为用户集合Ui的用户个数;Rk,i为用户k对目标项目i的兴趣度评分;
其中Ru,j采用如下方式计算:
如果具有用户u对其他项目j的兴趣度评分Ru,j,则Ru,j=Ru,j
如果不具有用户u对目标项目j的兴趣度评分,则Ru,j=ru,j,其中ru,j为用户u对其他项目j的组合加权评分:
r u , j = r u · r j , 其中ri为其他项目j的平均加权评分, r i = R j ‾ + Σ k ∈ U j ( R k , j - R u ‾ ) | U j | , 是其他项目j收到的平均兴趣度评分,|Uj|为用户集合Uj的用户个数;Rk,j为用户k对其他项目j的兴趣度评分;
近邻项目确定子模块,用于确定与目标项目i的相似度最高的K个项目作为目标项目i的近邻项目集合。
在其中一个实施例中,所述预测评分模块,具体用于:
目标用户v对目标项目i的预测评分Pv,i为:
P v , i = R i ‾ + Σ l ∈ S ( i ) sim ( i , l ) * ( R v , l - R l ‾ ) Σ l ∈ S ( i ) | sim ( i , l ) | , 其中S(i)是目标项目i的近邻项目集合,其中Rv,l为目标用户v对近邻项目集合中其中一个近邻项目l的兴趣度评分,是近邻项目l收到的平均兴趣度评分。
在其中一个实施例中,所述目标用户为对所述目标项目为具有兴趣度评分的用户。
上述的网站项目的通知方法及系统,计算项目相似度时,考虑的是两个项目的评分用户的并集,使用组合加权评分方法去填补评分空缺项。与现有的协同过滤技术计算项目相似度时考虑的是项目的评分用户的交集,更适合高度稀疏的现实数据,而且引入共同评分用户数阈值调整项目的相似度,更加能反映项目的相似度。同时现有技术的评分预测公式只考虑用户对目标项目的近邻项目的评分,而没有考虑到其他用户对目标项目的评分情况,以及近邻项目评分的总体情况,这使得预测评分过度依赖目标用户已有的评分数据,这会导致预测评分产生较大的偏差。所以本发明的评分预测方法的推荐效果比现有技术更佳,推荐商品的质量等到很大提高。
同时,本发明使用修正的余弦相似度公式计算两个项目的相似度,再考虑项目共同评分用户数,引入共同评分阈值调整项目的相似度。而现有技术使用的相似度计算方法一般为余弦相似性、Pearson相关系数和修正的余弦相似性,而且没有考虑项目的共同评分用户数。另外,本发明计算用户对指定项目的预测评分时,本发明把目标用户对近邻项目的评分与近邻项目获得的平均评分的偏差为加权相加项,并以目标项目的平均评分为基准。而现有的协同过滤技术把用户对近邻项目的评分作为加权相加项。因此,本发明的计算结果能得到进一步的提高,网站项目的推荐质量也得到大大提高。
同时,本发明利用用户历史行为数据生成用户对项目的评分,根据用户的购买、订阅以及“喜欢”按钮的点击记录评估用户对项目的兴趣度评分。本发明的评分方式综合考虑用户的多种行为,对用户的兴趣度评估更加全面、客观和切合业务逻辑,而且最后得到的数据分布适合分析和输入到推荐算法中。而现有的协同过滤技术直接使用用户对项目的打分数据,带有一定的用户主观性。
附图说明
图1为本发明的一种网站项目的通知方法的工作流程图;
图2为本发明一种网站项目的通知系统的模块结构图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步详细的说明。
如图1所示为本发明的一种网站项目的通知方法的工作流程图,包括:
步骤S101,获取多个用户对多个项目的兴趣度评分;
步骤S102,确定与目标项目的近邻项目集合,所述近邻项目集合为与目标项目相似度最高的K个其他项目,所述目标项目与所述其他项目的相似度由用户并集中的用户对目标项目及所述其他项目的兴趣度评分计算,所述并集为目标项目与其中一个其他项目具有兴趣度评分的用户的并集,目标项目或所述其他项目中未具有所述并集中的用户的兴趣度评分采用组合加权评分方法填补;
步骤S103,根据目标用户对近邻项目的兴趣度评分,确定目标用户对目标项目的预测评分;
步骤S104,如果目标用户对目标项目的预测评分超出预设评分阈值,则向目标用户发送目标项目通知。
本领域普通技术人员在阅读本专利后,可以确定步骤S101的具体步骤。在其中一个实施例中,所述步骤S101,具体包括:
获取用户对每个项目的购买次数buy、喜欢过次数like和订阅次数subs;
兴趣度评分R=log(nbuy*buy+nlike*like+nsubs*subs)+nR,其中nbuy为预设的购买次数权重,nlike为预设的喜欢过次数权重,nsubs为预设的订阅次数权重,nR为兴趣度权重。
本实施例利用用户历史行为数据生成用户对项目的评分,根据用户的购买、订阅以及“喜欢”按钮的点击记录评估用户对项目的兴趣度评分。因此,其数据与用户的需求更为接近
对于相似度的计算,本领域普通技术人员在阅读本专利后可以提出具体的实现方式。在其中一个实施例中,所述步骤S102,具体包括:
计算目标项目i与所有其他项目的相似度,其中,目标项目i与任一其他项目j的相似度计算如下:
确定目标项目i与其他项目j有过兴趣度评分记录的用户集合分别为Ui和Uj
计算目标项目i与其他项目j的相似度为:
sim ( i , j ) = Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) ( R u , j - R u ‾ ) Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) 2 Σ u ∈ U i ∪ U i ( R u , j - R u ‾ ) 2 · min ( η , | U i ∩ U j | ) η , 其中|Ui∩Uj|为目标项目i和其他项目j的共同兴趣度评分用户数,η为预设的用户数阈值,是用户u的平均兴趣度评分,Ru,i为用户u对目标项目i的修正评分,Ru,i为用户u对其他项目j的修正评分;
其中Ru,i采用如下方式计算:
如果具有用户u对目标项目i的兴趣度评分Ru,i,则Ru,i=Ru,i
如果不具有用户u对目标项目i的兴趣度评分,则Ru,i=ru,i,其中ru,i为用户u对目标项目i的组合加权评分:
r u , i = r u · r i , 其中ru为用户u的平均加权评分, r u = R u ‾ + Σ k ∈ I u ( R u , k - R i ‾ ) | I u | , Iu是具有用户u的兴趣度评分的项目集合,|Iu|为项目集合Iu的项目个数,Ruk为用户u对项目集合Iu的项目k的兴趣度评分,是目标项目i收到的平均兴趣度评分,其中ri为目标项目i的平均加权评分,|Ui|为用户集合Ui的用户个数;Rk,i为用户k对目标项目i的兴趣度评分;
其中Ru,j采用如下方式计算:
如果具有用户u对其他项目j的兴趣度评分Ru,j,则Ru,j=Ru,j
如果不具有用户u对目标项目j的兴趣度评分,则Ru,j=ru,j,其中ru,j为用户u对其他项目j的组合加权评分:
r u , j = r u · r j , 其中ri为其他项目j的平均加权评分, r i = R j ‾ + Σ k ∈ U j ( R k , j - R u ‾ ) | U j | , 是其他项目j收到的平均兴趣度评分,|Uj|为用户集合Uj的用户个数;Rk,j为用户k对其他项目j的兴趣度评分;
确定与目标项目i的相似度最高的K个项目作为目标项目i的近邻项目集合。
本实施例计算项目相似度时,考虑的是两个项目的评分用户的并集,使用组合加权评分方法去填补评分空缺项,再使用修正的余弦相似度公式计算两个项目的相似度,再考虑项目共同评分用户数,引入共同评分阈值调整项目的相似度。而现有的协同过滤技术计算项目相似度时考虑的是项目的评分用户的交集,使用的相似度计算方法一般为余弦相似性、Pearson相关系数和修正的余弦相似性,而且没有考虑项目的共同评分用户数。
在其中一个实施例中,步骤S103,具体包括:
目标用户v对目标项目i的预测评分Pv,i为:
P v , i = R i ‾ + Σ l ∈ S ( i ) sim ( i , l ) * ( R v , l - R l ‾ ) Σ l ∈ S ( i ) | sim ( i , l ) | , 其中S(i)是目标项目i的近邻项目集合,其中Rv,l为目标用户v对近邻项目集合中其中一个近邻项目l的兴趣度评分,是近邻项目l收到的平均兴趣度评分。
本实施例把目标用户对近邻项目的评分与近邻项目获得的平均评分的偏差为加权相加项,并以目标项目的平均评分为基准。而现有的协同过滤技术把用户对近邻项目的评分作为加权相加项
在其中一个实施例中,所述目标用户为对所述目标项目为具有兴趣度评分的用户。
对于每天新上线的项目,网站都需要挑选一部分可能对上线项目可能感兴趣的用户,对他们发送项目的上线信息,提醒他们准时访问网站对感兴趣的商品进行抢购。现有的用户挑选策略都是挑选对目标项目有过行为的用户,即对该项目的商品有过购买、放入购物车、订阅等行为的用户。但这种策略推荐的都是本来对目标项目就感兴趣的用户,忽略了其他没有对该项目产生过行为但具有有潜在兴趣的用户。
为了发掘目标项目更多潜在用户,开拓用户的项目兴趣,和为了避免与常规策略抽取的用户重复,本实施例的目标用户为对所述目标项目为具有兴趣度评分的用户。其中,通知方法,可以采用短信通知的方式。
如图2所示为本发明一种网站项目的通知系统的模块结构图,包括:
兴趣度评分模块210,用于获取多个用户对多个项目的兴趣度评分;
近邻项目集合模块220,用于确定与目标项目的近邻项目集合,所述近邻项目集合为与目标项目相似度最高的K个其他项目,所述目标项目与所述其他项目的相似度由用户并集中的用户对目标项目及所述其他项目的兴趣度评分计算,所述并集为目标项目与其中一个其他项目具有兴趣度评分的用户的并集,目标项目或所述其他项目中未具有所述并集中的用户的兴趣度评分采用组合加权评分方法填补;
预测评分模块230,用于根据目标用户对近邻项目的兴趣度评分,确定目标用户对目标项目的预测评分;
目标项目通知模块240,用于如果目标用户对目标项目的预测评分超出预设评分阈值,则向目标用户发送目标项目通知。
在其中一个实施例中,所述兴趣度评分模块210,具体包括:
兴趣度行为获取子模块211,用于获取用户对每个项目的购买次数buy、喜欢过次数like和订阅次数subs;
兴趣度评分计算子模块212,用于计算兴趣度评分R:
R=log(nbuy*buy+nlike*like+nsubs*subs)+nR,其中nbuy为预设的购买次数权重,nlike为预设的喜欢过次数权重,nsubs为预设的订阅次数权重,nR为兴趣度权重。
在其中一个实施例中,所述近邻项目集合模块220,具体包括:
相似度计算子模块221,用于计算目标项目i与所有其他项目的相似度,其中,目标项目i与任一其他项目j的相似度计算如下:
确定目标项目i与其他项目j有过兴趣度评分记录的用户集合分别为Ui和Uj
计算目标项目i与其他项目j的相似度为:
sim ( i , j ) = Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) ( R u , j - R u ‾ ) Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) 2 Σ u ∈ U i ∪ U i ( R u , j - R u ‾ ) 2 · min ( η , | U i ∩ U j | ) η , 其中|Ui∩Uj|为目标项目i和其他项目j的共同兴趣度评分用户数,η为预设的用户数阈值,是用户u的平均兴趣度评分,Ru,i为用户u对目标项目i的修正评分,Ru,i为用户u对其他项目j的修正评分;
其中Ru,i采用如下方式计算:
如果具有用户u对目标项目i的兴趣度评分Ru,i,则Ru,i=Ru,i
如果不具有用户u对目标项目i的兴趣度评分,则Ru,i=ru,i,其中ru,i为用户u对目标项目i的组合加权评分:
r u , i = r u · r i , 其中ru为用户u的平均加权评分, r u = R u ‾ + Σ k ∈ I u ( R u , k - R i ‾ ) | I u | , Iu是具有用户u的兴趣度评分的项目集合,|Iu|为项目集合Iu的项目个数,Ru,k为用户u对项目集合Iu的项目k的兴趣度评分,是目标项目i收到的平均兴趣度评分,其中ri为目标项目i的平均加权评分,|Ui|为用户集合Ui的用户个数;Rk,i为用户k对目标项目i的兴趣度评分;
其中Ru,j采用如下方式计算:
如果具有用户u对其他项目j的兴趣度评分Ru,j,则Ru,j=Ru,j
如果不具有用户u对目标项目j的兴趣度评分,则Ru,j=ru,j,其中ru,j为用户u对其他项目j的组合加权评分:
r u , j = r u · r j , 其中ri为其他项目j的平均加权评分, r i = R j ‾ + Σ k ∈ U j ( R k , j - R u ‾ ) | U j | , 是其他项目j收到的平均兴趣度评分,|Uj|为用户集合Uj的用户个数;Rk,j为用户k对其他项目j的兴趣度评分;
近邻项目确定子模块222,用于确定与目标项目i的相似度最高的K个项目作为目标项目i的近邻项目集合。
在其中一个实施例中,所述预测评分模块230,具体用于:
目标用户v对目标项目i的预测评分Pv,i为:
P v , i = R i ‾ + Σ l ∈ S ( i ) sim ( i , l ) * ( R v , l - R l ‾ ) Σ l ∈ S ( i ) | sim ( i , l ) | , 其中S(i)是目标项目i的近邻项目集合,其中Rv,l为目标用户v对近邻项目集合中其中一个近邻项目l的兴趣度评分,是近邻项目l收到的平均兴趣度评分。
在其中一个实施例中,所述目标用户为对所述目标项目为具有兴趣度评分的用户。
作为一个例子,为一个网站品牌的通知方法。
该例子中,网站从成立到现在的用户行为数据都保存在数据库里,包括用户的购买记录、订阅记录以及品牌“喜欢”按钮的点击记录。而评价用户对某个品牌的偏好程度就是根据用户对该品牌的购买次数(buy)、喜欢过次数(like)以及订阅次数(subs)这三个指标来衡量。根据经验,评估这三个指标对用户兴趣度不同的代表程度,给它们赋予不同的权重,给出下述的兴趣度评分公式:
R=log(0.3*buy+0.3*like+0.4*subs)+6 (1)
R就是用户对品牌的兴趣度评分,如果用户对品牌没有发生过上述的三种行为,则该用户对该品牌兴趣度评分为0。依据该公式和相关的用户网站行为记录就可以得到用户对品牌的评分数据,可表示成一个n×m阶的矩阵,m行代表m个用户,n列代表n个品牌,第u行第i列的元素Ru,i代表用户u对品牌i的评分:
Brand1 Brandj Brandn
User1 R1,1 R1,i R1,m
Useru Ru,1 Ru,i Ru,n
Usern Rn,1 Rn,i Rm,n
计算品牌相似度。
对于两个品牌i与j,记对它们有过评分记录的用户集合分别为Ui和Uj。计算品牌i与j的相似性时,传统的三种相似性度量只考虑两者的共同评分用户集合(即Ui与Uj的交集Ui∩Uj),因为这种方法受数据的稀疏性影响比较大,所以本算法考虑的是两个评分用户集合的并集Ui∪Uj。但并集中存在用户对品牌i或j没有评分数据,称为空缺项,如何填补这些空缺项成为计算相似度的关键。本发明采用的填补方式是组合加权评分法。
组合加权评分由用户平均加权评分和品牌加权评分两部分组成。对用户u∈Ui∪Uj-Ui,即品牌i未经用户u评分。用户u的平均加权评分ru如下式:
r u = R u ‾ + Σ k ∈ I u ( R u , k - R i ‾ ) | I u | - - - ( 2 )
其中是用户u的平均评分,是品牌i收到的平均评分,Iu是经用户u评分的品牌集合,则用户的平均加权评分ru是该用户平均评分与用户各项评分相对于未评分品牌i平均评分的平均偏差之和。品牌i的平均加权评分ri如下式:
r i = R i ‾ + Σ k ∈ U i ( R k , i - R u ‾ ) | U i | - - - ( 3 )
即品牌的平均加权评分ri是品牌i的平均评分与各用户对该品牌的评分与用户u的平均评分的平均偏差之和。结合ru与ri,可求用户u对品牌i的组合加权评分ru,i
r u , i = r u · r i = ( R u ‾ + Σ k ∈ I u ( R u , k - R i ‾ ) | I u | ) ( R i ‾ + Σ k ∈ U i ( R k , i - R u ‾ ) | U i | ) - - - ( 4 )
对Ui∪Uj中未对品牌i或j未有评分记录的用户,根据上式来估计他们的缺失评分,这样品牌i和j对Ui∪Uj中的每个用户都对应一个评分值,然后可以根据这些评分值去计算品牌i和j的相似度,本发明使用的是修正的余弦相似度,计算公式如下:
si m ( i , j ) = Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) ( R u , j - R u ‾ ) Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) 2 Σ u ∈ U i ∪ U i ( R u , j - R u ‾ ) 2 - - - ( 5 ) ·
其中当Ru,i存在时,Ru,i=Ru,i,否则,Ru,i=ru,i
而由于上述的相似度计算公式并没有考虑两个品牌的共同评分用户数,这是一个衡量相似度的重要因素,所以引入共同评分阈值η来调整品牌的相似性,修改后的相似度公式如下:
sim ( i , j ) = Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) ( R u , j - R u ‾ ) Σ u ∈ U i ∪ U i ( R u , i - R u ‾ ) 2 Σ u ∈ U i ∪ U i ( R u , j - R u ‾ ) 2 · min ( η , | U i ∩ U j | ) η - - - ( 6 )
其中|Ui∩Uj|就是品牌i和j的共同评分用户数,min(η,|Ui∩Uj|)就是取共同用户数与阈值η的最小值。
评分预测。
为了使预测更加准确,本发明使用一种优化的预测评分策略:先确定近邻集的大小K,以目标品牌获得的平均评分作为基准评分,然后寻找目标品牌的近邻品牌集合(即与目标品牌相似度最高的K个品牌组成的集合),再以品牌相似性作为权重结合目标用户对近邻品牌的评分与近邻品牌获得的平均评分的偏差,最后通过基准评分和加权组合的偏差评分来预测目标用户对目标品牌的评分,如下所示:
P u , i = R i ‾ + Σ j ∈ S ( i ) sim ( i , j ) * ( R u , j - R j ‾ ) Σ j ∈ S ( i ) | sim ( i , j ) | - - - ( 7 )
其中Pu,i是用户u对品牌i的预测评分,S(i)是品牌i的近邻品牌集合。
依据评分生成短信营销目标用户。
对于每天新上线的品牌,网站都需要挑选一部分可能对上线品牌可能感兴趣的用户,对他们发送品牌的上线信息,提醒他们准时访问网站对感兴趣的商品进行抢购。以往的用户挑选策略都是挑选对目标品牌有过行为的用户,即对该品牌的商品有过购买、放入购物车、订阅等行为的用户。但这种策略推荐的都是本来对目标品牌就感兴趣的用户,忽略了其他没有对该品牌产生过行为但具有有潜在兴趣的用户。
为了发掘目标品牌更多潜在用户,开拓用户的品牌兴趣,和为了避免与常规策略抽取的用户重复,本发明首先筛选掉对目标品牌有评分记录的用户,然后根据式子(7)预测其他用户对目标品牌的评分,最后挑选预测评分最高的若干个用户作为网站的短信营销对象。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种网站项目的通知方法,其特征在于,包括:
获取多个用户对多个项目的兴趣度评分;
确定与目标项目的近邻项目集合,所述近邻项目集合为与目标项目相似度最高的K个其他项目,所述目标项目与所述其他项目的相似度由用户并集中的用户对目标项目及所述其他项目的兴趣度评分计算,所述并集为目标项目与其中一个其他项目具有兴趣度评分的用户的并集,目标项目或所述其他项目中未具有所述并集中的用户的兴趣度评分采用组合加权评分方法填补;
根据目标用户对近邻项目的兴趣度评分,确定目标用户对目标项目的预测评分;
如果目标用户对目标项目的预测评分超出预设评分阈值,则向目标用户发送目标项目通知;
所述确定与目标项目的近邻项目集合的步骤,具体包括:
计算目标项目i与所有其他项目的相似度,其中,目标项目i与任一其他项目j的相似度计算如下:
确定目标项目i与其他项目j有过兴趣度评分记录的用户集合分别为Ui和Uj
计算目标项目i与其他项目j的相似度为:
其中|Ui∩Uj|为目标项目i和其他项目j的共同兴趣度评分用户数,η为预设的用户数阈值,是用户u的平均兴趣度评分,为用户u对目标项目i的修正评分,为用户u对其他项目j的修正评分;
其中采用如下方式计算:
如果具有用户u对目标项目i的兴趣度评分Ru,i,则
如果不具有用户u对目标项目i的兴趣度评分,则其中ru,i为用户u对目标项目i的组合加权评分:
其中ru为用户u的平均加权评分,Iu是具有用户u的兴趣度评分的项目集合,|Iu|为项目集合Iu的项目个数,Ru,k为用户u对项目集合Iu的项目k的兴趣度评分,是目标项目i收到的平均兴趣度评分,其中ri为目标项目i的平均加权评分,|Ui|为用户集合Ui的用户个数;Rk,i为用户k对目标项目i的兴趣度评分;
其中采用如下方式计算:
如果具有用户u对其他项目j的兴趣度评分Ru,j,则
如果不具有用户u对目标项目j的兴趣度评分,则其中ru,j为用户u对其他项目j的组合加权评分:
其中ri为其他项目j的平均加权评分, 是其他项目j收到的平均兴趣度评分,|Uj|为用户集合Uj的用户个数;Rk,j为用户k对其他项目j的兴趣度评分;
确定与目标项目i的相似度最高的K个项目作为目标项目i的近邻项目集合。
2.根据权利要求1所述的网站项目的通知方法,其特征在于,所述获取多个用户对多个项目的兴趣度评分的步骤,具体包括:
获取用户对每个项目的购买次数buy、喜欢过次数like和订阅次数subs;
兴趣度评分R=log(nbuy*buy+nlike*like+nsubs*subs)+nR,其中nbuy为预设的购买次数权重,nlike为预设的喜欢过次数权重,nsubs为预设的订阅次数权重,nR为兴趣度权重。
3.根据权利要求1所述的网站项目的通知方法,其特征在于,所述根据目标用户对近邻项目的兴趣度评分,确定目标用户对目标项目的预测评分的步骤,具体包括:
目标用户v对目标项目i的预测评分Pv,i为:
其中S(i)是目标项目i的近邻项目集合,其中Rv,l为目标用户v对近邻项目集合中其中一个近邻项目l的兴趣度评分,是近邻项目l收到的平均兴趣度评分。
4.根据权利要求1所述的网站项目的通知方法,其特征在于,所述目标用户为对所述目标项目为具有兴趣度评分的用户。
5.一种网站项目的通知系统,其特征在于,包括:
兴趣度评分模块,用于获取多个用户对多个项目的兴趣度评分;
近邻项目集合模块,用于确定与目标项目的近邻项目集合,所述近邻项目集合为与目标项目相似度最高的K个其他项目,所述目标项目与所述其他项目的相似度由用户并集中的用户对目标项目及所述其他项目的兴趣度评分计算,所述并集为目标项目与其中一个其他项目具有兴趣度评分的用户的并集,目标项目或所述其他项目中未具有所述并集中的用户的兴趣度评分采用组合加权评分方法填补;
预测评分模块,用于根据目标用户对近邻项目的兴趣度评分,确定目标用户对目标项目的预测评分;
目标项目通知模块,用于如果目标用户对目标项目的预测评分超出预设评分阈值,则向目标用户发送目标项目通知;
所述近邻项目集合模块,具体包括:
相似度计算子模块,用于计算目标项目i与所有其他项目的相似度,其中,目标项目i与任一其他项目j的相似度计算如下:
确定目标项目i与其他项目j有过兴趣度评分记录的用户集合分别为Ui和Uj
计算目标项目i与其他项目j的相似度为:
其中|Ui∩Uj|为目标项目i和其他项目j的共同兴趣度评分用户数,η为预设的用户数阈值,是用户u的平均兴趣度评分,为用户u对目标项目i的修正评分,为用户u对其他项目j的修正评分;
其中采用如下方式计算:
如果具有用户u对目标项目i的兴趣度评分Ru,i,则
如果不具有用户u对目标项目i的兴趣度评分,则其中ru,i为用户u对目标项目i的组合加权评分:
其中ru为用户u的平均加权评分,Iu是具有用户u的兴趣度评分的项目集合,|Iu|为项目集合Iu的项目个数,Ru,k为用户u对项目集合Iu的项目k的兴趣度评分,是目标项目i收到的平均兴趣度评分,其中ri为目标项目i的平均加权评分,|Ui|为用户集合Ui的用户个数;Rk,i为用户k对目标项目i的兴趣度评分;
其中采用如下方式计算:
如果具有用户u对其他项目j的兴趣度评分Ru,j,则
如果不具有用户u对目标项目j的兴趣度评分,则其中ru,j为用户u对其他项目j的组合加权评分:
其中ri为其他项目j的平均加权评分,是其他项目j收到的平均兴趣度评分,|Uj|为用户集合Uj的用户个数;Rk,j为用户k对其他项目j的兴趣度评分;
近邻项目确定子模块,用于确定与目标项目i的相似度最高的K个项目作为目标项目i的近邻项目集合。
6.根据权利要求5所述的网站项目的通知系统,其特征在于,所述兴趣度评分模块,具体包括:
兴趣度行为获取子模块,用于获取用户对每个项目的购买次数buy、喜欢过次数like和订阅次数subs;
兴趣度评分计算子模块,用于计算兴趣度评分R:
R=log(nbuy*buy+nlike*like+nsubs*subs)+nR,其中nbuy为预设的购买次数权重,nlike为预设的喜欢过次数权重,nsubs为预设的订阅次数权重,nR为兴趣度权重。
7.根据权利要求5所述的网站项目的通知系统,其特征在于,所述预测评分模块,具体用于:
目标用户v对目标项目i的预测评分Pv,i为:
其中S(i)是目标项目i的近邻项目集合,其中Rv,l为目标用户v对近邻项目集合中其中一个近邻项目l的兴趣度评分,是近邻项目l收到的平均兴趣度评分。
8.根据权利要求5所述的网站项目的通知系统,其特征在于,所述目标用户为对所述目标项目为具有兴趣度评分的用户。
CN201310226586.9A 2013-06-07 2013-06-07 网站项目的通知方法和系统 Active CN103412865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310226586.9A CN103412865B (zh) 2013-06-07 2013-06-07 网站项目的通知方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310226586.9A CN103412865B (zh) 2013-06-07 2013-06-07 网站项目的通知方法和系统

Publications (2)

Publication Number Publication Date
CN103412865A CN103412865A (zh) 2013-11-27
CN103412865B true CN103412865B (zh) 2016-08-31

Family

ID=49605877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310226586.9A Active CN103412865B (zh) 2013-06-07 2013-06-07 网站项目的通知方法和系统

Country Status (1)

Country Link
CN (1) CN103412865B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778329B (zh) * 2014-01-13 2017-01-04 成都国科海博信息技术股份有限公司 一种构造数据补足值的方法
CN104166732B (zh) * 2014-08-29 2017-04-12 合肥工业大学 一种基于全局评分信息的项目协同过滤推荐方法
CN105025091A (zh) * 2015-06-26 2015-11-04 南京邮电大学 一种基于移动用户位置的商铺推荐方法
CN108710648B (zh) * 2018-04-28 2021-08-31 东华大学 一种基于s型改进相似度的协同过滤推荐方法
CN111915393A (zh) * 2020-07-04 2020-11-10 中信银行股份有限公司 产品的确定方法及装置、存储介质、电子设备
CN112163733A (zh) * 2020-08-28 2021-01-01 南京星耀智能科技有限公司 一种基于专家知识结合协同过滤算法的作战能力评估方法
CN112926902A (zh) * 2021-04-15 2021-06-08 广州宏途教育网络科技有限公司 一种基于学生自身特性的选课方法及处理终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853463A (zh) * 2009-03-30 2010-10-06 北京邮电大学 基于客户特征的协同过滤推荐方法和系统
CN102957950A (zh) * 2012-07-23 2013-03-06 华东师范大学 一种用于视频推荐的用户隐式评分方法
CN103049528A (zh) * 2012-12-24 2013-04-17 北京信息科技大学 基于用户兴趣向量的个性化网页搜索排序方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8577896B2 (en) * 2010-06-08 2013-11-05 Netflix, Inc Interest based row selection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853463A (zh) * 2009-03-30 2010-10-06 北京邮电大学 基于客户特征的协同过滤推荐方法和系统
CN102957950A (zh) * 2012-07-23 2013-03-06 华东师范大学 一种用于视频推荐的用户隐式评分方法
CN103049528A (zh) * 2012-12-24 2013-04-17 北京信息科技大学 基于用户兴趣向量的个性化网页搜索排序方法

Also Published As

Publication number Publication date
CN103412865A (zh) 2013-11-27

Similar Documents

Publication Publication Date Title
CN103412865B (zh) 网站项目的通知方法和系统
Zhai et al. Mapping the popularity of urban restaurants using social media data
Wei et al. A review of the application of RFM model
Yang Understanding household switching behavior in the retail electricity market
Behrens International integration and regional inequalities: how important is national infrastructure?
Candra et al. Impact of E-Service Quality and Customer Value on Customer Satisfaction in LocalBrand
Qian et al. Incorporating heterogeneity to forecast the demand of new products in emerging markets: Green cars in China
CN105868847A (zh) 一种购物行为的预测方法及装置
Prathapan et al. Effectiveness of digital marketing: Tourism websites comparative analytics based on AIDA model
CN103412948A (zh) 基于聚类的协同过滤的商品推荐方法及系统
CN105976229A (zh) 一种基于用户和项目混合的协同过滤算法
Montazar et al. A fuzzy analytical hierarchy methodology for the performance assessment of irrigation projects
CN103440589A (zh) 门店选址系统及方法
CN104281956A (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN102982466B (zh) 一种基于用户活跃度的评分预测方法
CN103310353B (zh) 一种抗攻击的数据过滤优化系统和方法
Fernandes et al. Scale, scope, and trade dynamics of export processing plants
CN102208087A (zh) 信息推荐装置
CN105550275A (zh) 一种微博转发量预测方法
CN104008495A (zh) 面向产品的零售点营销推荐方法
Gradus et al. The effects of market concentration on costs of local public services: empirical evidence from Dutch waste collection
Hubbard Trade and transboundary pollution: quantifying the effects of trade liberalization on CO2 emissions
Brandão et al. International R&D spillovers to the electric power industries
Itsubo Weighting
Leung et al. Customer loyalty enhancement of online-to-offline marketing in beauty industry

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20170309

Address after: 510000 Liwan District, Guangzhou, Fangcun Road, No. 314, the middle of the road by the self written on the road, No. two,

Patentee after: GUANGZHOU VIP NETWORK TECHNOLOGY CO., LTD.

Address before: 510370 Guangdong, Guangzhou, Fangcun, No., No. 20 Huahai street, building 1-5

Patentee before: Guangzhou VIPSHOP Information and Technology Co., Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20171215

Address after: 510000 Guangzhou City, Guangzhou, Guangdong, Fangcun Avenue, one of the 314 self compiled

Patentee after: Guangzhou Pinwei Software Co., Ltd.

Address before: 510000 Liwan District, Guangzhou, Fangcun Road, No. 314, the middle of the road by the self written on the road, No. two,

Patentee before: GUANGZHOU VIP NETWORK TECHNOLOGY CO., LTD.