一种用于网上商场系统的混合推荐方法
技术领域
本发明属于推荐技术领域,具体属于一种用于网上商场系统的混合推荐方法。
背景技术
现有的商城商品推荐不够精细,主要是基于点击次数进行商品推荐,用户对某一商品点击查看次数多,在用户再次打开网页时,该商品的显示顺序就靠前,但此种推荐方法分析考量的维度少,不能真正反映用户真正实际想要的商品,不够系统,实际推荐的商品可能不是用户真正想要的。
因此,如何实现网上商城推荐的商品顺序更符合用户需求成为亟待解决的问题。最常见的是协同过滤算法。在商品推荐领域,由于网站上的商品数量巨大,但只有很少的用户愿意给去过的商品评分,所以造成了用户—网上商品评分矩阵的极大稀疏,导致基于协同过滤算法得到的商家推荐列表不够准确。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种提高矩阵稀疏度的用于网上商场系统的混合推荐方法。
本发明的技术方案如下:
一种用于网上商场系统的混合推荐方法,其包括以下步骤:
用户输入购买请求信息,并获取用户的历史购买信息,对所述用户的历史购买信息进行筛选,获取与网上商场及用户相关的信息,得到用户—网上商品评分矩阵,从预设的用户属性项集合中确定出与所述购买请求信息关联的目标属性项,并利用建立的用户—网上商品评分矩阵,为每个用户和每个网上商品端构建历史评分记录集合,同时构建用户集合,按照用户的评分网上商品从大到小对用户集合中的用户排序;按用户在用户集合中的顺序,选取一个评分最高的网上商品作为目标商品;根据用户—网上商品评分矩阵,计算其余商品与目标商品的相似度;选取与目标商品相似度大于第一设定值的商品构建目标用户的优先商品集;计算目标商品与各优先商品的历史共同评分差均值,若两个用户历史本身没有共同商品,则不做计算;选取共同评分差均值小于第二设定值的商品构造最终的相似商品集,利用目标商品的相似商品集对用户—网上商品评分矩阵进行填充;对用户—网上商品评分矩阵中剩下的未填充数据,同样采用相似度阈值法和共同评分差均值来选取最相似网上商品,并利用相似网上商品来对用户—网上商品评分矩阵进行再次填充,进行网上商品的初步推荐;将用户的历史购买数据分为单维度用户特征值和多维度用户特征值,其中,所述单维度用户特征值为能够直观判断用户对推荐算法兴趣度的用户信息,所述多维度用户特征值为多维的、隐形的、不能够直观判断用户对推荐算法兴趣度的用户信息;采用贝叶斯平均算法对所述单维度用户特征值进行计算,获得所述单维度用户的推荐算法兴趣度,其中,采用并行计算方法计算所述单维度用户的推荐算法兴趣度;以及,采用朴素贝叶斯模型对所述多维度用户特征值进行计算,建立多维度用户兴趣模型,并对所述多维度用户兴趣模型进行训练,获得所述多维度用户的推荐算法兴趣度,其中,采用并行计算方法计算所述多维度用户的推荐算法兴趣度;根据所述单维度用户的推荐算法兴趣度和所述多维度用户的推荐算法兴趣度,确定推荐列表,并将所述推荐列表推荐给所述数据库的用户;若和网上商品初步推荐结果有一半一样则按此推荐,若不一样则选取评分第二高的网上商品作为目标商品,重复以上步骤进行填充,直到超过一半相同则推荐商品类别给用户。
进一步的,所述构建目标商品的优先商品集过程如下:
按用户在用户集合中的顺序,选取一个评分最高的商品作为目标商品;利用用户—网上商品评分矩阵,通过Pearson皮尔逊相关系数公式来计算其余商品与目标商品的相似度;
其中,simu,v表示商品u和商品v的相似度,Iu,v为商品u和商品v的共同评分商家集合,Rui、Rvi分别为商品u、商品v对商家i的评分,分别为商品u、商品v的平均评分;选取与目标商品相似度大于α的商品构建目标商品的优选邻居商品集p_N(u)。
进一步的,所述最相似商品的选取过程如下:
计算目标商品与各优先商品的历史共同评分差均值,计算公式如下:
其中,avg(u,v)为商品u和商品v的历史共同评分差均值,Iu′,v为目标商品u和商品v的历史共同评分新闻播报端集合,Rui、Rvi分别为商品u、商品v对商品i的评分;选取共同评分差均值小于β的优先商品构造最终的最相似商品N(u)。
进一步的,所述获取目标商品属性项对应的商品属性信息;基于商品属性信息在待推荐网上商品中筛选出目标商品进行推荐,包括:判断所述筛选结果中是否包含与所述预设商品属性项集合中的商品属性项的标识关联的关键词;若是,提取出标识与所述解析结果中的关键词匹配的商品属性项,作为所述目标属性项;获取所述待推荐新闻库中的各待推荐新闻的摘要信息,所述摘要信息包括标题和内容摘要;基于各所述待推荐新闻的摘要信息与解析结果和所述目标属性项对应的商品属性信息之间的相似度筛选出所述目标商品;推送所述目标商品。
本发明的有益效果
本发明一方面通过计算评估不同用户的推荐算法兴趣度,通过采用贝叶斯平均算法获得单维度用户的推荐算法兴趣度,能够提高单维度用户的算法兴趣预测的准确率;通过采用朴素贝叶斯模型获得多维度用户的推荐算法兴趣度,采用朴素贝叶斯学习能够挖掘用户群隐性的算法兴趣,提高用户的算法兴趣预测精准度;通过并行计算能够缩短训练用户兴趣模型的时间和兴趣预测评估的时间。从而提升了新闻推荐的针对性。另一方面,加入了历史共同评分差均值来筛选邻居,去掉了与目标项评分差异较大的邻居,使相似邻居集的选取更加准确,有效避免了把一个商品讨厌的新闻播报端当成另一个商品喜欢的新闻播报端来进行推荐,使推荐更加准确。本发明先从用户的角度做第一步填充,再从商场的角度做第二步填充,使稀疏的用户—网上商品评分矩阵的填充更加完整。同时每一步填充都采用动态填充方式,按评分个数的大小来依次选取目标商品进行填充,每一次做填充的矩阵都是对上一个目标填充完成后的矩阵。动态填充使商品的共同评分数增多,相似度计算更加准确,因此对稀疏的用户—网上商品评分矩阵的填充也更加准确,最后给出的推荐列表更加符合商品的心意,提高了用户对推荐系统的粘性,并且当两者评判结果不一样时,则再次选取评分值第二高的商品作为目标商品,重复以上步骤进行填充,得到推荐商品,这样就避免了评分最高商品的局限性,推荐第二高的商品,使得推荐更加人性化。
附图说明
图1是本发明提供优选实施例用于网上商场系统的混合推荐方法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
如图1所示为一种用于网上商场系统的混合推荐方法,其包括以下步骤:
用户输入购买请求信息,并获取用户的历史购买信息,对所述用户的历史购买信息进行筛选,获取与网上商场及用户相关的信息,得到用户—网上商品评分矩阵,从预设的用户属性项集合中确定出与所述购买请求信息关联的目标属性项,并利用建立的用户—网上商品评分矩阵,为每个用户和每个网上商品端构建历史评分记录集合,同时构建用户集合,按照用户的评分网上商品从大到小对用户集合中的用户排序;按用户在用户集合中的顺序,选取一个评分最高的网上商品作为目标商品;根据用户—网上商品评分矩阵,计算其余商品与目标商品的相似度;选取与目标商品相似度大于第一设定值的商品构建目标用户的优先商品集;计算目标商品与各优先商品的历史共同评分差均值,若两个用户历史本身没有共同商品,则不做计算;选取共同评分差均值小于第二设定值的商品构造最终的相似商品集,利用目标商品的相似商品集对用户—网上商品评分矩阵进行填充;对用户—网上商品评分矩阵中剩下的未填充数据,同样采用相似度阈值法和共同评分差均值来选取最相似网上商品,并利用相似网上商品来对用户—网上商品评分矩阵进行再次填充,进行网上商品的初步推荐;将用户的历史购买数据分为单维度用户特征值和多维度用户特征值,其中,所述单维度用户特征值为能够直观判断用户对推荐算法兴趣度的用户信息,所述多维度用户特征值为多维的、隐形的、不能够直观判断用户对推荐算法兴趣度的用户信息;采用贝叶斯平均算法对所述单维度用户特征值进行计算,获得所述单维度用户的推荐算法兴趣度,其中,采用并行计算方法计算所述单维度用户的推荐算法兴趣度;以及,采用朴素贝叶斯模型对所述多维度用户特征值进行计算,建立多维度用户兴趣模型,并对所述多维度用户兴趣模型进行训练,获得所述多维度用户的推荐算法兴趣度,其中,采用并行计算方法计算所述多维度用户的推荐算法兴趣度;根据所述单维度用户的推荐算法兴趣度和所述多维度用户的推荐算法兴趣度,确定推荐列表,并将所述推荐列表推荐给所述数据库的用户;若和网上商品初步推荐结果有一半一样则按此推荐,若不一样则选取评分第二高的网上商品作为目标商品,重复以上步骤进行填充,直到超过一半相同则推荐商品类别给用户。
采用贝叶斯平均算法对所述单维度用户特征值进行计算的过程中,
所述贝叶斯平均算法公式为:
其中,C为一个自行设定的常数;m为数据库中项目的平均值;n为所述项目的数据数量;x为每个数据的值;
上述公式中,m为先验概率,每个x的值都是一个调整因子,随着n的增加,所述项目的值将不断趋向其正确的值。
优选的,在采用朴素贝叶斯模型对所述多维度用户特征值进行计算的过程中,所述朴素贝叶斯模型公式为:
其中,C为目标事件;X为特征值;P(C|X)为X条件下C发生的概率;
P(X|C)为C条件下X发生的概率;P(C)为C的概率;P(X)为X的概率。
优选的,所述构建目标商品的优先商品集过程如下:
按用户在用户集合中的顺序,选取一个评分最高的商品作为目标商品;利用用户—网上商品评分矩阵,通过Pearson皮尔逊相关系数公式来计算其余商品与目标商品的相似度;
其中,simu,v表示商品u和商品v的相似度,Iu,v为商品u和商品v的共同评分商家集合,Rui、Rvi分别为商品u、商品v对商家i的评分,Ru、Rv分别为商品u、商品v的平均评分;选取与目标商品相似度大于α的商品构建目标商品的优选邻居商品集p_N(u)。
优选的,所述最相似商品的选取过程如下:
计算目标商品与各优先商品的历史共同评分差均值,计算公式如下:
其中,avg(u,v)为商品u和商品v的历史共同评分差均值,为目标商品u和商品v的历史共同评分新闻播报端集合,Rui、Rvi分别为商品u、商品v对商品i的评分;选取共同评分差均值小于β的优先商品构造最终的最相似商品N(u)。
优选的,所述获取目标商品属性项对应的商品属性信息;基于商品属性信息在待推荐网上商品中筛选出目标商品进行推荐,包括:判断所述筛选结果中是否包含与所述预设商品属性项集合中的商品属性项的标识关联的关键词;若是,提取出标识与所述解析结果中的关键词匹配的商品属性项,作为所述目标属性项;获取所述待推荐新闻库中的各待推荐新闻的摘要信息,所述摘要信息包括标题和内容摘要;基于各所述待推荐新闻的摘要信息与解析结果和所述目标属性项对应的商品属性信息之间的相似度筛选出所述目标商品;推送所述目标商品。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。