CN109408707A - 一种项目推送方法及装置 - Google Patents
一种项目推送方法及装置 Download PDFInfo
- Publication number
- CN109408707A CN109408707A CN201811119145.8A CN201811119145A CN109408707A CN 109408707 A CN109408707 A CN 109408707A CN 201811119145 A CN201811119145 A CN 201811119145A CN 109408707 A CN109408707 A CN 109408707A
- Authority
- CN
- China
- Prior art keywords
- user
- interest
- scoring item
- similarity
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种项目推送方法及装置。该方法包括:根据未评分项目和多个用户的已评分项目,得到所述多个用户对所述未评分项目的兴趣分布;根据多个所述用户对所述未评分项目的兴趣分布,确定所述多个用户之间的兴趣相似度;根据所述多个用户之间的所述兴趣相似度,对所述多个用户之间进行项目推送。还公开了相应的装置。本申请基于核密度估计的项目推荐方法,通过挖掘用户在有限的评分数据上表现出来的潜在兴趣,可很好地描述用户兴趣在项目空间上的分布,进而可以更好地估计用户之间的兴趣相似度,实现用户间的精准推送。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种项目推送方法及装置。
背景技术
随着信息科技的迅速发展,互联网信息日趋庞大且保持着高速的增长,对于互联网用户来说,要解决的问题是如何高效快速地从海量的信息中挖掘对自己有价值的信息,而对于一些社交类、电子商务类的网站,则要考虑如何有效地将项目推送给用户,进一步来提高服务质量。
目前主要采用协同过滤算法实现项目推送,协同过滤算法的核心是利用近似用户或用户喜欢的项目的近似项目来过滤筛选大量辅助信息,从而为用户筛选出其可能感兴趣的项目。协同过滤算法将与特定用户兴趣相似的用户所喜欢的项目推荐给该用户,并且能够挖掘出用户的潜在兴趣,能够针对推荐结果进行合理解释。但协同过滤算法存在如下弊端:传统相似性度量方法在计算项目或用户间相似性只考虑有共同评分的数据,导致只有拥有共同评分项目的用户有相似的可能,进而不能准确地实现用户之间的项目推送。
发明内容
本申请提供了一种项目推送及装置,以准确地实现用户之间的项目推送。
第一方面,提供了一种项目推送方法,包括:根据未评分项目和多个用户的已评分项目,得到所述多个用户对所述未评分项目的兴趣分布;根据多个所述用户对所述未评分项目的兴趣分布,确定所述多个用户之间的兴趣相似度;根据所述多个用户之间的所述兴趣相似度,对所述多个用户之间进行项目推送。
在一种可能实现的方式中,所述根据未评分项目和用户的已评分项目,得到所述用户对所述未评分项目的兴趣分布,包括:根据所述已评分项目和所述未评分项目,确定所述已评分项目和所述未评分项目中重合类别的数量、所述已评分项目和所述未评分项目的类别总数量;根据所述重合类别的数量、所述类别总数量和所有类别的数量,得到所述用户的已评分项目与所述未评分项目之间的分类相似度,其中,所述所有类别的数量为所有项目的类别总数量;根据所述分类相似度,得到所述兴趣分布。
在另一种可能实现的方式中,所述根据多个所述用户的所述兴趣分布,确定所述多个用户之间的兴趣相似度,包括:根据多个所述兴趣分布,得到所述多个用户之间的相对熵;根据所述相对熵,得到所述多个用户之间的相似度。
在又一种可能实现的方式中,所述根据所述多个用户之间的所述兴趣相似度,对所述多个用户之间进行项目推送,包括:若所述多个用户中的任意两个所述用户之间的兴趣相似度大于阈值,获取推送信号;当检测到所述推送信号时,将所述两个用户之间的所有项目进行相互推送。
在又一种可能实现的方式中,所述方法还包括:对所述方法进行训练,得到一个或多个所述兴趣相似度;根据所述一个或多个相似度和所述一个或多个相似度对应的用户的项目相似度,整定所述阈值,其中,所述一个或多个相似度对应的用户的项目为已知。
第二方面,提供了一种项目推送装置,包括:第一计算单元,用于根据未评分项目和多个用户的已评分项目,得到所述多个用户对所述未评分项目的兴趣分布;第二计算单元,用于根据多个所述用户对所述未评分项目的兴趣分布,确定所述多个用户之间的兴趣相似度;推送单元,用于根据所述多个用户之间的所述兴趣相似度,对所述多个用户之间进行项目推送。
在一种可能实现的方式中,所述第一计算单元包括:确定子单元,用于根据所述已评分项目和所述未评分项目,确定所述已评分项目和所述未评分项目中重合类别的数量、所述已评分项目和所述未评分项目的类别总数量;第一计算子单元,用于根据所述重合类别的数量、所述类别总数量和所有类别的数量,得到所述用户的已评分项目与所述未评分项目之间的分类相似度,其中,所述所有类别的数量为所有项目的类别总数量;第二计算子单元,用于根据所述分类相似度,得到所述兴趣分布。
在另一种可能实现的方式中,所述第二计算单元包括:第三计算子单元,用于根据多个所述兴趣分布,得到所述多个用户之间的相对熵;第四计算子单元,用于根据所述相对熵,得到所述多个用户之间的相似度。
在又一种可能实现的方式中,所述推送单元包括:获取子单元,用于若所述多个用户中的任意两个所述用户之间的兴趣相似度大于阈值,获取推送信号;推送子单元,用于当检测到所述推送信号时,将所述两个用户之间的所有项目进行相互推送。
在又一种可能实现的方式中,所述装置还包括:训练单元,用于进行训练,得到一个或多个所述兴趣相似度;整定单元,用于根据所述一个或多个相似度和所述一个或多个相似度对应的用户的项目相似度,整定所述阈值,其中,所述一个或多个相似度对应的用户的项目为已知。
第三方面,提供了一种项目推送装置,包括:处理器、存储器,所述存储器用于存储一个或多个程序,所述处理器调用所述一个或多个程序,执行上述第一方面及其任一种可能的实现方式的方法步骤。可选的,所述装置还可以包括输入/输出接口,用于支持所述装置与其他装置之间的通信。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面及其任一种可能的实现方式的方法。
本申请基于高斯核函数和项目之间的相似度,对用户的兴趣分布进行估计,这样,能够更好地反映实际系统中的用户兴趣分布情况。再根据用户的兴趣分布计算得到相对熵,最后通过相关处理解决相对熵的非对称性带来的影响,得到用户之间的兴趣相似度。最后通过用户之间的兴趣相似度和阈值的比较,决定是否对用户进行项目推送。基于核密度估计的项目推荐方法,通过挖掘用户在有限的评分数据上表现出来的潜在兴趣,可很好地描述用户兴趣在项目空间上的分布,进而可以更好地估计用户之间的兴趣相似度,实现用户间的精准推送。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1为本申请实施例提供的一种项目推送方法的流程示意图;
图2为本申请实施例提供的另一种项目推送方法的流程示意图;
图3为本申请实施例提供的一种项目推送装置的结构示意图;
图4为本申请实施例提供的一种项目推送装置的硬件结构示意图。
具体实施方式
下面结合本申请实施例中的附图对本申请实施例进行描述。
请参阅图1,图1是本申请实施例提供的一种项目推送方法的流程示意图。
S101、根据未评分项目和多个用户的已评分项目,得到多个用户对上述未评分项目的兴趣分布。
本申请通过核密度估计构建用户兴趣模型,在此模型的基础上提出对应的相似性度量方法,能够更好地反映实际系统中的用户兴趣分布情况,再基于此兴趣分布计算得到用户之间的兴趣相似度,并根据兴趣相似度判断是否在用户之间进行项目推送。因此,在进行项目推送之前,需要计算得到每个用户的兴趣分布。
针对每个用户浏览网页的行为习惯,会对用户项目进行评分,根据未评分项目和多个用户的已评分项目,即可得到已评分项目与未评分项目之间的相似度,再基于高斯核函数和该相似度对用户的未评分项目的分布进行估计,即可得到兴趣分布函数。
S102、根据多个用户对上述未评分项目的兴趣分布,确定上述多个用户之间的兴趣相似度。
根据多个用户对上述未评分项目的兴趣分布,计算得到用户之间的相对熵。相对熵,是描述两个概率分布差异的一种方法,即在一定程度上,熵可以度量两个随机变量的距离。但相对熵是非对称的,若直接将相对熵作为用户的兴趣相似度,会影响最终的推送准确率。因此,需要对相对熵进行处理,消除非对称性,而处理后得到的结果即为用户之间的兴趣相似度。
S103、根据上述多个用户之间的兴趣相似度,对上述多个用户之间进行项目推送。
将上述得到的兴趣相似度与阈值相比较,若上述多个用户中的任意两个上述用户之间的兴趣相似度大于阈值,则将上述两个用户之间的所有项目进行相互推送。
可选的,在将本申请应用到实际场景之前,可对本申请的方法进行训练。具体的,以两个或两个以上已知评分项目和类别的用户为训练对象,通过S201~S206所述方法计算得到一个或多个兴趣相似度,再根据上述一个或多个相似度和上述一个或多个相似度对应的用户的项目相似度,整定上述阈值,即根据上述训练对象的真实兴趣相似度和训练得到的一个或多个兴趣相似度调节阈值,直至获得理想的推送效果。
本申请首先对用户的兴趣分布进行估计,再根据用户的兴趣分布计算得到相对熵,最后通过相关处理解决相对熵的非对称性带来的影响,得到用户之间的兴趣相似度。最后通过用户之间的兴趣相似度和阈值的比较,决定是否对用户进行项目推送。基于核密度估计的项目推荐方法,通过挖掘用户在有限的评分数据上表现出来的潜在兴趣,可很好地描述用户兴趣在项目空间上的分布,进而可以更好地估计用户之间的兴趣相似度,实现用户间的精准推送。
请参阅图2,图2是本申请实施例提供的另一种项目推送方法的流程示意图。
S201、根据已评分项目和未评分项目,确定已评分项目和未评分项目中重合类别的数量、上述已评分项目和上述未评分项目的类别总数量。
本申请实施例主要针对互联网出现新项目时,如何将其推荐给合适的老用户,需要理解的是,上述项目包括:商品、广告等。首先,根据老用户以往的浏览记录和购买记录,得到老用户已有的项目类别。
具体的,汽车网站可根据以下几种方法对用户喜欢的汽车类型进行统计和定义:1、基于搜索关键词进行统计:购物网站可根据用户搜索的关键词来进行统计。如:SUV、B级车、A级车在用户的搜索记录中所占的比例分别位列前三,因此,汽车网站可将SUV、B级车、A级车归为用户的已评分项目。2、基于浏览记录进行统计:汽车网站对用户在整个网站中的所有浏览记录的时间脉络都有记录,因此可根据这些记录进行统计。如:用户A浏览SUV、B级车、A级车的时长在所有浏览的汽车类型中最长,因此,汽车网站可将SUV、B级车、A级车归为用户的已评分项目。3、基于购买记录进行统计:当用户已经购买了某类汽车,自然可以证明用户对该类汽车的认可。如:用户购买了SUV、和A级车,因此,汽车网站可将SUV、和A级车归为用户的已评分项目。当汽车网站新上架了一款C级车,显然,该款汽车对于用户来说是未评分项目。以用户的已评分项目SUV为例,该SUV所属的汽车类别为两驱汽车、5座汽车、20万至30万的汽车,新上架的C级车可归属为两驱汽车、5座汽车、30万至50万的汽车,这样,牙膏和牙刷的重合类别数量就为2,即:两驱汽车、5座汽车,即为已评分项目和未评分项目中重合类别的数量。上述已评分项目和上述未评分项目的类别总数量为4,即:两驱汽车、5座汽车、20万至30万的汽车和30万至50万的汽车。
其中,上述评分指的是用户对已评分项目的评分,通过用户的反馈得到。反馈是通过用户浏览网页时的行为和动作,管理页面的前端工程师会把这些行为和动作保存下来,经过处理作为已知信息。如:大部分用户浏览网页的基本都是按照需求或兴趣去看东西,看的时间越长,表明越感兴趣,因此,用户浏览某一板块或某一信息的次数多且时间长,说明用户对这一块感兴趣,评分自然就会变高。
S202、根据上述重合类别的数量、上述类别总数量和所有类别的数量,得到上述用户的已评分项目与上述未评分项目之间的分类相似度。
通过高斯核函数可计算得到用户兴趣的核密度,再基于用户兴趣的核密度估计构建用户兴趣模型,在此模型的基础上提出对应的相似性度量方法,能够更好地反映实际系统中的用户兴趣分布情况,再基于此兴趣分布在用户间进行项目推送。上述用户兴趣模型是根据项目之间的分类相似度得到的。因此,在进行后续处理之前,需先计算出用户的已评分项目与未评分项目之间的分类相似度,具体可参见下式:
其中,i为用户的已评分项目,j为未评分项目,c为所有类别的数量,ci为项目i所属类别的数量,cj为项目j所属类别的数量。
显然,对用户而言,可将汽车网站上的所有汽车广告划分为已评分项目和未评分项目,因此上述已评分项目和上述未评分项目的类别总数量即为所有汽车广告类别的总数,再由S201可知:重合类别的数量和类别总数量,最后代入公式(1)即可得到用户的已评分项目与未评分项目之间的分类相似度simc(i,j)。
需要理解的是,已评分项目i和未评分项目j均为大于等于1的正整数,这样,最后得到的分类相似度simc(i,j)也可能有多个。
S203、根据上述分类相似度,得到兴趣分布。
在获取对某一事物的概率分布的情况下,如果某一个数在观察中出现了,我们可以认为这个数的概率密度比较大,和这个数比较近的数的概率密度也会比较大,而那些离这个数远的数的概率密度会比较小。基于这种想法,针对观察中的每一个数,我们都可以去拟合我们想象中的那个远小近大概率密度。当然其实也可以用其他对称的函数。针对每一个观察中出现的数拟合出多个概率密度分布函数之后,再取平均即可得到核密度估计分布。
本申请采用高斯核函数估计用户的兴趣分布,高斯核函数的具体表达式可参见下式:
其中,h∈[0,+∞)为核函数的窗宽。
若两个项目的相似性越大,在项目空间上的距离会越小,因此定义已评分项目i和未评分项目j之间的距离度量为:
di,j=1-simc(i,j)…公式(3)
其中,simc(i,j)为已评分项目i与未评分项目j之间的分类相似度。
再根据公式(2)的高斯核函数估计得到用户的兴趣分布Pu:
其中,Iu为用户已评分项目的数量,ru,i为网站对项目i的评分,di,j为已评分项目i和未评分项目j之间的距离度量,h∈[0,+∞)为核函数的窗宽。
S204、根据多个上述兴趣分布,得到上述多个用户之间的相对熵。
相对熵,是描述两个概率分布差异的一种方法,即在一定程度上,熵可以度量两个随机变量的距离。
令用户A的兴趣分布为Pu,用户B的兴趣分布为Pv,则用户A与用户B之间的相对熵可由下式求得:
其中,K为用户A已评分项目的数量,Pu(i)为用户A的兴趣分布,Pv(i)为用户B的兴趣分布。
S205、根据上述相对熵,得到上述多个用户之间的相似度。
由于相对熵具有不对称性,如若直接用其作为用户A和用户B的兴趣分布进行计算,得到的相似度会有较大的误差。因此,可对公式(5)得到的相对熵进行如下处理:
即为用户A与用户B之间的兴趣相似度。
S206、根据多个用户之间的兴趣相似度,对多个用户之间进行项目推送。
将上述得到的兴趣相似度与阈值相比较,若上述多个用户中的任意两个上述用户之间的兴趣相似度大于阈值,获取推送信号,当检测到上述推送信号时,将上述两个用户之间的所有项目进行相互推送。即当任意两个用户之间的兴趣相似度满足要求时,说明两个用户的兴趣相似,就可将其中一个用户喜欢的项目全推送给另一个。需要理解的是,这里所提到的两个用户中的其中一个用户的喜好是已知的,即该用户的已评分项目及类别均是已知的。
可选的,在将本申请应用到实际场景之前,可对本申请的方法进行训练。具体的,以两个或两个以上已知评分项目和类别的用户为训练对象,通过S201~S206所述方法计算得到一个或多个兴趣相似度,再根据上述一个或多个相似度和上述一个或多个相似度对应的用户的项目相似度,整定上述阈值,即根据上述训练对象的真实兴趣相似度和训练得到的一个或多个兴趣相似度调节阈值,直至获得理想的推送效果。
本申请基于高斯核函数和项目之间的相似度,对用户的兴趣分布进行估计,这样,能够更好地反映实际系统中的用户兴趣分布情况。再根据用户的兴趣分布计算得到相对熵,最后通过相关处理解决相对熵的非对称性带来的影响,得到用户之间的兴趣相似度。最后通过用户之间的兴趣相似度和阈值的比较,决定是否对用户进行项目推送。基于核密度估计的项目推荐方法,通过挖掘用户在有限的评分数据上表现出来的潜在兴趣,可很好地描述用户兴趣在项目空间上的分布,进而可以更好地估计用户之间的兴趣相似度,实现用户间的精准推送。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
请参阅图3,图3为本申请实施例提供的一种项目推送装置的结构示意图,该装置1000包括:第一计算单元11、第二计算单元12、推送单元13、训练单元14及整定单元15。其中:
第一计算单元11,用于根据未评分项目和多个用户的已评分项目,得到所述多个用户对所述未评分项目的兴趣分布;
第二计算单元12,用于根据多个所述用户对所述未评分项目的兴趣分布,确定所述多个用户之间的兴趣相似度;
推送单元13,用于根据所述多个用户之间的所述兴趣相似度,对所述多个用户之间进行项目推送;
训练单元14,用于进行训练,得到一个或多个所述兴趣相似度;
整定单元15,用于根据所述一个或多个相似度和所述一个或多个相似度对应的用户的项目相似度,整定所述阈值,其中,所述一个或多个相似度对应的用户的项目为已知。
进一步地,所述第一计算单元11包括:确定子单元111,用于根据所述已评分项目和所述未评分项目,确定所述已评分项目和所述未评分项目中重合类别的数量、所述已评分项目和所述未评分项目的类别总数量;第一计算子单元112,用于根据所述重合类别的数量、所述类别总数量和所有类别的数量,得到所述用户的已评分项目与所述未评分项目之间的分类相似度,其中,所述所有类别的数量为所有项目的类别总数量;第二计算子单元113,用于根据所述分类相似度,得到所述兴趣分布。
进一步地,所述第二计算单元12包括:第三计算子单元121,用于根据多个所述兴趣分布,得到所述多个用户之间的相对熵;第四计算子单元122,用于根据所述相对熵,得到所述多个用户之间的相似度。
进一步地,所述推送单元13包括:获取子单元131,用于若所述多个用户中的任意两个所述用户之间的兴趣相似度大于阈值,获取推送信号;推送子单元132,用于当检测到所述推送信号时,将所述两个用户之间的所有项目进行相互推送。
根据本申请实施例提供的一种项目推送装置,基于高斯核函数和项目之间的相似度,对用户的兴趣分布进行估计,这样,能够更好地反映实际系统中的用户兴趣分布情况。再根据用户的兴趣分布计算得到相对熵,最后通过相关处理解决相对熵的非对称性带来的影响,得到用户之间的兴趣相似度。最后通过用户之间的兴趣相似度和阈值的比较,决定是否对用户进行项目推送。基于核密度估计的项目推荐方法,通过挖掘用户在有限的评分数据上表现出来的潜在兴趣,可很好地描述用户兴趣在项目空间上的分布,进而可以更好地估计用户之间的兴趣相似度,实现用户间的精准推送。
图4为本申请实施例提供的一种项目推送装置的硬件结构示意图。该推送装置2000包括处理器21,还可以包括输入装置22、输出装置23和存储器24。该输入装置22、输出装置23、存储器24和处理器21之间通过总线相互连接。
存储器包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmable readonly memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器用于相关指令及数据。
输入装置用于输入数据和/或信号,以及输出装置用于输出数据和/或信号。输出装置和输入装置可以是独立的器件,也可以是一个整体的器件。
处理器可以包括是一个或多个处理器,例如包括一个或多个中央处理器(centralprocessing unit,CPU),在处理器是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
存储器用于存储网络设备的程序代码和数据。
处理器用于调用该存储器中的程序代码和数据,执行如下步骤:
根据未评分项目和多个用户的已评分项目,得到所述多个用户对所述未评分项目的兴趣分布;根据多个所述用户对所述未评分项目的兴趣分布,确定所述多个用户之间的兴趣相似度;根据所述多个用户之间的所述兴趣相似度,对所述多个用户之间进行项目推送。
在一个实现方式中,所述处理器用于执行所述根据未评分项目和多个用户的已评分项目,得到所述多个用户对所述未评分项目的兴趣分布的步骤,包括:根据所述已评分项目和所述未评分项目,确定所述已评分项目和所述未评分项目中重合类别的数量、所述已评分项目和所述未评分项目的类别总数量;根据所述重合类别的数量、所述类别总数量和所有类别的数量,得到所述用户的已评分项目与所述未评分项目之间的分类相似度,其中,所述所有类别的数量为所有项目的类别总数量;根据所述分类相似度,得到所述兴趣分布。
在另一个实现方式中,所述处理器用于执行根据多个所述用户的所述兴趣分布,确定所述多个用户之间的兴趣相似度的步骤,包括:根据多个所述兴趣分布,得到所述多个用户之间的相对熵;根据所述相对熵,得到所述多个用户之间的相似度。
在又一个实现方式中,所述处理器用于执行所述根据所述多个用户之间的所述兴趣相似度,对所述多个用户之间进行项目推送的步骤,包括:若所述多个用户中的任意两个所述用户之间的兴趣相似度大于阈值,获取推送信号;当检测到所述推送信号时,将所述两个用户之间的所有项目进行相互推送。
在又一个实现方式中,所述处理器还用于执行如下步骤:对所述方法进行训练,得到一个或多个所述兴趣相似度;根据所述一个或多个相似度和所述一个或多个相似度对应的用户的项目相似度,整定所述阈值,其中,所述一个或多个相似度对应的用户的项目为已知。
可以理解的是,图4仅仅示出了一种项目推送装置的简化设计。在实际应用中,项目推送装置还可以分别包含必要的其他元件,包含但不限于任意数量的输入/输出装置、处理器、控制器、存储器等,而所有可以实现本申请实施例的项目推送装置都在本申请的保护范围之内。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。所显示或讨论的相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者通过该计算机可读存储介质进行传输。该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是只读存储器(read-onlymemory,ROM),或随机存储存储器(random access memory,RAM),或磁性介质,例如,软盘、硬盘、磁带、磁碟、或光介质,例如,数字通用光盘(digital versatile disc,DVD)、或者半导体介质,例如,固态硬盘(solid state disk,SSD)等。
Claims (10)
1.一种项目推送方法,其特征在于,包括:
根据未评分项目和多个用户的已评分项目,得到所述多个用户对所述未评分项目的兴趣分布;
根据多个所述用户对所述未评分项目的兴趣分布,确定所述多个用户之间的兴趣相似度;
根据所述多个用户之间的所述兴趣相似度,对所述多个用户之间进行项目推送。
2.如权利要求1所述的方法,其特征在于,所述根据未评分项目和用户的已评分项目,得到所述用户对所述未评分项目的兴趣分布,包括:
根据所述已评分项目和所述未评分项目,确定所述已评分项目和所述未评分项目中重合类别的数量、所述已评分项目和所述未评分项目的类别总数量;
根据所述重合类别的数量、所述类别总数量和所有类别的数量,得到所述用户的已评分项目与所述未评分项目之间的分类相似度,其中,所述所有类别的数量为所有项目的类别总数量;
根据所述分类相似度,得到所述兴趣分布。
3.如权利要求1所述的方法,其特征在于,所述根据多个所述用户的所述兴趣分布,确定所述多个用户之间的兴趣相似度,包括:
根据多个所述兴趣分布,得到所述多个用户之间的相对熵;
根据所述相对熵,得到所述多个用户之间的相似度。
4.如权利要求1所述的方法,其特征在于,所述根据所述多个用户之间的所述兴趣相似度,对所述多个用户之间进行项目推送,包括:
若所述多个用户中的任意两个所述用户之间的兴趣相似度大于阈值,获取推送信号;
当检测到所述推送信号时,将所述两个用户之间的所有项目进行相互推送。
5.如权利要求1~4任一项所述的方法,其特征在于,还包括:
对所述方法进行训练,得到一个或多个所述兴趣相似度;
根据所述一个或多个相似度和所述一个或多个相似度对应的用户的项目相似度,整定所述阈值,其中,所述一个或多个相似度对应的用户的项目为已知。
6.一种项目推送装置,其特征在于,包括:
第一计算单元,用于根据未评分项目和多个用户的已评分项目,得到所述多个用户对所述未评分项目的兴趣分布;
第二计算单元,用于根据多个所述用户对所述未评分项目的兴趣分布,确定所述多个用户之间的兴趣相似度;
推送单元,用于根据所述多个用户之间的所述兴趣相似度,对所述多个用户之间进行项目推送。
7.如权利要求6所述的装置,其特征在于,所述第一计算单元包括:
确定子单元,用于根据所述已评分项目和所述未评分项目,确定所述已评分项目和所述未评分项目中重合类别的数量、所述已评分项目和所述未评分项目的类别总数量;
第一计算子单元,用于根据所述重合类别的数量、所述类别总数量和所有类别的数量,得到所述用户的已评分项目与所述未评分项目之间的分类相似度,其中,所述所有类别的数量为所有项目的类别总数量;
第二计算子单元,用于根据所述分类相似度,得到所述兴趣分布。
8.如权利要求6所述的装置,其特征在于,所述第二计算单元包括:
第三计算子单元,用于根据多个所述兴趣分布,得到所述多个用户之间的相对熵;
第四计算子单元,用于根据所述相对熵,得到所述多个用户之间的相似度。
9.如权利要求6所述的装置,其特征在于,所述推送单元包括:
获取子单元,用于若所述多个用户中的任意两个所述用户之间的兴趣相似度大于阈值,获取推送信号;
推送子单元,用于当检测到所述推送信号时,将所述两个用户之间的所有项目进行相互推送。
10.一种项目推送装置,其特征在于,包括:处理器、存储器,所述存储器用于存储一个或多个程序,所述处理器调用所述一个或多个程序,执行如权利要求1~5任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811119145.8A CN109408707A (zh) | 2018-09-25 | 2018-09-25 | 一种项目推送方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811119145.8A CN109408707A (zh) | 2018-09-25 | 2018-09-25 | 一种项目推送方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109408707A true CN109408707A (zh) | 2019-03-01 |
Family
ID=65466058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811119145.8A Pending CN109408707A (zh) | 2018-09-25 | 2018-09-25 | 一种项目推送方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109408707A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103970873A (zh) * | 2014-05-14 | 2014-08-06 | 中国联合网络通信集团有限公司 | 一种音乐推荐方法和系统 |
US9465889B2 (en) * | 2012-07-05 | 2016-10-11 | Physion Consulting, LLC | Method and system for identifying data and users of interest from patterns of user interaction with existing data |
CN106202519A (zh) * | 2016-07-22 | 2016-12-07 | 桂林电子科技大学 | 一种结合用户评论内容和评分的项目推荐方法 |
-
2018
- 2018-09-25 CN CN201811119145.8A patent/CN109408707A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9465889B2 (en) * | 2012-07-05 | 2016-10-11 | Physion Consulting, LLC | Method and system for identifying data and users of interest from patterns of user interaction with existing data |
CN103970873A (zh) * | 2014-05-14 | 2014-08-06 | 中国联合网络通信集团有限公司 | 一种音乐推荐方法和系统 |
CN106202519A (zh) * | 2016-07-22 | 2016-12-07 | 桂林电子科技大学 | 一种结合用户评论内容和评分的项目推荐方法 |
Non-Patent Citations (2)
Title |
---|
刘振娇: "基于上下文属性信息的个性化推荐系统研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
毕孝儒: "面向用户兴趣密度分布的协同过滤推荐算法", 《计算机系统应用》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105224699B (zh) | 一种新闻推荐方法及装置 | |
US8332775B2 (en) | Adaptive user feedback window | |
WO2020083020A1 (zh) | 确定用户对物品的兴趣度的方法与装置、设备和存储介质 | |
US9959563B1 (en) | Recommendation generation for infrequently accessed items | |
US7885952B2 (en) | Cloaking detection utilizing popularity and market value | |
US7921069B2 (en) | Granular data for behavioral targeting using predictive models | |
US8473369B2 (en) | Behavioral filter for personalized recommendations | |
TWI512653B (zh) | Information providing method and apparatus, method and apparatus for determining the degree of comprehensive relevance | |
US20160364490A1 (en) | Method, system and computer readable medium for creating a profile of a user based on user behavior | |
WO2017121251A1 (zh) | 一种信息推送方法及装置 | |
CN102609533B (zh) | 一种基于核方法的协同过滤推荐系统及方法 | |
US9760907B2 (en) | Granular data for behavioral targeting | |
CN107516235B (zh) | 商品偏好预估方法和装置 | |
US9256692B2 (en) | Clickstreams and website classification | |
CN101266620B (zh) | 向用户提供目标信息的方法及设备 | |
CA2899489A1 (en) | Dynamic prediction of online shopper's intent using a combination of prediction models | |
CN104679771A (zh) | 一种个性化数据搜索方法和装置 | |
CN110335123B (zh) | 基于社交电商平台的商品推荐方法、系统、计算机可读介质以及装置 | |
EP2188712A2 (en) | Recommendation systems and methods | |
CN104317835A (zh) | 视频终端的新用户推荐方法 | |
US8825641B2 (en) | Measuring duplication in search results | |
CN109241403A (zh) | 项目推荐方法、装置、机器设备和计算机可读存储介质 | |
US20140147048A1 (en) | Document quality measurement | |
CN103383702A (zh) | 一种基于用户投票排名的个性化新闻推荐的方法及系统 | |
CN113268656A (zh) | 一种用户推荐方法、装置、电子设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190301 |