CN103700007B - 基于物品的推荐方法及系统 - Google Patents
基于物品的推荐方法及系统 Download PDFInfo
- Publication number
- CN103700007B CN103700007B CN201310703736.0A CN201310703736A CN103700007B CN 103700007 B CN103700007 B CN 103700007B CN 201310703736 A CN201310703736 A CN 201310703736A CN 103700007 B CN103700007 B CN 103700007B
- Authority
- CN
- China
- Prior art keywords
- article
- evaluated
- mrow
- user
- predicted value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于物品的推荐方法及系统,其中的方法包括:通过用户历史评价获得已评价物品的物品对;根据所有用户对物品对的评价值,得到物品对的相关系数并进行缓存;根据所缓存的物品对的相关系数,获得所有用户已评价物品的相关物品集合;并将所有用户已评价物品进行数据块的切分,并对所切分的数据块进行并行化处理;通过对所有用户已评价物品的评价值进行线性预测得出未评价物品集合中的物品的预测值,并对所有预测值进行合并,得到未评价物品集合中的物品的最终预测值;根据最终预测值将未评价物品推荐给用户。通过本发明能够解决基于物品推荐算法的准确性问题,提高计算效率。
Description
技术领域
本发明涉及基于物品的推荐技术领域,更为具体地,涉及一种基于物品的推荐方法及系统。
背景技术
随着电子商务规模的不断扩大、商品个数和种类的快速增长,顾客往往需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关信息和产品的过程无疑会使淹没在信息过载问题中的消费者不断流失。
个性化推荐是根据用户的兴趣特点和购买行为向用户推荐用户感兴趣的信息和商品的推荐方法,这种推荐方法可以通过分析用户的习惯、历史记录等数据,较为准确地向用户提供感兴趣的信息,如视频、书籍、音乐、商品、新闻等,在很大程度上解决了“信息过载”和“信息迷失”带来的各种问题。在推荐资源的精确度足够高的情况下,个性化推荐还是提高用户粘性的一个非常好的途径。
在个性化推荐技术领域,上述推荐的信息可概括为物品,目前基于物品的个性化推荐算法主要有以下两种:
(1)协同过滤算法:通过用户对物品的历史评价计算物品间的相似度a,然后利用相似度a来预测用户对未评价物品的评分。从数学模型的角度来看,该算法可理解为令线性回归模型y=ax+b中的b=0的情况。协同过滤算法实际上仅考虑了物品间的相似度对推荐结果的影响。
(2)Slopeone算法:通过用户对物品的历史评价计算物品间的差值b,然后利用差值b来预测用户对未评价物品的评分。从数学模型的角度来看,该算法可理解为令线性回归模型y=ax+b中的a=1的情况。Slopeone算法实际上仅考虑了物品间的差对推荐结果的影响。
图1为传统的基于物品的推荐方法流程图。
如图1所示,协同过滤算法和Slopeone算法的推荐过程包括:步骤S110物品推荐开始、步骤S120用户历史评价、步骤S130计算物品的相似度或平均值、步骤S140计算为评价物品预测值、步骤S150按预测值对未评价物品降序排列、步骤S160给用户推荐排名前N的物品、步骤S170物品推荐结束。可知传统的物品推荐方法中都采用了线性回归的“简化版本”,即只考虑相似度或只考虑平均差。因为在海量用户和物品的情况下,y=ax+b模型的计算复杂度非常高,很难满足实时推荐的要求,因此,不得不牺牲一定的模型准确性来提高运算效率。
在海量用户物品情况下,使用y=ax+b模型进行推荐存在以下三个问题:
问题一:图1传统的基于物品的推荐方法流程图中所示步骤S130中对y=ax+b模型进行拟合的计算复杂度很高。
因为,传统的y=ax+b模型的计算过程为:
对于用户—物品矩阵:
其中任意一组itemj的值,用其他n-1组值来预测它有:
其中,公式1.2可简写为:
Y=XA+B (公式1.3),其中X为m*(n-1)维矩阵
在计算相关系数矩阵A时有:
A=X-1(Y-B) (公式1.4)
此时,当用户—物品矩阵规模达到数百万计时,由于大矩阵求逆本身存在的问题,求解公式1.4基本上是很难实现的。
问题二:热点物品负载不平衡。
传统上为了解决问题一,常规的做法是采用分布式并行计算的方式进行矩阵求解。但在实际的应用场景中,由于热点物品处理复杂度高,会给并行计算带来负载不均衡的问题。传统的并行计算大都实现了基于数据量的负载平衡,将待处理的数据平均分成n个数据块交由不同的线程进行处理,然而由于各个数据块中包含的热点物品数不同,会导致线程的计算负载并不相同,而出现负载不平衡的问题。
问题三:图1传统的基于物品的推荐方法流程图中所示步骤S140中,未评价物品数量过大,计算效率低。
大部分应用场景中物品评价分布中未评价物品的数量较多,均具有长尾的特点。常规方法是依次遍历用户未评价的物品,计算得到每个物品的预测值,这样就会导致计算循环次数高,计算效率低。
在如今信息爆炸的时代,算法的效率和准确性都很重要,因此在保证高效的前提下,如何更为准确的将y=ax+b模型应用于基于物品的推荐领域中,是一个很重要的现实问题。
发明内容
鉴于上述问题,本发明的目的是提供一种基于物品的推荐方法及系统,以解决目前基于物品的推荐方法中存在的计算复杂度高、热点物品负载不平衡以及计算效率低等问题。
根据本发明的一个方面,提供一种基于物品的推荐方法,包括:
获取一个用户的已评价物品,生成所述用户的已评价物品集合,然后从用户的已评价物品集合中取出任意两件物品组成物品对;
根据所有用户对物品对的评价值,分别对物品对中的物品进行线性拟合,以得到所有用户已评价物品中物品对的相关系数并进行缓存;然后根据所缓存的物品对的相关系数,获得所有用户已评价物品的相关物品集合;
根据所有用户已评价物品的相关物品集合中物品的个数,确定所有用户已评价物品的热门程度,然后根据热门程度将所有用户已评价物品进行数据块切分,并对所切分的数据块进行并行化处理,以得到所有用户已评价物品的相关物品集合中的物品的预测值;
根据用户每个已评价物品的相关物品集合生成用户的可预测物品集合,根据可预测物品集合和用户的已评价物品集合生成用户的未评价物品集合;
通过对任一用户预测出的未评价物品集合中的物品的所有预测值进行合并,得到该用户未评价物品集合中的物品的最终预测值;
根据最终预测值将所述未评价物品集合中的物品推荐给用户。
其中,未评价物品预测值的计算公式为:
其中Vmk为未评价物品预测值,Vtk为能够预测出未评价物品的物品预测值的评价值,c为能够预测出未评价物品预测值的物品的个数,atk、btk为物品对的相关系数。
其中,用户已评价物品的相关物品集合中物品的个数与用户已评价物品的热门程度成正比。
其中,在根据热门程度将所有用户已评价物品进行数据块切分的过程中,所切分的各数据块的热门程度的总和一致。
其中,在对所切分的数据块进行并行化处理,以得到所有用户已评价物品的相关物品集合中的物品的预测值的过程中,根据物品对的相关系数及用户对已评价物品的评价值进行线性预测得到所有用户已评价物品的相关物品集合中的物品的预测值。
另一方面,本发明还提供一种基于物品的推荐系统,包括:
物品对获取单元,用于根据一个用户已评价的物品,得到所述用户的已评价物品集合,然后从用户的已评价物品集合中取出任意两件物品以获取物品对;
所有用户已评价物品的相关物品集合获取单元,用于根据对物品对中的物品进行单独拟合,得到物品对的相关系数并进行缓存,根据缓存的物品对的相关系数获取所有用户已评价物品的相关物品集合;
预测值获取单元,用于根据将所有用户已评价物品进行数据块的切分,并对数据块并行化处理,获得所有用户已评价物品的相关物品集合中的物品的预测值;
未评价物品集合获取单元,用于根据用户每个已评价物品的相关物品集合生成用户的可预测物品集合,根据可预测物品集合和用户的已评价物品集合获得用户的未评价物品集合;
最终预测值获取单元,用于对预测出的未评价物品集合中的物品的所有预测值进行合并获取未评价物品集合中的物品的最终预测值;
物品推荐单元,用于根据未评价物品集合中的未评价物品的最终预测值将物品推荐给用户。
其中,在未评价物品的预测值获取单元中,对数据源块进行并行化处理的过程中,根据物品对的相关系数及已评价物品的评价值进行线性预测得到所有用户已评价物品的相关物品集合中的物品的预测值。
利用上述根据本发明的基于物品的推荐方法及系统,能够解决现有基于物品的推荐方法中存在的计算复杂度高、热点物品负载不平衡以及计算效率低等问题,并具有以下优点:
(1)提高了推荐算法的准确性;
(2)降低了模型拟合的复杂度;
(3)解决了热点物品的负载不平衡问题;
(4)解决了长尾特点的物品评价分布带来的计算效率低的问题。
为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。
附图说明
通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1为传统的基于物品的推荐方法流程图;
图2为根据本发明实施例的基于物品的推荐方法流程示意图;
图3为根据本发明实施例的基于物品的推荐方法详细流程示意图;
图4为根据本发明实施例的切分后的数据块结构示意图:
图5为根据本发明实施例的计算未评价物品预测值的过程示意图;
图6为根据本发明实施例的基于物品的推荐系统方框示意图。
在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
以下将结合附图对本发明的具体实施例进行详细描述。
图2示出了根据本发明实施例的基于物品的推荐方法流程。
如图2所示,本发明提供的基于物品的推荐方法,包括:
S210:获取一个用户的已评价物品,生成用户的已评价物品集合,然后从用户的已评价物品集合中取出任意两件物品组成物品对;
具体地,在所有用户的已评价物品中,任意选取其中一个用户的已评价物品,根据该用户的所有已评价物品生成该用户的已评价物品集合。
S220:根据所有用户对上一步骤获得的物品对的评价值,分别对物品对中的物品进行线性拟合,以得到所有用户已评价物品中物品对的相关系数并进行缓存;然后根据所缓存的物品对的相关系数,获得所有用户已评价物品的相关物品集合;其中,针对所有用户已评价物品中的每一个物品都有一个与其相对应的相关物品集合,通过对物品对的相关系数进行缓存,可以快速的找到与所有用户已评价物品相关的物品集合,能够提高后续算法的执行效率,解决传统的基于物品推荐方法中的将多个物品共同拟合导致的计算效率低下的问题。
S230:根据所有用户已评价物品的相关物品集合中物品的个数,确定所有用户已评价物品的热门程度,然后根据热门程度将所有用户已评价物品进行数据块切分,并对所切分的数据块进行并行化处理,以得到所有用户已评价物品的相关物品集合中的物品的预测值;
S240:根据用户每个已评价物品的相关物品集合生成用户的可预测物品集合,根据可预测物品集合和用户的已评价物品集合生成每个用户的未评价物品集合;
具体地,针对每个用户通过将上一步骤中得到的物品的相关物品集合中该用户已评价的物品过滤掉,即可得到未评价物品集合,即数据块中的任意物品能够推荐出的未评价物品集合。
S250:对预测出的所有未评价物品集合中的物品的预测值进行合并,得到未评价物品集合中的物品的最终预测值;
具体地,通过向线性方程y=ax+b中代入物品对的相关系数和用户已评价物品的评价值计算得到该用户未评价物品的预测值,并对未评价物品集合中的物品的所有预测值进行合并,即将所有能够预测出该集合中的物品预测值的物品给出的预测值进行求平均,得到最终的未评价物品集合中的物品的最终预测值。
S260:根据最终预测值将未评价物品推荐给用户;对于每一个用户通过根据未评价物品集合中物品的预测值对未评价物品进行降序排列,将排名前N的未评价物品推荐给该用户。
其中,在步骤S230中所有用户已评价物品的相关物品集合中物品的大小与所有用户已评价物品的热门程度成正比,并且按照热门程度将所有用户已评价物品进行数据块切分之后,各数据块的热门程度总和是基本一致的,这样将各个数据块交由下一步的不同的线程进行处理时,计算量也是一致的。
此外,在步骤S230中对切分的各数据块进行并行处理时,通过物品对的相关系数对所有用户已评价物品的评价值进行线性预测得到所有用户已评价物品的相关物品集合中的物品的预测值。
具体地,图3示出了根据本发明实施例的基于物品的推荐方法详细流程。
如图3所示,基于物品的推荐方法的详细流程包括:
301:开始进行物品的推荐;
302:查询历史评价文件;具体指查找用户对已评价物品的评价值记录;
303:用户已评价物品集合;具体指通过查找任意用户的已评价物品的评价记录,得到这一用户的已评价物品集合;
304:生成物品对;根据从得到的用户的已评价物品集合中任意选取两个物品,生成一个物品对;
305:拟合每对物品得到相关系数;具体指根据所有用户对该物品对的评价值对这两个物品进行单独拟合,得到物品对的相关系数;
306:对物品对的相关系数进行缓存;
307:实现热点物品的计算负载平衡;具体是指通过物品对的相关系数缓存得到所有用户已评价物品的相关物品集合,并以此为依据将所有用户已评价物品切分为多个数据块;
308:计算每个物品可以预测出的物品集合;将多个数据块进行并行处理,并根据步骤306的物品对的相关系数缓存及所有用户已评价物品的评价值进行线性预测得到所有用户已评价物品的相关物品集合中的物品的预测值;
309:获得未评价物品;将任一用户每个已评价物品的相关物品集合中的所有用户已评价物品过滤掉,即可得到该用户的未评价物品集合;
310:合并未评价物品的预测结果得到预测值;具体指通过对任一用户预测出的未评价物品集合中的同一个未评价物品的所有预测值进行合并,得到用户未评价物品集合中的未评价物品的最终预测值;
311:排序并向用户推荐排名TopN的物品;
312:物品推荐结束。
作为示例,本发明的基于物品的推荐方法具体地描述为:
1、根据历史评价文件,计算得到任意一个用户已评价的物品集合。通过对任意一个用户userm,找到该用户userm已经评价过的物品,得到已评价物品集合{item已评价};其中,user代表用户,item代表物品。
2、通过上步中得到一个用户的已评价物品集合{item已评价}中的任意两个物品itemi和itemj,得到一个物品对<itemi,itemj>以及用户userm对该物品对<itemi,itemj>的评价<Vmi,Vmj>;
3、根据所有对物品对<itemi,itemj>进行评价的用户的评价值将itemi和itemj这两个物品进行单独拟合。具体地,假设一组用户对物品对<itemi,itemj>的评价值为<V1i,V1j>,<V2i,V2j>……<Vmi,Vmj>,其中,V代表用户评价值。通过对线性模型y=ax+b进行拆解,将物品对里的两个物品进行单独的拟合,那么有:
拟合之后可以得到任意物品对<itemi,itemj>的相关系数aij,bij,
拟合中用到的aij的计算公式如下:
计算出aij之后,bij的值为:
4、将上一步得到的任意物品对<itemi,itemj>的相关系数aij,bij,缓存为如下形式:
Key=itemiitemj aij bij
itemk aik bik
……
Key=itemj itemi aji bji
……
这样可以通过任意物品itemi方便快速的找到与其相关的相关物品集合{itemi相关}及其与集合中每个物品组成的物品对的相关系数aij,bij,提高后续算法的执行效率。
5、在上述步骤执行结束之后,计算未评价物品的预测值之前,为了实现热点物品的计算负载均衡,首先根据步骤4的物品对的相关系数预估计所有用户已经的评价物品{item已评价}的计算量的大小,这里的计算量和物品的热门程度成正比,然后根据热门程度将所有用户已评价的物品进行数据块切分。图4示出了根据本发明实施例的切分后的数据块结构。
如图4所示,degree代表每个物品的热门程度,{item已评价}中的任一物品itemi的热门程度degreei的值等于itemi的相关物品集合{itemi相关}的大小。其中,所有用户已评价物品的相关物品集合可以根据步骤4缓存的任一物品对的相关系数得到。对于所有数据块有:
SUM数据块1(degree)≈SUM数据块2(degree)≈SUM数据块3(degree)
由于每个数据块的热门程度的总和基本一致,那么将这三个数据块交由下一步的不同的线程进行处理时,计算量也是一致的,这样就能达到了基于计算的负载平衡,提高推荐算法的效率。
6、并行化处理上一步输出的数据块,数据块中的每一个物品itemi均属于集合S(已评价)。对于数据块中每个物品itemi,根据第4步的相关数据缓存找到物品itemi的相关物品集合S(itemi相关),根据每个用户对itemi的评价值及itemi与S(itemi相关)集合中任一物品组成的物品对的相关系数就能够得到该用户对S(itemi相关)集合中的每个物品的预测值,也就是通过物品itemi能够给该用户预测出的物品集合中的物品的预测值。
7、判断预测物品是否为用户未评价的物品,对于每个用户将S(item相关)中用户已经评价过的物品过滤掉,令集合Si’=S(item相关)-(S(item相关)∩S(已评价)),则Si’即代表了所有通过物品itemi能够给该用户推荐出来的未评价物品的集合。
8、将未评价物品的预测值结果合并,得到其最终的预测值。假设用户userm的一个未评价物品itemk通过6、7两步所述的方法可由三个已评价的物品item给出预测结果,则itemk的最终预测值是由这三个结果取平均值得到的,其中,itemk的预测值的计算公式为:
其中,Vmt代表能够预测出未评价物品的物品的评价值,c代表能够预测出未评价物品的物品的个数,atk、btk为物品对的相关系数。
图5示出了根据本发明实施例的计算未评价物品预测值的过程。
如图5所示,本发明基于物品的推荐方法通过步骤6-8所述的方法遍历用户已经评价的物品集合来计算未评价物品的预测值,能够避免由于评价分布具有长尾的特点而导致的计算复杂性高的问题的发生。
9、按照预测值将物品降序排列,给用户推荐排名前N的物品。对于每一个用户根据预测值对物品进行降序排列,取排名为topN的物品推荐给此用户。
与上述方法相对应,本发明还提供了一种基于物品的推荐系统,图6示出了根据本发明实施例的基于物品的推荐系统逻辑结构。
如图6所示,本发明提供的基于物品的推荐系统600包括物品对获取单元610、所有用户已评价物品的相关物品集合获取单元620、预测值获取单元630、未评价物品集合获取单元640、最终预测值获取单元650和物品推荐单元660。
其中,物品对获取单元610用于根据获取任一用户已评价的物品,得到用户已评价物品集合,然后从用户已评价物品集合中取出任意两件物品获取物品对;所有用户已评价物品的相关物品集合获取单元620,用于根据对物品对中的物品进行单独拟合,得到物品对的相关系数并进行缓存,根据缓存的物品对的相关系数获取所有用户已评价物品的相关物品集合,其中,通过对物品对的相关系数进行缓存,可以快速的找到与所有用户已评价物品相关的物品集合,提高推荐算法的执行效率;预测值获取单元630,用于根据将所有用户已评价的相关物品集合进行数据块的切分,并对所述数据块并行化处理,获得所有用户已评价物品的相关物品集合中的物品的预测值,其中,切分的各数据块的热门程度总和基本一致,在进行下一步的不同的线程进行处理时,计算量也是一致的,达到计算的负载平衡;未评价物品集合获取单元640,用于根据所有用户已评价物品的相关物品集合生成用户的可预测物品集合,并根据所预测物品集合和用户的已评价物品集合获得用户的未评价物品集合;最终预测值获取单元650,用于根据对预测出的所有未评价物品集合中的未评价物品的预测值进行合并获取未评价物品的最终预测值,具体地,在对未评价物品的所有预测值进行合并的过程中,将所有能够预测出该未评价物品预测值的物品给出的预测值进行求平均,得到最终的未评价物品的预测值;物品推荐单元660,用于根据未评价物品的最终预测值将物品推荐给用户。
另外,本发明提供的基于物品的推荐系统,在未评价物品的预测值获取单元630中,对数据源块进行并行化处理的过程中,根据物品对的相关系数对已评价物品的评价值进行线性预测得到所有用户已评价物品的相关物品集合中的物品的预测值。
通过本发明基于物品的推荐方法及系统,能够将线性模型应用于基于物品的推荐中,提高了推荐算法的准确性,同时将线性模型进行拆解,将物品单独拟合并将结果合并,降低了模型拟合的复杂度,解决了热点物品的负载不均衡问题,提高计算效率。
如上参照附图以示例的方式描述根据本发明的基于物品的推荐方法及系统。但是,本领域技术人员应当理解,对于上述本发明所提出的基于物品的推荐方法及系统,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。
Claims (3)
1.一种基于物品的推荐方法,包括:
获取一个用户的已评价物品,生成所述用户的已评价物品集合,然后从所述用户的已评价物品集合中取出任意两件物品组成物品对;
根据所有用户对所述物品对的评价值,分别对所述物品对中的物品进行线性拟合,以得到所有用户已评价物品中物品对的相关系数并进行缓存;然后根据所缓存的物品对的相关系数,获得所有用户已评价物品的相关物品集合;
根据所有用户已评价物品的相关物品集合中物品的个数,确定所有用户已评价物品的热门程度,然后根据所述热门程度将所有用户已评价物品进行数据块切分,并对所切分的数据块进行并行化处理,通过物品对的相关系数及用户对已评价物品的评价值进行线性预测,以得到所有用户已评价物品的相关物品集合中的物品的预测值;其中,所切分的各数据块的热门程度的总和相一致;
根据用户每个已评价物品的相关物品集合生成所述用户的可预测物品集合,根据可预测物品集合和用户的已评价物品集合生成所述用户的未评价物品集合;
通过对任一用户预测出的未评价物品集合中的物品的所有预测值进行合并,得到所述用户未评价物品集合中的物品的最终预测值;
所述未评价物品预测值的计算公式为:
<mrow>
<msub>
<mi>v</mi>
<mrow>
<mi>m</mi>
<mi>k</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>c</mi>
</munderover>
<mrow>
<mo>(</mo>
<msub>
<mi>a</mi>
<mrow>
<mi>t</mi>
<mi>k</mi>
</mrow>
</msub>
<msub>
<mi>v</mi>
<mrow>
<mi>m</mi>
<mi>t</mi>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mi>b</mi>
<mrow>
<mi>t</mi>
<mi>k</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mi>c</mi>
</mfrac>
</mrow>
其中,Vmk为未评价物品预测值,Vmt为能够预测出未评价物品预测值的物品给出的预测值,c为能够预测出未评价物品预测值的物品给出的预测值个数,atk、btk为物品对的相关系数;
根据所述最终预测值将所述未评价物品集合中的未评价物品推荐给所述用户。
2.如权利要求1所述的基于物品的推荐方法,其中,所述所有用户已评价物品的相关物品集合中物品的个数与所述所有用户已评价物品的热门程度成正比。
3.一种基于物品的推荐系统,包括:
物品对获取单元,用于根据一个用户已评价的物品,得到所述用户的已评价物品集合,然后从所述用户的已评价物品集合中取出任意两件物品以获取物品对;
所有用户已评价物品的相关物品集合获取单元,用于根据对所述物品对中的物品进行单独拟合,得到物品对的相关系数并进行缓存,根据缓存的物品对的相关系数获取所有用户已评价物品的相关物品集合;
预测值获取单元,用于根据将所有用户已评价物品进行数据块的切分,并对所述数据块并行化处理,通过物品对的相关系数及已评价物品的评价值进行线性预测,获得所有用户已评价物品的相关物品集合中的物品的预测值;其中,所切分的各数据块的热门程度的总和相一致;
未评价物品集合获取单元,用于根据用户每个已评价物品的相关物品集合生成所述用户的可预测物品集合,根据可预测物品集合和所述用户的已评价物品集合获得所述用户的未评价物品集合;
最终预测值获取单元,用于对预测出的未评价物品集合中的物品的所有预测值进行合并获取所述未评价物品集合中的物品的最终预测值,其中,所述未评价物品预测值的计算公式为:
<mrow>
<msub>
<mi>v</mi>
<mrow>
<mi>m</mi>
<mi>k</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>c</mi>
</munderover>
<mrow>
<mo>(</mo>
<msub>
<mi>a</mi>
<mrow>
<mi>t</mi>
<mi>k</mi>
</mrow>
</msub>
<msub>
<mi>v</mi>
<mrow>
<mi>m</mi>
<mi>t</mi>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mi>b</mi>
<mrow>
<mi>t</mi>
<mi>k</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mi>c</mi>
</mfrac>
</mrow>
其中,Vmk为未评价物品预测值,Vmt为能够预测出未评价物品预测值的物品给出的预测值,c为能够预测出未评价物品预测值的物品给出的预测值个数,atk、btk为物品对的相关系数;
物品推荐单元,用于根据未评价物品集合中的未评价物品的最终预测值将物品推荐给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310703736.0A CN103700007B (zh) | 2013-12-18 | 2013-12-18 | 基于物品的推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310703736.0A CN103700007B (zh) | 2013-12-18 | 2013-12-18 | 基于物品的推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103700007A CN103700007A (zh) | 2014-04-02 |
CN103700007B true CN103700007B (zh) | 2017-10-31 |
Family
ID=50361528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310703736.0A Active CN103700007B (zh) | 2013-12-18 | 2013-12-18 | 基于物品的推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103700007B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104063589B (zh) * | 2014-06-16 | 2018-01-16 | 百度移信网络技术(北京)有限公司 | 一种推荐方法以及系统 |
CN105868207B (zh) * | 2015-01-21 | 2019-10-15 | 方正宽带网络服务有限公司 | 一种网络资源推送方法及装置 |
US9867425B2 (en) * | 2016-02-26 | 2018-01-16 | Nike, Inc. | Method of customizing forefoot cushioning in articles of footwear |
CN105812946A (zh) * | 2016-03-21 | 2016-07-27 | 深圳市九洲电器有限公司 | 基于数字电视设备的图书推荐方法及系统 |
CN109118243B (zh) * | 2017-06-26 | 2022-09-30 | 阿里巴巴集团控股有限公司 | 一种产品分享、有用评价识别、推送方法和服务器 |
CN112330405B (zh) * | 2020-11-10 | 2023-11-24 | 深圳大学 | 一种面向物品集显式反馈的推荐方法、终端及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102523511A (zh) * | 2011-11-09 | 2012-06-27 | 中国传媒大学 | 一种网络节目聚合及节目推荐系统和方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5481295B2 (ja) * | 2010-07-15 | 2014-04-23 | エヌ・ティ・ティ・コムウェア株式会社 | オブジェクト推薦装置、オブジェクト推薦方法、オブジェクト推薦プログラムおよびオブジェクト推薦システム |
-
2013
- 2013-12-18 CN CN201310703736.0A patent/CN103700007B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102523511A (zh) * | 2011-11-09 | 2012-06-27 | 中国传媒大学 | 一种网络节目聚合及节目推荐系统和方法 |
Non-Patent Citations (2)
Title |
---|
Collaborative Filtering Using a Regression-Based Approach;Slobodan Vucetic;《Knowledge and Information Systems》;20040206(第7期);第3-7页 * |
云计算环境下的大规模图数据处理技术;于戈;《计算机学报》;20111031;第34卷(第10期);第5-6页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103700007A (zh) | 2014-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103700007B (zh) | 基于物品的推荐方法及系统 | |
CN106485562B (zh) | 一种基于用户历史行为的商品信息推荐方法及系统 | |
CN107451894B (zh) | 数据处理方法、装置和计算机可读存储介质 | |
Ansah et al. | Analytic hierarchy process decision making algorithm | |
Kim et al. | Predicting the virtual temperature of web-blog articles as a measurement tool for online popularity | |
CN106651542A (zh) | 一种物品推荐的方法及装置 | |
CN106202519A (zh) | 一种结合用户评论内容和评分的项目推荐方法 | |
CN103559303A (zh) | 一种对数据挖掘算法的评估与选择方法 | |
CN109034981A (zh) | 一种电商协同过滤推荐方法 | |
KR20140053444A (ko) | 시장규모예측장치, 시장규모예측방법 및 시장규모를 예측하는 프로그램을 저장하는 저장매체 | |
CN104504583A (zh) | 分类器的评价方法 | |
McNamara et al. | Predicting high impact academic papers using citation network features | |
He et al. | Weighted meta paths and networking embedding for patent technology trade recommendations among subjects | |
Dias et al. | Perspectives on multi-criteria decision analysis and life-cycle assessment | |
Abdullah et al. | Integrating collaborative filtering and matching-based search for product recommendations | |
CN106649714B (zh) | 针对数据不均匀及数据稀疏的topN推荐系统及方法 | |
Chen et al. | A fuzzy matrix factor recommendation method with forgetting function and user features | |
CN101986301A (zh) | 一种基于逆邻分析的协作过滤推荐系统及方法 | |
Zhang et al. | Remarks to “Fuzzy multicriteria decision making method based on the improved accuracy function for interval-valued intuitionistic fuzzy sets” | |
Das Sarma et al. | E-commerce product search: personalization, diversification, and beyond | |
Choudhuri | Application of multi-criteria decision making (MCDM) technique for gradation of jute fibres | |
Kianinejad et al. | A strategy for trust propagation along the more trusted paths | |
Ackerman et al. | Evaluating rank accuracy based on incomplete pairwise preferences | |
Hug et al. | Experimenting analogical reasoning in recommendation | |
Wang et al. | Collaborative filtering enhanced by user free-text reviews topic modelling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |