CN109064285B - 一种获得商品推荐序列及商品推荐方法 - Google Patents

一种获得商品推荐序列及商品推荐方法 Download PDF

Info

Publication number
CN109064285B
CN109064285B CN201810870249.6A CN201810870249A CN109064285B CN 109064285 B CN109064285 B CN 109064285B CN 201810870249 A CN201810870249 A CN 201810870249A CN 109064285 B CN109064285 B CN 109064285B
Authority
CN
China
Prior art keywords
recommended
commodity
user
commodities
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810870249.6A
Other languages
English (en)
Other versions
CN109064285A (zh
Inventor
管子玉
雷燕
王娟
杨康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern University
Original Assignee
Northwestern University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern University filed Critical Northwestern University
Priority to CN201810870249.6A priority Critical patent/CN109064285B/zh
Publication of CN109064285A publication Critical patent/CN109064285A/zh
Application granted granted Critical
Publication of CN109064285B publication Critical patent/CN109064285B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种获得商品推荐序列及商品推荐方法,用于为待推荐用户提供待推荐商品序列,根据待推荐用户的历史购买商品信息对待推荐用户的待推荐商品进行评分,获得预测评分;对待推荐用户的历史购买商品进行聚类,获得多个商品类别,计算每个待推荐商品与多个商品类别的距离,获得每个待推荐商品与多个商品类别之间的距离值;根据预测评分以及距离值,获得待推荐用户对应的每个待推荐商品的评价参数;根据每个待推荐商品的评价参数的大小,将所有的待推荐商品进行排序,将前K个商品推荐给待推荐用户。

Description

一种获得商品推荐序列及商品推荐方法
技术领域
本发明涉及数据挖掘推荐方法,具体涉及一种获得商品推荐序列及商品推荐方法。
背景技术
随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。
现在的推荐系统主要是利用用户的历史购买记录和用户的社交网络关系来对用户进行推荐,这些方法只能被动的去预测和推荐用户下一次购买的商品,很少能够去指导或者吸引用户去选择购买一些商品。在现在的推荐方法中,利用了已购买的商品之间的相似性去分析用户的喜好,但是却忽略了已购买的商品内部之间的关系,商品之间不是相互独立的,而是存在依赖关系。比如:我们在选择购买上衣的时候,我们会分析这件上衣是否与已购买中的哪些下装,鞋子,配饰比较协调,然后在选择是否购买。评分高的商品并不是和其他任何商品的组合都是评分高,同理评分中等的商品不是和其他任何商品的组合都是中等,有可能会组合成高评分。这些商品的组合不是简单的线性相加,而是一种非线性的关系,有些商品组合甚至是指数递增的关系。如果考虑购买的东西和已有的商品之间不能够达到最小的匹配度或者是中等匹配,那么购买的这件商品将无法与任何商品搭配协调或者是与任何商品的搭配效果平平,则用户不能最大化对它进行使用,可能这件商品只能够成为“透明的”。
此外,虽然有一些推荐是关于搭配,利用一些人为的搭配准则和图片的卷积,并且产生的这种搭配组合是主观意识上搭配协调的商品组合,并不针对某个特定的目标用户。
发明内容
本发明的目的在于提供一种获得商品推荐序列及商品推荐方法,用以解决现有技术中的商品推荐方法未考虑到商品之间存在的依赖关系,导致推荐准确率不高的问题。
为了实现上述任务,本发明采用以下技术方案:
一种获得商品推荐序列的方法,用于从多个待推荐商品中选择部分待推荐商品组成的序列作为用户的商品推荐序列,所述的用户具有历史购买商品,所述的方法包括:
步骤1、获得用户对每个待推荐商品的预测评分;
步骤2、对用户的历史购买商品进行聚类,获得多个商品类别,计算每个待推荐商品与多个商品类别之间的距离值;
步骤3、根据用户对每个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值,获得用户对每个待推荐商品的评价参数;
步骤4、根据用户对每个待推荐商品的评价参数的大小,将所有的待推荐商品进行排序,将前K个待推荐商品组成的序列作为商品推荐序列,K≥1,获得用户的商品推荐序列。
进一步地,所述的步骤1、采用基于内容扩充的协同过滤方法获得用户对每个待推荐商品的预测评分。
进一步地,在采用基于内容扩充的协同过滤方法获得用户对每个待推荐商品的预测评分时,采用向量空间模型和TF-IDF方法提取待推荐商品的特征。
进一步地,所述的步骤2、对用户的历史购买商品采用AGNES方法进行聚类,获得多个商品类别;在所述AGNES方法中,采用Wasserstein距离作为距离度量;计算每个待推荐商品与多个商品类别之间的Wasserstein距离值。
进一步地,所述的步骤3、根据用户对每个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值,采用式IX获得用户u对待推荐商品i的评价参数L(u,i):
L(u,i)=rec(u,i)+max{1-W(i,Cj)} 式IX
其中,rec(u,i)为步骤1中获得的用户u对待推荐商品i的预测评分,max{1-W(i,Cj)}为待推荐商品i与第j个商品类别之间匹配分数的最大值,W(i,Cj)为步骤2获得的待推荐商品i与第j个商品类别之间的距离值,Cj为第j个商品类别,u≥1,i≥1,j≥1。
一种商品推荐方法,用于为待推荐用户推荐商品,所述的方法包括:
步骤A、判断待推荐用户是否具有历史购买商品:若待推荐用户具有历史购买商品,则执行步骤B;否则,执行步骤C;
步骤B、采用上述的获得商品推荐序列的方法,获得待推荐用户的商品推荐序列,将所述商品推荐序列中的商品推荐给待推荐用户;
步骤C、获得待推荐用户与邻居用户之间的关系矩阵,每个所述的邻居用户均具有历史购买商品,采用以上所述的获得商品推荐序列的方法,获得每个邻居用户的商品推荐序列,根据每个邻居用户的商品推荐序列,获得待推荐用户的商品推荐序列,将所述商品推荐序列中的商品推荐给待推荐用户。
进一步地,所述的步骤C包括:
对待推荐用户与该待推荐用户的多个邻居用户的关系进行爬取,获得待推荐用户与邻居用户之间的关系矩阵,每个所述的邻居用户均具有历史购买商品;
采用以上所述的获得商品推荐序列的方法,获得每个邻居用户的待推荐商品序列;
对每个邻居用户的待推荐商品序列中每个待推荐商品的评价参数进行加权后求和,获得每个待推荐商品加权后的评价参数和;
根据每个待推荐商品的加权评价参数和的大小,将所有的待推荐商品进行排序,将前N个待推荐商品加入商品推荐序列中,N≥1,获得待推荐用户的商品推荐序列。
进一步地,所述的对每个邻居用户的待推荐商品序列中的每个待推荐商品的评价参数进行加权时,所述的权重为所述关系矩阵中待推荐用户与邻居用户之间的关系值。
本发明与现有技术相比具有以下技术特点:
1.本发明提供的商品推荐方法考虑到了推荐系统中非线性组合效应的影响,即是评分高的商品与其他任何商品的组合不一定都评分高,同理评分低的商品与其他任何组合的评分不一定都是评分低,现在的推荐系统的方法几乎只考虑了商品之间的相似性,忽略了选择购买的商品与历史购买商品的依赖性;本发明提供商品推荐方法考虑了这种依赖性,提出了最大化非线性组合效应的想法,最大化了待推荐商品的用途,提高了推荐的准确率;
2.本发明提供的商品推荐方法能够改善用户的使用体验,而且能够吸引更多的新用户的加入。
附图说明
图1为本发明提供的获得商品推荐序列方法的流程图。
具体实施方式
以下是发明人提供的具体实施例,以对本发明的技术方案作进一步解释说明。
实施例一
本发明公开了一种获得商品推荐序列的方法,用于从多个待推荐商品中选择部分待推荐商品组成的序列作为用户的商品推荐序列,所述的用户具有历史购买商品,。
本发明提出最大化非线性组合效应,期望能够推荐最大化用户的偏好和与已购买的商品之间的最大匹配的商品,利用该方法可以自动的学习特定的目标用户的购物历史,学习出目标用户历史购物记录中商品类别和目标用户的偏好,也就是说本发明提供的推荐方法在在推荐新的商品的时候,不仅仅只考虑用户的偏好,也要考虑购买的东西和已有的商品之间是否能够达到最大的匹配度,如果购买的这件商品无法与任何商品搭配协调或者是搭配效果平平,则不能最大化对它进行使用,最后通过最大化评价参数,推荐一个即满足用户最大偏好的并且和已购买的商品中匹配指数最大的一组待推荐的商品。
所述的方法包括:
步骤1、获得用户对每个待推荐商品的预测评分;
本步骤实现对用户对应的待推荐商品进行预测评分,即计算用户的偏好,用户的预测评分越高,说明用户对该待推荐商品的喜好度越高。本发明在对待推荐商品进行推荐时,是基于用户对商品的喜好度。
在本步骤中,对待推荐的商品进行预测评分时,可以采用基于用户的协同过滤算法、基于商品的协同过滤算法或者是基于内容的协同过滤算法。
作为一种优选的实施方式,根据用户的历史购买商品对用户的待推荐商品进行评分时,采用基于内容扩充的协同过滤方法获得待推荐用户对每一个缺失商品的预测评分。
在步骤1中输入的是用户-商品-评分的文件,在对用户的待推荐商品进行评分之前,需要对用户-商品-评分的文件中的数据进行预处理,包括:
根据用户-商品-评分的文件中的数据,提取所有商品的特征,所有商品包括待推荐商品以及历史购买商品;
根据所有商品的特征,对用户-商品-评分的文件中的数据进行过滤,滤除掉常见的词语,保留重要的词语。
在提取所有商品的特征时,可以采用向量空间模型和TF-IDF方法、FP-Growth算法进行提取。
在本实施例中,为了提高方法的效率,采用过程较为简单的向量空间模型和TF-IDF方法提取待推荐商品的特征。
具体地,该方法包括:首先统计商品内容中的词频,词频指的是某一个给定的词语在该文件中出现的频率。这个数字是对词数的归一化,以防止它偏向长的文件,同一个词语在长文件里可能会比短文件有更高的词数,而不管该词语重要与否。对于在某一特定文件里的词语ta来说,它的重要性可表示为:
Figure BDA0001751941830000071
其中,na,b是该词在文件db中的出现次数,而分母则是在文件db中所有字词的出现次数之和,a≥1,b≥1,c≥1。
然后统计商品内容的逆向文件频率,逆向文件频率是一个词语普遍重要性的度量。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到:
Figure BDA0001751941830000072
其中,|D|为语料库中的文件总数,|{b:ta∈db}|包含词语ta的文件数目,即na,b≠0的文件数目;如果该词语不在语料库中,就会导致被除数为零,因此一般情况下使用1+|{b:ta∈db}|。
最后获得TF-IDF值向量tfidfa,b
tfidfa,b=tfa,b×idfa 式II
在某一特定文件内的高词语频率,以及该词语在整个文件集合中的低文件频率,可以产生出高权重的TF-IDF,因此,采用向量空间模型和TF-IDF方法能够过滤掉常见的词语,保留重要的词语。
在步骤中,采用基于内容扩充的协同过滤方法用户对每个待推荐商品的预测评分,包括:
步骤11、扩充用户评分向量:第i个待推荐商品是历史购买商品之中的商品,即第i个待推荐商品本身具有的真实评分,则ru,i=Vu,i;第i个待推荐商品不是历史购买商品之中的商品,即第i个待推荐商品本身不具有评分,则基于内容扩充待推荐商品i的预测评分ru,i=V* u,i
步骤12、根据这些评分,包括对待推荐商品的真实评分和待推荐商品的预测评分。我们先计算出用户之间的关系,用Pearson相关系数来计算用户的相似性,主要是计算第p个用户与第q个用户之间评分之间的差值:
Figure BDA0001751941830000081
rp,i为第p个用户对第i个商品的评分,r*p为第p个用户对所有商品的平均评分,rq,i为第q个用户对第i个商品的评分,r*q为第q个用户对所有商品的平均评分。
步骤13、当用户共同评分的物品数超过50,效果会趋于稳定,在本步骤中用户的偏好,越稳定越好,所以用Sgp,q来表示用户p与用户q之间评分的稳定性:
Figure BDA0001751941830000091
np,q为第p个用户与第q个用户共同评分过的物品总数。
步骤14、考虑到如果用户评分分数较少,基于内容的虚拟评分就相对不可信,所以用hmp,q来表示用户p与用户q之间的评分影响度,hmp,q>0:
Figure BDA0001751941830000092
其中,mp为第p个用户的评分可靠度,
Figure BDA0001751941830000093
np为第p个用户评分过的商品总数,np≥1,mq为第q个用户的评分可靠度,
Figure BDA0001751941830000094
nq为第q个用户评分过的商品总数,nq≥1。
如果原始评分值的个数超过50,那么用户的偏好会比较稳定,基于内容的预测评分就会更加的可靠;如果原始评分值的个数小于50,用户的偏好就不稳定,换种解释就是用户的偏好还是隐式的未被挖据。
步骤15、采用式VI计算用户p与用户q之间的混合关系权重,即用户p与用户q之间的关系和偏好稳定性:
hwp,q=Sgp,q+hmp,q 式VI
步骤16、采用式VII获得待推荐用户u对待推荐商品i的预测评分值rec(u,i):
Figure BDA0001751941830000101
其中,mu为第u个用户的评分可靠度,mu>0,ru,i为第u个用户对第i个商品的评分值,0≤ru,i≤5,如果第i个待推荐商品是历史购买商品之中的商品,则ru,i为已知评分,如果第i个待推荐商品不是历史购买商品之中的商品,即第i个待推荐商品没有评分,则ru,i为步骤I中采用基于内容的方法获得的预测评分;v≠u表示在所有用户中除了第u个用户之外的用户均为v,v≥1;hwu,v为第u个用户与第v个用户之间的评分影响度,hwu,v>0;sim(u,v)为第u个用户与第v个用户之间评分之间的差值,sim(u,v)>0;rv,i为第v个用户对第i个商品的评分,0≤rv,i≤5。
步骤2、对用户的历史购买商品进行聚类,获得多个商品类别,计算每个待推荐商品与多个商品类别之间的距离值;
在本步骤中,对用户的历史购买商品进行聚类时,可以采用K-means聚类方法、AGNES聚类方法等。
作为一种优选的是实施方式,对用户的历史购买商品采用AGNES方法进行聚类,获得多个商品类别;在所述AGNES方法中,采用Wasserstein距离作为距离度量;
计算每个待推荐商品与多个商品类别的Wasserstein距离值。
在本步骤中进行聚类时,仅对历史购买商品进行分类,获得多个商品类别,通过计算待推荐商品与商品类别之间的距离,获得待推荐商品与历史购买商品之间的匹配度,具体地,本步骤包括:
步骤21、获得第u个用户的历史购买记录{I1,I2,…,Ij,…,In},n≥1,最大匹配距离max_dis;
步骤22、把读入的每一个历史购买的商品看成是一个初始聚类簇Cj={Ij};
步骤23、初始化初始聚类簇之间的距离矩阵Ma,其中矩阵中每个值是对应的两个簇之间的距离;
步骤24、计算的聚类簇之间的距离矩阵采用的距离度量是Wasserstein距离,Wasserstein距离度量表示两个概率分布之间的距离,其距离如下:
W(i,Cj)=infr~π(i,Cj)E(X,Y)~[||X-Y||] 式VIII
π(i,Cj)是i,Cj分布组合起来的所有可能的联合分布的集合。对于每一个可能的联合分布γ,可以从中采样(X,Y)~γ得到一个样本X和Y,并计算出这对样本的距离||X-Y||,所以可以计算该联合分布γ下,样本对距离的期望值E(X,Y)~γ[||X-Y||]。在所有可能的联合分布中能够对这个期望值取到的下界
Figure BDA0001751941830000111
就是Wasserstein距离;
步骤25、根据聚类簇的距离矩阵,找到距离最近且距离大于max_dis的两个聚类簇;
步骤26、合并两个聚类簇Cm*=Cm U Cn,删除距离阵中Cn簇的所有距离。
步骤27、重复步骤25-26,直到距离已经超过max_dis,则聚类停止;
步骤28、获得多个聚类簇C={C1,C2,…,Cj,…,Ck},每个聚类簇为一个商品类别;
步骤29、采用式VIII获得每个待推荐商品与多个商品类别之间的Wasserstein。
步骤3、根据用户对每一个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值,获得用户对每个待推荐商品的评价参数;
在步骤中,根据用户对每一个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值,采用式IX获得用户u对待推荐商品i的评价参数L(u,i):
L(u,i)=rec(u,i)+max{1-W(i,Cj)} 式IX
其中,rec(u,i)为步骤1中获得的用户u对待推荐商品i的预测评分,max{1-W(i,Cj)}为待推荐商品i与第j个商品类别之间匹配分数的最大值,W(i,Cj)为步骤2获得的待推荐商品i与第j个商品类别之间的距离值,Cj为第j个商品类别,u≥1,i≥1,j≥1。
在本步骤中,通过最大化待推荐商品i与商品类别之间匹配分数使得用户u对待推荐商品i的评价参数L(u,i)取到最大值。
步骤4、根据用户对每个待推荐商品的评价参数的大小,将所有的待推荐商品进行排序,将前K个待推荐商品加入商品推荐序列中,K≥1,获得待推荐用户的商品推荐序列。
以上步骤1-步骤4的方法针对于用户其本身已经具有历史购买商品信息,采用该方法对用户的历史购买商品信息进行处理,获得待推荐商品序列。
实施例二
一种商品推荐方法,用于为待推荐用户推荐商品,所述的方法包括:
步骤A、判断待推荐用户是否具有历史购买商品:若待推荐用户具有历史购买商品,则执行步骤B;否则,执行步骤C;
步骤B、采用实施例一所述的获得商品推荐序列的方法,获得待推荐用户的商品推荐序列,将所述商品推荐序列中的商品推荐给待推荐用户;
步骤C、获得待推荐用户与邻居用户之间的关系矩阵,每个所述的邻居用户均具有历史购买商品,采用实施例一获得商品推荐序列的方法,获得每个邻居用户的商品推荐序列,根据每个邻居用户的商品推荐序列,获得待推荐用户的商品推荐序列,将所述商品推荐序列中的商品推荐给待推荐用户。
具体地,本步骤对待推荐用户与该待推荐用户的多个邻居用户的关系进行爬取,获得待推荐用户与邻居用户之间的关系矩阵,每个所述的邻居用户均具有历史购买商品;
网络上的待推荐用户不是孤立存在的,会存在与这个待推荐用户社交较为频繁的邻居用户,本发明通过网络爬取找到这个待推荐用户的邻居用户以及待推荐用户与邻居用户之间的关系,获得关系矩阵。
在本步骤中遍历社交网络,找到与用户在社交网络有联系的人,不只局限于一个单纯的购物网络,还有其他的网络。找到与用户有联系的人,是因为用户处于社会中,交往的绝大部分是生活在同一个朋友圈的人,关系越密切,对目标用户的影响就越大。在目标用户是新用户的条件下,没有任何历史购物数据以供我们参考,从目标用户的周围的人入手更合理。
采用实施例一中获得商品推荐序列的方法,获得每个邻居用户的待推荐商品序列;
对每个邻居用户的待推荐商品序列中每个待推荐商品的评价参数进行加权后求和,获得每个待推荐商品加权后的评价参数和;
所述的对每个邻居用户的待推荐商品序列中的每个待推荐商品的评价参数进行加权时,所述的权重为所述关系矩阵中待推荐用户与邻居用户之间的关系值。
根据每个待推荐商品的加权评价参数和的大小,将所有的待推荐商品进行排序,将前N个待推荐商品加入商品推荐序列中,N≥1,获得待推荐用户的商品推荐序列。
实施例三
在本实施例中,待推荐用户具有历史购买商品,为待推荐用户推荐商品。
待推荐用户集合U={u1,u2,u3,u4},商品集合Item={I1,I2,I3,I4,I5,I6,I7,I8,I9},其中{I1,I2,I3,I4,I5}为历史购买商品,{I6,I7,I8,I9}为待推荐商品。
用户-商品评分矩阵Rating为:
[[3,4,5,1,2,?,?,?,?],
[2,4,3,4,5,3,2,1,4]
[2,3,2,4,2,5,4,3,4]
[2,3,5,4,3,4,3,5,4]]
在用户-商品评分矩阵Rating中,“?”代表了待推荐用户没有购买这个商品,需要采用基于内容扩充的协同过滤方法获得待推荐用户对每一个待推荐商品的预测评分。
Meta-data=[[2,3,4,5,6,2,4,7,5],[2,3,5,4,2,7,4,5,8],[3,2,4,6,5,4,2,8,5],[3,4,5,7,6,5,4,3,2],[1,2,4,6,5,3,7,5,3],[3,4,6,2,3,4,5,3,2],[3,5,4,3,2,6,4,3,2],[4,3,2,4,3,2,1,4,6][2,3,5,3,6,4,5,3,2]]
Meta-data[i][j]代表了第i个商品的的第j个特征,在本实施例中设置max_dis=0.8.推荐的商品数k=1。
在本实施例中目标是为待推荐用户u1提供待推荐商品序列。
步骤1、获得待推荐用户对每一个待推荐商品的预测评分;
采用基于内容扩充的协同过滤方法获得待推荐用户对每一个待推荐商品{I6,I7,I8,I9}的预测评分,其步骤如下:
计算每个邻居用户与待推荐用户的关系矩阵如下:
P=[[1.0,0.956,0.845,0,867],[0.956,1.0,0.976,0.876][0.845,0.976,1.0,0.789][0.867,0.876,0.789,1.0]]
计算每个商品之间的关系强度,计算结果如下:PP=[[1.0,0.960,0.760,0.890,0.938],[0.960,1.0,0.886,0.824,0.833],[0.760,0.886,1.0,0.881,0.886],[0.890,0.824,0.881,1.0,0.920],[0.938,0.833,0.886,0.920,1.0]],
采用式VII获得待推荐用户u1对待推荐商品I6、I7、I8的预测评分值,其分数如下:
R(I6)=3.55,R(I7)=4.65,R(I8)=4.34
将预测评分值转换至0到1之间获得:R(I6)=0.71,R(I7)=0.93,R(I8)=0.868
步骤2、对待推荐用户的历史购买商品进行聚类,获得多个商品类别,计算每个待推荐商品与多个商品类别之间的距离值;
采用改进的层次聚类中AGNES方法,其中通过聚类,我们可以把目标用户的已购买的商品聚类成如下的聚类簇:
初始化聚类,C1={I1}....C5={I5};
初始化距离矩阵,其中每个元素是对应的聚类簇的Wasserstein距离,其结果如下:Ma=[[1.0,0.860,0.960,0.890,0.938],[0.860,1.0,0.886,0.824,0.833],[0.966,0.886,1.0,0.881,0.886],[0.890,0.824,0.881,1.0,0.920],[0.938,0.833,0.886,0.920,1.0];
从距离矩阵中选出最小距离即最大相似度,并且这个相似度要大于max_dis;即0.966,对应的聚类簇为C1,C3
合并聚类簇并且更新矩阵,此时聚类簇和矩阵如下:
C1={I1,I3},C2={I2},C3={I4},C4={I5}
Ma=[[1.0,0.860,0.890,0.938],[0.860,1.0,0.824,0.833],[0.890,0.824,1.0,0.920],[0.938,0.833,0.920,1.0],
重复从距离矩阵中选出最小距离即最大相似度,并且这个相似度要大于max_dis以及合并聚类簇并且更新矩阵,直到没有满足条件的距离为止,最终的聚类结果为:C1={I1,I4,I3}C2={I2,I5},因此历史购买商品经过聚类后获得两个商品类别,分别是C1和C2
步骤3、根据待推荐用户对每一个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值,采用式IX获得待推荐用户u1对待推荐商品I6、I7、I8的评价参数:
首先,采用式VII计算每个待推荐商品与商品类别的最大匹配分数:
rec(u1,I6)=0.876,rec(u1,I7)=0.767,rec(u1,I8)=0.886;
其次,最大匹配分数加入待推荐商品的预测评分值对待推荐商品进行评价参数的计算,获得待推荐用户对应的每个待推荐商品的评价参数:L(u1,I6)=1.586,L(u1,I7)=1.697,L(u1,I8)=1.754。
步骤4、根据待推荐用户对每个待推荐商品的评价参数的大小,将所有的待推荐商品进行排序,将前K个待推荐商品加入商品推荐序列中,K≥1,获得待推荐用户的商品推荐序列。
在本实施例中,当K=1时,选取具有最大评价参数的待推荐商品进行推荐,在本实施例中为待推荐用户u1的推荐序列为{I8}。
将所述商品推荐序列中的商品推荐给待推荐用户。
在本实施例中,将商品I8推荐给待推荐用户u1
实施例四
在本实施例中,待推荐用户没有历史购买商品信息,为待推荐用户推荐商品。
对待推荐用户与该待推荐用户的多个邻居用户的关系进行爬取,获得待推荐用户与邻居用户之间的关系矩阵;
对于待推荐用户A找到了3个邻居用户,分别是邻居用户B、邻居用户C以及邻居用户D,用户A、B、C、D之间的关系矩阵为:
Figure BDA0001751941830000181
其中,待推荐用户A与邻居用户B之间的关系值为Label1,2=1.1。
采用实施例一中所述的获得商品推荐序列的方法,获得每个邻居用户的待推荐商品序列;
在本实施例中,对每个邻居用户的历史购买商品信息以及待推荐商品信息进行处理,获得每个邻居用户的待推荐商品序列。
对于邻居用户B来说,他的待推荐商品序列为:[I1,I3,I4,I6],其对应的评价参数为[0.90,0.89,0.86,0.83];
对于邻居用户C来说,他的待推荐商品序列为:[I1,I2,I5,I8],其对应的评价参数为[0.96,0.94,0.90,0.84];
对于邻居用户D来说,他的待推荐商品序列为:[I2,I5,I7,I8],其对应的评价参数为[0.92,0.90,0.88,0.82];
对每个邻居用户的待推荐商品序列中每个待推荐商品的评价参数进行加权后求和,获得每个待推荐商品加权后的评价参数和;
作为一种优选的实施方式,所述的权重为所述关系矩阵中待推荐用户与邻居用户之间的关系值。
在本实施例中,待推荐商品I1在邻居用户B,C的待推荐商品序列中,邻居B与待推荐用户A之间的关系值为1.1,邻居C与待推荐的用户A的关系值为1.5,所以待推荐商品I1的加权评价参数和为1.1*0.90+1.5*0.96=2.43;
待推荐商品I2,在邻居用户C,D的待推荐商品序列中,邻居C与待推荐用户A之间的关系值为1.5,邻居C与待推荐的用户A的关系值为0.6,所以待推荐商品I2的加权评价参数和为1.5*0.94+0.6*0.92=1.96;
待推荐商品I3,在邻居用户B的待推荐商品序列中,邻居B与待推荐用户A之间的关系值为1.1,所以待推荐商品I3的加权评价参数和为1.1*0.89=0.979;
待推荐商品I4,在邻居用户B的待推荐商品序列中,邻居B与待推荐用户A之间的关系值为1.1,所以待推荐商品I4的加权评价参数和为1.1*0.86=0.946;
待推荐商品I5在邻居用户C,D的待推荐商品序列中,邻居C与待推荐用户A之间的关系值为1.5,邻居C与待推荐的用户A的关系值为0.6,所以待推荐商品I5的加权评价参数和为1.5*0.90+0.6*0.90=1.89;
待推荐商品I6在邻居用户B的待推荐商品序列中,邻居B与待推荐用户A之间的关系值为1.1,所以待推荐商品I6的加权评价参数和为1.1*0.83=0.913;
待推荐商品I7在邻居用户D的待推荐商品序列中,邻居D与待推荐用户A之间的关系值为0.6,所以待推荐商品I7的加权评价参数和为0.6*0.88=0.528;
待推荐商品I8,在邻居用户C,D的待推荐商品序列中,邻居C与待推荐用户A之间的关系值为1.5,邻居D与待推荐的用户A的关系值为0.6,所以待推荐商品I8的加权评价参数和为1.5*0.84+0.6*0.82=1.752。
根据每个待推荐商品的加权评价参数和的大小,将所有的待推荐商品进行排序,将前N个待推荐商品加入商品推荐序列中,N≥1,获得待推荐用户的商品推荐序列。
在本实施例中,N=3,将这8个待推荐商品的加权评价参数和进行排序:[2.43,1.96,1.89,1.752,0.979,0.946,0.913,0.528],[I1,I2,I5,I8,I3,I4,I6,I7],将前3个待推荐商品加入待推荐商品序列。
将所述商品推荐序列中的商品推荐给待推荐用户。
在本实施例中,商品推荐序列为{I1、I2、I5},因此将商品I1、I2、I5推荐给待推荐用户A。

Claims (8)

1.一种获得商品推荐序列的方法,用于从多个待推荐商品中选择部分待推荐商品组成的序列作为用户的商品推荐序列,所述的用户具有历史购买商品,其特征在于,所述的方法包括:
步骤1、获得用户对每个待推荐商品的预测评分;
步骤2、对用户的历史购买商品进行聚类,获得多个商品类别,计算每个待推荐商品与多个商品类别之间的距离值;
步骤3、根据用户对每个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值,获得用户对每个待推荐商品的评价参数;
步骤4、根据用户对每个待推荐商品的评价参数的大小,将所有的待推荐商品进行排序,将前K个待推荐商品组成的序列作为商品推荐序列,K≥1,获得用户的商品推荐序列。
2.如权利要求1所述的获得商品推荐序列的方法,其特征在于,所述的步骤1、采用基于内容扩充的协同过滤方法获得用户对每个待推荐商品的预测评分。
3.如权利要求2所述的获得商品推荐序列的方法,其特征在于,在采用基于内容扩充的协同过滤方法获得用户对每个待推荐商品的预测评分时,采用向量空间模型和TF-IDF方法提取待推荐商品的特征。
4.如权利要求1所述的获得商品推荐序列的方法,其特征在于,所述的步骤2、对用户的历史购买商品采用AGNES方法进行聚类,获得多个商品类别;在所述AGNES方法中,采用Wasserstein距离作为距离度量;计算每个待推荐商品与多个商品类别之间的Wasserstein距离值。
5.如权利要求1所述的获得商品推荐序列的方法,其特征在于,所述的步骤3、根据用户对每个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值,采用式IX获得用户u对待推荐商品i的评价参数L(u,i):
L(u,i)=rec(u,i)+max{1-W(i,Cj)} 式IX
其中,rec(u,i)为步骤1中获得的用户u对待推荐商品i的预测评分,max{1-W(i,Cj)}为待推荐商品i与第j个商品类别之间匹配分数的最大值,W(i,Cj)为步骤2获得的待推荐商品i与第j个商品类别之间的距离值,Cj为第j个商品类别,u≥1,i≥1,j≥1。
6.一种商品推荐方法,用于为待推荐用户推荐商品,其特征在于,所述的方法包括:
步骤A、判断待推荐用户是否具有历史购买商品:若待推荐用户具有历史购买商品,则执行步骤B;否则,执行步骤C;
步骤B、采用权利要求1-5任一项权利要求所述的获得商品推荐序列的方法,获得待推荐用户的商品推荐序列,将所述商品推荐序列中的商品推荐给待推荐用户;
步骤C、获得待推荐用户与邻居用户之间的关系矩阵,每个所述的邻居用户均具有历史购买商品,采用权利要求1-5任一项权利要求所述的获得商品推荐序列的方法,获得每个邻居用户的商品推荐序列,根据每个邻居用户的商品推荐序列,获得待推荐用户的商品推荐序列,将所述商品推荐序列中的商品推荐给待推荐用户。
7.如权利要求6所述的商品推荐方法,其特征在于,所述的步骤C包括:
对待推荐用户与该待推荐用户的多个邻居用户的关系进行爬取,获得待推荐用户与邻居用户之间的关系矩阵,每个所述的邻居用户均具有历史购买商品;
采用权利要求1-5任一项权利要求所述的获得商品推荐序列的方法,获得每个邻居用户的待推荐商品序列;
对每个邻居用户的待推荐商品序列中每个待推荐商品的评价参数进行加权后求和,获得每个待推荐商品加权后的评价参数和;
根据每个待推荐商品的加权评价参数和的大小,将所有的待推荐商品进行排序,将前N个待推荐商品加入商品推荐序列中,N≥1,获得待推荐用户的商品推荐序列。
8.如权利要求7所述的商品推荐方法,其特征在于,所述的对每个邻居用户的待推荐商品序列中的每个待推荐商品的评价参数进行加权时,加权的权重为所述关系矩阵中待推荐用户与邻居用户之间的关系值。
CN201810870249.6A 2018-08-02 2018-08-02 一种获得商品推荐序列及商品推荐方法 Active CN109064285B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810870249.6A CN109064285B (zh) 2018-08-02 2018-08-02 一种获得商品推荐序列及商品推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810870249.6A CN109064285B (zh) 2018-08-02 2018-08-02 一种获得商品推荐序列及商品推荐方法

Publications (2)

Publication Number Publication Date
CN109064285A CN109064285A (zh) 2018-12-21
CN109064285B true CN109064285B (zh) 2021-02-02

Family

ID=64832818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810870249.6A Active CN109064285B (zh) 2018-08-02 2018-08-02 一种获得商品推荐序列及商品推荐方法

Country Status (1)

Country Link
CN (1) CN109064285B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112685629A (zh) * 2019-10-18 2021-04-20 北京星选科技有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
CN111143702B (zh) * 2019-12-16 2021-04-23 中国科学技术大学 基于图卷积神经网络的信息推荐方法、系统、设备和介质
CN111143678B (zh) * 2019-12-27 2023-10-17 第四范式(北京)技术有限公司 推荐系统和推荐方法
CN111161029B (zh) * 2019-12-30 2020-08-18 亳州职业技术学院 一种自推荐电子商务平台
CN111325614B (zh) * 2020-05-15 2020-11-24 支付宝(杭州)信息技术有限公司 电子对象的推荐方法、装置和电子设备
CN112308662A (zh) * 2020-10-09 2021-02-02 北京沃东天骏信息技术有限公司 评价晒单推荐方法和装置
CN113763016A (zh) * 2021-01-18 2021-12-07 北京京东乾石科技有限公司 一种评价信息推送方法和装置
CN112862567B (zh) * 2021-02-25 2022-12-23 华侨大学 一种在线展会的展品推荐方法与系统
CN114648391B (zh) * 2022-05-18 2022-08-12 湖南工商大学 一种网购信息推荐方法
CN115086701A (zh) * 2022-06-23 2022-09-20 咪咕动漫有限公司 直播中的抽奖处理方法、装置、设备及可读存储介质
CN116757794B (zh) * 2023-08-17 2024-06-18 酒仙网络科技股份有限公司 基于大数据的售酒小程序内产品推荐方法
CN117312878B (zh) * 2023-10-30 2024-05-14 青岛汇聚融合健康科技有限公司 商城用户标记的生成方法、生成系统、存储介质以及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101082972A (zh) * 2007-05-30 2007-12-05 华为技术有限公司 预测用户对商品的兴趣的方法、装置和广告发布方法
CN102156942A (zh) * 2011-04-08 2011-08-17 东华大学 一种基于无线射频技术的商品推荐方法
CN102609523A (zh) * 2012-02-10 2012-07-25 上海视畅信息科技有限公司 基于物品分类和用户分类的协同过滤推荐算法
CN103412948A (zh) * 2013-08-27 2013-11-27 北京交通大学 基于聚类的协同过滤的商品推荐方法及系统
CN107944487A (zh) * 2017-11-20 2018-04-20 北京信息科技大学 一种基于混合协同过滤算法的作物育种品种推荐方法
CN108197285A (zh) * 2018-01-15 2018-06-22 腾讯科技(深圳)有限公司 一种数据推荐方法以及装置
CN108205682A (zh) * 2016-12-19 2018-06-26 同济大学 一种用于个性化推荐的融合内容和行为的协同过滤方法
CN108334592A (zh) * 2018-01-30 2018-07-27 南京邮电大学 一种基于内容与协同过滤相结合的个性化推荐方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101030653B1 (ko) * 2009-01-22 2011-04-20 성균관대학교산학협력단 정보 엔트로피를 이용하여 유사도를 보정하는 사용자 기반 협업 필터링 추천 시스템
CN102169566A (zh) * 2010-02-26 2011-08-31 国际商业机器公司 在陌生领域中生成推荐项目的方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101082972A (zh) * 2007-05-30 2007-12-05 华为技术有限公司 预测用户对商品的兴趣的方法、装置和广告发布方法
CN102156942A (zh) * 2011-04-08 2011-08-17 东华大学 一种基于无线射频技术的商品推荐方法
CN102609523A (zh) * 2012-02-10 2012-07-25 上海视畅信息科技有限公司 基于物品分类和用户分类的协同过滤推荐算法
CN103412948A (zh) * 2013-08-27 2013-11-27 北京交通大学 基于聚类的协同过滤的商品推荐方法及系统
CN108205682A (zh) * 2016-12-19 2018-06-26 同济大学 一种用于个性化推荐的融合内容和行为的协同过滤方法
CN107944487A (zh) * 2017-11-20 2018-04-20 北京信息科技大学 一种基于混合协同过滤算法的作物育种品种推荐方法
CN108197285A (zh) * 2018-01-15 2018-06-22 腾讯科技(深圳)有限公司 一种数据推荐方法以及装置
CN108334592A (zh) * 2018-01-30 2018-07-27 南京邮电大学 一种基于内容与协同过滤相结合的个性化推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Recommendation systems: Principles, methods and evaluation;F.O.Isinkaye等;《Egyptian Informatics Journal》;20151130;第16卷(第3期);第261-273页 *
基于基准相似空间分布优化的偏好预测方法;高岭等;《计算机研究与发展》;20180531;第55卷(第5期);第977-985页 *

Also Published As

Publication number Publication date
CN109064285A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
CN109064285B (zh) 一种获得商品推荐序列及商品推荐方法
CN108629665B (zh) 一种个性化商品推荐方法和系统
US20100223258A1 (en) Information retrieval system and method using a bayesian algorithm based on probabilistic similarity scores
CN107833117B (zh) 一种考虑标签信息的贝叶斯个性化排序推荐方法
CN104252456B (zh) 一种权重估计方法、装置及系统
CN108182621A (zh) 商品推荐方法及商品推荐装置、设备和存储介质
Tewari et al. Sequencing of items in personalized recommendations using multiple recommendation techniques
US8825641B2 (en) Measuring duplication in search results
US20130173583A1 (en) Keyword index pruning
CN108287916B (zh) 一种资源推荐方法
CN111651678B (zh) 一种基于知识图谱的个性化推荐方法
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN111310046A (zh) 对象推荐方法及装置
CN112487199A (zh) 一种基于用户购买行为的用户特征预测方法
CN115760202A (zh) 一种基于人工智能的产品运营管理系统及方法
CN112182390B (zh) 一种函件推送方法、装置、计算机设备及存储介质
CN106919647B (zh) 一种基于聚类的网络结构相似性推荐方法
US8484201B2 (en) Comparative entity mining
CN114282119B (zh) 一种基于异构信息网络的科技信息资源检索方法及系统
CN115131108A (zh) 一种电商商品筛选系统
Hu et al. Utilizing users' tipping points in E-commerce Recommender systems
JP7158870B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
CN116402565B (zh) 一种基于大数据分析的商品推荐方法及系统
CN113781076B (zh) 提示方法、装置、设备及可读存储介质
CN116738035B (zh) 一种基于窗口滑动的推荐重排方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant