CN108595533B - 一种基于协同过滤的物品推荐方法、存储介质及服务器 - Google Patents

一种基于协同过滤的物品推荐方法、存储介质及服务器 Download PDF

Info

Publication number
CN108595533B
CN108595533B CN201810284795.1A CN201810284795A CN108595533B CN 108595533 B CN108595533 B CN 108595533B CN 201810284795 A CN201810284795 A CN 201810284795A CN 108595533 B CN108595533 B CN 108595533B
Authority
CN
China
Prior art keywords
user
feature vector
item
model
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810284795.1A
Other languages
English (en)
Other versions
CN108595533A (zh
Inventor
郑炯彬
蔡婉铃
黎琳
潘微科
彭小刚
明仲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201810284795.1A priority Critical patent/CN108595533B/zh
Publication of CN108595533A publication Critical patent/CN108595533A/zh
Application granted granted Critical
Publication of CN108595533B publication Critical patent/CN108595533B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于协同过滤的物品推荐方法、存储介质及服务器,方法包括步骤:获取近邻用户特征向量和近邻物品特征向量,采用不同组合方式形成多种邻域信息;将所述领域信息融合到与其相对应的协同过滤推荐模型中,根据融合模型预测得出用户偏好的物品列表并推荐给用户。本发明针对不同的问题选取不同的协同过滤推荐模型,并将相应的邻域信息融合到所述协同过滤推荐模型中,实现全局信息与邻域信息的融合,通过两种信息的融合互补能够更加准确地预测用户偏好的物品列表,从而将物品有效推荐给用户。

Description

一种基于协同过滤的物品推荐方法、存储介质及服务器
技术领域
本发明涉及物品推荐领域,尤其涉及一种基于协同过滤的物品推荐方法、存储介质及服务器。
背景技术
在用户数据建模问题中,用户显示反馈数据建模问题是最经典的推荐算法求解问题,其目标在于根据用户历史评分数据构建模型学习用户的偏好,即求出用户对其他物品的预测评分,这里的评分对应了用户对物品的偏好程度,根据所述偏好程度可得出更好的推荐效果。面向用户显示反馈数据建模的经典推荐算法有很多,基于模型的协同过滤算法根据训练准则不同,可以具体分为pointwise和pairwise两种。基于pointwise是指训练过程中,只采样单个用户和物品,在一定的迭代次数范围内不断优化训练函数,而基于pairwise是指采样单个用户和两个物品,训练函数中将两个物品的矩阵乘积作差,从而对差值进行优化。基于pointwise方法中比较典型的为概率矩阵分解(Probabilistic MatrixFactorization,PMF)模型,该模型将用户对物品的预测评分分解成用户特征向量和物品特征向量的乘积并进行优化。此外还有增强的奇异值分解(Enhanced Singular ValueDecomposition,SVD++)模型,该模型同样是通过矩阵分解的方式,将潜在向量模型和物品间相似度模型进行融合,使得融合后的模型比单一模型的效果更好。多类别偏好上下文学习(Matrix Factorization with Multiclass Preference Context,MF-MPC)模型则是从用户评分反馈的类别角度出发,提出在求解面向用户显式反馈数据建模问题时,通过更细粒度的多类别偏好上下文信息来构建模型。相比PMF模型,SVD++模型在构建模型时考虑了单类别评分反馈的上下文信息,也就是将虚拟用户的特征向量转换成已评价过的物品特征向量表示,并添加到原有的矩阵分解模型中,从而提高了整体模型的推荐效果。而MF-MPC模型则利用多类别偏好上下文偏好信息,具体是将每个用户对物品的评分划分为一个评分类别,所有用户的评分则构成一个评分类别集合,相当于SVD++模型是MF-MPC模型的一个特例。
在现实场景中,互联网平台收集到的用户数据更多的是隐式反馈或是单类反馈,具体是将用户的行为用二元值形式来表示,1表示评价过,0表示未评价过。这类数据相比用户显式反馈数据更容易收集和存储,因此关于用户隐式反馈数据建模的推荐算法研究受到越来越多的关注。按照协同过滤推荐算法的思想,用户隐式反馈数据建模同样是根据用户历史数据,来预测用户未来可能的行为,其目的是生成面向用户的个性化物品排序列表。面向用户隐式反馈数据建模的推荐算法里最具代表性的是权值回归矩阵分解(WeightedRegression Matrix Factorization,WRMF)模型,该模型将矩阵分解的方式应用在用户隐式反馈数据建模问题上。WRMF模型认为数据集中观测到的用户物品对(u,i),属于正样本,也就是用户u喜欢或评价过的物品i。而在数据集中未观测到的则归为负样本,但是正样本和负样本都存在一个置信度问题。WRMF模型提出基于用户u对物品i产生的行为次数越多,则可信度越大的假设。同样是面向用户隐式反馈数据建模,基于pointwise的FISM模型,在相同数据集上的实验效果要比WRMF的好。FISM模型将用户u对物品i预测偏好转换成物品i与物品j的相似度之和,结合矩阵分解的思想,将物品间相似度表示成两个物品特征矩阵的乘积。
大部分的经典推荐模型是基于矩阵分解方式构建的,其中SVD++模型在求解面向用户显式反馈数据建模问题时,潜在向量模型是对用户整体评分具有有效的预测,涉及训练集中的大部分或所有物品。而物品间相似度模型在探测局域关系时,只识别到少数重要物品的邻域关系,通常忽略用户大量的打分记录,所以导致无法捕捉到包含在所有用户和物品里的微弱特征。而面向用户隐式反馈数据建模的WRMF模型则偏向于通过用户向量和物品向量之间传递信息来学习用户对物品的偏好,FISM模型偏向于通过物品向量之间传递信息来学习用户对物品的偏好,但从两个模型在相同数据集上的实验结果可以看出通过物品间向量的建模方式更有利于学习用户对物品的偏好。对于这两个求解用户隐式反馈数据建模的推荐模型都只是通过传统矩阵分解方式进行全局的信息传递,其推荐效果仍有提高的空间。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种基于协同过滤的物品推荐方法、存储介质及服务器,旨在解决现有方法在预测用户偏好的物品列表时,未考虑邻域信息导致物品推荐效果较差的问题。
本发明的技术方案如下:
一种基于协同过滤的物品推荐方法,其中,包括步骤:
获取近邻用户特征向量和近邻物品特征向量,采用不同组合方式形成多种邻域信息;
将所述领域信息融合到与其相对应的协同过滤推荐模型中,根据融合模型预测得出用户偏好的物品列表并推荐给用户。
所述的基于协同过滤的物品推荐方法,其中,所述步骤获取近邻用户特征向量和近邻物品特征向量,采用不同组合方式形成多种邻域信息,具体包括:
将近邻用户特征向量与物品特征向量的乘积作为邻域信息;
或将近邻物品特征向量与用户特征向量的乘积作为邻域信息;
或将近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和作为近邻信息。
所述的基于协同过滤的物品推荐方法,其中,当采用的协同过滤推荐模型为FISM模型时,则将近邻用户特征向量与物品特征向量的乘积作为邻域信息并融合到所述FISM模型中,得到的融合模型公式为:
Figure BDA0001615702190000031
其中,
Figure BDA0001615702190000041
为近邻用户特征向量与物品特征向量的乘积,Nu代表用户u的近邻用户集合,Xu'.代表近邻用户u'的特征向量,Vi.是物品i的特征向量,α是规范化参数,取值范围为[0,1];bu是表示用户u的偏差,bi是表示物品i的偏差,Wj.是物品j的特征向量,Iu代表用户u的物品集合。
所述的基于协同过滤的物品推荐方法,其中,当采用的系统过滤推荐模型为FISM模型时,将近邻物品特征向量与用户特征向量的乘积作为邻域信息融合到所述FISM模型中,得到的融合模型公式为:
Figure BDA0001615702190000042
其中,
Figure BDA0001615702190000043
为近邻物品特征向量与用户特征向量的乘积,Ni代表物品i的近邻物品集合,Yi'代表近邻物品i'的特征向量,Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];bu是表示用户u的偏差,bi是表示物品i的偏差,Wj.是物品j的特征向量,Vi.是物品i的特征向量,Iu代表用户u的物品集合。
所述的基于协同过滤的物品推荐方法,其中,当采用的系统过滤推荐模型为PMF模型时,则将近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和作为近邻信息融合到所述PMF模型中,得到的融合模型公式为:
Figure BDA0001615702190000044
其中,
Figure BDA0001615702190000045
为近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和,Nu代表用户u的近邻用户集合,Ni代表物品i的近邻物品集合,Xu'.代表近邻用户u'的特征向量,Yi'.代表近邻物品i'的特征向量,Vi.是物品i的特征向量,而Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];μ代表全局平均分,bu是代表用户u的偏差,bi是代表物品i的偏差。
所述的基于协同过滤的物品推荐方法,其中,当采用的系统过滤推荐模型为SVD++模型时,则将近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和作为近邻信息融合到所述SVD++模型中,得到的融合模型公式为:
Figure BDA0001615702190000051
其中,
Figure BDA0001615702190000052
为近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和,Nu代表用户u的近邻用户集合,Ni代表物品i的近邻物品集合,Xu'.代表近邻用户u'的特征向量,Yi'.代表近邻物品i'的特征向量,Vi.是物品i的特征向量,而Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];μ代表全局平均分,bu是代表用户u的偏差,bi是代表物品i的偏差,Wj.是物品j的特征向量,Iu代表用户u的物品集合。
所述的基于协同过滤的物品推荐方法,其中,当采用的系统过滤推荐模型为MF-MPC模型时,则将近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和作为近邻信息融合到所述MF-MPC模型中,得到的融合模型公式为:
Figure BDA0001615702190000053
其中,
Figure BDA0001615702190000054
为近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和,Nu代表用户u的近邻用户集合,Ni代表物品i的近邻物品集合,Xu'.代表近邻用户u'的特征向量,Yi'.代表近邻物品i'的特征向量,Vi.是物品i的特征向量,而Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];μ代表全局平均分,bu是代表用户u的偏差,bi是代表物品i的偏差,M代表用户对物品的评分所属的类别集合,
Figure BDA0001615702190000062
是评分类别为r时物品j的特征向量,
Figure BDA0001615702190000061
代表用户u的评分类别为r的物品集合。
一种计算机可读存储介质,其中,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序被一个或多个处理器执行,以实现一种基于协同过滤的物品推荐方法的步骤。
一种应用服务器,其中,包括至少一个处理器、显示屏、存储器以及通信接口和总线,所述处理器、显示屏、存储器和通信接口通过总线完成相互间的通信,所述处理器调用存储器中的逻辑指令以执行一种基于协同过滤的物品推荐方法的步骤。
有益效果:本发明通过获取近邻用户特征向量和近邻物品特征向量,并采用不同组合方式形成多种邻域信息,针对不同的问题选取不同的协同过滤推荐模型,并将相应的邻域信息融合到所述协同过滤推荐模型中,实现全局信息与邻域信息的融合,通过两种信息的融合互补能够更加准确地预测用户偏好的物品列表,从而将物品有效推荐给用户。
附图说明
图1为本发明一种基于协同过滤的物品推荐方法较佳实施例的流程图。
图2为本发明一种应用服务器较佳实施例的结构框图。
具体实施方式
本发明提供一种基于协同过滤的物品推荐方法、存储介质及服务器,为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,图1为本发明提供的一种基于协同过滤的物品推荐方法较佳实施例的流程图,其中,如图所示,包括步骤:
S10、获取近邻用户特征向量和近邻物品特征向量,采用不同组合方式形成多种邻域信息;
S20、将所述领域信息融合到与其相对应的协同过滤推荐模型中,根据融合模型预测得出用户偏好的物品列表并推荐给用户。
具体来讲,目前协同过滤推荐算法中主要分为基于邻域和基于模型两大类,基于邻域的协同过滤推荐模型,具体又可以分为基于用户邻域的协同过滤(User-basedCollaborative Filtering,UCF)模型和基于物品邻域的协同过滤(Item-basedCollaborative Filtering,ICF)模型。其中UCF模型是基于过去评价过的物品来计算得到相似的用户,核心步骤是先求解用户之间的相似度,并根据用户间相似度进行排序得出用户u的最近邻用户列表,其次求出以往评价过物品i的用户集合和用户u的最近邻集合之间的交集,最后对交集中用户间相似度和用户对物品评分的乘积进行求和得出用户u对物品i的预测评分。
相对于UCF模型,ICF模型则是基于过去评价过的物品。由于模型简单有效,基于邻域的算法在很多国内外知名的电商得到广泛应用,但随着数据集的不断增大,其计算成本也在成倍递增。和基于邻域的算法不同,基于模型的算法因其高效准确的优势被广泛地研究。根据训练准则不同基于模型的协同过滤算法可以分为pointwise和pairwise两种。其中具有代表性的就是基于pointwise训练准则的正则化约束的奇异值分解(RegularizedSingular Value Decomposition,RSVD)模型。RSVD则属于pointwise方法,其通过矩阵分解的方式,将用户对物品的预测评分分解成用户特征向量和物品特征向量的乘积并进行优化,模型的训练函数公式为:
Figure BDA0001615702190000081
其中yui={1,0},代表用户u对物品i是否有评分,1代表有评分,否则为0。
Figure BDA0001615702190000082
是指训练函数中的正则化项,用于防止模型过拟合。最终将训练后的用户特征向量Uu.和物品特征向量Vi.乘积以及用户全局平均评分、用户偏差、物品的偏差作为用户u对物品i的预测评分,具体预测公式为:
Figure BDA0001615702190000083
其中μ代表全局平均评分,bu是代表用户u的偏差,bi是代表物品i的偏差,而实验中设定的用户特征向量和物品特征向量的维度数,一般是根据具体的实验数据集进行设定。
最具代表性的面向用户隐式反馈数据建模方法是贝叶斯个性化排序(BayesianPersonalized Ranking,BPR)模型,提出用户对评价过物品的偏好大于没评价过物品的假设,在用户隐式反馈数据集上,采用基于pairwise的训练准则。在训练过程中,随机采样一个三元组(u,i,j),通过sigmoid函数来量化预测偏好差值的概率,训练最小化该概率的相反数,具体的训练函数公式为:
Figure BDA0001615702190000084
其中,三元组(u,i,j)所对应的预测公式为:
Figure BDA0001615702190000085
而差值的概率对应公式为:
Figure BDA0001615702190000086
Figure BDA0001615702190000087
是指训练函数中的正则化项,用于防止模型过拟合。
在2016年,Weike Pan等人提出了利用迁移学习的思想,构建应用迁移学习的联合相似度学习(Transfer via Joint Similarity Learning,TJSL)模型。TJSL模型是面向用户隐式反馈数据建模,通过模型来求出用户u对物品i的预测偏好的,而用户隐式反馈数据中只包含用户的评价记录,不包含用户对物品的评分。TJSL模型的核心思想是结合了分解物品相似度(FactoredItem Similarity Model,FISM)模型和boosting学习方法。它的训练函数如公式为:
Figure BDA0001615702190000091
其中,
Figure BDA0001615702190000092
是经过模型第l次挑选后的用户u的物品集合,而
Figure BDA0001615702190000093
是指训练函数中的正则化项,用于防止模型过拟合。
FISM模型面向用户隐式反馈数据建模,通过矩阵分解方式学习得到物品i与物品j的特征矩阵乘积。而TJSL模型则在此基础上,引入了另一种内容的数据,比如用户的历史浏览行为数据,同样通过矩阵分解的方式学习物品i与物品k之间的相似度。并且利用boosting学习方法,在模型训练过程中通过对其它内容的数据进行筛选。具体做法是在每次模型迭代中,挑选出上一轮数据的90%作为一下轮模型的数据输入,目的是为了挑选出更有代表性的辅助数据,最后把多轮模型的预测偏好进行加权平均,作为最终用户u对物品i的预测偏好,TJSL模型的预测为:
Figure BDA0001615702190000094
其中,bu是表示用户u的偏差,bi是表示物品i的偏差,Wj.是物品j的特征向量,Ek.是物品k的特征向量,Vi.是物品i的特征向量,Iu是指用户物品集合,
Figure BDA0001615702190000095
是经过模型第l次挑选后的用户u的物品集合。TJSL模型是已有的面向用户隐式反馈数据建模的推荐算法之一,同时它也是利用异构数据成功提高原有FISM模型的推荐算法。相比于原有的面向用户数据建模的推荐算法,它成功利用了更多不同内容的数据,从而提高原有经典推荐算法的准确度,这给面向用户隐式反馈数据建模的推荐算法研究提供了一个很好的思路。
现有基于矩阵分解方式构建的推荐模型在求解面向用户显示反馈数据建模问题时,例如SVD++模型中,潜在向量模型是对用户整体评分具有有效的预测,涉及训练集中的大部分或所有物品。而物品间相似度模型在探测局域关系时,只识别到少数重要物品的邻域关系,通常忽略用户大量的打分记录,所以导致无法捕捉到包含在所有用户和物品里的微弱特征。
现有面向用户隐式反馈数据建模的WRMF模型则偏向于通过用户向量和物品向量之间传递信息来学习用户对物品的偏好,FISM模型偏向于通过物品向量之间传递信息来学习用户对物品的偏好,但从两个模型在相同数据集上的实验结果可以看出通过物品间向量的建模方式更有利于学习用户对物品的偏好。对于这两个求解用户隐式反馈数据建模的推荐模型都只是通过传统矩阵分解方式进行全局的信息传递,其推荐效果仍有提高的空间。
为解决现有推荐模型所存在的问题,本发明提出将邻用户特征向量和近邻物品特征向量组合成邻域信息,将所述邻域信息应用于矩阵分解方式构建的模型中,可以有效地增强经典的推荐模型学习到的全局信息。通过两种信息进行互补,可以显著地提高基础推荐模型的效果。
具体来讲,对于求解用户隐式反馈数据建模问题,本发明利用邻域信息增强的思想来提高已有的矩阵分解推荐算法效果,并构建了基于用户近邻增强的矩阵分解(UserNeighborhood-enhanced Matrix Factorization,U-NeiMF)模型和基于物品近邻增强的矩阵分解(Item Neighborhood-enhanced Matrix Factorization,I-NeiMF)模型。
FISM模型的核心是将用户对物品的偏好信息分解成物品间的特征向量乘积,代表用户和物品关联的全局信息,本发明提出的U-NeiMF模型核心则是添加近邻用户特征向量和物品特征向量乘积,作为邻域信息添加到模型中,得到的融合模型公式为:
Figure BDA0001615702190000111
其中,
Figure BDA0001615702190000112
为近邻用户特征向量与物品特征向量的乘积,Nu代表用户u的近邻用户集合,Xu'.代表近邻用户u'的特征向量,Vi.是物品i的特征向量,α是规范化参数,取值范围为[0,1];bu是表示用户u的偏差,bi是表示物品i的偏差,Wj.是物品j的特征向量,Iu代表用户u的物品集合。
相比于FISM模型将用户对物品的偏好信息分解成物品间的特征向量乘积,代表用户和物品的全局信息,I-NeiMF模型则是添加近邻物品特征向量和用户特征向量乘积,作为邻域信息添加到模型中,其融合模型公式为:
Figure BDA0001615702190000113
其中,
Figure BDA0001615702190000114
为近邻物品特征向量与用户特征向量的乘积,Ni代表物品i的近邻物品集合,Yi'代表近邻物品i'的特征向量,Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];bu是表示用户u的偏差,bi是表示物品i的偏差,Wj.是物品j的特征向量,Vi.是物品i的特征向量,Iu代表用户u的物品集合。
进一步地,本发明针对用户显式反馈数据建模问题,提出基于邻域的偏好上下文学习(Neighborhood-enhanced Preference Context Learning,Nei-PCL)推荐算法框架,根据该框架,根据该框架在PMF、SVD++、MF-MPC三个经典推荐模型上进行改进,同时添加用户和物品的近邻项,得到Nei-PMF、Nei-SVD++、Nei-MPC三个独立的新模型,这三个新模型在原有模型上引入了用户和物品的局部上下文信息,使得偏好上下文学习更加充分,达到提到原有模型推荐效果的目的。
PMF模型的核心是构建用户和物品的特征向量,获得用户和物品的全局上下文信息,而Nei-PMF的核心是引入用户和物品近邻信息来补充学习,添加的用户近邻项和物品近邻项同样通过矩阵分解的方式构建,其融合模型公式为
Figure BDA0001615702190000121
其中,
Figure BDA0001615702190000122
为近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和,Nu代表用户u的近邻用户集合,Ni代表物品i的近邻物品集合,Xu'.代表近邻用户u'的特征向量,Yi'.代表近邻物品i'的特征向量,Vi.是物品i的特征向量,而Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];μ代表全局平均分,bu是代表用户u的偏差,bi是代表物品i的偏差。
SVD++模型的核心是对潜在向量模型和物品间相似度模型的融合,使得融合后的模型效果比单一模型更优,而Nei-SVD++的核心是引入近邻信息,弥补了在SVD++模型中无法捕捉到所有用户和物品特征的缺陷,添加的用户近邻项和物品近邻项同样通过矩阵分解的方式构建,其融合模型公式为:
Figure BDA0001615702190000123
其中,
Figure BDA0001615702190000124
为近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和,Nu代表用户u的近邻用户集合,Ni代表物品i的近邻物品集合,Xu'.代表近邻用户u'的特征向量,Yi'.代表近邻物品i'的特征向量,Vi.是物品i的特征向量,而Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];μ代表全局平均分,bu是代表用户u的偏差,bi是代表物品i的偏差,Wj.是物品j的特征向量,Iu代表用户u的物品集合。
MF-MPC模型的核心是将用户对物品的评分进行类别的划分,将SVD++模型看成其一个特例,使潜在向量模型和邻域模型两个模型的融合更加有效,而Nei-MPC的核心是引入近邻信息,添加了在MF-MPC模型中所没有的用户和近邻的信息,和原有模型的多类别上下文信息互补,使模型对用户的偏好预测更加精确,同样通过矩阵分解的方式来构建,其融合模型公式为:
Figure BDA0001615702190000131
其中,
Figure BDA0001615702190000132
为近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和,Nu代表用户u的近邻用户集合,Ni代表物品i的近邻物品集合,Xu'.代表近邻用户u'的特征向量,Yi'.代表近邻物品i'的特征向量,Vi.是物品i的特征向量,而Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];μ代表全局平均分,bu是代表用户u的偏差,bi是代表物品i的偏差,M代表用户对物品的评分所属的类别集合,
Figure BDA0001615702190000133
是评分类别为r时物品j的特征向量,
Figure BDA0001615702190000134
代表用户u的评分类别为r的物品集合。
无论是对于求解用户隐式反馈数据建模问题还是对于求解用户显式反馈数据建模问题,本发明通过将全局信息和邻域信息进行融合,通过两种信息的互补能够更加准确地预测用户偏好的物品列表,从而将物品有效推荐给用户。
基于上述基于协同过滤的物品推荐方法,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一实施例所述的基于协同过滤的物品推荐方法中的步骤。
基于上述基于协同过滤的物品推荐方法,本发明还提供了一种应用服务器,如图2所示,其包括至少一个处理器(processor)20;显示屏21;以及存储器(memory)22,还可以包括通信接口(Communications Interface)23和总线24。其中,处理器20、显示屏21、存储器22和通信接口23可以通过总线24完成相互间的通信。显示屏21设置为显示初始设置模式中预设的用户引导界面。通信接口23可以传输信息。处理器20可以调用存储器22中的逻辑指令,以执行上述实施例中的方法。
此外,上述的存储器22中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器22作为一种计算机可读存储介质,可设置为存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令或模块。处理器30通过运行存储在存储器22中的软件程序、指令或模块,从而执行功能应用以及数据处理,即实现上述实施例中的方法。
存储器22可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器。例如,U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
此外,上述存储介质以及移动终端中的多条指令处理器加载并执行的具体过程在上述方法中已经详细说明,在这里就不再一一陈述。
综上所述,本发明通过获取近邻用户特征向量和近邻物品特征向量,并采用不同组合方式形成多种邻域信息,针对不同的问题选取不同的协同过滤推荐模型,并将相应的邻域信息融合到所述协同过滤推荐模型中,实现全局信息与邻域信息的融合,通过两种信息的融合互补能够更加准确地预测用户偏好的物品列表,从而将物品有效推荐给用户。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (8)

1.一种基于协同过滤的物品推荐方法,其特征在于,包括步骤:
获取近邻用户特征向量和近邻物品特征向量,采用不同组合方式形成多种邻域信息;
将所述领域信息融合到与其相对应的协同过滤推荐模型中,根据融合模型预测得出用户偏好的物品列表并推荐给用户;
所述组合方式具体包括:
将近邻用户特征向量与物品特征向量的乘积作为邻域信息;
或将近邻物品特征向量与用户特征向量的乘积作为邻域信息;
或将近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和作为近邻信息;
所述协同过滤推荐模型包括用于求解用户隐式反馈数据建模问题的推荐模型和用于求解用户显式反馈数据建模问题的推荐模型。
2.根据权利要求1所述的基于协同过滤的物品推荐方法,其特征在于,当采用的协同过滤推荐模型为FISM模型时,则将近邻用户特征向量与物品特征向量的乘积作为邻域信息并融合到所述FISM模型中,得到的融合模型公式为:
Figure FDA0003123716280000011
其中,
Figure FDA0003123716280000012
为近邻用户特征向量与物品特征向量的乘积,Nu代表用户u的近邻用户集合,Xu'.代表近邻用户u'的特征向量,Vi.是物品i的特征向量,α是规范化参数,取值范围为[0,1];bu是表示用户u的偏差,bi是表示物品i的偏差,Wj.是物品j的特征向量,Iu代表用户u的物品集合。
3.根据权利要求1所述的基于协同过滤的物品推荐方法,其特征在于,当采用的系统过滤推荐模型为FISM模型时,将近邻物品特征向量与用户特征向量的乘积作为邻域信息融合到所述FISM模型中,得到的融合模型公式为:
Figure FDA0003123716280000021
其中,
Figure FDA0003123716280000022
为近邻物品特征向量与用户特征向量的乘积,Ni代表物品i的近邻物品集合,Yi'代表近邻物品i'的特征向量,Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];bu是表示用户u的偏差,bi是表示物品i的偏差,Wj.是物品j的特征向量,Vi.是物品i的特征向量,Iu代表用户u的物品集合。
4.根据权利要求1所述的基于协同过滤的物品推荐方法,其特征在于,当采用的系统过滤推荐模型为PMF模型时,则将近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和作为近邻信息融合到所述PMF模型中,得到的融合模型公式为:
Figure FDA0003123716280000023
其中,
Figure FDA0003123716280000031
为近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和,Nu代表用户u的近邻用户集合,Ni代表物品i的近邻物品集合,Xu'.代表近邻用户u'的特征向量,Yi'.代表近邻物品i'的特征向量,Vi.是物品i的特征向量,而Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];μ代表全局平均分,bu是代表用户u的偏差,bi是代表物品i的偏差。
5.根据权利要求1所述的基于协同过滤的物品推荐方法,其特征在于,当采用的系统过滤推荐模型为SVD++模型时,则将近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和作为近邻信息融合到所述SVD++模型中,得到的融合模型公式为:
Figure FDA0003123716280000032
,其中,
Figure FDA0003123716280000033
为近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和,Nu代表用户u的近邻用户集合,Ni代表物品i的近邻物品集合,Xu'.代表近邻用户u'的特征向量,Yi'.代表近邻物品i'的特征向量,Vi.是物品i的特征向量,而Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];μ代表全局平均分,bu是代表用户u的偏差,bi是代表物品i的偏差,Wj.是物品j的特征向量,Iu代表用户u的物品集合。
6.根据权利要求1所述的基于协同过滤的物品推荐方法,其特征在于,当采用的系统过滤推荐模型为MF-MPC模型时,则将近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和作为近邻信息融合到所述MF-MPC模型中,得到的融合模型公式为:
Figure FDA0003123716280000041
其中,
Figure FDA0003123716280000042
为近邻用户特征向量、物品特征向量之间的乘积与近邻物品特征向量、用户特征向量之间的乘积之和,Nu代表用户u的近邻用户集合,Ni代表物品i的近邻物品集合,Xu'.代表近邻用户u'的特征向量,Yi'.代表近邻物品i'的特征向量,Vi.是物品i的特征向量,而Uu.是用户u的特征向量,α是规范化参数,取值范围为[0,1];μ代表全局平均分,bu是代表用户u的偏差,bi是代表物品i的偏差,M代表用户对物品的评分所属的类别集合,
Figure FDA0003123716280000043
是评分类别为r时物品j的特征向量,
Figure FDA0003123716280000044
代表用户u的评分类别为r的物品集合。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序被一个或多个处理器执行,以实现上述权利要求1-6任意一种基于协同过滤的物品推荐方法的步骤。
8.一种应用服务器,其特征在于,包括至少一个处理器、显示屏、存储器以及通信接口和总线,所述处理器、显示屏、存储器和通信接口通过总线完成相互间的通信,所述处理器调用存储器中的逻辑指令以执行权利要求上述权利要求1-6任意一种基于协同过滤的物品推荐方法的步骤。
CN201810284795.1A 2018-04-02 2018-04-02 一种基于协同过滤的物品推荐方法、存储介质及服务器 Active CN108595533B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810284795.1A CN108595533B (zh) 2018-04-02 2018-04-02 一种基于协同过滤的物品推荐方法、存储介质及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810284795.1A CN108595533B (zh) 2018-04-02 2018-04-02 一种基于协同过滤的物品推荐方法、存储介质及服务器

Publications (2)

Publication Number Publication Date
CN108595533A CN108595533A (zh) 2018-09-28
CN108595533B true CN108595533B (zh) 2021-09-14

Family

ID=63624193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810284795.1A Active CN108595533B (zh) 2018-04-02 2018-04-02 一种基于协同过滤的物品推荐方法、存储介质及服务器

Country Status (1)

Country Link
CN (1) CN108595533B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008410A (zh) * 2019-04-16 2019-07-12 上饶市中科院云计算中心大数据研究院 一种产品个性化推荐方法
CN110889747B (zh) * 2019-12-02 2023-05-09 腾讯科技(深圳)有限公司 商品推荐方法、装置、系统、计算机设备及存储介质
CN112036980A (zh) * 2020-08-31 2020-12-04 北京明略昭辉科技有限公司 一种物品推荐方法、装置、电子设备及存储介质
CN112182131B (zh) * 2020-09-28 2021-11-09 中国电子科技集团公司第五十四研究所 一种基于多属性融合的遥感影像推荐方法
CN112330405B (zh) * 2020-11-10 2023-11-24 深圳大学 一种面向物品集显式反馈的推荐方法、终端及存储介质
CN113077313B (zh) * 2021-04-13 2022-09-13 合肥工业大学 融合用户生成场景图像与个性化偏好的互补品推荐方法
CN113379482B (zh) * 2021-05-28 2023-12-01 车智互联(北京)科技有限公司 一种物品推荐方法、计算设备以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8909626B2 (en) * 2009-03-31 2014-12-09 Yahoo! Inc. Determining user preference of items based on user ratings and user features
CN105574216A (zh) * 2016-03-07 2016-05-11 达而观信息科技(上海)有限公司 基于概率模型和用户行为分析的个性化推荐方法、系统
CN106326367A (zh) * 2016-08-11 2017-01-11 华南师范大学 基于wnbi和rsvd混合协同推荐算法
CN107368519A (zh) * 2017-06-05 2017-11-21 桂林电子科技大学 一种契合用户兴趣变化的协同处理方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8001132B2 (en) * 2007-09-26 2011-08-16 At&T Intellectual Property I, L.P. Methods and apparatus for improved neighborhood based analysis in ratings estimation
EP2463818A1 (en) * 2010-12-07 2012-06-13 Digital Foodie Oy A method for creating computer generated shopping list

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8909626B2 (en) * 2009-03-31 2014-12-09 Yahoo! Inc. Determining user preference of items based on user ratings and user features
CN105574216A (zh) * 2016-03-07 2016-05-11 达而观信息科技(上海)有限公司 基于概率模型和用户行为分析的个性化推荐方法、系统
CN106326367A (zh) * 2016-08-11 2017-01-11 华南师范大学 基于wnbi和rsvd混合协同推荐算法
CN107368519A (zh) * 2017-06-05 2017-11-21 桂林电子科技大学 一种契合用户兴趣变化的协同处理方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Transfer Learning for Heterogeneous One-Class Collaborative Filtering;Weike Pan et al;《Intelligent Systems IEEE》;20160831;第31卷(第4期);全文 *
一种融合近邻用户影响力的矩阵分解推荐算法;李昆仑等;《小型微型计算机系统》;20180131;第39卷(第1期);第37-41页 *
基于上下文属性信息的个性化推荐系统研究;刘振娇;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180115;第I138-2056页 *

Also Published As

Publication number Publication date
CN108595533A (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
CN108595533B (zh) 一种基于协同过滤的物品推荐方法、存储介质及服务器
CN110458663B (zh) 一种车辆推荐方法、装置、设备及存储介质
CN110263257B (zh) 基于深度学习处理多源异构数据的推荐方法
CN112232925A (zh) 一种融合知识图谱对商品进行个性化推荐的方法
CN110781409B (zh) 一种基于协同过滤的物品推荐方法
Nadimi-Shahraki et al. Cold-start problem in collaborative recommender systems: Efficient methods based on ask-to-rate technique
CN107545471B (zh) 一种基于高斯混合的大数据智能推荐方法
CN110619081A (zh) 一种基于交互图神经网络的新闻推送方法
US20220253722A1 (en) Recommendation system with adaptive thresholds for neighborhood selection
CN112884552B (zh) 一种基于生成对抗和知识蒸馏的轻量级多模推荐方法
CN110263245B (zh) 基于强化学习模型向用户推送对象的方法和装置
CN113761388B (zh) 一种推荐方法、装置、电子设备及存储介质
US20220253688A1 (en) Recommendation system with adaptive weighted baysian personalized ranking loss
Sivaramakrishnan et al. An effective user clustering-based collaborative filtering recommender system with grey wolf optimisation
Shi et al. Learning from heterogeneous sources via gradient boosting consensus
CN111949885A (zh) 一种面向旅游景点的个性化推荐方法
CN114756694B (zh) 基于知识图谱的推荐系统、推荐方法和相关设备
CN115618098B (zh) 基于知识增强与空洞卷积的冷链物流推荐方法及装置
CN115098692A (zh) 跨域推荐方法、装置、电子设备及存储介质
CN115329215A (zh) 异构网络中基于自适应动态知识图谱的推荐方法及系统
Ahamed et al. A recommender system based on deep neural network and matrix factorization for collaborative filtering
CN113610610A (zh) 基于图神经网络和评论相似度的会话推荐方法和系统
US20240242127A1 (en) Recommendation method and related apparatus
Liang et al. Top-N-rank: A scalable list-wise ranking method for recommender systems
CN117216281A (zh) 一种基于知识图谱的用户兴趣扩散推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant