CN112765458B - 基于度量分解和标签自适应分配权重的混合推荐方法 - Google Patents

基于度量分解和标签自适应分配权重的混合推荐方法 Download PDF

Info

Publication number
CN112765458B
CN112765458B CN202110018668.9A CN202110018668A CN112765458B CN 112765458 B CN112765458 B CN 112765458B CN 202110018668 A CN202110018668 A CN 202110018668A CN 112765458 B CN112765458 B CN 112765458B
Authority
CN
China
Prior art keywords
label
user
item
score
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110018668.9A
Other languages
English (en)
Other versions
CN112765458A (zh
Inventor
孙长银
张宇清
葛泉波
董璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202110018668.9A priority Critical patent/CN112765458B/zh
Publication of CN112765458A publication Critical patent/CN112765458A/zh
Application granted granted Critical
Publication of CN112765458B publication Critical patent/CN112765458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了基于度量分解和标签自适应分配权重的混合推荐方法,针对特定的用户及选定物品,利用预先构建的基于度量分解的模型得到该用户对该选定物品的第一预测评分;利用预先构建的基于标签的模型得到该用户对该选定物品的第二预测评分;将第一预测评分和第二预测评分进行加权求和确定该用户对该特定物品的最终预测评分;根据各用户对各物品的最终预测评分为用户推荐物品。本发明充分结合了欧式距离对个体数值特征的绝对差异的敏感性以及余弦相似度对方向和比例的敏感性,引入了物品的标签信息并有效加以利用,使得评分预测结果更加全面且准确。

Description

基于度量分解和标签自适应分配权重的混合推荐方法
技术领域
本发明属于机器学习领域,针对动漫评分预测场景涉及一种基于度量分解和标签自适应分配权重的混合推荐方法。
背景技术
推荐系统已在现代生活中得到越来越广泛的应用,并且它们发挥了越来越重要的作用。例如,电影,书籍,新闻和电子商务中都离不开推荐系统的存在。在过去的几十年中,大量信息的涌入使用户在面对海量数据时无所适从。如何准确地向用户推荐有用的信息并满足用户的相应兴趣和需求是非常重要的。手机的飞速发展使得当代网民更倾向于在手机上阅读新闻报道。因此,迫切需要从大量的信息中准确推荐符合用户兴趣的信息。推荐系统是可以预测用户对产品和信息的偏好或排序的模型,这是用户从互联网上大量信息中找到适合自己的信息和产品的重要渠道。
常见的推荐方法有基于内容的推荐方法、协同过滤推荐方法和混合推荐方法等。基于矩阵分解的推荐方法是比较流行且有效的一种推荐方法,它可以将难以处理的高维稀疏矩阵降维成低维特征矩阵,且训练数据量越大,精度越高,但是这种方法也存在其局限性。论文《Collaborative Filtering via Euclidean Embedding》首次提出了对于矩阵分解中的特征向量,使用其欧氏距离代替内积作为预测评分,以解决矩阵分解不满足三角不等式的问题。这一改进使得用户和物品的特征向量的可视化结果符合人类直觉,但是仍然存在着因为数据单一、难以利用其它特征和无法实现物品冷启动,而导致的预测结果不够合理和准确的问题。
发明内容
本发明为解决现有的推荐方法存在的预测结果不够合理和准确的问题,提出基于度量分解和标签自适应分配权重的混合推荐方法。
本发明采用以下技术方案,提供基于度量分解和标签自适应分配权重的混合推荐方法,包括:针对特定用户及各选定物品,利用预先构建的基于度量分解的模型得到所述特定用户对各选定物品的第一预测评分;利用预先构建的基于标签的模型得到所述特定用户对各选定物品的第二预测评分;分别将所述特定用户对同样的选定物品的第一预测评分和第二预测评分进行加权求和确定所述特定用户对各选定物品的最终预测评分;根据所述特定用户对各选定物品的最终预测评分为用户推荐物品。进一步地,所述的基于度量分解的模型训练方法包括如下步骤:构建用户物品评分矩阵S和物品标签特征向量,其中用户物品评分矩阵S的行索引是用户的标识号,列索引是物品的标识号,将用户物品评分矩阵S转化为距离矩阵D,方法如下:
D(u,i)=Maximum-S(u,i)
其中D(u,i)表示用户u对物品i的评分值与最大评分的距离,Maximum为数据集中允许出现的最大评分,S(u,i)表示用户u对物品i的评分值;
利用正态分布随机初始化一个(m+n)×k的矩阵,k表示隐向量维度;该矩阵的每一行代表一个用户的隐向量,表示为pu,或代表物品i的隐向量,表示为qi
利用正态分布随机初始化一个(m+n)×1的矩阵,其中m表示用户个数,n表示物品个数,用来保存与迭代bu和bi;bu为基于度量分解的模型的用户偏差,bi为基于度量分解的模型的物品偏差;
构造损失函数,表达式如下:
Figure BDA0002887588360000031
其中pu表示用户u的隐向量,
Figure BDA0002887588360000032
表示原始用户和物品间的欧式距离的平方,μ为全局偏差,qi表示物品i的隐向量,
Figure BDA0002887588360000033
表示
Figure BDA0002887588360000034
三元组格式的训练数据集,cui表示置信度系数,λ表示正则化系数,
Figure BDA0002887588360000035
为训练集中用户u对物品i的评分。
Figure BDA0002887588360000036
指在训练时,以设定的概率p随机丢弃
Figure BDA0002887588360000037
部分维度的分量;
基于三元组结构的数据
Figure BDA0002887588360000038
使用梯度下降方法来减小损失函数,优化相关参数,在每一次的对损失函数求导,计算梯度,更新参数后,按比例缩放得到更新的(m+n)×k的特征矩阵中每一行的特征向量使得它们的2范数等于超参数l,k表示隐向量维度;至此,基于度量分解的模型训练完成
再进一步地,cui的计算方法如下:
Figure BDA0002887588360000039
其中β为超参数,用来调节评分偏离Maximum/2的程度给损失函数带来的影响。
进一步地基于标签的模型的训练方法如下:
利用正态分布随机初始化一个m×L的用户标签特征矩阵,每一行代表用户u的基于标签的模型特征向量p′u,利用物品标签信息生成物品标签向量q′i
利用正态分布随机初始化一个(m+n)×1的矩阵,其中m表示用户个数,n表示物品个数,用来保存与迭代b′u和b′i。b′u为基于标签的模型的用户偏差,b′i为基于标签的模型的物品偏差。
使p′u与q′i做内积再加上偏差项得到基于标签的预测评分,表达式如下:
rui=p′uq′i+b′u+b′i+μ′
其中b′u表示基于标签的模型的用户偏差,b′i表示基于标签的模型的物品偏差,μ′为基于标签的模型的全局偏差;
构造基于标签的推荐算法的损失函数:
Figure BDA0002887588360000041
λ表示正则化系数,
Figure BDA0002887588360000042
表示
Figure BDA0002887588360000043
三元组格式的训练数据集,生成的评分矩阵S得到大量三元组结构的数据
Figure BDA0002887588360000044
使用梯度下降方法来减小损失函数,优化相关参数,至此,基于标签的模型训练完成。
进一步地将第一预测评分和第二预测评分进行加权求和确定该用户对该特定物品的最终预测评分的表达式如下:
R=(1-α)R1+αR2
其中R1表示第一预测评分,R2表示第二预测评分,α表示分配的权重系数。
进一步地分配的权重系数α的设定方法如下:
对训练集中的每一个三元组
Figure BDA0002887588360000051
对应的L维的物品标签向量q′i,计算其对应的标签重要性与评分重要性,表达式如下:
Figure BDA0002887588360000052
Figure BDA0002887588360000053
其中t表示L维的物品标签向量q′i中大于0的维度数,TI表示L维的物品标签向量q′i中大于0的维度数占总维数的比例,Ui表示给当前物品i评价过的用户数量,U表示用户总数,RI表示给当前item评价过的用户数占总用户数的比例。根据TI和RI确定分配的权重系数α。
可选的,所述梯度下降具体采用小批量随机梯度下降方法。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如以上技术方案任意一种可能实施方式所提供的方法的步骤。
本发明所取得的有益技术效果:
1、本发明充分结合了欧式距离对个体数值特征的绝对差异的敏感性以及余弦相似度对方向和比例的敏感性,引入了物品的标签信息并有效加以利用,使得评分预测结果更加全面且准确。
2、本发明谨慎评估了用户评分稀疏度和标签稀疏度对预测结果带来的影响,根据样本本身的特定情况自适应地分配预测评分的主要项和修正项的权重,使得预测结果更加合理且准确。
3、本发明对于物品标签信息的引入与利用有效地解决了物品的冷启动问题,生成的用户标签特征向量也增强了推荐结果的可解释性。
附图说明
图1是本方法具体实施例提供的方法的具体流程图。
具体实施方式
以下结合说明书附图和具体实施例对本发明做进一步地说明。
实施例一、基于度量分解和标签自适应分配权重的混合推荐方法本实施例针对动漫评分预测场景,针对特定用户及各选定物品,利用预先构建的基于度量分解的模型得到所述特定用户对各选定物品的第一预测评分;利用预先构建的基于标签的模型得到所述特定用户对各选定物品的第二预测评分;分别将所述特定用户对同样的选定物品的第一预测评分和第二预测评分进行加权求和确定所述特定用户对各选定物品的最终预测评分;根据所述特定用户对各选定物品的最终预测评分为用户推荐物品。训练步骤如图1所示,包括以下步骤:
训练步骤1,采集来自欧美权威动漫评价网站myanimelist.net的用户物品信息数据(用户id,动漫id,评分),构建用户物品评分矩阵S和物品标签特征向量。其中用户物品评分矩阵S的行索引是用户的id,列索引是物品的id,特定的行列索引定位的矩阵中的值即该用户对该物品的评分值;其中物品标签特征向量q′i从物品的标签信息中计算得到,可选地采用以下方法确定:设所有物品的标签信息中一共出现过L种不同的标签,对每一个物品按照其拥有的标签平均分配权重,最终会针对每个物品生成一个维度为L的标签特征向量,其中大部分维度下的值为0,值不为0的几个维度对应物品标签信息中拥有的几个标签,且总和为1。
训练步骤2,将评分矩阵S(相似度矩阵)转化为距离矩阵D:
D(u,i)=Maximum-S(u,i)
其中,Maximum为数据集中允许出现的最大评分。
训练步骤3,设数据集中一共有m个用户,n个物品,其特征维度k为超参数。利用正态分布随机初始化一个(m+n)×k的矩阵,该矩阵的每一行代表一个用户(物品)的隐向量pu(qi)。利用正态分布随机初始化一个(m+n)×1的矩阵,代表下一步骤中将要提到的基于度量分解模型的用户偏差bu和物品偏差bi。接下来需要构造一个损失函数,通过梯度下降法,不断优化上述矩阵。
训练步骤4,构造损失函数之前,需要先定义用户和物品间的距离:
Figure BDA0002887588360000071
即在原本的欧式距离的基础上加入用户偏差bu,物品偏差bi以及全局偏差μ,其中全局偏差μ由对距离矩阵D直接求平均值得到,用户偏差bu和物品偏差bi则通过梯度下降法训练得到。
训练步骤5,构造损失函数:
Figure BDA0002887588360000081
其中cui=1+β|yui-Maximum/2|,是置信度系数,给予偏离平均值较大的评分更高的权重。其中β为超参数,用来调节评分偏离Maximum/2的程度给损失函数带来的影响。其中dropout指在训练时,以p的概率随机丢弃
Figure BDA0002887588360000082
部分维度的分量,以达到减弱维度相关性的目的,在测试时则不需要这一操作。最后的平方项为正则化项。
训练步骤6,根据上述生成的距离矩阵D得到大量三元组结构的数据
Figure BDA0002887588360000083
代入数据,使用mini-batch SGD来减小损失函数,优化相关参数。在每一次的对损失函数求导,计算梯度,更新参数后,需要额外增加一个梯度裁剪的操作,即按比例缩放刚刚得到更新的(m+n)×k的特征矩阵中每一行的特征向量使得它们的2范数等于超参数l。至此,基于度量分解的模型训练完成,在测试步骤中会得到第一预测评分R1(主要项)。
训练步骤7,利用正态分布随机初始化一个m×L的用户标签特征矩阵,每一行代表用户u的基于标签的模型的特征向量p′u,利用物品标签信息生成物品标签向量q′i
利用正态分布随机初始化一个(m+n)×1的矩阵,其中m表示用户个数,n表示物品个数,用来保存与迭代b′u和b′i。b′u为基于标签的模型的用户偏差,b′i为基于标签的模型的物品偏差。
使p′u与q′i做内积再加上上述步骤提到的偏差项得到基于标签的预测评分:
rui=p′uq′i+b′u+b′i+μ′
b′u表示基于标签的模型的用户偏差,b′i表示基于标签的模型的物品偏差,μ′为基于标签的模型的全局偏差;
训练步骤8,构造基于标签的推荐算法的损失函数:
Figure BDA0002887588360000091
训练步骤9,根据上述生成的评分矩阵S得到大量三元组结构的数据
Figure BDA0002887588360000092
代入数据,使用mini-batch SGD来减小损失函数,优化相关参数。至此,基于标签的模型训练完成。在测试步骤中会得到第二预测评分R2(修正项)。
在测试步骤中会以通过权重系数α加权后的总评分作为最终预测结果R:
R=(1-α)R1+αR2
实施例二、在实施例一的基础上,为了使分配权重系统效果更好,本实施例采用以下方法设定分配权重系数α,包括:
训练步骤10,对训练集中的每一个三元组
Figure BDA0002887588360000093
对应的L维的物品标签向量q′i,计算其对应的标签重要性(Tag Importance)与评分重要性(Rating Importance):
Figure BDA0002887588360000101
Figure BDA0002887588360000102
其中t表示L维的物品标签向量q′i中大于0的维度数,TI表示L维的物品标签向量q′i中大于0的维度数占总维数的比例,Ui表示给当前物品i评价过的用户数量,U表示用户总数,RI表示给当前item评价过的用户数占总用户数的比例。
训练步骤11,调整超参数:
权重系数—α,隐向量维度—k,梯度裁剪clip value—l,dropout概率—p。
经过多次验证,按照如下方法分配权重系数α效果相对较好:
若TI≥RI,α=0.4;若TI<RI,α=0.1。
测试步骤1,将(u,i)代入基于度量分解的模型得到第一预测评分R1(主要项)。
Figure BDA0002887588360000103
R1=Maximum-yui
测试步骤2,将(u,i)代入基于标签的模型得到第二预测评分R2(修正项)。
R2=p′uq′i+b′u+b′i+μ′
测试步骤3,将第一预测评分和第二预测评分按照上述规则进行加权得到最终预测评分R。
R=(1-α)R1+αR2
以下表1为多种推荐算法在Anime Recommendations Database上的RMSE和MAE对比,以user id划分三个子集多次验证得到的结果。
从表1中可以看出,本方法在以user id划分的任意子集里,相较于其他方法均有相似幅度的RMSE和MAE的稳定提升,其推荐效果明显优于其他方法,同时也很好地缓解了item的冷启动。
表1对比结果
Figure BDA0002887588360000111
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (9)

1.基于度量分解和标签自适应分配权重的混合推荐方法,其特征在于,包括:针对特定用户及各选定物品,利用预先构建的基于度量分解的模型得到所述特定用户对各选定物品的第一预测评分;利用预先构建的基于标签的模型得到所述特定用户对各选定物品的第二预测评分;分别将所述特定用户对同样的选定物品的第一预测评分和第二预测评分进行加权求和确定所述特定用户对各选定物品的最终预测评分;根据所述特定用户对各选定物品的最终预测评分为用户推荐物品;
所述的基于度量分解的模型的训练方法包括如下步骤:
构建用户物品评分矩阵S,其中用户物品评分矩阵S的行索引是用户的标识号,列索引是物品的标识号,
将用户物品评分矩阵S转化为距离矩阵D,方法如下:
D(u,i)=Maximum-S(u,i)
其中D(u,i)表示用户u对物品i的评分值与最大评分的距离,Maximum为数据集中允许出现的最大评分,S(u,i)表示用户u对物品i的评分值;利用正态分布随机初始化一个(m+n)×k的矩阵,k表示隐向量维度;该矩阵保存每个用户的隐向量,表示为pu,以及每个物品的隐向量,表示为qi;利用正态分布随机初始化一个(m+n)×1的矩阵,其中m表示用户个数,n表示物品个数,用来保存与迭代bu和bi,bu为基于度量分解的模型的用户偏差,bi为基于度量分解的模型的物品偏差;
构造损失函数;
基于三元组结构的数据
Figure FDA0003714306250000021
使用梯度下降方法来减小损失函数,优化相关参数,在每一次的对损失函数求导,计算梯度,更新参数后,按比例缩放得到更新的(m+n)×k的特征矩阵中每一行的特征向量使得它们的2范数等于超参数l;至此,基于度量分解的模型训练完成;
基于标签的模型的训练方法如下:
利用正态分布随机初始化一个m×L的用户标签特征矩阵,每一行代表用户u的基于标签的模型的特征向量p′u
根据物品的标签信息确定物品标签特征向量q′i
利用正态分布随机初始化一个(m+n)×1的矩阵,其中m表示用户个数,n表示物品个数,用来保存与迭代b′u和b′i;b′u为基于标签的模型的用户偏差,b′i为基于标签的模型的物品偏差;
使p′u与q′i做内积再加上偏差项得到基于标签的预测评分rui,表达式如下:rui=p′uq′i+b′u+b′i+μ′,
其中b′u表示基于标签的模型用户偏差,b′i表示基于标签的模型物品偏差,μ′为基于标签的模型全局偏差;
生成的评分矩阵S得到选定个数的三元组结构的数据
Figure FDA0003714306250000022
使用梯度下降方法来减小损失函数,优化相关参数,至此,基于标签的模型训练完成。
2.根据权利要求1所述的基于度量分解和标签自适应分配权重的混合推荐方法,其特征在于,
基于度量分解的模型的训练过程中构造的损失函数,表达式如下:
Figure FDA0003714306250000031
其中
Figure FDA0003714306250000032
表示原始用户和物品间的欧式距离的平方,μ为基于度量分解的模型的全局偏差;
Figure FDA0003714306250000033
表示
Figure FDA0003714306250000034
三元组格式的训练数据集,cui表示置信度系数,λ表示正则化系数;
Figure FDA0003714306250000035
为训练集中用户u对物品i的评分;
Figure FDA0003714306250000036
Figure FDA0003714306250000037
指在训练时,以设定的概率p随机丢弃
Figure FDA0003714306250000038
部分维度的分量。
3.根据权利要求2所述的基于度量分解和标签自适应分配权重的混合推荐方法,其特征在于,置信度系数cui的计算方法如下:
Figure FDA0003714306250000039
其中β为超参数,用来调节评分偏离Maximum/2的程度给损失函数带来的影响。
4.根据权利要求1所述的基于度量分解和标签自适应分配权重的混合推荐方法,其特征在于,
基于标签的模型的训练过程中构建的损失函数表示为:
Figure FDA00037143062500000310
其中λ表示正则化系数,
Figure FDA00037143062500000311
表示
Figure FDA00037143062500000312
三元组格式的训练数据集。
5.根据权利要求1所述的基于度量分解和标签自适应分配权重的混合推荐方法,其特征在于,根据物品的标签信息确定物品标签特征向量q′i的方法包括:设所有物品的标签信息中一共出现过L种不同的标签,对每一个物品按照其拥有的标签平均分配权重,最终会针对每个物品生成一个维度为L的标签特征向量,其中特定维度下的标签特征值为0,标签特征值不为0的维度对应物品标签信息中拥有的标签,且各维度的标签特征总和为1。
6.根据权利要求1所述的基于度量分解和标签自适应分配权重的混合推荐方法,其特征在于,将第一预测评分和第二预测评分进行加权求和确定该用户对该特定物品的最终预测评分的表达式如下:
R=(1-α)R1+αR2
其中R1表示第一预测评分,R2表示第二预测评分,α表示分配的权重系数。
7.根据权利要求1所述的基于度量分解和标签自适应分配权重的混合推荐方法,其特征在于,分配的权重系数α的设定方法如下:
对训练集中的每一个三元组
Figure FDA0003714306250000041
对应的L维的物品标签向量q′i,计算其对应的标签重要性与评分重要性,表达式如下:
Figure FDA0003714306250000042
Figure FDA0003714306250000043
其中t表示L维的物品标签向量q′i中大于0的维度数,TI表示L维的物品标签向量q′i中大于0的维度数占总维数的比例,Ui表示给当前物品i评价过的用户数量,U表示用户总数,RI表示给当前item评价过的用户数占总用户数的比例;根据TI和RI确定分配的权重系数α。
8.根据权利要求1所述的基于度量分解和标签自适应分配权重的混合推荐方法,其特征在于,所述梯度下降具体采用小批量随机梯度下降方法。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~8任意一项权利要求所述方法的步骤。
CN202110018668.9A 2021-01-07 2021-01-07 基于度量分解和标签自适应分配权重的混合推荐方法 Active CN112765458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110018668.9A CN112765458B (zh) 2021-01-07 2021-01-07 基于度量分解和标签自适应分配权重的混合推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110018668.9A CN112765458B (zh) 2021-01-07 2021-01-07 基于度量分解和标签自适应分配权重的混合推荐方法

Publications (2)

Publication Number Publication Date
CN112765458A CN112765458A (zh) 2021-05-07
CN112765458B true CN112765458B (zh) 2022-10-14

Family

ID=75700660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110018668.9A Active CN112765458B (zh) 2021-01-07 2021-01-07 基于度量分解和标签自适应分配权重的混合推荐方法

Country Status (1)

Country Link
CN (1) CN112765458B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073720A (zh) * 2011-01-10 2011-05-25 北京航空航天大学 一种对个性化推荐结果进行优化的fr方法
CN106846106A (zh) * 2017-01-16 2017-06-13 南京师范大学 一种图构建框架下的矩阵分解推荐方法
CN107239993A (zh) * 2017-05-24 2017-10-10 海南大学 一种基于拓展标签的矩阵分解推荐方法及系统
CN109063120A (zh) * 2018-08-01 2018-12-21 北京邮电大学 一种基于聚类的协同过滤推荐方法和装置
CN109272390A (zh) * 2018-10-08 2019-01-25 中山大学 融合评分和标签信息的个性化推荐方法
CN110427567A (zh) * 2019-07-24 2019-11-08 东北大学 一种基于用户偏好相似度加权的协同过滤推荐方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021298B (zh) * 2016-05-03 2019-05-28 广东工业大学 一种基于非对称加权相似度的协同过滤推荐方法及系统
CN107729444B (zh) * 2017-09-30 2021-01-12 桂林电子科技大学 一种基于知识图谱的个性化旅游景点推荐方法
CN109300014B (zh) * 2018-10-24 2020-09-08 中南民族大学 基于日志挖掘的商品推荐方法、装置、服务器及存储介质
CN109308654A (zh) * 2018-11-20 2019-02-05 辽宁师范大学 基于物品能量扩散和用户偏好的协同过滤推荐方法
CN111339439B (zh) * 2020-02-18 2023-05-09 广东工业大学 一种融合评论文本与时序效应的协同过滤推荐方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073720A (zh) * 2011-01-10 2011-05-25 北京航空航天大学 一种对个性化推荐结果进行优化的fr方法
CN106846106A (zh) * 2017-01-16 2017-06-13 南京师范大学 一种图构建框架下的矩阵分解推荐方法
CN107239993A (zh) * 2017-05-24 2017-10-10 海南大学 一种基于拓展标签的矩阵分解推荐方法及系统
CN109063120A (zh) * 2018-08-01 2018-12-21 北京邮电大学 一种基于聚类的协同过滤推荐方法和装置
CN109272390A (zh) * 2018-10-08 2019-01-25 中山大学 融合评分和标签信息的个性化推荐方法
CN110427567A (zh) * 2019-07-24 2019-11-08 东北大学 一种基于用户偏好相似度加权的协同过滤推荐方法

Also Published As

Publication number Publication date
CN112765458A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN111538912B (zh) 内容推荐方法、装置、设备及可读存储介质
Guan et al. Matrix factorization with rating completion: An enhanced SVD model for collaborative filtering recommender systems
CN110503531B (zh) 时序感知的动态社交场景推荐方法
CN105787061B (zh) 信息推送方法
CN106503022B (zh) 推送推荐信息的方法和装置
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
Sun et al. Learning multiple-question decision trees for cold-start recommendation
CN110889747B (zh) 商品推荐方法、装置、系统、计算机设备及存储介质
CN110008397B (zh) 一种推荐模型训练方法及装置
CN114202061A (zh) 基于生成对抗网络模型及深度强化学习的物品推荐方法、电子设备及介质
CN108334592A (zh) 一种基于内容与协同过滤相结合的个性化推荐方法
CN109977299B (zh) 一种融合项目热度和专家系数的推荐算法
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN112749330B (zh) 信息推送方法、装置、计算机设备和存储介质
CN116541607B (zh) 基于商品检索数据分析的智能推荐方法
Babu et al. An implementation of the user-based collaborative filtering algorithm
US20210383275A1 (en) System and method for utilizing grouped partial dependence plots and game-theoretic concepts and their extensions in the generation of adverse action reason codes
US20220172083A1 (en) Noise contrastive estimation for collaborative filtering
CN111753215B (zh) 一种多目标推荐优化方法及可读介质
CN112256965A (zh) 一种基于lambdaMart的神经协同过滤模型推荐方法
CN110059257B (zh) 基于评分修正的项目推荐方法
CN108763515B (zh) 一种基于概率矩阵分解的时间敏感个性化推荐方法
CN112765458B (zh) 基于度量分解和标签自适应分配权重的混合推荐方法
CN117251622A (zh) 对象推荐的方法、装置、计算机设备和存储介质
Hidayati et al. The Influence of User Profile and Post Metadata on the Popularity of Image-Based Social Media: A Data Perspective

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant