CN108959332B - 一种利用高维辅助信息修正的内容推荐方法及推荐系统 - Google Patents

一种利用高维辅助信息修正的内容推荐方法及推荐系统 Download PDF

Info

Publication number
CN108959332B
CN108959332B CN201710655588.8A CN201710655588A CN108959332B CN 108959332 B CN108959332 B CN 108959332B CN 201710655588 A CN201710655588 A CN 201710655588A CN 108959332 B CN108959332 B CN 108959332B
Authority
CN
China
Prior art keywords
matrix
project
auxiliary information
module
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710655588.8A
Other languages
English (en)
Other versions
CN108959332A (zh
Inventor
赵翔
陈一帆
李瑞琪
葛斌
肖卫东
贺明科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201710655588.8A priority Critical patent/CN108959332B/zh
Publication of CN108959332A publication Critical patent/CN108959332A/zh
Application granted granted Critical
Publication of CN108959332B publication Critical patent/CN108959332B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种利用高维辅助信息修正的项目推荐方法,包括收集用户对项目的反馈行为和项目的高维辅助信息;建立基于项目相似度计算的目标函数及约束条件;利用局部保留投影方法,将所述的高维辅助信息的特征矩阵进行降维操作,映射为所述高维辅助信息的投影矩阵,并代入所述的目标函数;计算出所述的投影矩阵、项目相似度矩阵和用户对项目的预测评分矩阵;根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。本发明充分利用项目的高维辅助信息,提升了推荐方法及系统的准确度,将局部投影方法融入推荐模型的方法,同时提出了一种联合迭代优化的计算方法,有效地避开高维数据的缺点,改进推荐方法在实际应用中精度和效率。

Description

一种利用高维辅助信息修正的内容推荐方法及推荐系统
技术领域
本发明属于互联网智能推荐技术领域,具体涉及一种利用高维辅助信息修正的项目推荐方法及推荐系统。
背景技术
为了帮助用户识别最适合个人特点的项目,项目排序任务中广泛使用了TOP-N推荐方法。其中代表性的方法包括了基于项目的k-最近邻方法,稀疏线性方法(SLIM)等等。在协同过滤算法中,基于项目的推荐方法已经被证明优于基于用户的推荐方法。基于项目的推荐方法的准确性主要依赖于所计算出的项目相似度的准确性。具体来说,项目相似度主要基于用户反馈来进行计算。传统的用户反馈包括购买记录,排名,评论,点击数等。然而,随着互联网的交互性逐步增强,很多项目中产生了大量的辅助信息,比如电影推荐系统里的电影评论、工作推荐系统里的申请人简历、垃圾邮件检测里的邮件内容、在线购物中的项目评价等。这些辅助信息包含中的大量项目相关特征,由此研究人员研发了众多基于辅助信息的混合算法来增加推荐系统的精确性。然而,这些辅助信息一般都具有高维的特点。例如,项目的文本描述中,如果将每一个在语料库中的词项都作为一维的话,那么整个文档就是高维的。此外,以图片或视频为形式的辅助信息的维度会更加高。现有的方法并没有关注到这一点,导致他们的精度和效率被高维严重制约。本发明关注于高维辅助信息,将高维的辅助信息通过数据规约集成进协同过滤推荐方法中,提出了一种利用高维辅助信息修正的项目推荐方法及推荐系统,利用数据规约的方法,有效地避开高维数据的缺点,大大改进推荐方法及系统在实际应用中精准度表现。
发明内容
本发明的第一目的在于提供一种利用高维辅助信息修正的项目推荐方法。
本发明的第一目的是这样实现的,包括:
步骤S1,收集用户对项目的反馈行为和项目的高维辅助信息;
步骤S2,初始化用户行为反馈矩阵和项目高维辅助信息的特征矩阵;
步骤S3,建立基于项目相似度计算的目标函数及约束条件;
步骤S4,利用局部保留投影方法,将所述的高维辅助信息的特征矩阵进行降维操作,映射为所述的高维辅助信息的投影矩阵,并代入所述的目标函数;
步骤S5,利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵;
步骤S6,利用所述的用户行为反馈矩阵和所述的项目相似度矩阵,计算用户对项目的预测评分矩阵;
步骤S7,根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。
本发明的第二目的在于提供一种利用高维辅助信息修正的项目推荐方法的项目推荐系统。
本发明的第二目的是这样实现的,包括:
信息获取模块,信息规整模块,模型计算模块,评分计算模块,项目推荐模块,所述的信息获取模块用于收集用户对项目的反馈行为和项目的高维辅助信息;
所述的信息规整模块用于将信息获取模块获取到的信息,规整为用户行为反馈矩阵和项目高维信息的特征矩阵;
所述的模型计算模块包括模型建立模块,高维降维模块和结果计算模块,所述的模型建立模块用于建立基于项目相似度计算的目标函数及约束条件,所述的高维降维模块利用局部保留投影方法,将所述的高维信息的特征矩阵进行降维操作,映射为所述的高维辅助信息的投影矩阵,所述的结果计算模块利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵;
所述的评分计算模块利用所述的用户行为反馈矩阵和所述的项目相似度矩阵,计算用户对项目的预测评分矩阵;
所述的项目推荐模块根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。
与现有技术相比,本发明具有以下技术效果:
1、本发明充分利用高维辅助信息,挖掘出高辅助信息中对项目推荐的有用信息,大大提升了推荐方法及系统的准确度;
2、本发明提供了一种将局部投影方法融入推荐模型的方法,同时提出了一种联合迭代优化的计算方法,可以同步的进行局部投影操作和计算项目相似度,使得本发明的推荐结果计算的精度和效率大大提升。
附图说明
图1为本发明中一种利用高维辅助信息修正的项目推荐方法的流程示意图;
图2为本发明中项目推荐方法的模型求解流程图;
图3为本发明中一种利用高维辅助信息修正的项目推荐系统的结构示意图;
图中:1-信息获取模块,2-信息规整模块,3-模型计算模块,4-评分计算模块,5-项目推荐模块,301-模型建立模块,302-高维降维模块,303-结果计算模块,S1~S7为项目推荐方法的流程步骤,S101~S106为模型求解的流程步骤。
具体实施方式
下面结合附图对本发明作进一步的说明,但不以任何方式对本发明加以限制,基于本发明教导所作的任何变换或替换,均属于本发明的保护范围。
如附图1所示本发明的一种利用高维辅助信息修正的项目推荐方法,包括:
步骤S1,收集用户对项目的反馈行为和项目的高维辅助信息;
步骤S2,初始化用户行为反馈矩阵和项目高维信息的特征矩阵;
步骤S3,建立基于项目相似度计算的目标函数及约束条件;
步骤S4,利用局部保留投影方法,将所述的高维信息的特征矩阵进行降维操作,映射为所述的高维辅助信息的投影矩阵,并代入所述的目标函数;
步骤S5,利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵;
步骤S6,利用所述的用户行为反馈矩阵和所述的项目相似度矩阵,计算用户对项目的预测评分矩阵;
步骤S7,根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。
所述的用户反馈包括购买记录,排名,评论,点击数等,所述的高维辅助信息包括电影推荐系统里的电影评论、工作推荐系统里的申请人简历、垃圾邮件检测里的邮件内容、在线购物中的项目评价等。辅助信息一般都具有高维的特点。例如,项目的文本描述中,如果将每一个在语料库中的词项(term)都作为一维的话,那么整个文档就是高维的。此外,以图片或视频为形式的辅助信息的维度会更加高。
所述的用户反馈矩阵为R,大小为m×n,矩阵第u行i列代表了第i个项目是否被用户u购买、观看或者排名,是为1否为0。
所述的项目高维信息的特征矩阵为F,大小为n×d,d为辅助信息的维度。
所述的目标函数为:
Figure 543469DEST_PATH_IMAGE001
其中S代表项目相似度矩阵,大小为n×n,矩阵每一元素都在[0,1]之间,W为投影矩阵,大小为d×k,被用来将d维信息投影进k维空间,k远小于d。
所述的约束条件为:
Figure DEST_PATH_IMAGE002
其具体推导过程如下所述,一个典型的推荐系统需要利用项目相似度来填补矩阵R,而辅助信息则可以被用来计算项目相似度。利用S的范式,并结合了特征矩阵F,可形成如下目标:
Figure 522926DEST_PATH_IMAGE003
(1)
其中,
Figure DEST_PATH_IMAGE004
并且
Figure 784887DEST_PATH_IMAGE005
Figure DEST_PATH_IMAGE006
Figure 445675DEST_PATH_IMAGE007
矩阵的第j列,代表了第j个项目和其他项目的相似度。
Figure DEST_PATH_IMAGE008
的限制避免了当
Figure 73097DEST_PATH_IMAGE009
非常稀疏时,
Figure 426718DEST_PATH_IMAGE007
趋近于0。目标函数中的
Figure DEST_PATH_IMAGE010
用来学习
Figure 506800DEST_PATH_IMAGE007
的系数矩阵并重构反馈矩阵。由于L1范式结果为常数,所以用L2范式规范
Figure 502438DEST_PATH_IMAGE007
Figure 702475DEST_PATH_IMAGE011
比率用来平衡两种信息的权重。
Figure DEST_PATH_IMAGE012
中,
Figure 305626DEST_PATH_IMAGE013
被用来代表项目i 的特征。特征的距离设定为欧氏距离
Figure DEST_PATH_IMAGE014
。虽然相似度未知,但距离越远,相似度越小;距离越近,相似度越高。因此将正则化项设为
Figure 401233DEST_PATH_IMAGE015
所述的步骤S4中的局部保留投影(LPP)是非线性拉普拉斯特征映射的一种线性估计。该方法首先通过特征矩阵
Figure 669404DEST_PATH_IMAGE017
来构造邻接图,这一过程中可以利用在公式(1)中学习到的相似度矩阵
Figure 723947DEST_PATH_IMAGE019
。紧接着,需要解决广义特征向量问题:
Figure DEST_PATH_IMAGE020
(2)
其中
Figure 232420DEST_PATH_IMAGE021
是一个对角矩阵,第i个对角元素为
Figure DEST_PATH_IMAGE022
Figure 536363DEST_PATH_IMAGE023
Figure DEST_PATH_IMAGE024
的拉普拉斯矩阵,即
Figure 93377DEST_PATH_IMAGE025
。投影矩阵
Figure DEST_PATH_IMAGE026
,其中特征向量
Figure 533586DEST_PATH_IMAGE027
对应特征值
Figure DEST_PATH_IMAGE028
,且
Figure 947381DEST_PATH_IMAGE029
。线性组合
Figure DEST_PATH_IMAGE030
代表了辅助信息在低维空间的投影。
最终模型将(1)和(2)合并,最终模型为:
Figure 941881DEST_PATH_IMAGE031
(3)
其中
Figure DEST_PATH_IMAGE032
Figure 348592DEST_PATH_IMAGE033
:系数
Figure DEST_PATH_IMAGE034
是方便求导后去掉系数(
Figure 859951DEST_PATH_IMAGE035
),
Figure DEST_PATH_IMAGE036
表示对用户反馈的预测,
Figure 959494DEST_PATH_IMAGE037
表示真实值与预测值之间的误差,目标函数使得误差尽量小。
Figure DEST_PATH_IMAGE038
:系数
Figure 254341DEST_PATH_IMAGE034
是方便求导后去掉系数(
Figure 871267DEST_PATH_IMAGE035
),
Figure 754909DEST_PATH_IMAGE039
是用户给定的参数。
Figure DEST_PATH_IMAGE040
表示项目
Figure 776086DEST_PATH_IMAGE041
和项目
Figure DEST_PATH_IMAGE042
之间关于辅助信息的距离。由于约束条件
Figure 24140DEST_PATH_IMAGE043
Figure DEST_PATH_IMAGE044
的限制,最小化该项使得当项目
Figure 710336DEST_PATH_IMAGE041
和项目
Figure 995955DEST_PATH_IMAGE042
之间关于辅助信息的距离较大时,项目
Figure 906143DEST_PATH_IMAGE041
和项目
Figure 972319DEST_PATH_IMAGE042
的相似度
Figure 491899DEST_PATH_IMAGE045
较小,反之亦然。
Figure DEST_PATH_IMAGE046
:系数
Figure 818976DEST_PATH_IMAGE034
是方便求导后去掉系数(
Figure 634485DEST_PATH_IMAGE035
),
Figure 843749DEST_PATH_IMAGE047
是用户给定的参数。该项为正则化项,最小化该项可以防止过拟合。
模型没有设定
Figure DEST_PATH_IMAGE048
,而是设定
Figure 888060DEST_PATH_IMAGE049
是为了学习出一个独特的特征空间。此外,将正则化项设定为
Figure DEST_PATH_IMAGE050
,而不是
Figure DEST_PATH_IMAGE052
的原因有两个:首先,此模型为联合学习优化问题,可以同时进行数据规约和项目推荐。其次,在此低维空间中相似度矩阵
Figure 928697DEST_PATH_IMAGE053
可以被加强。因此,LPP不仅可以被用来保留局部信息,还可以改进相似度计算。
令投影矩阵
Figure DEST_PATH_IMAGE054
,
Figure DEST_PATH_IMAGE055
是一个k维的行向量,代表了特征i的嵌入。通过投影,每一个特征被表述为k个独立的方面。我们假设同义词组更加经常地出现在相似度较高的项目中。基于此假设,通过LPP方法,同义词的嵌入会更加靠近。因此,含有更多同义词的项目会在投影空间中更加靠近,最终对让实际上更相似的项目的相似度更高。通过对
Figure DEST_PATH_IMAGE056
进行联合优化,可以在对高维辅助信息进行降维的同时,学到由用户反馈信息引导,低维辅助信息约束的项目相似度。
所述的步骤S5中,利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵,其具体过程如下所述。由于如上模型是非凸的,因此没有全局最优解。因此,设计了一个迭代的改进方案:
Figure DEST_PATH_IMAGE057
固定,更新
Figure DEST_PATH_IMAGE058
,设定拉格朗日函数为:
Figure DEST_PATH_IMAGE059
(4)
其中,
Figure DEST_PATH_IMAGE060
为拉格朗日乘子。
Figure DEST_PATH_IMAGE061
Figure DEST_PATH_IMAGE062
是一个所有元素都为1的向量。
Figure DEST_PATH_IMAGE063
关于
Figure DEST_PATH_IMAGE064
的偏导为:
Figure 148064DEST_PATH_IMAGE065
(5)
其中
Figure DEST_PATH_IMAGE066
为第j维为1其他维为0的向量。
由此,闭式解为:
Figure DEST_PATH_IMAGE067
(6)
其中如果
Figure DEST_PATH_IMAGE068
Figure DEST_PATH_IMAGE069
是正定的,且
Figure DEST_PATH_IMAGE070
。操作符
Figure 657673DEST_PATH_IMAGE071
代表了取出第i个元素,如果第i个元素不小于0;否则即为0。
Figure DEST_PATH_IMAGE072
固定,更新
Figure DEST_PATH_IMAGE074
为了更新
Figure DEST_PATH_IMAGE076
,首先引入如下基于谱分析的等式:
Figure DEST_PATH_IMAGE077
(7)
因此,问题等同于:
Figure DEST_PATH_IMAGE078
(8)
运用Karush-Kuhn-Tucker(KKT)一阶最优条件,可以得到:
Figure DEST_PATH_IMAGE079
(9)
解决方案由
Figure DEST_PATH_IMAGE080
前k个最小特征值对应的特征向量构成。请注意,在LPP的框架中,
Figure DEST_PATH_IMAGE081
已经会被更新。
故,如图2所示,所述的计算过程包括:
步骤S101,随机初始化项目相似度矩阵
Figure DEST_PATH_IMAGE082
和投影矩阵
Figure DEST_PATH_IMAGE083
步骤S102,根据公式C1:
Figure DEST_PATH_IMAGE084
,计算项目似度矩阵
Figure 135420DEST_PATH_IMAGE082
中的元素;
步骤S103,根据公式C2:
Figure DEST_PATH_IMAGE085
,更新对角矩阵D的值;
步骤S104,根据公式C3:
Figure DEST_PATH_IMAGE086
,更新拉普拉斯矩阵
Figure DEST_PATH_IMAGE087
的值;
步骤S105,
Figure 781296DEST_PATH_IMAGE083
取值为
Figure DEST_PATH_IMAGE088
Figure DEST_PATH_IMAGE089
个最小特征值对应的特征向量;
步骤S106,考察W和S的值是否已收敛,如收敛,则结束计算,若未收敛,则,重复步骤102至步骤105。
如附图3所示,本发明的一种利用高维辅助信息修正的项目推荐系统,包括:
信息获取模块1,信息规整模块2,模型计算模块3,评分计算模块4,项目推荐模块5,所述的信息获取模块1用于收集用户对项目的反馈行为,收集项目的高维辅助信息;
所述的用户反馈包括购买记录,排名,评论,点击数等,所述的高维辅助信息包括电影推荐系统里的电影评论、工作推荐系统里的申请人简历、垃圾邮件检测里的邮件内容、在线购物中的项目评价等。辅助信息一般都具有高维的特点。
所述的信息规整模块2用于将信息获取模块获取到的信息,规整为用户行为反馈矩阵和项目高维信息的特征矩阵;所述的用户反馈矩阵为
Figure DEST_PATH_IMAGE090
,大小为m×n,矩阵第u行i列代表了第i个项目是否被用户u购买、观看或者排名,是为1否为0。所述的项目高维信息的特征矩阵为
Figure DEST_PATH_IMAGE092
,大小为n×d,d为辅助信息的维度。
所述的模型计算模块3包括模型建立模块301,高维降维模块302和结果计算模块303,所述的模型建立模块301用于建立基于项目相似度计算的目标函数及约束条件,所述的高维降维模块302利用局部保留投影方法,将所述的高维信息的特征矩阵通过降维操作,映射为所述的高维辅助信息的投影矩阵,所述的结果计算模块303利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵;
所述的评分计算模块4利用所述的用户行为反馈矩阵和所述的项目相似度矩阵,计算用户对项目的预测评分矩阵;
所述的项目推荐模块5根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。
本发明的实施例利用了真实数据集CiteULike,Enron Mail Box,Yahoo!Movies对本发明的方法及系统进行检验。
(1)实验简介
CiteULike(CUL)是一个可以让研究人员将科技论文添加至他们图书馆的在线服务。每一个用户图书馆中的论文被视为被偏爱的论文。文章的名称、摘要为辅助信息。EnronMail Box(Enron1和Enron2)表现了从Enron Email中抽取的邮箱。这些数据在联邦能源管理委员会对安然公司(Enron Corporation)进行调查的阶段。对最大的两个邮箱(dasovichj和kean-s)及其拥有者发送的信息进行实验,将邮件内容视为辅助信息,预测新邮件最有可能的接受者。Yahoo!Movies包含了一部分雅虎电影社区对于不同电影的喜好(A+到F),二值化为0至1。这个数据集也包含了许多在2003年11月份发行的一系列电影的辅助信息,包括演职人员、概要、类型、平均排名、奖项等。表1概述了不同数据集的相关统计信息。
表1实验数据集介绍
Figure DEST_PATH_IMAGE093
采用5折留一交叉验证的方式,比较推荐列表和测试集中该用户的实际列表。我们用点击率(HitRate,HR)和平均交互点击率(ARHR)来评价结果。
Prism代表本发明方法。首先比较了Prism和SLIM来辅证当反馈很少时利用辅助信息的必要性。利用CoSim来检验辅助信息的质量。为了检验数据规约的作用,我们对基于公式(1)的基本方法也进行了实验。我们还对Prism和许多现有最新方法进行了比较,包括SSLIM,UFSM,PCM。
(2)实验结果
设定不同大小的推荐列表,发现Prism在任一大小的推荐列表下表现均最优。表2展示了四个数据集下TOP-10的推荐结果。总的来说,SLIM在Enron1和Enron2上结果不如CoSim,但在Yahoo和CUL中相反。这表明虽然相比于用户反馈信息来说,所有数据集是稀疏的,但Enron的辅助信息的质量非常高,非常适合用户推荐系统。
由于Enron的辅助信息的质量非常高,Prism在Enron1和Enron2的表现明显较优。具体表现为,Prism在Enron1和Enron2上比基本方法上的表现提升明显大于在Yahoo和CUL上。这一结果证实了将涵盖了辅助信息的LPP集成在推荐方法的有效性。
在和其他方法的比较中,Prism在所有数据集上表现均最优,特别在具有最高质量的辅助信息的Enron2上。Prism的推荐准确度将HR提升至21.2%,将ARHR提升至36.8%。
值得注意的是,SSLIM和UFSM在Yahoo上的表现比SLIM差。PCM也仅仅只是稍微提升了一点。这说明Yahoo数据集中的辅助信息质量不高,但是Prism却依然有很大提升。这证明了Prism的鲁棒性,即即使在辅助信息较有限的情况下,Prism依然依然表现良好。
这样的鲁棒性也体现在了由良好用户反馈但较差辅助信息的CUL上。实验结果说明,CUL似乎更适合于对辅助信息要求较宽松的方法如SSLIM2上。在此情况下,Prism依然表现出了很不错的结果。这是由于辅助信息的关联性通过数据规约得到了改进,且
Figure 751658DEST_PATH_IMAGE094
也根据情况调小,决策更依赖于用户反馈信息。
在Enron1上的结果并不是特殊情况。由于其有质量较高的辅助信息,对辅助信息利用较高的方法,如SSLIM1和PCF,就表现出众。另一方面,由于Enron1的特征维度比Enron2的特征为度低,数据规约在不同数据集上的作用并不是一定的。
表2实验结果
Figure DEST_PATH_IMAGE095
本发明工作原理和工作过程:本发明综合考虑多种用户对项目的反馈信息,用以设计了面向项目的协同过滤推荐方法和推荐系统,尤其是在利用高维辅助信息修正的过程中,利用局部投影方法对高维信息进行降维处理,同时,提出了一种联合学习的方法来同步迭代地实现数据规约和推荐的要求,实验证明本发明的方法超出了现有的方法,将点击率提升至21.2%,将平均交互点击率提升至36.8%。
本发明的优点:本发明综合考虑项目的多种描述信息,用高维辅助信息修正的方法大幅提高了项目推荐方法及推荐系统的准确性,同时,针对高维信息的处理会严重制约推荐系统的精度和效率,本发明提出的求解方法效避开高维数据的缺点,使得推荐方法及推荐系统的计算效率和计算精度进一步增强。

Claims (2)

1.一种利用高维辅助信息修正的项目推荐方法,其特征在于,所述方法包括:
步骤S1,收集用户对项目的反馈行为和项目的高维辅助信息;
步骤S2,初始化用户行为反馈矩阵和项目高维辅助信息的特征矩阵;
步骤S3,建立基于项目相似度计算的目标函数及约束条件;
步骤S4,利用局部保留投影方法,将所述的高维辅助信息的特征矩阵进行降维操作,映射为所述的高维辅助信息的投影矩阵,并代入所述的目标函数;
步骤S5,利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵;
步骤S6,利用所述的用户行为反馈矩阵和所述的项目相似度矩阵,计算用户对项目的预测评分矩阵;
步骤S7,根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目;
步骤S3中所述的目标函数为:
Figure FDA0003121511940000011
目标函数应最小化,约束条件为:
Figure FDA0003121511940000012
并且
Figure FDA0003121511940000013
步骤S4中代入所述的目标函数后为:
Figure FDA0003121511940000014
约束条件为:
Figure FDA0003121511940000015
R为所述的用户行为反馈矩阵,F为项目高维辅助信息的特征矩阵,在F中,fi被用来代表项目i的特征,S为项目相似度矩阵,W为投影矩阵,α比率用来平衡两种信息的权重,λ是用户给定的参数,||·||F表示矩阵F范数,即对矩阵所有元素求平方和开根号,α为用户指定的参数以及来平衡两种信息的权重;n为表示项目的数量;sij表示项目i和项目j为之间的相似性,其中sij是S矩阵的第i行和第j列元素;fj表示项目j的特征;运算符
Figure FDA0003121511940000021
表示l2-范数的平方,
Figure FDA0003121511940000022
表示向量sj与向量1的内积,即
Figure FDA0003121511940000023
步骤S5中的迭代收敛计算方法的步骤为:
步骤S101,随机初始化项目相似度矩阵S和投影矩阵W;
步骤S102,计算项目相似度矩阵S中的元素;
步骤S103,根据公式更新对角矩阵D的值;
步骤S104,根据公式更新拉普拉斯矩阵L的值;
步骤S105,W取值为FTLF前k个最小特征值对应的特征向量;
步骤S106,考察W和S的值是否已收敛,如收敛,则结束计算,若未收敛,则,重复步骤102至步骤106。
2.一种根据权利要求1所述的项目推荐方法的项目推荐系统,包括信息获取模块(1),信息规整模块(2),模型计算模块(3),评分计算模块(4),项目推荐模块(5),其特征在于:所述的信息获取模块(1)用于收集用户对项目的反馈行为,收集项目的高维辅助信息;
所述的信息规整模块(2)用于将信息获取模块获取到的信息,规整为用户行为反馈矩阵和项目高维辅助信息的特征矩阵;
所述的模型计算模块(3)包括模型建立模块(301),高维降维模块(302)和结果计算模块(303),所述的模型建立模块(301)用于建立基于项目相似度计算的目标函数及约束条件,所述的高维降维模块(302)利用局部保留投影方法,将所述的高维辅助信息的特征矩阵通过降维操作,映射为所述的高维辅助信息的投影矩阵,所述的结果计算模块(303)利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵;
所述的评分计算模块(4)利用所述的用户行为反馈矩阵和所述的项目相似度矩阵,计算用户对项目的预测评分矩阵;
所述的项目推荐模块(5)根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。
CN201710655588.8A 2017-08-03 2017-08-03 一种利用高维辅助信息修正的内容推荐方法及推荐系统 Active CN108959332B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710655588.8A CN108959332B (zh) 2017-08-03 2017-08-03 一种利用高维辅助信息修正的内容推荐方法及推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710655588.8A CN108959332B (zh) 2017-08-03 2017-08-03 一种利用高维辅助信息修正的内容推荐方法及推荐系统

Publications (2)

Publication Number Publication Date
CN108959332A CN108959332A (zh) 2018-12-07
CN108959332B true CN108959332B (zh) 2021-09-14

Family

ID=64495127

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710655588.8A Active CN108959332B (zh) 2017-08-03 2017-08-03 一种利用高维辅助信息修正的内容推荐方法及推荐系统

Country Status (1)

Country Link
CN (1) CN108959332B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101256573A (zh) * 2008-04-01 2008-09-03 天津大学 基于内容相关性的反馈式搜索方法及内容相关方法
CN104063481A (zh) * 2014-07-02 2014-09-24 山东大学 一种基于用户实时兴趣向量的电影个性化推荐方法
CN106021298A (zh) * 2016-05-03 2016-10-12 广东工业大学 一种基于非对称加权相似度的协同过滤推荐方法及系统
CN106920147A (zh) * 2017-02-28 2017-07-04 华中科技大学 一种基于词向量数据驱动的商品智能推荐方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9336546B2 (en) * 2014-03-27 2016-05-10 Microsoft Technology Licensing, Llc Recommendation system with multi-dimensional discovery experience
US10341701B2 (en) * 2015-04-21 2019-07-02 Edge2020 LLC Clustering and adjudication to determine a recommendation of multimedia content

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101256573A (zh) * 2008-04-01 2008-09-03 天津大学 基于内容相关性的反馈式搜索方法及内容相关方法
CN104063481A (zh) * 2014-07-02 2014-09-24 山东大学 一种基于用户实时兴趣向量的电影个性化推荐方法
CN106021298A (zh) * 2016-05-03 2016-10-12 广东工业大学 一种基于非对称加权相似度的协同过滤推荐方法及系统
CN106920147A (zh) * 2017-02-28 2017-07-04 华中科技大学 一种基于词向量数据驱动的商品智能推荐方法

Also Published As

Publication number Publication date
CN108959332A (zh) 2018-12-07

Similar Documents

Publication Publication Date Title
Wang et al. GMC: Graph-based multi-view clustering
CN109241203B (zh) 一种融合时间因素的用户偏好和距离加权的聚类方法
Wang et al. Learning hidden features for contextual bandits
Jin et al. Translating online customer opinions into engineering characteristics in QFD: A probabilistic language analysis approach
Bachrach et al. Speeding up the xbox recommender system using a euclidean transformation for inner-product spaces
US8131786B1 (en) Training scoring models optimized for highly-ranked results
CN109615452B (zh) 一种基于矩阵分解的产品推荐方法
CN109740064A (zh) 一种融合矩阵分解和挖掘用户项目信息的cf推荐方法
CN113378959B (zh) 一种基于语义纠错下生成对抗网络的零样本学习方法
Sindhwani et al. Uncertainty sampling and transductive experimental design for active dual supervision
CN112100512A (zh) 一种基于用户聚类和项目关联分析的协同过滤推荐方法
Kouadria et al. A multi-criteria collaborative filtering recommender system using learning-to-rank and rank aggregation
CN109033294B (zh) 一种融入内容信息的混合推荐方法
CN112800344B (zh) 一种基于深度神经网络的电影推荐方法
CN110633421A (zh) 特征提取、推荐以及预测方法、装置、介质和设备
Takamura et al. Text summarization model based on the budgeted median problem
CN113468291A (zh) 基于专利网络表示学习的专利自动分类方法
CN112632984A (zh) 基于描述文本词频的图模型移动应用分类方法
CN112085158A (zh) 一种基于堆栈降噪自编码器的图书推荐方法
Zhu et al. Multimodal sparse linear integration for content-based item recommendation
CN107169830B (zh) 一种基于聚类pu矩阵分解的个性化推荐方法
CN106651461A (zh) 基于灰理论的电影个性化推荐方法
CN108959332B (zh) 一种利用高维辅助信息修正的内容推荐方法及推荐系统
CN111209489B (zh) 一种基于差异化资源分配的二部图推荐方法
Tso et al. Attribute-aware collaborative filtering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant