CN111159556B - 一种基于用户好奇心的贝叶斯个性化排序推荐方法 - Google Patents

一种基于用户好奇心的贝叶斯个性化排序推荐方法 Download PDF

Info

Publication number
CN111159556B
CN111159556B CN201911405967.7A CN201911405967A CN111159556B CN 111159556 B CN111159556 B CN 111159556B CN 201911405967 A CN201911405967 A CN 201911405967A CN 111159556 B CN111159556 B CN 111159556B
Authority
CN
China
Prior art keywords
user
item
article
items
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911405967.7A
Other languages
English (en)
Other versions
CN111159556A (zh
Inventor
蔡毅
丁琪琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201911405967.7A priority Critical patent/CN111159556B/zh
Publication of CN111159556A publication Critical patent/CN111159556A/zh
Priority to PCT/CN2020/105072 priority patent/WO2021135192A1/zh
Application granted granted Critical
Publication of CN111159556B publication Critical patent/CN111159556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于用户好奇心的贝叶斯个性化排序推荐方法,包括步骤:使用有好友关系的数据集,遍历数据集中每一个用户的历史数据,对于数据集中的每一个用户u,构建用户u的正向物品集合Pu,令用户u感到好奇的物品集合Cu以及用户u的负向物品集合Nu;提出优化排序准则,获取用户矩阵P和物品矩阵Q;对于每一个用户u,随机从Pu、Cu、Nu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q;对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐。

Description

一种基于用户好奇心的贝叶斯个性化排序推荐方法
技术领域
本发明涉及个性化推荐技术领域,尤其涉及一种基于用户好奇心的贝叶斯个性化排序推荐方法。
背景技术
随着信息技术的发展和互联网的普及,用户能够更方便地接触到更多的信息,但用户在享受信息技术带来便利的同时,也遇到了“信息过载”的问题,导致用户无法从海量的数据中找到自己想要的信息。一般来说,用户接触信息主要靠两种方式,一种是用户在互联网上手动地进行搜索,此时搜索引擎会返回一系列用户可能想要的答案;另一种就是个性化推荐,互联网会根据用户的兴趣、历史记录去为用户推荐用户感兴趣的信息。个性化推荐技术大大的降低了用户面对信息过载时的选择问题。
目前的推荐技术中,应用最广泛的当属协同过滤算法,这类算法充分利用用户的历史记录,比如评分数据、点击记录和购买记录去挖掘用户的兴趣偏好从而进行推荐,该类方法一般推荐与用户历史记录相似度比较高的物品,以寻求准确率上的提升,但是在实际应用中,总是给用户推荐与用户过去喜欢的物品一样的物品,最终会让用户产生乏味的感觉,从而对推荐的物品再也不感兴趣。此时我们需要为用户提供更具有多样性的推荐列表,从而去吸引用户注意。
心理学研究表明,好奇心可以激发起一个人的兴趣并且驱使人去做出探索行为。研究还表明,人的好奇心可以被以下特质所引起,包括新颖性(Novelty)、不确定性(uncertainty)、冲突性(conflict)和复杂性(complexity)刺激等。所以本发明的目的是在不损失一定准确率的情况下,考虑用户的好奇心,多多地提升推荐列表的多样性。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于用户好奇心的贝叶斯个性化排序推荐方法。本发明将用户的好奇心融入到经典的贝叶斯个性化排序中,在保证一定准确率的前提下,大大提升了推荐列表的多样性。
本发明的目的能够通过以下技术方案实现:
一种基于用户好奇心的贝叶斯个性化排序推荐方法,包括步骤:
使用有好友关系的数据集,遍历数据集中每一个用户u的历史数据,根据用户u有过正向反馈的物品构建该用户的正向物品集合(positive user-item set),用字母Pu表示;
对于数据集中的每一个用户,构建令用户u感到好奇的物品集合(curiosityuser-item set),用字母Cu表示;
构建用户u的负向物品集合(negative user-item set),用字母Nu表示。
提出优化排序准则,获取用户矩阵P和物品矩阵Q;
对于每一个用户,随机从Nu、Pu、Cu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q。
对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐。
具体地,所述使用有好友关系的数据集里面包括两种类型的数据;一个是用户对物品的评分数据,一个是用户与用户之间的关系数据,第二个数据可以直接表示朋友关系,因此能够获得朋友的打分行为。
具体地,所述“有过正向反馈”表示该行为记录可以显示出用户的偏好,包括显性反馈数据集和隐性反馈数据集。
对于显性反馈数据集,通过用户的评分可以表示出用户的喜好,规定超过某个阈值分数的反馈可以认为用户u对此物品i有正向反馈。比如,如果是评分范围为1-5分,则规定5分才算是用户的正向反馈。
对于隐性反馈数据集,用户对某一物品产生的行为次数可以表示出用户的喜好,规定超过某个阈值次数的反馈可以认为用户u对此物品i有正向反馈。比如,如果次数无上限,则规定用户u对物品i有过2次以上的行为记录为用户对该物品有正向反馈。
本发明使用显性反馈数据。
具体地,所述对于数据集中的每一个用户,构建令用户u感到好奇的物品集合Cu的步骤中,包括:
构建会令用户u产生新颖性感觉的物品集合C1
构建会令用户u产生不确定性感觉的物品集合C2
构建会令用户u产生冲突性感觉的物品集合C3
构建会令用户u产生复杂性感觉的物品集合C4
具体地,所述“会令用户u感到好奇的物品集合”表示会让用户u产生新颖性、不确定性、冲突性或者复杂性感觉的物品集合,表示为:
Cu=C1∩C2∩C3∩C4
其中,Cu是C1、C2、C3、C4的并集。
具体地,对于构建集合C1,使用现有的基于准确率提升的方法,比如MF算法,可以得到用户u的朋友对所有评过分的物品i的预测分数,比较预测分数与用户u的朋友对物品i打的实际分数的差值,如果差值达到一定阈值,则把物品i归为会令用户u产生新颖性感觉的物品集合C1。所述物品i不包括用户对其有过正向反馈的物品。
具体地,对于构建集合C2,统计用户u的所有朋友对物品i的评分个数,所述物品i不包括用户u对其有过正向反馈的物品,使用
Figure BDA0002348632150000041
来表示用户u的朋友对物品i打分为k分的朋友个数,通过以下公式得到用户u的朋友对物品i的打分落在k分数段的概率p(u,i,k)为:
Figure BDA0002348632150000042
例如,用户u有10个朋友,其中有5个朋友打了5分,3个朋友打了4分,2个朋友打了1分,则用户u的朋友中,对物品i的打分是5分的概率是1/2,对物品i的打分是4分的概率是3/10,对物品i的打分是1分的概率是1/10。
根据香浓熵公式计算出用户u对朋友们对物品i打分给用户u产生的不确定性感觉entropy(u,i)的大小,公式为:
Figure BDA0002348632150000043
根据Dempster–Shafer理论来支撑计算得到的entropy(u,i)表达‘不确定’的能力,使用符号DS(u,i)来进行表示:
Figure BDA0002348632150000044
其中,r表示打分分数段的最高分数值。(比如1-5分中,r=5)
则用户u对物品i产生的总不确定性感觉Uncertainty(u,i)可以通过下面的公式来进行计算:
Figure BDA0002348632150000051
得到用户i对所有物品的不确定感觉之后,选择前TopN个物品组成会令用户u产生不确定性感觉的物品集合C2
对于构建集合C3,统计用户u的所有朋友对物品i产生正向反馈和产生负向反馈的比例P1和P2,两者相乘的值为用户u对物品i产生的冲突性强度,选择前TopN个物品归为会令用户u产生冲突性感觉的物品集合C3。所述物品i不包括用户对其有过正向反馈的物品。
对于构建集合C4,用户u对物品i产生的复杂性感觉可以根据该物品和用户以往有过正反馈的物品的相似度差别是否大来进行衡量,物品i和用户历史记录中的物品越不相似,则给用户带来的复杂性感觉越大。所述物品i不包括用户对其有过正向反馈的物品。
具体地,计算两个物品之间的相似度,直接利用现有的MF算法得到的物品矩阵Q。Q矩阵中的每一列都代表一个物品,所以两列元素的余弦值可以表示这两个物品的相似度值,从而可以求得物品i与用户历史记录里面的所有物品的相似度平均值sui。对于所有的物品,按照从低到高进行排序,选择前TopN个物品组成会令用户u产生复杂性感觉的物品集合C4
具体地,所述构建用户u的负向物品集合的步骤中,把用户u有过负向反馈或者没有过反馈的物品归入集合Nu,主要包括两部分物品:一种是用户有过反馈,但是反馈是负的,也即表示用户对此有不喜欢的打分;另一种是用户没有过反馈并且也不是用户可能会产生好奇的物品,即不属于集合Cu的物品,则默认为用户对没有产生好奇的物品。
因此,M表示所有物品的总数量,M的大小为:
M=|Pu|∪|Cu|∪|Nu|
具体地,本发明提出排序优化准则如下所示:
Xui≥Xuj,Xuc≥Xuj
其中,ui表示从用户u的正向反馈集合Pu里面随机选择的物品i,uj表示从用户u的的负向反馈集合Nu里面随机选择的物品j,uc表示从用户u的好奇心物品集合Cu里面随机选择的物c。Xui≥Xuj优化准则假设对于用户u来说,用户u更加喜欢自己有过正向反馈的物品i而不是用户有过负向反馈的物品j;Xuc≥Xuj优化准则假设对于用户u来说,用户u更加喜欢能让自己产生好奇心的物品c而不是会产生负向反馈的物品j。该公式的目的是通过训练去加大用户u喜欢i物品和喜欢j物品的概率差值以及用户u喜欢c物品和喜欢j物品的概率差值,希望最后可以得到一个很好的排序顺序列表。
现在,这里使用下面的公式来表示上面两个假设:
Figure BDA0002348632150000061
Figure BDA0002348632150000062
其中,Pr(Xui≥Xuj)表示Xui≥Xuj的概率,Pr(Xuc≥Xuj)表示Xuc≥Xuj的概率,δ(·)和∈(·)是二进制的常量,表示为:
Figure BDA0002348632150000063
Figure BDA0002348632150000064
所以上述的公式可以被重写为:
Figure BDA0002348632150000071
这里使用sigmoid函数
Figure BDA0002348632150000072
函数来代替约等于Pr(·),因此目标函数可以变为最大化下面这个目标函数:
Figure BDA0002348632150000073
其中,
Figure BDA0002348632150000074
Figure BDA0002348632150000075
Qi,Qj,Qc分别表示的是物品矩阵Q的第i,j,c行,
Figure BDA0002348632150000076
bi,bj,bc分别表示的是b向量的第i,j,c位置的元素。N为用户的数量,M为物品的数量,d是隐因子的大小,另外couc表示用户的朋友选择c物品而用户本身没有选择c物品的朋友个数。
(5)这里使用SGD去优化以上公式。对于每一个用户,首先是随机从Nu、Pu、Cu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q。
具体的CBPR算法公式推导如下,令
Figure BDA0002348632150000077
Figure BDA0002348632150000078
Xui表示的是用户u对物品i的预测评分,具体计算是通过计算用户矩阵P中的第u行与物品矩阵Q中的第i行的乘积得到的。Xuj以及Xuc的计算也是类推,Xuij表示的是预测用户u对物品i和物品j喜欢的评分差值,Xucj表示的是预测用户u对物品c和物品j喜欢的评分差值。d在这里指的是P和Q矩阵中的隐因子的大小,Puf表示的是P矩阵第u行第f列的一个元素值,其他Qif和Qcf的意思也是类推。
CBPR算法的最终目的是训练参数,得到最后想要的用户矩阵P和物品矩阵Q,从而进行推荐,以下是CBPR公式的具体推导过程:
根据SGD公式,可以得到:
Figure BDA0002348632150000081
所以可以得到:
Figure BDA0002348632150000082
因此有:
当θ=Puf时,
Figure BDA0002348632150000083
Qjf)+λPuf)
当θ=Qif时,
Figure BDA0002348632150000084
当θ=Qjf时,
Figure BDA0002348632150000085
当θ=Qcf时,
Figure BDA0002348632150000086
当θ=bi时,
Figure BDA0002348632150000087
当θ=bj时,
Figure BDA0002348632150000088
当θ=bc时,
Figure BDA0002348632150000089
根据以上公式对用户矩阵P和物品矩阵Q进行梯度更新。
具体地,所述对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐的步骤中,预测评分公式为:
Figure BDA00023486321500000810
其中Xuj表示用户u对物品j的最后预测评分。
本发明相较于现有技术,具有以下的有益效果:
本发明可以量化能激起用户好奇心的物品,包括让用户感觉到新颖的物品(Novelty)、让用户产生不确定感觉的物品(uncertainty)、让用户产生强烈冲突的物品(conflict)以及让用户觉得复杂的物品(complexity),并利用心理学中的好奇心相关理论,在不损失一定准确度的前提下,提升了排序结果的多样性。本发明在给用户进行物品推荐时,不仅考虑到用户的历史兴趣偏好,还考虑到用户的好奇心。
附图说明
图1为基于用户好奇心的贝叶斯个性化排序方法(CBPR)的计算流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
如图1所示为一种基于用户好奇心的贝叶斯个性化排序推荐方法的流程图,所述方法包括步骤:
(1)使用有好友关系的数据集,遍历数据集中每一个用户u的历史数据,根据用户u有过正向反馈的物品构建该用户的正向物品集合(positive user-item set),用字母Pu表示;
具体地,所述“有过正向反馈”表示该行为记录可以显示出用户的偏好,包括显性反馈数据集和隐性反馈数据集。
对于显性反馈数据集,通过用户的评分可以表示出用户的喜好,规定超过某个阈值分数的反馈可以认为用户u对此物品i有正向反馈。比如,如果是评分范围为1-5分,则规定5分才算是用户的正向反馈。
对于隐性反馈数据集,用户对某一物品产生的行为次数可以表示出用户的喜好,规定超过某个阈值次数的反馈可以认为用户u对此物品i有正向反馈。比如,如果次数无上限,则规定用户u对物品i有过2次以上的行为记录为用户对该物品有正向反馈。
本发明使用显性反馈数据。
(2)对于数据集中的每一个用户,构建令用户u感到好奇的物品集合(curiosityuser-item set),用字母Cu表示,包括:
(2-1)构建会令用户u产生新颖性感觉的物品集合C1
具体地,使用现有的基于准确率提升的方法,比如MF算法,可以得到用户u的朋友对所有评过分的物品i的预测分数,比较预测分数与用户u的朋友对物品i打的实际分数的差值,如果差值达到一定阈值,则把物品i归为会令用户u产生新颖性感觉的物品集合C1。所述物品i不包括用户对其有过正向反馈的物品。
(2-2)构建会令用户u产生不确定性感觉的物品集合C2
具体地,统计用户u的所有朋友对物品i的评分个数,所述物品i不包括用户对其有过正向反馈的物品,使用
Figure BDA0002348632150000101
来表示用户u的朋友对物品i的打分为k分的朋友个数,通过以下公式得到用户u的朋友对物品i的打分落在k分数段的概率P(u,i,k)为:
Figure BDA0002348632150000102
根据香浓熵公式可以计算出用户u对朋友们对物品i打分给用户u自己产生的不确定性感觉的大小,公式为:
Figure BDA0002348632150000111
根据Dempster–Shafer理论来支撑计算得到的entropy(u,i)表达‘不确定’的能力,使用DS(u,i)来进行表示:
Figure BDA0002348632150000112
其中,r表示打分分数段的最高分数。则用户u对物品i产生的总不确定性感觉Uncertainty(u,i)可以通过下面的公式来进行计算:
Figure BDA0002348632150000113
得到用户i对所有物品的不确定感觉,选择前TopN个物品组成会令用户u产生不确定性感觉的物品集合C2
(2-3)构建会令用户u产生冲突性感觉的物品集合C3
统计用户u的所有朋友对物品i产生正向反馈和产生负向反馈的比例P1和P2,两者相乘的值为用户u对物品i产生的冲突性强度,选择前TopN个物品归为会令用户u产生冲突性感觉的物品集合C3。所述物品i不包括用户对其有过正向反馈的物品。
(2-4)构建会令用户u产生复杂性感觉的物品集合C4
本发明认为用户u对物品i产生的复杂性感觉可以根据该物品和用户以往有过正反馈的物品的相似度差别是否大来进行衡量,物品i和用户历史记录中的物品越不相似,则给用户带来的复杂性感觉越大。所述物品i不包括用户对其有过正向反馈的物品。
具体地,计算两个物品之间的相似度,直接利用已有的算法MF得到的物品矩阵Q。Q矩阵中的每一列都代表一个物品,所以两列元素的余弦值可以表示这两个物品的相似度值,从而可以求得物品i与用户历史记录里面的所有物品的相似度平均值sui。对于所有的物品,按照从低到高进行排序,选择前TopN个物品组成会令用户u产生复杂性感觉的物品集合C4
更进一步地,所述“会令用户u感到好奇的物品集合”表示会让用户u产生新颖性、不确定性、冲突性或者复杂性感觉的物品集合,表示为:
Cu=C1∩C2∩C3∩C4
其中,Cu是C1、C2、C3、C4的并集。
(3)把用户u有过负向反馈或者没有过反馈的物品归为该用户的负向物品集合(negative user-item set),用字母Nu表示。
Nu主要包括两部分物品,首先是用户有过反馈,但是反馈是负的,也即表示用户对此有不喜欢的打分,另一种是用户没有过反馈并且也不是用户可能会产生好奇的物品。
因此,M表示所有物品的总数量,M的大小为:
M=|Pu|∪|Cu|∪|Nu|
(4)提出排序优化准则,获取用户矩阵P和物品矩阵Q;
具体地,本发明提出排序优化准则如下所示:
Xui≥Xuj,Xuc≥Xuj
其中,ui表示从用户u的正向反馈集合Pu里面随机选择的物品i,uj表示从用户u的的负向反馈集合Nu里面随机选择的物品j,uc表示从用户u的好奇心物品集合Cu里面随机选择的物c。Xui≥Xuj优化准则假设对于用户u来说,用户u更加喜欢自己有过正向反馈的物品i而不是用户有过负向反馈的物品j;Xuc≥Xuj优化准则假设对于用户u来说,用户u更加喜欢能让自己产生好奇心的物品c而不是会产生负向反馈的物品j。该公式的目的是通过训练去加大用户u喜欢i物品和喜欢j物品的概率差值以及用户u喜欢c物品和喜欢j物品的概率差值,希望最后可以得到一个很好的排序顺序列表。
现在,这里使用下面的公式来表示上面两个假设:
Figure BDA0002348632150000131
Figure BDA0002348632150000132
其中δ(·)和∈(·)是二进制的常量,表示为:
Figure BDA0002348632150000133
Figure BDA0002348632150000134
所以上述的公式可以被重写为:
Figure BDA0002348632150000135
这里使用sigmoid函数
Figure BDA0002348632150000136
函来代替约等于Pr(·),因此目标函数可以变为最大化下面这个目标函数:
Figure BDA0002348632150000137
其中,
Figure BDA0002348632150000138
Figure BDA0002348632150000139
Qi,Qj,Qc分别表示的是物品矩阵Q的第i,j,c行,
Figure BDA00023486321500001310
bi,bj,bc分别表示的是b向量的第i,j,c位置的元素。N为用户的数量,M为物品的数量,d是隐因子的大小,另外couc表示用户的朋友选择c物品而用户本身没有选择c物品的朋友个数。
(5)这里使用SGD去优化以上公式。对于每一个用户,首先是随机从Nu、Pu、Cu中选择物品组成物品对(positive,negative)和(curiosity,negative),在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q。
CBPR算法的最终目的是训练参数,得到最后想要的用户矩阵P和物品矩阵Q,从而进行推荐,以下是CBPR公式的具体推导过程:
Figure BDA0002348632150000141
Figure BDA0002348632150000142
其中,Xui表示的是用户u对物品i的预测评分,具体计算是通过计算用户矩阵P中的第u行与物品矩阵Q中的第i行的乘积得到的。Xuj表示的是用户u对物品j的预测评分,Xuc表示的是用户u对物品c的预测评分,Xuij表示的是预测用户u对物品i和物品j喜欢的评分差值,Xucj表示的是预测用户u对物品c和物品j喜欢的评分差值。d在这里指的是P和Q矩阵中的隐因子的大小,Puf表示的是P矩阵第u行第f列的一个元素值,Qif表示的是Q矩阵第i行第f列的一个元素值,Qjf表示的是Q矩阵第j行第f列的一个元素值,Qcf表示的是Q矩阵第c行第f列的一个元素值。
根据SGD公式,可以得到:
Figure BDA0002348632150000143
所以可以得到:
Figure BDA0002348632150000144
因此有:
当θ=Puf时,
Figure BDA0002348632150000151
Qjf)+λPuf)
当θ=Qif时,
Figure BDA0002348632150000152
当θ=Qjf时,
Figure BDA0002348632150000153
当θ=Qcf时,
Figure BDA0002348632150000154
当θ=bi时,
Figure BDA0002348632150000155
当θ=bj时,
Figure BDA0002348632150000156
当θ=bc时,
Figure BDA0002348632150000157
根据以上公式对用户矩阵P和物品矩阵Q进行梯度更新。
(6)对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐,公式如下:
Figure BDA0002348632150000158
其中Xuj表示用户u对物品j的最后预测评分。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (2)

1.一种基于用户好奇心的贝叶斯个性化排序推荐方法,其特征在于,包括步骤:
使用有好友关系的数据集,遍历数据集中每一个用户的历史数据,对于数据集中的每一个用户u,根据用户u有过正向反馈的物品构建该用户的正向物品集合Pu
所述对于数据集中的每一个用户,构建令用户感到好奇的物品集合Cu的步骤中,包括:
构建会令用户产生新颖性感觉的物品集合C1
构建会令用户产生不确定性感觉的物品集合C2
构建会令用户产生冲突性感觉的物品集合C3
构建会令用户产生复杂性感觉的物品集合C4
对于构建集合C1,使用现有的MF算法,得到用户u的朋友对所有评过分的物品i的预测分数,比较预测分数与用户u的朋友对物品i打的实际分数的差值,如果差值达到一定阈值,则把物品i归为会令用户u产生新颖性感觉的物品集合C1;所述物品i不包括用户对其有过正向反馈的物品;
对于构建集合C2,统计用户u的所有朋友对物品i的评分个数,所述物品i不包括用户对其有过正向反馈的物品,使用
Figure FDA0004055091760000011
来表示用户u的朋友对物品i打分为k分的朋友个数,通过以下公式得到用户u的朋友对物品i的打分落在k分数段的概率p(u,i,k)为:
Figure FDA0004055091760000012
根据香浓熵公式计算出用户u对朋友们对物品i打分给用户u产生的不确定性感觉entropy(u,i)的大小,公式为:
Figure FDA0004055091760000013
根据Dempster-Shafer理论来支撑计算得到的entropy(u,i)表达‘不确定’的能力,使用DS(u,i)来进行表示:
Figure FDA0004055091760000021
其中,r表示打分分数段的最高分数值;
则用户u对物品i产生的总不确定性感觉Uncertainty(u,i)可以通过下面的公式来进行计算:
Figure FDA0004055091760000022
得到用户i对所有物品的不确定感觉,选择前TopN个物品组成会令用户u产生不确定性感觉的物品集合C2
对于构建集合C3,统计用户u的所有朋友对物品i产生正向反馈和产生负向反馈的比例P1和P2,两者相乘的值为用户u对物品i产生的冲突性强度,选择前TopN个物品归为会令用户u产生冲突性感觉的物品集合C3;所述物品i不包括用户对其有过正向反馈的物品;
对于构建集合C4,用户u对物品i产生的复杂性感觉可以根据该物品和用户以往有过正反馈的物品的相似度差别是否大来进行衡量,物品i和用户历史记录中的物品越不相似,则给用户带来的复杂性感觉越大;所述物品i不包括用户对其有过正向反馈的物品;
构建令用户u感到好奇的物品集合Cu
构建用户u的负向物品集合Nu
提出优化排序准则,获取用户矩阵P和物品矩阵Q;所述优化排序准则如下所示:
Xui≥Xuj,Xuc≥Xuj
其中,ui表示从用户u的正向物品集合Pu里面随机选择的物品i,uj表示从用户u的负向物品集合Nu里面随机选择的物品j,uc表示从用户u的好奇心物品集合Cu里面随机选择的物c;Xui≥Xuj优化准则假设对于用户u来说,用户u更加喜欢自己有过正向反馈的物品i而不是用户有过负向反馈的物品j;Xuc≥Xuj优化准则假设对于用户u来说,用户u更加喜欢能让自己产生好奇心的物品c而不是会产生负向反馈的物品j;
使用下面的公式来表示上面两个假设:
Figure FDA0004055091760000031
Figure FDA0004055091760000032
其中δ(·)和∈(·)是二进制的常量,表示为:
Figure FDA0004055091760000033
Figure FDA0004055091760000034
所以上述的公式可以被重写为:
Figure FDA0004055091760000035
这里使用sigmoid函数
Figure FDA0004055091760000036
来代替约等于Pr(·),因此目标函数可以变为最大化下面这个目标函数:
Figure FDA0004055091760000037
其中,
Figure FDA0004055091760000038
Figure FDA0004055091760000039
Qi,Qj,Qc分别表示的是物品矩阵Q的第i,j,c行,
Figure FDA00040550917600000310
bi,bj,bc分别表示的是b向量的第i,j,c位置的元素;N为用户的数量,M为物品的数量,d是隐因子的大小,另外couc表示用户u的朋友选择c物品而用户u本身没有选择c物品的朋友个数;
对于每一个用户,随机从Pu、Cu、Nu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q;具体的基于用户好奇心的贝叶斯个性化排序推荐算法公式推导如下,令
Figure FDA0004055091760000041
Figure FDA0004055091760000042
其中,Xui表示的是用户u对物品i的预测评分,Xuj表示的是用户u对物品j的预测评分,Xuc表示的是用户u对物品c的预测评分,Xuij表示的是预测用户u对物品i和物品j喜欢的评分差值,Xucj表示的是预测用户u对物品c和物品j喜欢的评分差值;d表示P和Q矩阵中的隐因子的大小,Puf表示的是P矩阵第u行第f列的一个元素值,Qif表示的是Q矩阵第i行第f列的一个元素值,Qjf表示的是Q矩阵第j行第f列的一个元素值,Qcf表示的是Q矩阵第c行第f列的一个元素值;
根据SGD公式,可以得到:
Figure FDA0004055091760000043
所以可以得到:
Figure FDA0004055091760000044
因此有:
当θ=Puf时,
Figure FDA0004055091760000045
Figure FDA0004055091760000046
当θ=Qif时,
Figure FDA0004055091760000047
当θ=Qjf时,
Figure FDA0004055091760000048
当θ=Qcf时,
Figure FDA0004055091760000049
当θ=bi时,
Figure FDA00040550917600000410
当θ=bj时,
Figure FDA0004055091760000051
当θ=bc时,
Figure FDA0004055091760000052
根据以上公式对用户矩阵P和物品矩阵Q进行梯度更新;
对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐。
2.根据权利要求1所述的方法,其特征在于,所述对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐的步骤中,预测评分公式为:
Figure FDA0004055091760000053
其中Xuj表示用户u对物品j的最后预测评分。
CN201911405967.7A 2019-12-31 2019-12-31 一种基于用户好奇心的贝叶斯个性化排序推荐方法 Active CN111159556B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201911405967.7A CN111159556B (zh) 2019-12-31 2019-12-31 一种基于用户好奇心的贝叶斯个性化排序推荐方法
PCT/CN2020/105072 WO2021135192A1 (zh) 2019-12-31 2020-07-28 一种基于用户好奇心的贝叶斯个性化排序推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911405967.7A CN111159556B (zh) 2019-12-31 2019-12-31 一种基于用户好奇心的贝叶斯个性化排序推荐方法

Publications (2)

Publication Number Publication Date
CN111159556A CN111159556A (zh) 2020-05-15
CN111159556B true CN111159556B (zh) 2023-04-21

Family

ID=70559843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911405967.7A Active CN111159556B (zh) 2019-12-31 2019-12-31 一种基于用户好奇心的贝叶斯个性化排序推荐方法

Country Status (2)

Country Link
CN (1) CN111159556B (zh)
WO (1) WO2021135192A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159556B (zh) * 2019-12-31 2023-04-21 华南理工大学 一种基于用户好奇心的贝叶斯个性化排序推荐方法
CN112115384A (zh) * 2020-08-14 2020-12-22 南京航空航天大学 一种基于生成排序的时序推荐算法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598643A (zh) * 2015-02-13 2015-05-06 成都品果科技有限公司 一种物品相似度贡献系数、相似度获取方法及物品推荐方法及其系统
CN107025311A (zh) * 2017-05-18 2017-08-08 北京大学 一种基于k近邻的贝叶斯个性化推荐方法及装置
CN109299384A (zh) * 2018-11-02 2019-02-01 北京小米智能科技有限公司 场景推荐方法、装置及系统、存储介质
CN109783725A (zh) * 2018-12-15 2019-05-21 华南理工大学 一种融入用户好奇心机制的推荐方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9600581B2 (en) * 2009-02-19 2017-03-21 Yahoo! Inc. Personalized recommendations on dynamic content
CN103886047B (zh) * 2014-03-12 2017-07-07 浙江大学 面向流式数据的分布式在线推荐方法
CN107423335B (zh) * 2017-04-27 2020-06-05 电子科技大学 一种针对单类协同过滤问题的负样本选择方法
CN111159556B (zh) * 2019-12-31 2023-04-21 华南理工大学 一种基于用户好奇心的贝叶斯个性化排序推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598643A (zh) * 2015-02-13 2015-05-06 成都品果科技有限公司 一种物品相似度贡献系数、相似度获取方法及物品推荐方法及其系统
CN107025311A (zh) * 2017-05-18 2017-08-08 北京大学 一种基于k近邻的贝叶斯个性化推荐方法及装置
CN109299384A (zh) * 2018-11-02 2019-02-01 北京小米智能科技有限公司 场景推荐方法、装置及系统、存储介质
CN109783725A (zh) * 2018-12-15 2019-05-21 华南理工大学 一种融入用户好奇心机制的推荐方法

Also Published As

Publication number Publication date
WO2021135192A1 (zh) 2021-07-08
CN111159556A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
Kotkov et al. A survey of serendipity in recommender systems
CN108460619B (zh) 一种提供融合显隐式反馈的协同推荐模型的方法
Tyagi et al. Enhancing collaborative filtering recommendations by utilizing multi-objective particle swarm optimization embedded association rule mining
Rana et al. Building a Book Recommender system using time based content filtering
CN110263257B (zh) 基于深度学习处理多源异构数据的推荐方法
CN107220365A (zh) 基于协同过滤与关联规则并行处理的精准推荐系统及方法
CN112115377A (zh) 一种基于社交关系的图神经网络链路预测推荐方法
Hofmann Fast and reliable online learning to rank for information retrieval
CN111159556B (zh) 一种基于用户好奇心的贝叶斯个性化排序推荐方法
JP7157239B2 (ja) 感情認識機械を定義するための方法及びシステム
Bhattacharya et al. Intent-aware contextual recommendation system
Parida et al. Prediction of recommendations for employment utilizing machine learning procedures and geo-area based recommender framework
CN112507231A (zh) 一种基于gwo-fcm的个性化推荐方法
Sivaramakrishnan et al. An effective user clustering-based collaborative filtering recommender system with grey wolf optimisation
Park et al. Fast Collaborative Filtering with a k-nearest neighbor graph
Zeldes et al. Deep density networks and uncertainty in recommender systems
CN109684561B (zh) 基于用户签到行为变化的深层语义分析的兴趣点推荐方法
Devika et al. Book recommendation system
Rohani et al. An enhanced content-based recommender system for academic social networks
Somantri et al. Opinion mining on culinary food customer satisfaction using naïve bayes based-on hybrid feature selection
CN114298783A (zh) 基于矩阵分解融合用户社交信息的商品推荐方法及系统
CN110795640B (zh) 一种弥补群组成员差异的自适应组推荐方法
Alfarhood et al. Collaborative attentive autoencoder for scientific article recommendation
Liu et al. A sequential embedding approach for item recommendation with heterogeneous attributes
Gandhi et al. A Modified Approach towards Tourism Recommendation System with Collaborative Filtering and Association Rule Mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant