CN111159556B - 一种基于用户好奇心的贝叶斯个性化排序推荐方法 - Google Patents
一种基于用户好奇心的贝叶斯个性化排序推荐方法 Download PDFInfo
- Publication number
- CN111159556B CN111159556B CN201911405967.7A CN201911405967A CN111159556B CN 111159556 B CN111159556 B CN 111159556B CN 201911405967 A CN201911405967 A CN 201911405967A CN 111159556 B CN111159556 B CN 111159556B
- Authority
- CN
- China
- Prior art keywords
- user
- item
- article
- items
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims abstract description 48
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 7
- 239000008186 active pharmaceutical agent Substances 0.000 claims description 3
- 230000008447 perception Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 3
- 238000009795 derivation Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于用户好奇心的贝叶斯个性化排序推荐方法,包括步骤:使用有好友关系的数据集,遍历数据集中每一个用户的历史数据,对于数据集中的每一个用户u,构建用户u的正向物品集合Pu,令用户u感到好奇的物品集合Cu以及用户u的负向物品集合Nu;提出优化排序准则,获取用户矩阵P和物品矩阵Q;对于每一个用户u,随机从Pu、Cu、Nu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q;对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐。
Description
技术领域
本发明涉及个性化推荐技术领域,尤其涉及一种基于用户好奇心的贝叶斯个性化排序推荐方法。
背景技术
随着信息技术的发展和互联网的普及,用户能够更方便地接触到更多的信息,但用户在享受信息技术带来便利的同时,也遇到了“信息过载”的问题,导致用户无法从海量的数据中找到自己想要的信息。一般来说,用户接触信息主要靠两种方式,一种是用户在互联网上手动地进行搜索,此时搜索引擎会返回一系列用户可能想要的答案;另一种就是个性化推荐,互联网会根据用户的兴趣、历史记录去为用户推荐用户感兴趣的信息。个性化推荐技术大大的降低了用户面对信息过载时的选择问题。
目前的推荐技术中,应用最广泛的当属协同过滤算法,这类算法充分利用用户的历史记录,比如评分数据、点击记录和购买记录去挖掘用户的兴趣偏好从而进行推荐,该类方法一般推荐与用户历史记录相似度比较高的物品,以寻求准确率上的提升,但是在实际应用中,总是给用户推荐与用户过去喜欢的物品一样的物品,最终会让用户产生乏味的感觉,从而对推荐的物品再也不感兴趣。此时我们需要为用户提供更具有多样性的推荐列表,从而去吸引用户注意。
心理学研究表明,好奇心可以激发起一个人的兴趣并且驱使人去做出探索行为。研究还表明,人的好奇心可以被以下特质所引起,包括新颖性(Novelty)、不确定性(uncertainty)、冲突性(conflict)和复杂性(complexity)刺激等。所以本发明的目的是在不损失一定准确率的情况下,考虑用户的好奇心,多多地提升推荐列表的多样性。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于用户好奇心的贝叶斯个性化排序推荐方法。本发明将用户的好奇心融入到经典的贝叶斯个性化排序中,在保证一定准确率的前提下,大大提升了推荐列表的多样性。
本发明的目的能够通过以下技术方案实现:
一种基于用户好奇心的贝叶斯个性化排序推荐方法,包括步骤:
使用有好友关系的数据集,遍历数据集中每一个用户u的历史数据,根据用户u有过正向反馈的物品构建该用户的正向物品集合(positive user-item set),用字母Pu表示;
对于数据集中的每一个用户,构建令用户u感到好奇的物品集合(curiosityuser-item set),用字母Cu表示;
构建用户u的负向物品集合(negative user-item set),用字母Nu表示。
提出优化排序准则,获取用户矩阵P和物品矩阵Q;
对于每一个用户,随机从Nu、Pu、Cu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q。
对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐。
具体地,所述使用有好友关系的数据集里面包括两种类型的数据;一个是用户对物品的评分数据,一个是用户与用户之间的关系数据,第二个数据可以直接表示朋友关系,因此能够获得朋友的打分行为。
具体地,所述“有过正向反馈”表示该行为记录可以显示出用户的偏好,包括显性反馈数据集和隐性反馈数据集。
对于显性反馈数据集,通过用户的评分可以表示出用户的喜好,规定超过某个阈值分数的反馈可以认为用户u对此物品i有正向反馈。比如,如果是评分范围为1-5分,则规定5分才算是用户的正向反馈。
对于隐性反馈数据集,用户对某一物品产生的行为次数可以表示出用户的喜好,规定超过某个阈值次数的反馈可以认为用户u对此物品i有正向反馈。比如,如果次数无上限,则规定用户u对物品i有过2次以上的行为记录为用户对该物品有正向反馈。
本发明使用显性反馈数据。
具体地,所述对于数据集中的每一个用户,构建令用户u感到好奇的物品集合Cu的步骤中,包括:
构建会令用户u产生新颖性感觉的物品集合C1;
构建会令用户u产生不确定性感觉的物品集合C2;
构建会令用户u产生冲突性感觉的物品集合C3;
构建会令用户u产生复杂性感觉的物品集合C4。
具体地,所述“会令用户u感到好奇的物品集合”表示会让用户u产生新颖性、不确定性、冲突性或者复杂性感觉的物品集合,表示为:
Cu=C1∩C2∩C3∩C4
其中,Cu是C1、C2、C3、C4的并集。
具体地,对于构建集合C1,使用现有的基于准确率提升的方法,比如MF算法,可以得到用户u的朋友对所有评过分的物品i的预测分数,比较预测分数与用户u的朋友对物品i打的实际分数的差值,如果差值达到一定阈值,则把物品i归为会令用户u产生新颖性感觉的物品集合C1。所述物品i不包括用户对其有过正向反馈的物品。
具体地,对于构建集合C2,统计用户u的所有朋友对物品i的评分个数,所述物品i不包括用户u对其有过正向反馈的物品,使用来表示用户u的朋友对物品i打分为k分的朋友个数,通过以下公式得到用户u的朋友对物品i的打分落在k分数段的概率p(u,i,k)为:
例如,用户u有10个朋友,其中有5个朋友打了5分,3个朋友打了4分,2个朋友打了1分,则用户u的朋友中,对物品i的打分是5分的概率是1/2,对物品i的打分是4分的概率是3/10,对物品i的打分是1分的概率是1/10。
根据香浓熵公式计算出用户u对朋友们对物品i打分给用户u产生的不确定性感觉entropy(u,i)的大小,公式为:
根据Dempster–Shafer理论来支撑计算得到的entropy(u,i)表达‘不确定’的能力,使用符号DS(u,i)来进行表示:
其中,r表示打分分数段的最高分数值。(比如1-5分中,r=5)
则用户u对物品i产生的总不确定性感觉Uncertainty(u,i)可以通过下面的公式来进行计算:
得到用户i对所有物品的不确定感觉之后,选择前TopN个物品组成会令用户u产生不确定性感觉的物品集合C2。
对于构建集合C3,统计用户u的所有朋友对物品i产生正向反馈和产生负向反馈的比例P1和P2,两者相乘的值为用户u对物品i产生的冲突性强度,选择前TopN个物品归为会令用户u产生冲突性感觉的物品集合C3。所述物品i不包括用户对其有过正向反馈的物品。
对于构建集合C4,用户u对物品i产生的复杂性感觉可以根据该物品和用户以往有过正反馈的物品的相似度差别是否大来进行衡量,物品i和用户历史记录中的物品越不相似,则给用户带来的复杂性感觉越大。所述物品i不包括用户对其有过正向反馈的物品。
具体地,计算两个物品之间的相似度,直接利用现有的MF算法得到的物品矩阵Q。Q矩阵中的每一列都代表一个物品,所以两列元素的余弦值可以表示这两个物品的相似度值,从而可以求得物品i与用户历史记录里面的所有物品的相似度平均值sui。对于所有的物品,按照从低到高进行排序,选择前TopN个物品组成会令用户u产生复杂性感觉的物品集合C4。
具体地,所述构建用户u的负向物品集合的步骤中,把用户u有过负向反馈或者没有过反馈的物品归入集合Nu,主要包括两部分物品:一种是用户有过反馈,但是反馈是负的,也即表示用户对此有不喜欢的打分;另一种是用户没有过反馈并且也不是用户可能会产生好奇的物品,即不属于集合Cu的物品,则默认为用户对没有产生好奇的物品。
因此,M表示所有物品的总数量,M的大小为:
M=|Pu|∪|Cu|∪|Nu|
具体地,本发明提出排序优化准则如下所示:
Xui≥Xuj,Xuc≥Xuj
其中,ui表示从用户u的正向反馈集合Pu里面随机选择的物品i,uj表示从用户u的的负向反馈集合Nu里面随机选择的物品j,uc表示从用户u的好奇心物品集合Cu里面随机选择的物c。Xui≥Xuj优化准则假设对于用户u来说,用户u更加喜欢自己有过正向反馈的物品i而不是用户有过负向反馈的物品j;Xuc≥Xuj优化准则假设对于用户u来说,用户u更加喜欢能让自己产生好奇心的物品c而不是会产生负向反馈的物品j。该公式的目的是通过训练去加大用户u喜欢i物品和喜欢j物品的概率差值以及用户u喜欢c物品和喜欢j物品的概率差值,希望最后可以得到一个很好的排序顺序列表。
现在,这里使用下面的公式来表示上面两个假设:
其中,Pr(Xui≥Xuj)表示Xui≥Xuj的概率,Pr(Xuc≥Xuj)表示Xuc≥Xuj的概率,δ(·)和∈(·)是二进制的常量,表示为:
所以上述的公式可以被重写为:
其中, Qi,Qj,Qc分别表示的是物品矩阵Q的第i,j,c行,bi,bj,bc分别表示的是b向量的第i,j,c位置的元素。N为用户的数量,M为物品的数量,d是隐因子的大小,另外couc表示用户的朋友选择c物品而用户本身没有选择c物品的朋友个数。
(5)这里使用SGD去优化以上公式。对于每一个用户,首先是随机从Nu、Pu、Cu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q。
具体的CBPR算法公式推导如下,令
Xui表示的是用户u对物品i的预测评分,具体计算是通过计算用户矩阵P中的第u行与物品矩阵Q中的第i行的乘积得到的。Xuj以及Xuc的计算也是类推,Xuij表示的是预测用户u对物品i和物品j喜欢的评分差值,Xucj表示的是预测用户u对物品c和物品j喜欢的评分差值。d在这里指的是P和Q矩阵中的隐因子的大小,Puf表示的是P矩阵第u行第f列的一个元素值,其他Qif和Qcf的意思也是类推。
CBPR算法的最终目的是训练参数,得到最后想要的用户矩阵P和物品矩阵Q,从而进行推荐,以下是CBPR公式的具体推导过程:
根据SGD公式,可以得到:
所以可以得到:
因此有:
根据以上公式对用户矩阵P和物品矩阵Q进行梯度更新。
具体地,所述对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐的步骤中,预测评分公式为:
其中Xuj表示用户u对物品j的最后预测评分。
本发明相较于现有技术,具有以下的有益效果:
本发明可以量化能激起用户好奇心的物品,包括让用户感觉到新颖的物品(Novelty)、让用户产生不确定感觉的物品(uncertainty)、让用户产生强烈冲突的物品(conflict)以及让用户觉得复杂的物品(complexity),并利用心理学中的好奇心相关理论,在不损失一定准确度的前提下,提升了排序结果的多样性。本发明在给用户进行物品推荐时,不仅考虑到用户的历史兴趣偏好,还考虑到用户的好奇心。
附图说明
图1为基于用户好奇心的贝叶斯个性化排序方法(CBPR)的计算流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
如图1所示为一种基于用户好奇心的贝叶斯个性化排序推荐方法的流程图,所述方法包括步骤:
(1)使用有好友关系的数据集,遍历数据集中每一个用户u的历史数据,根据用户u有过正向反馈的物品构建该用户的正向物品集合(positive user-item set),用字母Pu表示;
具体地,所述“有过正向反馈”表示该行为记录可以显示出用户的偏好,包括显性反馈数据集和隐性反馈数据集。
对于显性反馈数据集,通过用户的评分可以表示出用户的喜好,规定超过某个阈值分数的反馈可以认为用户u对此物品i有正向反馈。比如,如果是评分范围为1-5分,则规定5分才算是用户的正向反馈。
对于隐性反馈数据集,用户对某一物品产生的行为次数可以表示出用户的喜好,规定超过某个阈值次数的反馈可以认为用户u对此物品i有正向反馈。比如,如果次数无上限,则规定用户u对物品i有过2次以上的行为记录为用户对该物品有正向反馈。
本发明使用显性反馈数据。
(2)对于数据集中的每一个用户,构建令用户u感到好奇的物品集合(curiosityuser-item set),用字母Cu表示,包括:
(2-1)构建会令用户u产生新颖性感觉的物品集合C1;
具体地,使用现有的基于准确率提升的方法,比如MF算法,可以得到用户u的朋友对所有评过分的物品i的预测分数,比较预测分数与用户u的朋友对物品i打的实际分数的差值,如果差值达到一定阈值,则把物品i归为会令用户u产生新颖性感觉的物品集合C1。所述物品i不包括用户对其有过正向反馈的物品。
(2-2)构建会令用户u产生不确定性感觉的物品集合C2;
具体地,统计用户u的所有朋友对物品i的评分个数,所述物品i不包括用户对其有过正向反馈的物品,使用来表示用户u的朋友对物品i的打分为k分的朋友个数,通过以下公式得到用户u的朋友对物品i的打分落在k分数段的概率P(u,i,k)为:
根据香浓熵公式可以计算出用户u对朋友们对物品i打分给用户u自己产生的不确定性感觉的大小,公式为:
根据Dempster–Shafer理论来支撑计算得到的entropy(u,i)表达‘不确定’的能力,使用DS(u,i)来进行表示:
其中,r表示打分分数段的最高分数。则用户u对物品i产生的总不确定性感觉Uncertainty(u,i)可以通过下面的公式来进行计算:
得到用户i对所有物品的不确定感觉,选择前TopN个物品组成会令用户u产生不确定性感觉的物品集合C2。
(2-3)构建会令用户u产生冲突性感觉的物品集合C3;
统计用户u的所有朋友对物品i产生正向反馈和产生负向反馈的比例P1和P2,两者相乘的值为用户u对物品i产生的冲突性强度,选择前TopN个物品归为会令用户u产生冲突性感觉的物品集合C3。所述物品i不包括用户对其有过正向反馈的物品。
(2-4)构建会令用户u产生复杂性感觉的物品集合C4。
本发明认为用户u对物品i产生的复杂性感觉可以根据该物品和用户以往有过正反馈的物品的相似度差别是否大来进行衡量,物品i和用户历史记录中的物品越不相似,则给用户带来的复杂性感觉越大。所述物品i不包括用户对其有过正向反馈的物品。
具体地,计算两个物品之间的相似度,直接利用已有的算法MF得到的物品矩阵Q。Q矩阵中的每一列都代表一个物品,所以两列元素的余弦值可以表示这两个物品的相似度值,从而可以求得物品i与用户历史记录里面的所有物品的相似度平均值sui。对于所有的物品,按照从低到高进行排序,选择前TopN个物品组成会令用户u产生复杂性感觉的物品集合C4。
更进一步地,所述“会令用户u感到好奇的物品集合”表示会让用户u产生新颖性、不确定性、冲突性或者复杂性感觉的物品集合,表示为:
Cu=C1∩C2∩C3∩C4
其中,Cu是C1、C2、C3、C4的并集。
(3)把用户u有过负向反馈或者没有过反馈的物品归为该用户的负向物品集合(negative user-item set),用字母Nu表示。
Nu主要包括两部分物品,首先是用户有过反馈,但是反馈是负的,也即表示用户对此有不喜欢的打分,另一种是用户没有过反馈并且也不是用户可能会产生好奇的物品。
因此,M表示所有物品的总数量,M的大小为:
M=|Pu|∪|Cu|∪|Nu|
(4)提出排序优化准则,获取用户矩阵P和物品矩阵Q;
具体地,本发明提出排序优化准则如下所示:
Xui≥Xuj,Xuc≥Xuj
其中,ui表示从用户u的正向反馈集合Pu里面随机选择的物品i,uj表示从用户u的的负向反馈集合Nu里面随机选择的物品j,uc表示从用户u的好奇心物品集合Cu里面随机选择的物c。Xui≥Xuj优化准则假设对于用户u来说,用户u更加喜欢自己有过正向反馈的物品i而不是用户有过负向反馈的物品j;Xuc≥Xuj优化准则假设对于用户u来说,用户u更加喜欢能让自己产生好奇心的物品c而不是会产生负向反馈的物品j。该公式的目的是通过训练去加大用户u喜欢i物品和喜欢j物品的概率差值以及用户u喜欢c物品和喜欢j物品的概率差值,希望最后可以得到一个很好的排序顺序列表。
现在,这里使用下面的公式来表示上面两个假设:
其中δ(·)和∈(·)是二进制的常量,表示为:
所以上述的公式可以被重写为:
其中, Qi,Qj,Qc分别表示的是物品矩阵Q的第i,j,c行,bi,bj,bc分别表示的是b向量的第i,j,c位置的元素。N为用户的数量,M为物品的数量,d是隐因子的大小,另外couc表示用户的朋友选择c物品而用户本身没有选择c物品的朋友个数。
(5)这里使用SGD去优化以上公式。对于每一个用户,首先是随机从Nu、Pu、Cu中选择物品组成物品对(positive,negative)和(curiosity,negative),在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q。
CBPR算法的最终目的是训练参数,得到最后想要的用户矩阵P和物品矩阵Q,从而进行推荐,以下是CBPR公式的具体推导过程:
其中,Xui表示的是用户u对物品i的预测评分,具体计算是通过计算用户矩阵P中的第u行与物品矩阵Q中的第i行的乘积得到的。Xuj表示的是用户u对物品j的预测评分,Xuc表示的是用户u对物品c的预测评分,Xuij表示的是预测用户u对物品i和物品j喜欢的评分差值,Xucj表示的是预测用户u对物品c和物品j喜欢的评分差值。d在这里指的是P和Q矩阵中的隐因子的大小,Puf表示的是P矩阵第u行第f列的一个元素值,Qif表示的是Q矩阵第i行第f列的一个元素值,Qjf表示的是Q矩阵第j行第f列的一个元素值,Qcf表示的是Q矩阵第c行第f列的一个元素值。
根据SGD公式,可以得到:
所以可以得到:
因此有:
根据以上公式对用户矩阵P和物品矩阵Q进行梯度更新。
(6)对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐,公式如下:
其中Xuj表示用户u对物品j的最后预测评分。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (2)
1.一种基于用户好奇心的贝叶斯个性化排序推荐方法,其特征在于,包括步骤:
使用有好友关系的数据集,遍历数据集中每一个用户的历史数据,对于数据集中的每一个用户u,根据用户u有过正向反馈的物品构建该用户的正向物品集合Pu;
所述对于数据集中的每一个用户,构建令用户感到好奇的物品集合Cu的步骤中,包括:
构建会令用户产生新颖性感觉的物品集合C1;
构建会令用户产生不确定性感觉的物品集合C2;
构建会令用户产生冲突性感觉的物品集合C3;
构建会令用户产生复杂性感觉的物品集合C4;
对于构建集合C1,使用现有的MF算法,得到用户u的朋友对所有评过分的物品i的预测分数,比较预测分数与用户u的朋友对物品i打的实际分数的差值,如果差值达到一定阈值,则把物品i归为会令用户u产生新颖性感觉的物品集合C1;所述物品i不包括用户对其有过正向反馈的物品;
对于构建集合C2,统计用户u的所有朋友对物品i的评分个数,所述物品i不包括用户对其有过正向反馈的物品,使用来表示用户u的朋友对物品i打分为k分的朋友个数,通过以下公式得到用户u的朋友对物品i的打分落在k分数段的概率p(u,i,k)为:
根据香浓熵公式计算出用户u对朋友们对物品i打分给用户u产生的不确定性感觉entropy(u,i)的大小,公式为:
根据Dempster-Shafer理论来支撑计算得到的entropy(u,i)表达‘不确定’的能力,使用DS(u,i)来进行表示:
其中,r表示打分分数段的最高分数值;
则用户u对物品i产生的总不确定性感觉Uncertainty(u,i)可以通过下面的公式来进行计算:
得到用户i对所有物品的不确定感觉,选择前TopN个物品组成会令用户u产生不确定性感觉的物品集合C2;
对于构建集合C3,统计用户u的所有朋友对物品i产生正向反馈和产生负向反馈的比例P1和P2,两者相乘的值为用户u对物品i产生的冲突性强度,选择前TopN个物品归为会令用户u产生冲突性感觉的物品集合C3;所述物品i不包括用户对其有过正向反馈的物品;
对于构建集合C4,用户u对物品i产生的复杂性感觉可以根据该物品和用户以往有过正反馈的物品的相似度差别是否大来进行衡量,物品i和用户历史记录中的物品越不相似,则给用户带来的复杂性感觉越大;所述物品i不包括用户对其有过正向反馈的物品;
构建令用户u感到好奇的物品集合Cu;
构建用户u的负向物品集合Nu;
提出优化排序准则,获取用户矩阵P和物品矩阵Q;所述优化排序准则如下所示:
Xui≥Xuj,Xuc≥Xuj
其中,ui表示从用户u的正向物品集合Pu里面随机选择的物品i,uj表示从用户u的负向物品集合Nu里面随机选择的物品j,uc表示从用户u的好奇心物品集合Cu里面随机选择的物c;Xui≥Xuj优化准则假设对于用户u来说,用户u更加喜欢自己有过正向反馈的物品i而不是用户有过负向反馈的物品j;Xuc≥Xuj优化准则假设对于用户u来说,用户u更加喜欢能让自己产生好奇心的物品c而不是会产生负向反馈的物品j;
使用下面的公式来表示上面两个假设:
其中δ(·)和∈(·)是二进制的常量,表示为:
所以上述的公式可以被重写为:
其中, Qi,Qj,Qc分别表示的是物品矩阵Q的第i,j,c行,bi,bj,bc分别表示的是b向量的第i,j,c位置的元素;N为用户的数量,M为物品的数量,d是隐因子的大小,另外couc表示用户u的朋友选择c物品而用户u本身没有选择c物品的朋友个数;
对于每一个用户,随机从Pu、Cu、Nu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q;具体的基于用户好奇心的贝叶斯个性化排序推荐算法公式推导如下,令
其中,Xui表示的是用户u对物品i的预测评分,Xuj表示的是用户u对物品j的预测评分,Xuc表示的是用户u对物品c的预测评分,Xuij表示的是预测用户u对物品i和物品j喜欢的评分差值,Xucj表示的是预测用户u对物品c和物品j喜欢的评分差值;d表示P和Q矩阵中的隐因子的大小,Puf表示的是P矩阵第u行第f列的一个元素值,Qif表示的是Q矩阵第i行第f列的一个元素值,Qjf表示的是Q矩阵第j行第f列的一个元素值,Qcf表示的是Q矩阵第c行第f列的一个元素值;
根据SGD公式,可以得到:
所以可以得到:
因此有:
根据以上公式对用户矩阵P和物品矩阵Q进行梯度更新;
对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911405967.7A CN111159556B (zh) | 2019-12-31 | 2019-12-31 | 一种基于用户好奇心的贝叶斯个性化排序推荐方法 |
PCT/CN2020/105072 WO2021135192A1 (zh) | 2019-12-31 | 2020-07-28 | 一种基于用户好奇心的贝叶斯个性化排序推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911405967.7A CN111159556B (zh) | 2019-12-31 | 2019-12-31 | 一种基于用户好奇心的贝叶斯个性化排序推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111159556A CN111159556A (zh) | 2020-05-15 |
CN111159556B true CN111159556B (zh) | 2023-04-21 |
Family
ID=70559843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911405967.7A Active CN111159556B (zh) | 2019-12-31 | 2019-12-31 | 一种基于用户好奇心的贝叶斯个性化排序推荐方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111159556B (zh) |
WO (1) | WO2021135192A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111159556B (zh) * | 2019-12-31 | 2023-04-21 | 华南理工大学 | 一种基于用户好奇心的贝叶斯个性化排序推荐方法 |
CN112115384A (zh) * | 2020-08-14 | 2020-12-22 | 南京航空航天大学 | 一种基于生成排序的时序推荐算法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598643A (zh) * | 2015-02-13 | 2015-05-06 | 成都品果科技有限公司 | 一种物品相似度贡献系数、相似度获取方法及物品推荐方法及其系统 |
CN107025311A (zh) * | 2017-05-18 | 2017-08-08 | 北京大学 | 一种基于k近邻的贝叶斯个性化推荐方法及装置 |
CN109299384A (zh) * | 2018-11-02 | 2019-02-01 | 北京小米智能科技有限公司 | 场景推荐方法、装置及系统、存储介质 |
CN109783725A (zh) * | 2018-12-15 | 2019-05-21 | 华南理工大学 | 一种融入用户好奇心机制的推荐方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9600581B2 (en) * | 2009-02-19 | 2017-03-21 | Yahoo! Inc. | Personalized recommendations on dynamic content |
CN103886047B (zh) * | 2014-03-12 | 2017-07-07 | 浙江大学 | 面向流式数据的分布式在线推荐方法 |
CN107423335B (zh) * | 2017-04-27 | 2020-06-05 | 电子科技大学 | 一种针对单类协同过滤问题的负样本选择方法 |
CN111159556B (zh) * | 2019-12-31 | 2023-04-21 | 华南理工大学 | 一种基于用户好奇心的贝叶斯个性化排序推荐方法 |
-
2019
- 2019-12-31 CN CN201911405967.7A patent/CN111159556B/zh active Active
-
2020
- 2020-07-28 WO PCT/CN2020/105072 patent/WO2021135192A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598643A (zh) * | 2015-02-13 | 2015-05-06 | 成都品果科技有限公司 | 一种物品相似度贡献系数、相似度获取方法及物品推荐方法及其系统 |
CN107025311A (zh) * | 2017-05-18 | 2017-08-08 | 北京大学 | 一种基于k近邻的贝叶斯个性化推荐方法及装置 |
CN109299384A (zh) * | 2018-11-02 | 2019-02-01 | 北京小米智能科技有限公司 | 场景推荐方法、装置及系统、存储介质 |
CN109783725A (zh) * | 2018-12-15 | 2019-05-21 | 华南理工大学 | 一种融入用户好奇心机制的推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2021135192A1 (zh) | 2021-07-08 |
CN111159556A (zh) | 2020-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kotkov et al. | A survey of serendipity in recommender systems | |
CN108460619B (zh) | 一种提供融合显隐式反馈的协同推荐模型的方法 | |
Tyagi et al. | Enhancing collaborative filtering recommendations by utilizing multi-objective particle swarm optimization embedded association rule mining | |
Rana et al. | Building a Book Recommender system using time based content filtering | |
CN110263257B (zh) | 基于深度学习处理多源异构数据的推荐方法 | |
CN107220365A (zh) | 基于协同过滤与关联规则并行处理的精准推荐系统及方法 | |
CN112115377A (zh) | 一种基于社交关系的图神经网络链路预测推荐方法 | |
Hofmann | Fast and reliable online learning to rank for information retrieval | |
CN111159556B (zh) | 一种基于用户好奇心的贝叶斯个性化排序推荐方法 | |
JP7157239B2 (ja) | 感情認識機械を定義するための方法及びシステム | |
Bhattacharya et al. | Intent-aware contextual recommendation system | |
Parida et al. | Prediction of recommendations for employment utilizing machine learning procedures and geo-area based recommender framework | |
CN112507231A (zh) | 一种基于gwo-fcm的个性化推荐方法 | |
Sivaramakrishnan et al. | An effective user clustering-based collaborative filtering recommender system with grey wolf optimisation | |
Park et al. | Fast Collaborative Filtering with a k-nearest neighbor graph | |
Zeldes et al. | Deep density networks and uncertainty in recommender systems | |
CN109684561B (zh) | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 | |
Devika et al. | Book recommendation system | |
Rohani et al. | An enhanced content-based recommender system for academic social networks | |
Somantri et al. | Opinion mining on culinary food customer satisfaction using naïve bayes based-on hybrid feature selection | |
CN114298783A (zh) | 基于矩阵分解融合用户社交信息的商品推荐方法及系统 | |
CN110795640B (zh) | 一种弥补群组成员差异的自适应组推荐方法 | |
Alfarhood et al. | Collaborative attentive autoencoder for scientific article recommendation | |
Liu et al. | A sequential embedding approach for item recommendation with heterogeneous attributes | |
Gandhi et al. | A Modified Approach towards Tourism Recommendation System with Collaborative Filtering and Association Rule Mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |