CN116992155A - 一种利用nmf的不同活跃度用户长尾推荐方法与系统 - Google Patents
一种利用nmf的不同活跃度用户长尾推荐方法与系统 Download PDFInfo
- Publication number
- CN116992155A CN116992155A CN202311213550.7A CN202311213550A CN116992155A CN 116992155 A CN116992155 A CN 116992155A CN 202311213550 A CN202311213550 A CN 202311213550A CN 116992155 A CN116992155 A CN 116992155A
- Authority
- CN
- China
- Prior art keywords
- user
- items
- item
- tail
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 230000008569 process Effects 0.000 claims abstract description 38
- 238000001914 filtration Methods 0.000 claims abstract description 22
- 238000004364 calculation method Methods 0.000 claims description 43
- 238000004422 calculation algorithm Methods 0.000 claims description 24
- 238000013528 artificial neural network Methods 0.000 claims description 22
- 239000011159 matrix material Substances 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 18
- 230000003993 interaction Effects 0.000 claims description 11
- 238000000354 decomposition reaction Methods 0.000 claims description 9
- 230000001537 neural effect Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 238000005065 mining Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 2
- 238000013215 result calculation Methods 0.000 claims 1
- 230000007547 defect Effects 0.000 abstract description 2
- 238000003491 array Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种利用NMF的不同活跃度用户长尾推荐方法与系统,该方法包括:预测出用户对所有项目的评分,再将用户及项目按照活跃度划分为活跃用户分支和不活跃用户分支;将活跃用户分支和不活跃用户分支分别采用协同过滤方法和User‑KNN的方式获取对应的预推荐结果;将推荐列表中的部分热门项目替换为相似的长尾项目,并且在替换的过程中过滤掉潜在的热门项目,以提高长尾项目的曝光率,得到最终推荐结果。本发明通过对不同活跃度的用户采用不同的推荐方法,充分挖掘出不同信息量用户的兴趣,有效地改善了同一推荐方式面对不同信息量用户上的不足,提升了推荐的准确性。
Description
技术领域
本发明属于推荐技术领域,特别涉及一种利用NMF的不同活跃度用户长尾推荐方法与系统。
背景技术
推荐系统主要用于根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户。但是在推荐的过程中,存在少数热门项目被大量推荐,而大部分项目只有很少的交互和曝光机会。这导致了一个问题,即大量的项目很少或根本不会被推荐给用户,而用户也错失了可能与他们兴趣相符的项目,进而导致所推荐的信息较为单一,缺少了长尾推荐所带来的偶然性和多样性。并且活跃用户由于信息获取较多,推荐可以更为精准,而不活跃用户缺乏有效信息,因此推荐结果不精准,无法满足用户需求。因此,缓解长尾问题,以满足用户兴趣,平衡个性化推荐和整体推荐质量至关重要。
长尾问题既涉及到用户,也涉及到项目。在用户方面,少数热门用户的偏好和行为数据数量很大,而大多数用户的数据相对较少。在项目方面,少数热门项目的曝光机会更高,而大多数项目的曝光机会较少。
当前的一些基于多目标优化或聚类的长尾推荐方法只关注长尾项目的推荐,但没有考虑用户同样存在长尾问题,忽略了用户与项目之间的交互信息量存在巨大的差异。使用相同的方法对不同的用户进行推荐,不但难以充分挖掘信息,对用户的偏好信息也会有所损失,最终影响推荐效果。
发明内容
鉴于上述状况,本发明的主要目的是为了提出一种利用NMF的不同活跃度用户长尾推荐方法与系统,以解决上述技术问题。
本发明提供了一种利用NMF的不同活跃度用户长尾推荐方法,所述方法包括如下步骤:
步骤1、通过神经矩阵分解对用户与项目的交互信息进行深层次建模,预测出用户对所有项目的评分,利用用户对所有项目的评分结合Pareto经验值将用户及项目按照活跃度划分为活跃用户分支和不活跃用户分支;
步骤2、将活跃用户分支使用基于项目的协同过滤方法挖掘出活跃用户感兴趣的项目,根据活跃用户感兴趣的项目,再利用推荐算法计算获得活跃用户的预推荐结果;将不活跃用户分支采用User-KNN的方式,赋予不活跃用户的相似用户偏好信息,根据不活跃用户的相似用户偏好信息,再利用推荐算法计算获得不活跃用户的预推荐结果;
步骤3、在得到所有用户的预推荐结果后,将推荐列表中的部分热门项目替换为相似的长尾项目,并且在替换的过程中过滤掉潜在的热门项目,以提高长尾项目的曝光率,得到最终推荐结果。
本发明还提出一种利用NMF的不同活跃度用户长尾推荐系统,所述系统包括:
用户Pareto划分模块,用于通过神经矩阵分解对用户与项目的交互信息进行深层次建模,预测出用户对所有项目的评分,利用用户对所有项目的评分结合Pareto经验值将用户及项目按照活跃度划分为活跃用户分支和不活跃用户分支;
不同活跃度用户兴趣处理模块,用于将活跃用户分支使用基于项目的协同过滤方法挖掘出活跃用户感兴趣的项目,根据活跃用户感兴趣的项目,再利用推荐算法计算获得活跃用户的预推荐结果;将不活跃用户分支采用User-KNN的方式,赋予不活跃用户的相似用户偏好信息,根据不活跃用户的相似用户偏好信息,再利用推荐算法计算获得不活跃用户的预推荐结果;
长尾项目比例规范化模块,用于在得到所有用户的预推荐结果后,将推荐列表中的部分热门项目替换为相似的长尾项目,并且在替换的过程中过滤掉潜在的热门项目,以提高长尾项目的曝光率,得到最终推荐结果。
与现有技术相比,本发明有益效果如下:
1、本发明通过对不同活跃度的用户采用不同的推荐方法,充分挖掘出不同信息量用户的兴趣,有效地改善了同一推荐方式面对不同信息量用户上的不足,提升了推荐的准确性。
2、本发明寻找不同活跃度用户的预推荐结果中部分热门项目的相似长尾项目加以替换,并在替换过程中过滤掉潜在热门项目,提高了推荐的多样性,并使推荐结果中的冷门项目满足一定的比例,来达到曝光冷门项目的目的。
3、本发明针对不同活跃度的用户推荐算法是与模型无关的,可以替换为其他的推荐方式以适应不同的应用场景。
本发明的附加方面与优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实施例了解到。
附图说明
图1为本发明提出的一种利用NMF的不同活跃度用户长尾推荐方法的流程图;
图2为本发明长尾项目比例规范化过程图;
图3为本发明提出的一种利用NMF的不同活跃度用户长尾推荐方法系统的总体框架。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
参照下面的描述和附图,将清楚本发明的实施例的这些和其他方面。在这些描述和附图中,具体公开了本发明的实施例中的一些特定实施方式,来表示实施本发明的实施例的原理的一些方式,但是应当理解,本发明的实施例的范围不受此限制。
请参阅图1和图2,本发明实施例提供了一种利用NMF的不同活跃度用户长尾推荐方法,所述方法包括如下步骤:
步骤1、通过神经矩阵分解对用户与项目的交互信息进行深层次建模,预测出用户对所有项目的评分,利用用户对所有项目的评分结合Pareto经验值将用户及项目按照活跃度划分为活跃用户分支和不活跃用户分支;
在上述方案中,通过神经矩阵分解对用户与项目的交互信息进行深层次建模,预测出用户对所有项目的评分的方法具体包括如下步骤:
神经矩阵分解包括输入层、嵌入层、GMF层、MLP层和输出层,利用输入层分别对用户编号与项目编号采用one-hot进行编码,用户的编码长度为M,项目的编码长度为N;
利用嵌入层将用户编码结果与项目编码结果进行降维操作,获得K维用户潜在特征矩阵和K维项目潜在特征矩阵,其中K<<M、K<<N,再将用户编码结果与项目编码分别与K维用户潜在特征矩阵和K维项目潜在特征矩阵相乘,以映射用户与项目的表示至低维密致矩阵,获得K维的潜在特征向量;
利用GMF层将潜在特征向量进行内积,得到K维向量,K维向量计算过程存在如下关系式:
;
其中,表示用户潜在特征向量,/>表示项目潜在特征向量,/>表示K维向量,/>表示内积操作;
将K维向量输入MLP层中,MLP层包括有多层神经网络,采用上一层输出作为下一层输入的方式将K维向量通过多层神经网络,以学习用户与项目深层的交互关系,捕捉用户更深层的特征,得到神经网络计算结果,神经网络计算过程存在如下关系式:
;
;
其中,表示第1层的神经网络的激活函数,/>和/>分别表示第1层的神经网络的连接权重和偏置值,/>表示第1层的神经网络计算结果,/>表示第/>层的神经网络的激活函数,/>和/>分别表示第/>层的神经网络的连接权重和偏置值,/>表示第/>层的神经网络计算结果,/>表示转置操作;
通过输出层将神经网络计算结果输入至全连接层,以得到用户对项目的预测评分,用户对项目的预测评分计算过程存在如下关系式:
;
其中,表示用户/>对项目/>的预测偏好值,/>与/>分别为输出层的激活函数和连接权重。
在上述方案中,利用用户对所有项目的评分结合Pareto经验值将用户及项目按照活跃度划分为活跃用户分支和不活跃用户分支的过程存在如下关系式:
;
;
其中,表示Pareto经验值,/>,/>和/>分别表示活跃用户与不活跃用户集,/>表示用户集,/>表示项目集,/>和/>分别表示热门项目与长尾项目集,/>表示降序排序。
步骤2、将活跃用户分支使用基于项目的协同过滤方法挖掘出活跃用户感兴趣的项目,根据活跃用户感兴趣的项目,再利用推荐算法计算获得活跃用户的预推荐结果;将不活跃用户分支采用User-KNN的方式,赋予不活跃用户的相似用户偏好信息,根据不活跃用户的相似用户偏好信息,再利用推荐算法计算获得不活跃用户的预推荐结果;
在上述方案中,将活跃用户分支使用基于项目的协同过滤方法挖掘出活跃用户感兴趣的项目,根据活跃用户感兴趣的项目,再利用推荐算法计算获得活跃用户的预推荐结果的方法具体包括如下步骤:
通过引入反活跃度参数来修正项目相似度的计算;
根据修正后的项目相似度,利用ItemCF算法计算用户对项目/>的感兴趣程度,用户/>对项目/>的感兴趣程度计算过程存在如下关系式:
;
其中,表示活跃用户评分的项目集,/>表示感兴趣程度计算,/>表示项目/>最相似的K个项目集;
再根据用户对项目/>的感兴趣程度,利用ItemCF算法计算活跃用户的预推荐结果,活跃用户的预推荐结果计算过程如下关系式:
;
其中,表示活跃用户的预推荐结果,/>表示根据用户对项目的感兴趣度/>取前/>个项目。
在上述方案中,将不活跃用户分支采用User-KNN的方式,赋予不活跃用户的相似用户偏好信息,根据不活跃用户的相似用户偏好信息,再利用推荐算法计算获得不活跃用户的预推荐结果的方法具体包括如下步骤:
利用欧式距离计算不活跃用户之间的距离,利用欧式距离计算不活跃用户之间的距离过程如下关系式:
;
其中,和/>均表示用户集/>中的用户,/>表示欧式距离计算,/>和/>分别表示用户/>对项目/>的评分以及用户/>对项目/>的评分,/>表示项目数;
以用户之间的距离作为衡量相似度的指标,根据相似度的大小,选择与目标用户最相似的K个用户作为相似最近邻;
通过引入反活跃度参数来修正项目相似度的计算;
根据项目的相似度矩阵,利用ItemCF算法计算用户对项目的感兴趣程度;
再根据最近邻中用户对项目的感兴趣程度,利用ItemCF算法计算相似最近邻中每个不活跃用户的预推荐结果,得到相似最近邻中每个不活跃用户的推荐项目列表;
将推荐列表组合后按对项目的兴趣度排序,取出前个项目作为目标用户的预推荐结果,目标用户的预推荐结果计算过程存在如下关系式:
;
其中,表示不活跃用户的预推荐结果,/>表示第/>个相似最近邻用户的推荐结果。
在上述方案中,项目相似度计算过程存在如下关系式:
;
其中,表示对项目/>评分的用户数量,/>表示相似度计算/>表示对项目/>评分的用户数量,/>表示同时对项目/>与项目/>评分的用户,/>表示同时对项目/>与项目/>评分的用户数量。
步骤3、在得到所有用户的预推荐结果后,将推荐列表中的部分热门项目替换为相似的长尾项目,并且在替换的过程中过滤掉潜在的热门项目,以提高长尾项目的曝光率,得到最终推荐结果。
在上述方案中,在得到所有用户的预推荐结果后,将推荐列表中的部分热门项目替换为相似的长尾项目,并且在替换的过程中过滤掉潜在的热门项目,以提高长尾项目的曝光率,得到最终推荐结果的方法具体包括如下步骤:
将活跃用户与非活跃用户的预推荐结果结合,得到整体用户的推荐结果;
从整体用户的推荐结果中选择用户对项目感兴趣程度小的热门项目作为待替换热门项目,待替换热门项目的计算过程存在如下关系式:
;
;
其中,表示项目的标签总数,/>、/>分别表示目标项目与长尾项目的标签,/>表示挑选用户对项目感兴趣程度小的热门项目,/>表示挑选出的待替换热门项目集;
使用欧式距离计算待替换热门项目与长尾项目的相关性,以得到与待替换热门项目相似的相似长尾项目,相似长尾项目计算过程存在如下关系式:
;
其中,和/>分别表示待替换热门项目集中第/>个待替换热门项目以及待替换热门项目集中的项目数,/>表示长尾项目集中的长尾项目数,/>表示选取前/>个相似长尾项目,/>表示/>的相似长尾项目集;
对相似长尾项目进行计数,统计各个长尾项目被作为替换候选的次数,对相似长尾项目进行计数存在如下关系式:
;
其中,Count表示集合中的长尾项目进行计数并保存,表示带有计数信息的相似长尾项目;
设定新晋热门阈值,过滤掉出现次数大于新晋热门阈值的相似长尾项目,得到候选相似长尾项目,候选相似长尾项目计算过程存在如下关系式:
;
其中,表示新晋热门阈值,Filter过滤掉出现次数大于/>的长尾项目,/>表示候选相似长尾项目集;
将候选相似长尾项目集中选择项目相关性最高项进行替换,得到符合长尾比例的最终推荐结果,最终推荐结果计算过程存在如下关系式:
;
其中,表示符合长尾比例的最终推荐结果,/>表示长尾比例,/>表示推荐列表长度,/>表示推荐列表中长尾项目。
请参阅图3,本发明实施例还提供了一种利用NMF的不同活跃度用户长尾推荐系统,所述系统包括:
用户Pareto划分模块,用于通过神经矩阵分解对用户与项目的交互信息进行深层次建模,预测出用户对所有项目的评分,利用用户对所有项目的评分结合Pareto经验值将用户及项目按照活跃度划分为活跃用户分支和不活跃用户分支;
不同活跃度用户兴趣处理模块,用于将活跃用户分支使用基于项目的协同过滤方法挖掘出活跃用户感兴趣的项目,根据活跃用户感兴趣的项目,再利用推荐算法计算获得活跃用户的预推荐结果;将不活跃用户分支采用User-KNN的方式,赋予不活跃用户的相似用户偏好信息,根据不活跃用户的相似用户偏好信息,再利用推荐算法计算获得不活跃用户的预推荐结果;
长尾项目比例规范化模块,用于在得到所有用户的预推荐结果后,将推荐列表中的部分热门项目替换为相似的长尾项目,并且在替换的过程中过滤掉潜在的热门项目,以提高长尾项目的曝光率,得到最终推荐结果。
应当理解的,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种利用NMF的不同活跃度用户长尾推荐方法,其特征在于,所述方法包括如下步骤:
步骤1、通过神经矩阵分解对用户与项目的交互信息进行深层次建模,预测出用户对所有项目的评分,利用用户对所有项目的评分结合Pareto经验值将用户及项目按照活跃度划分为活跃用户分支和不活跃用户分支;
步骤2、将活跃用户分支使用基于项目的协同过滤方法挖掘出活跃用户感兴趣的项目,根据活跃用户感兴趣的项目,再利用推荐算法计算获得活跃用户的预推荐结果;将不活跃用户分支采用User-KNN的方式,赋予不活跃用户的相似用户偏好信息,根据不活跃用户的相似用户偏好信息,再利用推荐算法计算获得不活跃用户的预推荐结果;
步骤3、在得到所有用户的预推荐结果后,将推荐列表中的部分热门项目替换为相似的长尾项目,并且在替换的过程中过滤掉潜在的热门项目,以提高长尾项目的曝光率,得到最终推荐结果。
2.根据权利要求1所述的一种利用NMF的不同活跃度用户长尾推荐方法,其特征在于,在所述步骤1中,通过神经矩阵分解对用户与项目的交互信息进行深层次建模,预测出用户对所有项目的评分的方法具体包括如下步骤:
神经矩阵分解包括输入层、嵌入层、GMF层、MLP层和输出层,利用输入层分别对用户编号与项目编号采用one-hot进行编码,用户的编码长度为M,项目的编码长度为N;
利用嵌入层将用户编码结果与项目编码结果进行降维操作,获得K维用户潜在特征矩阵和K维项目潜在特征矩阵,其中K<<M、K<<N,再将用户编码结果与项目编码分别与K维用户潜在特征矩阵和K维项目潜在特征矩阵相乘,以映射用户与项目的表示至低维密致矩阵,获得K维的潜在特征向量;
利用GMF层将潜在特征向量进行内积,得到K维向量,K维向量计算过程存在如下关系式:
;
其中,表示用户潜在特征向量,/>表示项目潜在特征向量,/>表示K维向量,/>表示内积操作;
将K维向量输入MLP层中,MLP层包括有多层神经网络,采用上一层输出作为下一层输入的方式将K维向量通过多层神经网络,以学习用户与项目深层的交互关系,捕捉用户更深层的特征,得到神经网络计算结果,神经网络计算过程存在如下关系式:
;
;
其中,表示第1层的神经网络的激活函数,/>和/>分别表示第1层的神经网络的连接权重和偏置值,/>表示第1层的神经网络计算结果,/>表示第/>层的神经网络的激活函数,和/>分别表示第/>层的神经网络的连接权重和偏置值,/>表示第/>层的神经网络计算结果,/>表示转置操作;
通过输出层将神经网络计算结果输入至全连接层,以得到用户对项目的预测评分,用户对项目的预测评分计算过程存在如下关系式:
;
其中,表示用户/>对项目/>的预测偏好值,/>与/>分别为输出层的激活函数和连接权重。
3.根据权利要求2所述的一种利用NMF的不同活跃度用户长尾推荐方法,其特征在于,在所述步骤1中,利用用户对所有项目的评分结合Pareto经验值将用户及项目按照活跃度划分为活跃用户分支和不活跃用户分支的过程存在如下关系式:
;
;
其中,表示Pareto经验值,/>,/>和/>分别表示活跃用户与不活跃用户集,/>表示用户集,/>表示项目集,/>和/>分别表示热门项目与长尾项目集,/>表示降序排序。
4.根据权利要求3所述的一种利用NMF的不同活跃度用户长尾推荐方法,其特征在于,在所述步骤2中,将活跃用户分支使用基于项目的协同过滤方法挖掘出活跃用户感兴趣的项目,根据活跃用户感兴趣的项目,再利用推荐算法计算获得活跃用户的预推荐结果的方法具体包括如下步骤:
通过引入反活跃度参数来修正项目相似度的计算;
根据修正后的项目相似度,利用ItemCF算法计算用户对项目/>的感兴趣程度,用户/>对项目/>的感兴趣程度计算过程存在如下关系式:
;
其中,表示活跃用户评分的项目集,/>表示感兴趣程度计算,/>表示项目/>最相似的K个项目集;
再根据用户对项目/>的感兴趣程度,利用ItemCF算法计算活跃用户的预推荐结果,活跃用户的预推荐结果计算过程如下关系式:
;
其中,表示活跃用户的预推荐结果,/>表示根据用户对项目的感兴趣度/>取前/>个项目。
5.根据权利要求4所述的一种利用NMF的不同活跃度用户长尾推荐方法,其特征在于,在所述步骤2中,将不活跃用户分支采用User-KNN的方式,赋予不活跃用户的相似用户偏好信息,根据不活跃用户的相似用户偏好信息,再利用推荐算法计算获得不活跃用户的预推荐结果的方法具体包括如下步骤:
利用欧式距离计算不活跃用户之间的距离,利用欧式距离计算不活跃用户之间的距离过程如下关系式:
;
其中,和/>均表示用户集/>中的用户,/>表示欧式距离计算,/>和/>分别表示用户/>对项目/>的评分以及用户/>对项目/>的评分,/>表示项目数;
以用户之间的距离作为衡量相似度的指标,根据相似度的大小,选择与目标用户最相似的K个用户作为相似最近邻;
通过引入反活跃度参数来修正项目相似度的计算;
再根据最近邻中用户对项目的感兴趣程度,利用ItemCF算法计算相似最近邻中每个不活跃用户的预推荐结果,得到相似最近邻中每个不活跃用户的推荐项目列表;
将推荐列表组合后按对项目的兴趣度排序,取出前个项目作为目标用户的预推荐结果,目标用户的预推荐结果计算过程存在如下关系式:
;
其中,表示不活跃用户的预推荐结果,/>表示第/>个相似最近邻用户的推荐结果。
6.根据权利要求5所述的一种利用NMF的不同活跃度用户长尾推荐方法,其特征在于,项目相似度计算过程存在如下关系式:
;
其中,表示对项目/>评分的用户数量,/>表示相似度计算,/>表示对项目/>评分的用户数量,/>表示同时对项目/>与项目/>评分的用户,/>表示同时对项目/>与项目/>评分的用户数量。
7.根据权利要求6所述的一种利用NMF的不同活跃度用户长尾推荐方法,其特征在于,在所述步骤3中,在得到所有用户的预推荐结果后,将推荐列表中的部分热门项目替换为相似的长尾项目,并且在替换的过程中过滤掉潜在的热门项目,以提高长尾项目的曝光率,得到最终推荐结果的方法具体包括如下步骤:
将活跃用户与非活跃用户的预推荐结果结合,得到整体用户的推荐结果;
从整体用户的推荐结果中选择用户对项目感兴趣程度小的热门项目作为待替换热门项目,待替换热门项目的计算过程存在如下关系式:
;
;
其中,表示项目的标签总数,/>、/>分别表示目标项目与长尾项目的标签,/>表示挑选用户对项目感兴趣程度小的热门项目,/>表示挑选出的待替换热门项目集;
使用欧式距离计算待替换热门项目与长尾项目的相关性,以得到与待替换热门项目相似的相似长尾项目,相似长尾项目计算过程存在如下关系式:
;
其中,和/>分别表示待替换热门项目集中第/>个待替换热门项目以及待替换热门项目集中的项目数,/>表示长尾项目集中的长尾项目数,/>表示选取前/>个相似长尾项目,表示/>的相似长尾项目集;
对相似长尾项目进行计数,统计各个长尾项目被作为替换候选的次数,对相似长尾项目进行计数存在如下关系式:
;
其中,Count表示集合中的长尾项目进行计数并保存,表示带有计数信息的相似长尾项目;
设定新晋热门阈值,过滤掉出现次数大于新晋热门阈值的相似长尾项目,得到候选相似长尾项目,候选相似长尾项目计算过程存在如下关系式:
;
其中,表示新晋热门阈值,Filter过滤掉出现次数大于/>的长尾项目,/>表示候选相似长尾项目集;
将候选相似长尾项目集中选择项目相关性最高项进行替换,得到符合长尾比例的最终推荐结果,最终推荐结果计算过程存在如下关系式:
;
其中,表示符合长尾比例的最终推荐结果,/>表示长尾比例,/>表示推荐列表长度,/>表示推荐列表中长尾项目。
8.一种利用NMF的不同活跃度用户长尾推荐系统,其特征在于,所述系统应用如上述权利要求1至7任意一项所述的一种利用NMF的不同活跃度用户长尾推荐方法,所述系统包括:
用户Pareto划分模块,用于通过神经矩阵分解对用户与项目的交互信息进行深层次建模,预测出用户对所有项目的评分,利用用户对所有项目的评分结合Pareto经验值将用户及项目按照活跃度划分为活跃用户分支和不活跃用户分支;
不同活跃度用户兴趣处理模块,用于将活跃用户分支使用基于项目的协同过滤方法挖掘出活跃用户感兴趣的项目,根据活跃用户感兴趣的项目,再利用推荐算法计算获得活跃用户的预推荐结果;将不活跃用户分支采用User-KNN的方式,赋予不活跃用户的相似用户偏好信息,根据不活跃用户的相似用户偏好信息,再利用推荐算法计算获得不活跃用户的预推荐结果;
长尾项目比例规范化模块,用于在得到所有用户的预推荐结果后,将推荐列表中的部分热门项目替换为相似的长尾项目,并且在替换的过程中过滤掉潜在的热门项目,以提高长尾项目的曝光率,得到最终推荐结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311213550.7A CN116992155B (zh) | 2023-09-20 | 2023-09-20 | 一种利用nmf的不同活跃度用户长尾推荐方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311213550.7A CN116992155B (zh) | 2023-09-20 | 2023-09-20 | 一种利用nmf的不同活跃度用户长尾推荐方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116992155A true CN116992155A (zh) | 2023-11-03 |
CN116992155B CN116992155B (zh) | 2023-12-12 |
Family
ID=88534015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311213550.7A Active CN116992155B (zh) | 2023-09-20 | 2023-09-20 | 一种利用nmf的不同活跃度用户长尾推荐方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116992155B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117312679A (zh) * | 2023-11-28 | 2023-12-29 | 江西财经大学 | 一种双分支信息协同增强的长尾推荐方法与系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2020101885A4 (en) * | 2020-08-19 | 2020-09-24 | Xinjiang University | A Novel Tensor Factorization Using Trust and Rating for Recommendation, system and method thereof |
CN112861019A (zh) * | 2021-01-27 | 2021-05-28 | 山东师范大学 | 基于惩罚课程热力度和用户活跃度的课程推荐方法及系统 |
CN114329233A (zh) * | 2022-01-10 | 2022-04-12 | 青岛科技大学 | 一种跨区域跨评分协同过滤推荐方法及系统 |
CN114461906A (zh) * | 2022-01-06 | 2022-05-10 | 中国科学院信息工程研究所 | 一种聚焦于用户核心兴趣的序列推荐方法及装置 |
CN114510645A (zh) * | 2022-04-08 | 2022-05-17 | 浙大城市学院 | 一种基于提取有效多目标群组来解决长尾推荐问题的方法 |
CN115114517A (zh) * | 2022-03-29 | 2022-09-27 | 郑州航空工业管理学院 | 基于用户属性和项目评分的协同过滤推荐算法 |
-
2023
- 2023-09-20 CN CN202311213550.7A patent/CN116992155B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2020101885A4 (en) * | 2020-08-19 | 2020-09-24 | Xinjiang University | A Novel Tensor Factorization Using Trust and Rating for Recommendation, system and method thereof |
CN112861019A (zh) * | 2021-01-27 | 2021-05-28 | 山东师范大学 | 基于惩罚课程热力度和用户活跃度的课程推荐方法及系统 |
CN114461906A (zh) * | 2022-01-06 | 2022-05-10 | 中国科学院信息工程研究所 | 一种聚焦于用户核心兴趣的序列推荐方法及装置 |
CN114329233A (zh) * | 2022-01-10 | 2022-04-12 | 青岛科技大学 | 一种跨区域跨评分协同过滤推荐方法及系统 |
CN115114517A (zh) * | 2022-03-29 | 2022-09-27 | 郑州航空工业管理学院 | 基于用户属性和项目评分的协同过滤推荐算法 |
CN114510645A (zh) * | 2022-04-08 | 2022-05-17 | 浙大城市学院 | 一种基于提取有效多目标群组来解决长尾推荐问题的方法 |
Non-Patent Citations (1)
Title |
---|
胡炳文;孙克雷;: "一种缓解推荐偏好的协同过滤TopN算法", 淮南职业技术学院学报, no. 01 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117312679A (zh) * | 2023-11-28 | 2023-12-29 | 江西财经大学 | 一种双分支信息协同增强的长尾推荐方法与系统 |
CN117312679B (zh) * | 2023-11-28 | 2024-02-09 | 江西财经大学 | 一种双分支信息协同增强的长尾推荐方法与系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116992155B (zh) | 2023-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cai et al. | A many-objective optimization recommendation algorithm based on knowledge mining | |
CN107491432B (zh) | 基于人工智能的低质量文章识别方法及装置、设备及介质 | |
Hadi-Vencheh et al. | Fuzzy inferior ratio method for multiple attribute decision making problems | |
CN107451267B (zh) | 一种基于Spark平台的分布式推荐方法 | |
Xiao et al. | GMDH-based semi-supervised feature selection for customer classification | |
CN106447066A (zh) | 一种大数据的特征提取方法和装置 | |
CN116992155B (zh) | 一种利用nmf的不同活跃度用户长尾推荐方法与系统 | |
CN111091196B (zh) | 客流数据确定方法、装置、计算机设备和存储介质 | |
Li et al. | Integrating ensemble-urban cellular automata model with an uncertainty map to improve the performance of a single model | |
CN106445988A (zh) | 一种大数据的智能处理方法和系统 | |
CN111178611A (zh) | 一种日电量预测的方法 | |
CN112967088A (zh) | 基于知识蒸馏的营销活动预测模型结构和预测方法 | |
CN112256866A (zh) | 一种基于深度学习的文本细粒度情感分析方法 | |
CN113591971A (zh) | 基于dpi时间序列词嵌入向量的用户个性行为预测方法 | |
CN111737479A (zh) | 数据获取方法、装置、电子设备及存储介质 | |
CN116245259B (zh) | 基于深度特征选择的光伏发电预测方法、装置和电子设备 | |
CN116843388B (zh) | 一种广告投放分析方法及系统 | |
CN117455529A (zh) | 基于大数据技术的用户用电特征画像构建方法及系统 | |
CN112148994A (zh) | 信息推送效果评估方法、装置、电子设备及存储介质 | |
CN105678430A (zh) | 基于邻近项目Slope One算法的用户改进推荐方法 | |
CN113792945B (zh) | 一种营运车辆的派遣方法、装置、设备及可读存储介质 | |
Chen et al. | Travel mode choice prediction using imbalanced machine learning | |
CN116862078B (zh) | 一种换电套餐用户逾期的预测方法、系统、装置及介质 | |
CN111666410A (zh) | 商品用户评论文本的情感分类方法及系统 | |
CN113837802B (zh) | 一种时序过程与手机缺陷特征深度融合的二手手机价格预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |