CN109684536A - 一种基于物品k-最近邻算法的图书推荐方法和系统 - Google Patents

一种基于物品k-最近邻算法的图书推荐方法和系统 Download PDF

Info

Publication number
CN109684536A
CN109684536A CN201810050236.4A CN201810050236A CN109684536A CN 109684536 A CN109684536 A CN 109684536A CN 201810050236 A CN201810050236 A CN 201810050236A CN 109684536 A CN109684536 A CN 109684536A
Authority
CN
China
Prior art keywords
article
user
books
nearest neighbor
neighbor algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810050236.4A
Other languages
English (en)
Inventor
郝宁宁
李媛鸣
陈梦瑶
石冰洁
王川
刘二宝
祝晓雪
高婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810050236.4A priority Critical patent/CN109684536A/zh
Publication of CN109684536A publication Critical patent/CN109684536A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于物品的k‑最近邻算法的图书推荐方法和系统,本发明实现了基于物品k‑近邻协同过滤算法的图书推荐方法,本发明将推荐技术应用到了图书推荐系统中,目的是为了给读书爱好者个性化地推荐其有可能感兴趣的图书,减少读书爱好者在海量图书信息中找到感兴趣图书的时间。本发明应用的推荐算法是基于协同过滤的推荐算法,具体使用到了基于物品的k‑最近邻算法,这些算法可以针对读者对不同图书的评分,向读者个性化地推荐其可能感兴趣的图书。

Description

一种基于物品k-最近邻算法的图书推荐方法和系统
技术领域
本发明属于图书推荐技术领域,具体涉及一种基于物品k-最近邻算法的 图书推荐方法和系统。
背景技术
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息 过载的时代。很多时候,我们面临的问题不是物质短缺、信息匮乏,而是这 些东西太多,让我们眼花缭乱、不知如何选择。面对海量信息,目前,存在 着两方面的问题,一方面,如何从过载的信息中找到自己真正感兴趣的内容; 另一方面,信息提供者如何使他们提供的信息被感兴趣的人注意到,而不是 被淹没在海量的信息中。
为了解决信息过载问题,出现了分类目录和搜索引擎。它们都是在信息 和用户之间建立匹配的,用户可以通过搜索关键字来寻找感兴趣的信息。然 而,搜索引擎也存在着局限性,首先,它提供的结果通常不是个性化的,不 同的人用同一个关键词进行搜索,返回的结果往往是一模一样的,而人与人 之间的品味往往是各不相同的;因此,搜索引擎无法准确地为不同用户过滤 信息;搜索引擎的另一个局限性就是它要求用户必须对自己的需求有清晰的 认识,并且能够用关键词表述出来,然而,用户有时候存在着某些需求,这 些需求他们自己还没有意识到,这时候搜索引擎就无能为力了。虽然这两种 工具都可以帮助用户较快的找到他们可能感兴趣的信息。但这些工具都不能 针对不同的用户提供个性化的服务。
推荐系统是另外一种帮助信息和用户进行匹配的手段。与搜索引擎不一 样的是,推荐系统无需用户输入额外的关键词,它能根据用户以往历史行为 记录,主动挖掘用户的兴趣爱好,帮助用户发现潜在的兴趣点,并将相关商 品或信息推荐给用户。由于是根据每个用户的特点进行推荐的,所以它能够 满足个性化的要求,为不同的用户推荐满足他们个性化需求的产品,让信息 更加准确地展现在用户面前,同时,它也不那么依赖于用户主动输入的信息 去过滤信息。
基于物品的k-最近邻协同过滤算法的核心思想是,在已给一个用户-物 品评分矩阵的前提下,找到当前每个物品的相似物品。k-最近邻指的是与当 前用户已评价的物品中,k个最相似的物品,k-最近邻算法利用这些相似物 品的信息来产生推荐。该算法充分考虑了用户以往的选择历史,推荐效果较 为准确。
发明内容
本发明目的是提供一种基于物品的k-最近邻算法的图书推荐方法和系 统,该算法可以针对不同用户的对图书的评分,向不同的用户个性化地推荐 其可能感兴趣的图书,全面考虑了系统中涉及对象的相似度,提高了推荐的 准确度,
本发明采用的技术方案是一种基于物品的k-最近邻算法的图书推荐方 法,包括以下步骤:
步骤1,将用户历史图书评分行为数据按照均匀分布随机分为M份,选 取一份作为测试集,将剩下的M-1份作为训练集,在用户历史图书评分行为 数据的训练集上建立基于物品的k-最近邻推荐模型;
步骤2,通过k-最近邻推荐模型在用户历史图书评分行为数据的训练集 上建立用户兴趣模型,生成推荐图书列表,再通过结合用户历史图书评分行 为数据的测试集,计算最相似物品的个数k在初始值的情况下,k-最近邻算 法的准确率和召回率;
步骤3,依次更新建立k-最近邻推荐模型中的所设定算法的最相似物品 的个数k值,计算不同k值下的图书推荐列表;并计算不同k值情况下,基 于物品的k-最近邻算法的准确率和召回率;
步骤4,将每个不同k值所对应的准确率和召回率相加,得到基于物品 的k-最近邻算法的性能指标值;取基于物品的k-最近邻算法的多组性能指标 值的最大值所对应的参数k的值作为某用户在基于物品的k-最近邻算法中的 最优算法参数k的值;
步骤5,输入某用户在基于物品的k-最近邻算法的最优参数k的值,利 用步骤1中的k-最近邻推荐模型为用户产生基于物品的k-最近邻算法的图书 推荐列表。
其中所述步骤1中的k-最近邻推荐模型的建立步骤如下:
步骤1.1,将用户历史图书评分行为数据的训练集处理为m*n的用户图 书评分矩阵R;
步骤1.2,使用同现矩阵计算物品间的相似度;
步骤1.3,对于每本图书,按从大到小的顺序将该图书与其他图书的相 似度进行排序;
步骤1.4,根据相似度计算结果,结合算法参数k,生成候选推荐图书列 表,再利用预测评分的计算公式,计算出候选推荐图书列表中的每本图书的 预测评分,并按预测评分从大到小的顺序对候选推荐图书列表进行排序,取 候选推荐图书排序列表的前几本图书组成最终的图书推荐列表,产生基于物 品的k-最近邻算法的推荐图书列表;
其中所述步骤2计算物品间的相似度,使用的相似性度量为同现矩阵, 其中元素tkn表示图书k与图书n之间的关联度,同现矩阵T计算过程如下所 示:
当用户u对图书i、j、k进行了评分,对同现矩阵T中图书i、j、k的组 成子矩阵Tijk中的每一个元素添加数值1;
针对所有的用户进行上述操作,然后将所有的结果相加,并将同现矩阵 T中的元素进行归一化处理,归一化公式计算如下:
在上述公式中,tij表示图书i和图书j之间的相似度;
通过归一化处理同现矩阵,以得到物品之间的相似度。
作为本发明的进一步改进,步骤4)中预测评分的计算公式如下所示:
在上式中,表示用户u对图书i的预测评分,是用户u和对图书的平 均评分,sim(i,j)是图书i和图书j之间的相似度,ruj表示用户u对图书j的评 分,D是与图书i最相似的图书组成的集合。
其中所述步骤2中的k-最近邻算法的准确率和召回率,计算公式如下所 示:
步骤2.1,准确率
式中,Precision(I(u)表示对于用户u,基于物品的k-最近邻算法的准 确率,R(I(u))表示基于物品的k-最近邻推荐算法为用户u产生的的图书 推荐列表,T(u)表示用户u评分过的物品的推荐列表,U表示所有用户;
步骤2.2,召回率
式中,Recall(I(u)表示对于用户u,基于物品的k-最近邻算法的召回 率,R(I(u))表示基于物品的k-最近邻推荐算法为用户u产生的的图书推荐 列表,T(u)表示用户u评分过的物品的推荐列表,U表示所有用户。
本发明的另一个技术方案为一种基于物品k-最近邻算法的图书推荐系 统,包括用户物品信息收集层、存储层、推荐引擎模块、接口层;
所述的存储层,用于存储系统使用和产生的数据,包括用户、图书的基 本信息及用户行为信息;
所述的用户物品信息收集层,与存储层连接,用于负责录入和维护用户、 图书的基本信息及用户行为信息;
所述的推荐引擎模块,与存储层连接,用于用户对物品的历史行为数据 的基础上进行计算,产生推荐列表;采用基于物品的k-最近邻推荐模型和基 于物品的k-最近邻推荐模型构建推荐引擎;
所述的接口层,与推荐引擎模块、存储层连接及前端展示单元通信,用 于计算出的数据需要传递给前端展示单元,用户对图书的评分通过前端展示 单元获取传回,接口层为前端展示单元调用提供所需数据,将前端展示单元 传来的用户行为数据交由存储层储备用。
本发明与现有技术相比,具有以下优点:
本发明采用基于物品的k-最近邻算法的优势,是利用用户对物品的历史 评分记录就可产生推荐,并且具有更高的推荐性能。算法的优势还体现在对 k-最近邻算法所涉及的核心参数最相似物品个数k的优化。通过将不同用户 的图书历史评分记录分割为训练集和测试集,依次代入不同的k,分别计算 对应k-最近邻算法的准确率和召回率,将每个不同k值所对应的准确率和召 回率相加,得到基于物品的k-最近邻算法的性能指标值;选择多组性能指标 值的最大值所对应的参数k的值作为某用户在基于物品的k-最近邻算法的中的最优算法参数k的值;且可以根据用户历史记录的变化动态调整算法的核 心参数k的值,提高了推荐算法的性能。
附图说明
图1为本发明的一种基于物品的k-最近邻算法的图书推荐方法和系统 训练最优参数k值的流程图;
图2为本发明的一种基于物品的k-最近邻算法的图书推荐方法和系统 基于物品的k-近邻算法推荐过程图;
图3为本发明的一种基于物品的k-最近邻算法的图书推荐方法和系统 基于物品的协同过滤算法流程图;
图4为本发明的一种基于物品的k-最近邻算法的图书推荐方法和系统 系统框架图;
图5为本发明的一种基于物品的k-最近邻算法的图书推荐方法和系统部 分物品最优参数散点图;
图6为本发明的一种基于物品的k-最近邻算法的图书推荐方法和系统图 书推荐模块设计图;
图7为本发明的一种基于物品的k-最近邻算法的图书推荐方法和系统图 书推荐算法框图;
图8为本发明的一种基于物品的k-最近邻算法的图书推荐方法和系统 基于物品的用户cytun的最终图书推荐列表。
具体实施方式
下面结合附图和具体实施方式对本发明作详细描述:
本发明提供一种基于物品k-最近邻算法的图书推荐方法,如图1所示包 括以下步骤:
步骤1,将用户历史图书评分行为数据按照均匀分布随机分为M份,选 取一份作为测试集,将剩下的M-1份作为训练集。在用户历史图书评分行为 数据的训练集上建立基于物品的k-最近邻推荐模型,如图2所示,推荐模型 的建立步骤如下:
步骤1.1,将用户历史图书评分行为数据的训练集处理为m*n的用户图 书评分矩阵R,其中,m表示为m个用户,n表示为n本图书,rui表示 用户n对物品i的评分。
步骤1.2,计算物品间的相似度,所使用的相似性度量为同现矩阵,其 中元素tkn表示图书k与图书n之间的关联度,同现矩阵T计算过程如下所示:
当用户u对图书i、j、k进行了评分,对同现矩阵T中图书i、j、k组成 的子矩阵Tijk中的每一个元素添加数值1。
针对所有的用户进行上述操作,然后将所有的结果相加,并将同现矩阵 T中的元素进行归一化处理,归一化公式计算如下:
在上述公式中,tij表示图书i和图书j之间的相似度。通过归一化处理同 现矩阵,以得到物品之间的相似度。
步骤1.3,对于每本图书,按从大到小的顺序将该图书与其他图书的相 似度进行排序。
步骤1.4,如图3所示,产生基于物品的k-最近邻算法的推荐图书列表。
假设为用户u产生推荐图书列表。首先,设定参数k值的初始值为20, 参数k的含义是,最相似图书的个数。将用户u所有未评分的的图书作为候 选推荐图书列表,取某本候选推荐图书i与用户u已评价的图书的相似度排 序列表的前20本图书作为某本候选推荐图书的邻居图书集,并对该本候选 推荐图书进行评分,图书预测评分的计算公式如下所示:
在上式中,表示用户u对图书i的预测评分,是用户u和对图书的平 均评分,sim(i,j)是图书i和图书j之间的相似度,ruj表示用户u对图书j的评 分,D是与图书i最相似的图书组成的集合。
根据以上步骤计算候选推荐图书列表中的每本图书的预测评分,再按预 测评分从大到小的顺序对候选推荐图书列表进行排序。然后,设定参数N为 10,参数N的含义是图书推荐列表中图书的个数。最后,取候选推荐图书排 序列表的前10本图书组成最终的图书推荐列表。
步骤2,通过以上4个步骤可以在用户历史图书评分行为数据的训练集 上建立用户兴趣模型,生成推荐图书列表,再通过结合用户历史图书评分行 为数据的测试集,计算在初始值k=20的情况下,预测行为和测试集上实际 行为的重合度,即k-最近邻算法的准确率和召回率,具体计算公式如下所示:
步骤2.1,准确率
在上述公式中,Precision(I(u)表示对于用户u,基于物品的k-最近邻算 法的准确率,R(I(u))表示基于物品的k-最近邻推荐算法为用户u产生的的图 书推荐列表,T(u)表示用户u评分过的物品的推荐列表,U表示所有用户。
步骤2.2,召回率
式中,Recall(I(u)表示对于用户u,基于物品的k-最近邻算法的召回 率,R(I(u))表示基于物品的k-最近邻推荐算法为用户u产生的的图书推荐 列表,T(u)表示用户u评分过的物品的推荐列表,U表示所有用户。
步骤3,依次更新步骤1确定推荐模型中的步骤1.4中所设定的算法的 核心参数k值,更新为30、40、50,计算不同k值下,图书推荐列表。然后 重复步骤3,计算k=30、k=40、k=50的情况下,基于物品的k-最近邻算法 的准确率和召回率。
步骤4通过以上3个步骤,最终得到,k=20、k=30、k=40、k=50的情 况下,基于物品的k-最近邻算法的准确率和召回率,共计4组准确率和召回 率。然后,将k=20、k=30、k=40、k=50所对应的准确率和召回率相加,得 到4组基于物品的k-最近邻算法的性能指标值,并将4组性能指标值按从大 到小的顺序进行排序。最后,取4组性能指标值的最大值所对应的参数k的 值作为用户在基于物品的k-最近邻算法的中的最优算法参数k的值。
本发明还提供了一种基于物品k-最近邻算法的图书推荐系统,推荐系统 要面对两个重要对象:用户和物品,系统的核心是推荐引擎,它把用户和物 品联系在一起。图书推荐系统的主要工作,是向用户提供一个图书推荐列表。 一般用户、物品、推荐引擎三部分组成一个完整的推荐系统,下面就分别对 系统总体架构和这三个部分的模型设计进行阐述,具体的系统框架图如图4 所示:
存储层用于存储系统使用和产生的数据,主要包括用户、图书、图书的 基本信息,用户行为信息。
用户物品信息收集层负责录入和维护用户、图书的基本信息及用户行为 信息。
推荐引擎在用户对物品的历史行为数据的基础上进行计算,产生推荐列 表。本系统采用的是协同过滤推荐算法,具体使用的是基于物品的k-最近邻 协同过滤算法构建推荐引擎。
接口层负责系统与前端程序的通信。因为系统运行在后台,计算出的数 据需要传递给前端展示,用户对图书的评分通过前端获取传回,接口层的工 作就是为前端调用提供所需数据,将前端传来的用户行为数据交由存储层储 备用。
数据库使用SQLite存储用户的行为数据及用户、图书的基本数据。本 系统的数据库存在用户、图书实体,用户与图书之间存在多对多的关系,用 户与用户之间存在多对多的关系。基于此,可以设计出相应的数据库表:
(a)系统对象信息采集
系统对象包括用户信息、图书基本信息。用户信息共分为两部分采集, 第一部分来自于用户注册时所填写的信息;第二部分是由系统后台根据已有 用户行为数据计算出来的,其中所涉及的基于物品的k-最近邻算法的核心参 数的数值。
对于新用户,由于不存在用户行为数据,后台程序将无法为其训练出算 法最优参数,因此,根据推荐仿真实验所得出结论,大部分用户的最优参数 都为50,用户具体属性如下表1所示:
表1
图书基本信息的采集是利用爬虫技术,通过豆瓣API接口生成的,图书 具体属性如下表2所示:
表2
用户行为记录的采集
推荐系统中对算法所使用的就是用户行为记录,本系统主要指的是用户 对图书的评分记录。该记录的采集是通过用户在系统前台检索图书,并对图 书进行评分,该评分数据将会通过接口,传递到后台数据库中,用户行为记 录所涉及的用户-图书评分表的具体内容,如下表3所示:
表3
推荐模块主要是建立物品推荐模型、训练算法核心参数,为用户推荐可 能感兴趣的图书。该模块是本图书推荐系统的的核心模块,其功能就是为用 户实现图书列表的推荐。该模块涉及基于物品的k-最近邻协同过滤算法。该 模块可以实现单独算法的推荐功能。推荐模块设计图,如图4所示:
本系统首先收集用户行为记录,并将其生成用户-物品评分矩阵来进行 相关运算,以实现对用户进行推荐的功能,推荐算法设计框图如图3所示:
实施例:
下面使用共有129334条用户图书评分记录的数据集,其中共涉及了265 本图书和1968名用户。
(1)首先,将该数据集按照均匀分布随机分为3份,选取一份做为测 试集,将剩下的2份作为训练集。下表4和表5展示了用户cytun的训练集 和测试集。
表4
表5
(2)在用户cytun的历史图书评分行为数据的训练集上建立基于物品的 k-最近邻推荐模型,再结合用户cytun的历史图书评分行为数据的测试集计 算k=20、k=30、k=40、k=50的情况下,基于物品的k-最近邻算法的准确率 和召回率,共计4组准确率和召回率。具体cytun的参数性能如下表6所示。
表6
本发明应用的推荐算法是基于物品k-最近邻算法,这个算法可以针对不 同读者对图书的评分,向不同的读者个性化地推荐其可能感兴趣的图书。在 协同过滤算法中,选取的参数不同,会对推荐的效果产生不同的影响。本发 明还通过离线实验的方法,为用户训练了基于k-最近邻算法中的核心参数k, 目的是为了提高推荐算法的性能,以获得最优的推荐结果。本发明实现了基 于物品的协同过滤算法的图书推荐方法,最后设计完成了个性化的图书推荐 系统,实现了图书历史评分记录查询、图书信息查询以及图书推荐的功能, 并在数据集上进行了推荐仿真实验。
为了更直观的观察系统中已有用户的最优参数分布,现以部分物品为横 坐标,以参数K为纵坐标的用户参数散点图,如图5所示
在k-最近邻模块中最重要的功能是产生推荐,下面以用户cytun为例, 图8展示了基于物品的k-最近邻推荐算法为用户cytun产生的图书推荐列表。
以上,仅为本发明的较佳实施例,并非仅限于本发明的实施范围,凡依 本发明范围的内容所做的等效变化和修饰,都应为本发明的技术范畴。

Claims (6)

1.一种基于物品的k-最近邻算法的图书推荐方法,其特征在于,包括以下步骤:
步骤1,将用户历史图书评分行为数据按照均匀分布随机分为M份,选取一份作为测试集,将剩下的M-1份作为训练集,在用户历史图书评分行为数据的训练集上建立基于物品的k-最近邻推荐模型;
步骤2,通过k-最近邻推荐模型在用户历史图书评分行为数据的训练集上建立用户兴趣模型,生成推荐图书列表,再通过结合用户历史图书评分行为数据的测试集,计算最相似物品的个数k在初始值的情况下,k-最近邻算法的准确率和召回率;
步骤3,依次更新建立k-最近邻推荐模型中的所设定的算法的最相似物品的个数k值,计算不同k值下的图书推荐列表;并计算不同k值情况下,基于物品的k-最近邻算法的准确率和召回率;
步骤4,将每个不同k值所对应的准确率和召回率相加,得到基于物品的k-最近邻算法的性能指标值;取基于物品的k-最近邻算法的多组性能指标值的最大值所对应的参数k的值作为某用户在基于物品的k-最近邻算法的中的最优算法参数k的值;
步骤5,输入某用户在基于物品的k-最近邻算法的最优参数k的值,利用步骤1中的k-最近邻推荐模型为用户产生基于物品的k-最近邻算法的图书推荐列表。
2.根据权利要求1所述的一种基于物品的k-最近邻算法的图书推荐方法,其特征在于,步骤1中的k-最近邻推荐模型的建立步骤如下:
步骤1.1,将用户历史图书评分行为数据的训练集处理为m*n的用户图书评分矩阵R;
步骤1.2,使用同现矩阵计算物品间的相似度;
步骤1.3,对于每本图书,按从大到小的顺序将该图书与其他图书的相似度进行排序;
步骤1.4,根据相似度计算结果,结合算法参数k,产生基于物品的k-最近邻算法的候选推荐图书列表,再利用预测评分的计算公式,计算出候选推荐图书列表中的每本图书的预测评分,并按预测评分从大到小的顺序对候选推荐图书列表进行排序,取候选推荐图书排序列表的前几本图书组成最终的图书推荐列表,产生基于物品的k-最近邻算法的推荐图书列表。
3.根据权利要求2所述的一种基于物品的k-最近邻算法的图书推荐方法,其特征在于,步骤1.2中用户间的相似度计算,使用的相似性度量为同现矩阵,其中元素tkn表示图书k与图书n之间的关联度,同现矩阵T计算过程如下所示:
当用户u对图书i、j、k进行了评分,对同现矩阵T中图书i、j、k的组成子矩阵Tijk中的每一个元素添加数值1;
针对所有的用户进行上述操作,然后将所有的结果相加,并将同现矩阵T中的元素进行归一化处理,归一化公式计算如下:
在上述公式中,tij表示图书i和图书j之间的相似度;
通过归一化处理同现矩阵,以得到物品之间的相似度。
4.根据权利要求2所述的一种基于物品的k-最近邻算法的图书推荐方法,其特征在于,步骤5中预测评分的计算公式如下所示:
在上式中,是用户u和用户u′对物品的平均评分,sim(u,u′)是用户u和用户u′之间的相似度,N是与物品i最相似的物品组成的集合。
5.根据权利要求1所述的一种基于物品的k-最近邻算法的图书推荐方法,其特征在于,步骤2中的k-最近邻算法的准确率和召回率,计算公式如下所示:
步骤2.1,准确率
式中,Precision(I(u)表示对于用户u,基于物品的k-最近邻算法的准确率,R(I(u))表示基于物品的k-最近邻推荐算法为用户u产生的的图书推荐列表,T(u)表示用户u评分过的物品的推荐列表,U表示所有用户;
步骤2.2,召回率
式中,Recall(I(u)表示对于用户u,基于物品的k-最近邻算法的召回率,R(I(u))表示基于物品的k-最近邻推荐算法为用户u产生的的图书推荐列表,T(u)表示用户u评分过的物品的推荐列表,U表示所有用户。
6.一种基于物品k-最近邻算法的图书推荐系统,其特征在于,包括用户物品信息收集层、存储层、推荐引擎模块、接口层;
所述的存储层,用于存储系统使用和产生的数据,包括用户、图书的基本信息及用户行为信息;
所述的用户物品信息收集层,与存储层连接,用于负责录入和维护用户、图书的基本信息及用户行为信息;
所述的推荐引擎模块,与存储层连接,用于用户对物品的历史行为数据的基础上进行计算,产生推荐列表;采用基于物品的k-最近邻推荐模型和基于物品的k-最近邻推荐模型构建推荐引擎;
所述的接口层,与推荐引擎模块、存储层连接及前端展示单元通信,用于计算出的数据需要传递给前端展示单元,用户对图书的评分通过前端展示单元获取传回,接口层为前端展示单元调用提供所需数据,将前端展示单元传来的用户行为数据交由存储层储备用。
CN201810050236.4A 2018-01-18 2018-01-18 一种基于物品k-最近邻算法的图书推荐方法和系统 Withdrawn CN109684536A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810050236.4A CN109684536A (zh) 2018-01-18 2018-01-18 一种基于物品k-最近邻算法的图书推荐方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810050236.4A CN109684536A (zh) 2018-01-18 2018-01-18 一种基于物品k-最近邻算法的图书推荐方法和系统

Publications (1)

Publication Number Publication Date
CN109684536A true CN109684536A (zh) 2019-04-26

Family

ID=66184345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810050236.4A Withdrawn CN109684536A (zh) 2018-01-18 2018-01-18 一种基于物品k-最近邻算法的图书推荐方法和系统

Country Status (1)

Country Link
CN (1) CN109684536A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413825A (zh) * 2019-06-21 2019-11-05 东华大学 面向时尚电商的街拍推荐系统
CN111125543A (zh) * 2019-12-17 2020-05-08 掌阅科技股份有限公司 书籍推荐排序模型的训练方法、计算设备及存储介质
TWI731666B (zh) * 2020-04-30 2021-06-21 股感生活金融科技股份有限公司 利用多維度評級資料之文章推薦系統及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413825A (zh) * 2019-06-21 2019-11-05 东华大学 面向时尚电商的街拍推荐系统
CN110413825B (zh) * 2019-06-21 2023-12-01 东华大学 面向时尚电商的街拍推荐系统
CN111125543A (zh) * 2019-12-17 2020-05-08 掌阅科技股份有限公司 书籍推荐排序模型的训练方法、计算设备及存储介质
CN111125543B (zh) * 2019-12-17 2023-03-10 掌阅科技股份有限公司 书籍推荐排序模型的训练方法、计算设备及存储介质
TWI731666B (zh) * 2020-04-30 2021-06-21 股感生活金融科技股份有限公司 利用多維度評級資料之文章推薦系統及方法

Similar Documents

Publication Publication Date Title
CN110162693B (zh) 一种信息推荐的方法以及服务器
CN107391687B (zh) 一种面向地方志网站的混合推荐系统
CN103377250B (zh) 基于邻域的top‑k推荐方法
CN103577501B (zh) 热点话题搜索系统及热点话题搜索方法
US20110184977A1 (en) Recommendation method and system based on collaborative filtering
CN103902538B (zh) 基于决策树的信息推荐装置及方法
Shih et al. Hybrid recommendation approaches: collaborative filtering via valuable content information
CN108415928A (zh) 一种基于加权混合k-最近邻算法的图书推荐方法与系统
Liu et al. Mobile commerce product recommendations based on hybrid multiple channels
CN108022152A (zh) 基于图像识别的用户商品自动推荐系统及推荐方法
CN110852852A (zh) 一种工业互联网产品推荐系统及方法
CN104866530A (zh) 一种基于滑标评分的推荐系统及方法
CN102411754A (zh) 一种基于商品属性熵值的个性化推荐方法
CN106980646A (zh) 基于流行度对用户兴趣的影响机制分析及其在推荐算法中应用的方法
CN109684536A (zh) 一种基于物品k-最近邻算法的图书推荐方法和系统
CN111737608B (zh) 企业信息检索结果排序方法及装置
CN113850649A (zh) 一种基于多平台用户数据的定制化推荐方法及推荐系统
CN110347923B (zh) 一种可回溯的快速裂变式构建用户画像的方法
CN115829683A (zh) 一种基于逆奖赏学习优化的电力积分商品推荐方法及系统
CN113641904A (zh) 一种为互联网婚恋线下门店推荐目标客户的方法及装置
CN116187808A (zh) 一种基于虚拟电厂用户-套餐标签画像的电力套餐推荐方法
CN108710620A (zh) 一种基于用户的k-最近邻算法的图书推荐方法与系统
KR100901782B1 (ko) 마케팅 정보 생성 방법 및 시스템
CN117934036A (zh) 一种基于大数据分析的获客数据智能分类管理系统
Chou et al. The RFM Model Analysis for VIP Customer: A case study of golf clothing brand

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190426