CN111400585B - 图书推荐方法及装置 - Google Patents

图书推荐方法及装置 Download PDF

Info

Publication number
CN111400585B
CN111400585B CN201910000970.4A CN201910000970A CN111400585B CN 111400585 B CN111400585 B CN 111400585B CN 201910000970 A CN201910000970 A CN 201910000970A CN 111400585 B CN111400585 B CN 111400585B
Authority
CN
China
Prior art keywords
book
user
books
intersection
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910000970.4A
Other languages
English (en)
Other versions
CN111400585A (zh
Inventor
孔维莲
曾海涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910000970.4A priority Critical patent/CN111400585B/zh
Publication of CN111400585A publication Critical patent/CN111400585A/zh
Application granted granted Critical
Publication of CN111400585B publication Critical patent/CN111400585B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种图书推荐方法及装置,属于互联网技术领域。图书推荐方法包括:获取图书信息以及用户的阅读记录,构建图书数据库;基于图书内容属性确定所述图书数据库中图书之间的关系取值,基于所述关系取值构建以图书为节点的图书网络;从用户阅读的图书出发,遍历所述图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合;按照预设规则计算所述候选推荐集合中每一交集的分值,根据所述分值向用户推荐所述交集中的图书。本发明能够准确地对用户进行个性化的图书推荐。

Description

图书推荐方法及装置
技术领域
本发明涉及互联网技术领域,特别是指一种图书推荐方法及装置。
背景技术
近年来,随着计算机技术和互联网技术的迅速发展,给人们的日常生活和工作带来了极大的便利,人们常常通过网络获取信息,尤其是手机已经成为必不可少的工具,但是随着生活节奏越来越快,喜欢读书的用户不得不从纸质版图书逐渐转向电子图书,如何通过分析用户的阅读数据对用户进行个性化推荐变得越来越重要。
传统的对于图书推荐的方法有很多,常用的推荐方法是协同过滤算法,基于用户的协同过滤算法和基于物品的协同过滤算法,多数推荐方法都是考虑用户的偏好是否相同,进而寻找相同偏好的用户阅读的图书进行推荐,但是没有考虑图书内容属性的特点之间的关系;对于基于物品的协同过滤方法是给用户推荐那些和他们之前喜欢的物品相似的物品,不过基于物品的协同过滤的方法并不利用物品内容属性的相似度,也没有将用户的偏好与物品本身的属性特点进行综合考虑,对于新出版的图书没有用户的评分,不能很好地进行推荐。
发明内容
本发明要解决的技术问题是提供一种图书推荐方法及装置,能够准确地对用户进行个性化的图书推荐。
为解决上述技术问题,本发明的实施例提供技术方案如下:
一方面,本发明的实施例提供一种图书推荐方法,包括:
获取图书信息以及用户的阅读记录,构建图书数据库;
基于图书内容属性确定所述图书数据库中图书之间的关系取值,基于所述关系取值构建以图书为节点的图书网络;
从用户阅读的图书出发,遍历所述图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合;
按照预设规则计算所述候选推荐集合中每一交集的分值,根据所述分值向用户推荐所述交集中的图书。
进一步地,所获取的图书信息包括:作者、价格、出版时间、出版社、语言;
所获取的用户的阅读记录包括:图书名称、阅读时间、用户评分。
进一步地,所述构建图书数据库之前,所述方法还包括:
将缺少作者、价格、或出版时间的图书信息过滤掉。
进一步地,所述基于图书内容属性确定所述图书数据库中图书之间的关系取值包括:
基于物品内容属性相似度基于图书内容属性确定所述图书数据库中图书之间的关系取值。
进一步地,还包括:
基于图书的多个属性构建图书节点的属性集合,通过Jaccard相似性计算方法计算不同图书属性集合的相似性值作为不同图书节点之间的权重值。
进一步地,所述从用户阅读的图书出发,遍历所述图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合包括:
从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的一阶邻居,记为集合i1,其中,i为大于0不大于n的整数,n为用户看过的图书数量;
将集合11、…i1、…、n1的交集记为一阶邻居交集;
从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的二阶邻居,记为集合i2;
将集合12、…i2、…、n2的交集记为二阶邻居交集;
…,
从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的m阶邻居,记为集合im,m为大于1的整数;
将集合1m、…im、…、nm的交集记为m阶邻居交集;
将所述一阶邻居交集、所述二阶邻居交集、…、所述m阶邻居交集添加至所述候选推荐集合。
进一步地,利用以下公式计算每一交集的分值V:
V=((c*∑w+a*∑s-b*∑t)/∑L)*N
其中,c为权重值系数,w为图书节点之间的权重值,a为用户评分系数,s为用户评分,b为阅读时间系数,t为阅读时间至今的时间,N为节点个数,L为两个节点的邻居有相交的情况下,这两个节点之间的路径长度。
进一步地,所述根据所述分值向用户推荐所述交集中的图书包括:
按照所述分值的从高到低,顺序向用户推荐所述交集中的图书。
本发明实施例还提供了一种图书推荐装置,包括:
数据库构建模块,用于获取图书信息以及用户的阅读记录,构建图书数据库;
图书网络构建模块,用于基于图书内容属性确定所述图书数据库中图书之间的关系取值,基于所述关系取值构建以图书为节点的图书网络;
处理模块,用于从用户阅读的图书出发,遍历所述图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合;
推荐模块,用于按照预设规则计算所述候选推荐集合中每一交集的分值,根据所述分值向用户推荐所述交集中的图书。
进一步地,所获取的图书信息包括:作者、价格、出版时间、出版社、语言;
所获取的用户的阅读记录包括:图书名称、阅读时间、用户评分。
进一步地,所述装置还包括:
过滤模块,用于将缺少作者、价格、或出版时间的图书信息过滤掉。
进一步地,所述图书网络构建模块具体用于基于物品内容属性相似度基于图书内容属性确定所述图书数据库中图书之间的关系取值。
进一步地,还包括:
计算模块,用于基于图书的多个属性构建图书节点的属性集合,通过Jaccard相似性计算方法计算不同图书属性集合的相似性值作为不同图书节点之间的权重值。
进一步地,所述处理模块具体用于从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的一阶邻居,记为集合i1,其中,i为大于0不大于n的整数,n为用户看过的图书数量;将集合11、…i1、…、n1的交集记为一阶邻居交集;从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的二阶邻居,记为集合i2;将集合12、…i2、…、n2的交集记为二阶邻居交集;…,从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的m阶邻居,记为集合im,m为大于1的整数;将集合1m、…im、…、nm的交集记为m阶邻居交集;将所述一阶邻居交集、所述二阶邻居交集、…、所述m阶邻居交集添加至所述候选推荐集合。
进一步地,所述推荐模块具体用于利用以下公式计算每一交集的分值V:
V=((c*∑w+a*∑s-b*∑t)/∑L)*N
其中,c为权重值系数,w为图书节点之间的权重值,a为用户评分系数,s为用户评分,b为阅读时间系数,t为阅读时间至今的时间,N为节点个数,L为两个节点的邻居有相交的情况下,这两个节点之间的路径长度。
进一步地,所述推荐模块具体用于按照所述分值的从高到低,顺序向用户推荐所述交集中的图书。
本发明实施例还提供了一种图书推荐设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述处理器执行所述程序时实现如上所述的图书推荐方法。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的图书推荐方法中的步骤。
本发明的实施例具有以下有益效果:
上述方案中,根据图书信息和用户的阅读记录建立图书数据库,确定图书数据库中图书之间的关系取值,基于关系取值构建以图书为节点的图书网络,从用户阅读的图书出发,遍历图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合,按照预设规则计算候选推荐集合中每一交集的分值,根据分值向用户推荐交集中的图书,本实施例基于图书信息和用户的历史阅读数据对用户进行推荐,能够对用户进行更全面更准确的个性化推荐。
附图说明
图1为本发明实施例图书推荐方法的流程示意图;
图2为本发明实施例图书推荐装置的结构框图;
图3为本发明实施例图书A、图书B和图书C的图书遍历集合存在交集的示意图。
具体实施方式
为使本发明的实施例要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明的实施例提供一种图书推荐方法及装置,能够准确地对用户进行个性化的图书推荐。
本发明的实施例提供一种图书推荐方法,如图1所示,包括:
步骤101:获取图书信息以及用户的阅读记录,构建图书数据库;
步骤102:基于图书内容属性确定所述图书数据库中图书之间的关系取值,基于所述关系取值构建以图书为节点的图书网络;
步骤103:从用户阅读的图书出发,遍历所述图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合;
步骤104:按照预设规则计算所述候选推荐集合中每一交集的分值,根据所述分值向用户推荐所述交集中的图书。
本实施例中,根据图书信息和用户的阅读记录建立图书数据库,确定图书数据库中图书之间的关系取值,基于关系取值构建以图书为节点的图书网络,从用户阅读的图书出发,遍历图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合,按照预设规则计算候选推荐集合中每一交集的分值,根据分值向用户推荐交集中的图书,本实施例基于图书信息和用户的历史阅读数据对用户进行推荐,能够对用户进行更全面更准确的个性化推荐。
进一步地,所获取的图书信息包括:作者、价格、出版时间、出版社、语言;
所获取的用户的阅读记录包括:图书名称、阅读时间、用户评分。
进一步地,所述构建图书数据库之前,所述方法还包括:
将缺少作者、价格、或出版时间的图书信息过滤掉。
进一步地,所述基于图书内容属性确定所述图书数据库中图书之间的关系取值包括:
基于物品内容属性相似度基于图书内容属性确定所述图书数据库中图书之间的关系取值。
进一步地,还包括:
基于图书的多个属性构建图书节点的属性集合,通过Jaccard相似性计算方法计算不同图书属性集合的相似性值作为不同图书节点之间的权重值。
进一步地,所述从用户阅读的图书出发,遍历所述图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合包括:
从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的一阶邻居,记为集合i1,其中,i为大于0不大于n的整数,n为用户看过的图书数量;
将集合11、…i1、…、n1的交集记为一阶邻居交集;
从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的二阶邻居,记为集合i2;
将集合12、…i2、…、n2的交集记为二阶邻居交集;
…,
从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的m阶邻居,记为集合im,m为大于1的整数;
将集合1m、…im、…、nm的交集记为m阶邻居交集;
将所述一阶邻居交集、所述二阶邻居交集、…、所述m阶邻居交集添加至所述候选推荐集合。
进一步地,利用以下公式计算每一交集的分值V:
V=((c*∑w+a*∑s-b*∑t)/∑L)*N
其中,c为权重值系数,w为图书节点之间的权重值,a为用户评分系数,s为用户评分,b为阅读时间系数,t为阅读时间至今的时间,N为节点个数,L为两个节点的邻居有相交的情况下,这两个节点之间的路径长度。
进一步地,所述根据所述分值向用户推荐所述交集中的图书包括:
按照所述分值的从高到低,顺序向用户推荐所述交集中的图书。
本发明实施例还提供了一种图书推荐装置,如图2所示,包括:
数据库构建模块21,用于获取图书信息以及用户的阅读记录,构建图书数据库;
图书网络构建模块22,用于基于图书内容属性确定所述图书数据库中图书之间的关系取值,基于所述关系取值构建以图书为节点的图书网络;
处理模块23,用于从用户阅读的图书出发,遍历所述图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合;
推荐模块24,用于按照预设规则计算所述候选推荐集合中每一交集的分值,根据所述分值向用户推荐所述交集中的图书。
本实施例中,根据图书信息和用户的阅读记录建立图书数据库,确定图书数据库中图书之间的关系取值,基于关系取值构建以图书为节点的图书网络,从用户阅读的图书出发,遍历图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合,按照预设规则计算候选推荐集合中每一交集的分值,根据分值向用户推荐交集中的图书,本实施例基于图书信息和用户的历史阅读数据对用户进行推荐,能够对用户进行更全面更准确的个性化推荐。
进一步地,所获取的图书信息包括:作者、价格、出版时间、出版社、语言;
所获取的用户的阅读记录包括:图书名称、阅读时间、用户评分。
进一步地,所述装置还包括:
过滤模块,用于将缺少作者、价格、或出版时间的图书信息过滤掉。
进一步地,所述图书网络构建模块具体用于基于物品内容属性相似度基于图书内容属性确定所述图书数据库中图书之间的关系取值。
进一步地,还包括:
计算模块,用于基于图书的多个属性构建图书节点的属性集合,通过Jaccard相似性计算方法计算不同图书属性集合的相似性值作为不同图书节点之间的权重值。
进一步地,所述处理模块具体用于从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的一阶邻居,记为集合i1,其中,i为大于0不大于n的整数,n为用户看过的图书数量;将集合11、…i1、…、n1的交集记为一阶邻居交集;从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的二阶邻居,记为集合i2;将集合12、…i2、…、n2的交集记为二阶邻居交集;…,从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的m阶邻居,记为集合im,m为大于1的整数;将集合1m、…im、…、nm的交集记为m阶邻居交集;将所述一阶邻居交集、所述二阶邻居交集、…、所述m阶邻居交集添加至所述候选推荐集合。
进一步地,所述推荐模块具体用于利用以下公式计算每一交集的分值V:V=((c*∑w+a*∑s-b*∑t)/∑L)*N
其中,c为权重值系数,w为图书节点之间的权重值,a为用户评分系数,s为用户评分,b为阅读时间系数,t为阅读时间至今的时间,N为节点个数,L为两个节点的邻居有相交的情况下,这两个节点之间的路径长度。
进一步地,所述推荐模块具体用于按照所述分值的从高到低,顺序向用户推荐所述交集中的图书。
下面结合附图以及具体的实施例对本发明的技术方案进行进一步介绍:
本实施例通过收集图书信息和用户阅读行为数据,构建基于图书内容属性相似性的图书网络,遍历图书网络中的图书节点,从而找出用户偏好相似,且图书内容属性相似的图书为用户进行个性化推荐。
本实施例充分考虑了图书内容属性的特点,并综合考虑用户所有阅读的图书记录的影响,有些图书可能是用户很久之前喜欢的,现在又喜欢了新的类型的图书,因此推荐时需要综合考虑所有历史记录,还要考虑时间因素,最新喜欢的图书所占比重应该更大,因此,本实施例将时间因素也考虑进来,作为图书的一个属性,在推荐过程中综合考虑时间因素,体现了用户最新喜欢的类型,进而更全面更准确的进行个性化推荐。
在构建图书网络的时候,依据图书内容属性的相似性确定图书网络中的权重值,在遍历用户所有阅读的图书节点时,计算图书节点的邻居节点交集时,综合考虑用户评分、时间、权重等信息选取候选推荐集合,既考虑了用户偏好,对于新出版的图书,也可依据图书内容属性信息很好的找出候选推荐集合,最后依据排序结果进行推荐。
本实施例的图书推荐方法包括以下步骤:
步骤1、收集数据
具体地,可以从多个使用移动网络的阅读app上收集图书数据及用户数据观看产生的行为数据,包括图书名称、阅读时间、用户评分等信息,构建图书信息表及用户观看行为信息表,还可以对数据进行清洗及预处理,将缺少作者、价格、年份等关键信息的数据过滤掉,将过滤后的数据导入图书数据库中;
步骤2、确定网络连边规则;
确定图书之间的关系取值,收集的图书信息数据中,图书总数为n,超过50%的图书爬取到的属性添加至边连接规则中;
步骤3、构建图书网络
构建以图书为节点的图书网络,不同图书节点之间的权重值依据不同的关系连接的取值不同,基于图书的多个属性构建图书节点的属性集合,通过Jaccard相似性计算方法计算不同图书属性集合的相似性值作为权重值。
Jaccard(A,B)=|A∩B|/|A∪B|
其中,A和B为不同的图书。
步骤4、确定候选推荐集合;
根据用户行为数据表中可以得知用户看过哪些书,为某用户推荐新的可能感兴趣的图书时,假设用户看过n本书,从构建的图书网络中该用户看过的一本书i出发,遍历其一阶邻居,记录集合为l={a,b,…,l},其他看过的n-1本书依次进行遍历,得到一阶邻居集合,首先计算一阶邻居集合的交集,得出一阶邻居交集集合k={x,y,},然后依次进行二阶和三阶邻居的交集集合的计算,并将其添加至候选推荐集合中。
如图3所示,图书A和图书B存在一阶邻居集合的交集,交集中存在一个图书节点m,图书B和图书C存在一阶邻居集合的交集,交集中存在一个图书节点n。其中,图书A的阅读时间为2018年10月13日,用户评分为8.5;图书B的阅读时间为2017年11月13日,用户评分为7.5;图书C的阅读时间为2018年08月13日,用户评分为8.0。
步骤5、交集分值计算
在计算各阶邻居交集集合时,交集的图书节点按照一定的规则赋予分数值v,分数v需要综合考虑图书节点的内容属性信息,包括用户评分s、阅读时间t(阅读时间至今的时间)以及图书节点之间的权重值w。其中,a是评分系数,b是阅读时间系数,c是权重系数,依次进行遍历,当遍历的网络阶数越大交集节点的分值则会越小,考虑到图书网络中阶数过大,图书之间的关系过小,推荐的可能性较低,且会增加遍历的复杂度,因此本实施例优选遍历图书网络中图书节点的三阶邻居,最后将候选集中的交集节点按照分值V降序排序,分值越高的图书越先进行推荐。
V=((c*∑w+a*∑s-b*∑t)/∑L)*N
其中,c为权重值系数,w为图书节点之间的权重值,a为用户评分系数,s为用户评分,b为阅读时间系数,t为阅读时间至今的时间,N为节点个数,L为两个节点的邻居有相交的情况下,这两个节点之间的路径长度。
本实施例中,综合考虑图书内容属性赋予图书之间的连边的权重值,基于物品内容属性相似性构建图书网络,并综合考虑用户评分、用户阅读时间以及不同图书之间的内容属性的相似性对用户进行推荐,能够更加全面的进行推荐,将用户的最新兴趣体现出来,更精准的进行个性化推荐。
本发明实施例还提供了一种图书推荐设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述处理器执行所述程序时实现如上所述的图书推荐方法。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的图书推荐方法中的步骤。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (16)

1.一种图书推荐方法,其特征在于,包括:
获取图书信息以及用户的阅读记录,构建图书数据库;
基于图书内容属性基于图书内容属性确定所述图书数据库中图书之间的关系取值,基于所述关系取值构建以图书为节点的图书网络;
从用户阅读的图书出发,遍历所述图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合;
按照预设规则计算所述候选推荐集合中每一交集的分值,根据所述分值向用户推荐所述交集中的图书;
按照预设规则计算所述候选推荐集合中每一交集的分值包括:
利用以下公式计算每一交集的分值V:
V=((c*∑w+a*∑s-b*∑t)/∑L)*N
其中,c为权重值系数,w为图书节点之间的权重值,a为用户评分系数,s为用户评分,b为阅读时间系数,t为阅读时间至今的时间,N为节点个数,L为两个节点的邻居有相交的情况下,这两个节点之间的路径长度。
2.根据权利要求1所述的图书推荐方法,其特征在于,
所获取的图书信息包括:作者、价格、出版时间、出版社、语言;
所获取的用户的阅读记录包括:图书名称、阅读时间、用户评分。
3.根据权利要求1所述的图书推荐方法,其特征在于,所述构建图书数据库之前,所述方法还包括:
将缺少作者、价格、或出版时间的图书信息过滤掉。
4.根据权利要求1所述的图书推荐方法,其特征在于,所述基于图书内容属性确定所述图书数据库中图书之间的关系取值包括:
基于物品内容属性相似度基于图书内容属性确定所述图书数据库中图书之间的关系取值。
5.根据权利要求1所述的图书推荐方法,其特征在于,还包括:
基于图书的多个属性构建图书节点的属性集合,通过Jaccard相似性计算方法计算不同图书属性集合的相似性值作为不同图书节点之间的权重值。
6.根据权利要求5所述的图书推荐方法,其特征在于,所述从用户阅读的图书出发,遍历所述图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合包括:
从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的一阶邻居,记为集合i1,其中,i为大于0不大于n的整数,n为用户看过的图书数量;
将集合11、…i1、…、n1的交集记为一阶邻居交集;
从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的二阶邻居,记为集合i2;
将集合12、…i2、…、n2的交集记为二阶邻居交集;
…,
从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的m阶邻居,记为集合im,m为大于1的整数;
将集合1m、…im、…、n m的交集记为m阶邻居交集;
将所述一阶邻居交集、所述二阶邻居交集、…、所述m阶邻居交集添加至所述候选推荐集合。
7.根据权利要求1所述的图书推荐方法,其特征在于,所述根据所述分值向用户推荐所述交集中的图书包括:
按照所述分值的从高到低,顺序向用户推荐所述交集中的图书。
8.一种图书推荐装置,其特征在于,包括:
数据库构建模块,用于获取图书信息以及用户的阅读记录,构建图书数据库;
图书网络构建模块,用于基于图书内容属性确定所述图书数据库中图书之间的关系取值,基于所述关系取值构建以图书为节点的图书网络;
处理模块,用于从用户阅读的图书出发,遍历所述图书网络,获取同一用户阅读的多个图书的图书遍历集合的交集作为候选推荐集合;
推荐模块,用于按照预设规则计算所述候选推荐集合中每一交集的分值,根据所述分值向用户推荐所述交集中的图书;
所述推荐模块具体用于利用以下公式计算每一交集的分值V:
V=((c*∑w+a*∑s-b*∑t)/∑L)*N
其中,c为权重值系数,w为图书节点之间的权重值,a为用户评分系数,s为用户评分,b为阅读时间系数,t为阅读时间至今的时间,N为节点个数,L为两个节点的邻居有相交的情况下,这两个节点之间的路径长度。
9.根据权利要求8所述的图书推荐装置,其特征在于,
所获取的图书信息包括:作者、价格、出版时间、出版社、语言;
所获取的用户的阅读记录包括:图书名称、阅读时间、用户评分。
10.根据权利要求8所述的图书推荐装置,其特征在于,所述装置还包括:
过滤模块,用于将缺少作者、价格、或出版时间的图书信息过滤掉。
11.根据权利要求8所述的图书推荐装置,其特征在于,所述图书网络构建模块具体用于基于物品内容属性相似度基于图书内容属性确定所述图书数据库中图书之间的关系取值。
12.根据权利要求8所述的图书推荐装置,其特征在于,还包括:
计算模块,用于基于图书的多个属性构建图书节点的属性集合,通过Jaccard相似性计算方法计算不同图书属性集合的相似性值作为不同图书节点之间的权重值。
13.根据权利要求12所述的图书推荐装置,其特征在于,
所述处理模块具体用于从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的一阶邻居,记为集合i1,其中,i为大于0不大于n的整数,n为用户看过的图书数量;将集合11、…i1、…、n1的交集记为一阶邻居交集;从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的二阶邻居,记为集合i2;将集合12、…i2、…、n2的交集记为二阶邻居交集;…,从用户看过的第i图书出发,遍历所述图书网络中所述第i图书的m阶邻居,记为集合im,m为大于1的整数;将集合1m、…i m、…、n m的交集记为m阶邻居交集;将所述一阶邻居交集、所述二阶邻居交集、…、所述m阶邻居交集添加至所述候选推荐集合。
14.根据权利要求8所述的图书推荐装置,其特征在于,所述推荐模块具体用于按照所述分值的从高到低,顺序向用户推荐所述交集中的图书。
15.一种图书推荐设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的图书推荐方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的图书推荐方法中的步骤。
CN201910000970.4A 2019-01-02 2019-01-02 图书推荐方法及装置 Active CN111400585B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910000970.4A CN111400585B (zh) 2019-01-02 2019-01-02 图书推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910000970.4A CN111400585B (zh) 2019-01-02 2019-01-02 图书推荐方法及装置

Publications (2)

Publication Number Publication Date
CN111400585A CN111400585A (zh) 2020-07-10
CN111400585B true CN111400585B (zh) 2023-06-30

Family

ID=71430142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910000970.4A Active CN111400585B (zh) 2019-01-02 2019-01-02 图书推荐方法及装置

Country Status (1)

Country Link
CN (1) CN111400585B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765476A (zh) * 2020-07-27 2021-05-07 上海斐杰教育科技有限公司 一种亲子阅读资源推荐服务系统与方法
CN113592289B (zh) * 2021-07-28 2024-06-07 咪咕数字传媒有限公司 图书质量的预测方法、装置及设备
CN113901326A (zh) * 2021-10-27 2022-01-07 海信集团控股股份有限公司 图书推荐方法、服务器及系统
CN114971976A (zh) * 2022-08-01 2022-08-30 北京思源智通科技有限责任公司 一种用于提升校园阅读素养的智能引导系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001042880A2 (en) * 1999-12-10 2001-06-14 Amazon.Com, Inc. Search query refinement using related search phrases
CN107766547A (zh) * 2017-10-31 2018-03-06 掌阅科技股份有限公司 电子书推荐方法、电子设备及计算机存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110320276A1 (en) * 2010-06-28 2011-12-29 International Business Machines Corporation System and method for online media recommendations based on usage analysis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001042880A2 (en) * 1999-12-10 2001-06-14 Amazon.Com, Inc. Search query refinement using related search phrases
CN107766547A (zh) * 2017-10-31 2018-03-06 掌阅科技股份有限公司 电子书推荐方法、电子设备及计算机存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
包朔 ; .数字出版时代传统图书的发展策略.科技资讯.2009,(33),全文. *
唐晓波 ; 周咏 ; .基于图书基因组的个性化图书推荐研究.图书馆学研究.2017,(02),全文. *

Also Published As

Publication number Publication date
CN111400585A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN111400585B (zh) 图书推荐方法及装置
US10515424B2 (en) Machine learned query generation on inverted indices
US20230129014A1 (en) Apparatus, systems, and methods for analyzing characteristics of entities of interest
US10567182B1 (en) Revealing connections for persons in a social graph
US10572565B2 (en) User behavior models based on source domain
US11176142B2 (en) Method of data query based on evaluation and device
US9152969B2 (en) Recommendation ranking system with distrust
JP3389948B2 (ja) 表示広告選択システム
CA3070612A1 (en) Click rate estimation
US8838512B2 (en) Random walk on query pattern graph for query task classification
CN111159341B (zh) 基于用户投资理财偏好的资讯推荐方法及装置
US20190220875A1 (en) Systems and methods for personalized discovery engines
US20160132811A1 (en) Influential Peers
CN105391594A (zh) 识别特征账号的方法及装置
CN109727047A (zh) 一种确定数据关联度的方法和装置、数据推荐方法和装置
CN110609889A (zh) 基于学术网络确定对象重要性排名及选择评审专家的方法和系统
TW201734909A (zh) 一種目標用戶的識別方法和裝置
KR20190081671A (ko) 온라인 쇼핑몰 통합 관리 시스템에서의 유사상품을 검색하는 방법 및 그 서버
CN108009194A (zh) 一种图书推送方法、电子设备、存储介质及装置
JP2020035409A (ja) 特性推定装置、特性推定方法、及び特性推定プログラム等
CN117076770A (zh) 基于图计算的数据推荐方法、装置、存储价值及电子设备
WO2018044955A1 (en) Systems and methods for measuring collected content significance
CN116977091A (zh) 个股投资组合的确定方法、装置、电子设备及可读存储介质
US20190065987A1 (en) Capturing knowledge coverage of machine learning models
Asim et al. Content based call for papers recommendation to researchers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant