CN107437215B - 一种基于标签的图书推荐方法 - Google Patents
一种基于标签的图书推荐方法 Download PDFInfo
- Publication number
- CN107437215B CN107437215B CN201710651464.2A CN201710651464A CN107437215B CN 107437215 B CN107437215 B CN 107437215B CN 201710651464 A CN201710651464 A CN 201710651464A CN 107437215 B CN107437215 B CN 107437215B
- Authority
- CN
- China
- Prior art keywords
- preference
- user
- book
- label
- labels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于标签的图书推荐方法,包括有:步骤一、根据用户的历史阅读图书记录,计算用户对已阅读图书所包含的每个通用标签的偏好值,并从中挑选出多个偏好值最大的通用标签作为用户的偏好标签;步骤二、从用户的每本未阅读图书的通用标签中挑选出用户的偏好标签,并根据用户对通用标签的偏好值,计算用户对未阅读图书的偏好值,以据此向用户推荐图书。本发明属于数据业务领域,能充分利用图书所包含的通用标签来为用户挑选符合其偏好的推荐图书。
Description
技术领域
本发明涉及一种基于标签的图书推荐方法,属于数据业务领域。
背景技术
为了便于用户从图书平台上的海量图书中快速了解、并挑选自己偏好的图书,通常采用标签来描述每本图书的主题内容。
专利申请CN 201310135875.8(申请名称:一种图书推荐方法和装置,申请日:2013-04-18,申请人:中国移动通信集团浙江有限公司)提供了一种图书推荐方法和装置,其中,所述方法包括:获取包括多本图书信息的图书信息库;确定所述多本图书中的每本图书的图书标签集,形成图书标签库;计算所述图书标签库中的每个图书标签的区分度值,形成图书标签的区分度值表;根据所述图书信息库中存储的第一用户的阅读行为数据和所述图书标签的区分度值表,计算所述第一用户的第一用户度量值表;将所述多本图书中的每本图书的图书标签集与所述第一用户度量值表进行关联,确定每本图书各自的图书推荐值;根据所述图书推荐值,在所述多本图书中选择至少一本目标图书,作为推荐图书。该技术方案完全依靠现有图书标签集合中的标签进行图书推荐,但对于标签稀少或者缺失的图书却无法进行推荐。
因此,如何充分利用图书所包含的通用标签来为用户挑选符合其偏好的推荐图书,已成为技术人员急需解决的技术问题,目前还未发现有效的技术解决方案。
发明内容
有鉴于此,本发明的目的是提供一种基于标签的图书推荐方法,能充分利用图书所包含的通用标签来为用户挑选符合其偏好的推荐图书。
为了达到上述目的,本发明提供了一种基于标签的图书推荐方法,包括有:
步骤一、根据用户的历史阅读图书记录,计算用户对已阅读图书所包含的每个通用标签的偏好值,并从中挑选出多个偏好值最大的通用标签作为用户的偏好标签,所述通用标签是图书编辑人工为图书所添加的标签属性;
步骤二、从用户的每本未阅读图书的通用标签中挑选出用户的偏好标签,并根据用户对通用标签的偏好值,计算用户对未阅读图书的偏好值,以据此向用户推荐图书,
还包括有:
步骤A1、挑选一定数量的用户作为样本用户,并提取每个样本用户的历史阅读图书记录,然后计算每个样本用户对已阅读图书所包含的每个通用标签的偏好值,再从中挑选出多个偏好值最大的通用标签作为每个样本用户的偏好标签,并构成每个样本用户的偏好标签集,所有样本用户的偏好标签集构成用户偏好标签集群;
步骤A2、提取未添加标签图书的所有阅读用户,然后从用户偏好标签集群中寻找所有阅读用户对应的偏好标签集,最后从所有阅读用户的偏好标签集中挑选多个标签作为所述未添加标签图书的标签属性,
步骤A2进一步包括有:
步骤A21、获取未添加标签图书的所有阅读用户,为所述未添加标签图书新建一个图书标签集,然后从所有阅读用户的偏好标签集中逐一提取每个偏好标签;
步骤A23、判断所提取的偏好标签的出现频率是否大于预设值,如果是,则将所提取的偏好标签写入图书标签集中,然后继续下一步;如果否,则转向步骤A25;
步骤A24、计算所提取的偏好标签的用户偏好平均值:
其中,prefer(Lp)是标签Lp的用户偏好平均值,Ux是偏好标签集包含标签Lp的阅读用户,是偏好标签集包含标签Lp的所有阅读用户对标签Lp的偏好值之和,TAG(Lp,Ux)是用户Ux对标签Lp的偏好值;
步骤A25、判断所有阅读用户的偏好标签集中是否还有未提取的偏好标签,如果是,则继续提取下一个未提取的偏好标签,然后转向步骤A22;如果否,则继续下一步;
步骤A26、从图书标签集的所有标签中,挑选出其用户偏好平均值最大的前若干个标签,并将其他未挑选的标签从图书标签集中删除;
步骤A27、将图书标签集中的所有标签添加为所述未添加标签图书的标签属性。
与现有技术相比,本发明的有益效果是:本发明通过用户的阅读行为来提取用户的偏好标签,再根据用户对标签的偏好值来最终获得用户对未阅读图书的偏好值,从而能为用户挑选符合其偏好的推荐图书;当某本图书的大量阅读用户同时具备某个偏好标签时,也就意味着该本图书应具有同样的标签属性,本发明还可以进一步为无标签的图书添加符合其内容的标签属性,从而能充分利用图书所包含的通用标签为用户进行个性化图书推荐。
附图说明
图1是本发明一种基于标签的图书推荐方法的流程图。
图2是步骤一的具体操作流程图。
图3是本发明进一步为无标签图书添加符合其内容的标签属性的具体操作流程图。
图4是步骤A2的具体操作流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
如图1所示,本发明一种基于标签的图书推荐方法,包括有:
步骤一、根据用户的历史阅读图书记录,计算用户对已阅读图书所包含的每个通用标签的偏好值,并从中挑选出多个偏好值最大的通用标签作为用户的偏好标签;
步骤二、从用户的每本未阅读图书的通用标签中挑选出用户的偏好标签,并根据用户对通用标签的偏好值,计算用户对未阅读图书的偏好值,以据此向用户推荐图书。
如图2所示,步骤一还可以进一步包括有:
步骤11、从用户的历史阅读图书中挑选出包含有通用标签的阅读图书,所述通用标签是图书编辑人工为图书所添加的标签属性,然后计算用户的阅读图书包含的每个通用标签对于其所属图书的重要值:TFIDF(Li,Bj)=TF(Bj)×IDF(Li),其中,TFIDF(Li,Bj)是标签Li对于其所属图书Bj的重要值,TF(Bj)是标签Li的词频,IDF(Li)是标签Li的逆向文件频率,并对所有通用标签对于其所属图书的重要值进行归一化处理;
其中,TF(Bj)的计算公式如下:其中,num_L(Bj)是图书Bj包含的通用标签总数;IDF(Li)的计算公式如下:其中,num_total_L是图书平台上包含通用标签的图书总数,num_B(Li)是图书平台上包含标签Li的图书总数;
步骤12、计算用户对已阅读图书所包含的每个通用标签的偏好值:其中,TAG(Li,Uz)是用户Uz对其阅读图书所包含的标签Li的偏好值,TFIDF(Li,Bj)是标签Li对于其所属图书Bj的重要值,Jz是用户Uz阅读过的、且包含有标签Li的图书总数,是标签Li对于所有用户Uz阅读过的图书的重要值之和,Qz是用户Uz阅读过的、且包含有通用标签的图书总数,然后从用户对已阅读图书所包含的所有通用标签的偏好值中挑选出最大的前若干个偏好值,将最大的前若干个偏好值对应的标签作为用户的偏好标签,并构成用户的偏好标签集。
步骤二还可以进一步包括有:
从用户的每本未阅读图书的通用标签中挑选出用户的偏好标签,计算用户对每本未阅读图书的偏好值:其中,TAG(Bb,Uz)是用户Uz对未阅读图书Bb的偏好值,Lk是未阅读图书Bb的通用标签中所包含的第k个用户的偏好标签,Sb是未阅读图书Bb的通用标签中所包含的用户的偏好标签总数,TAG(Lk,Uz)是用户Uz对未阅读图书Bb所包含的通用标签Lk的偏好值,然后从用户的所有未阅读图书中挑选出偏好值最大的若干本图书向用户推荐。
当前主要依靠图书编辑来人工为图书添加标签属性,所以经常会遇到图书标签稀少或者缺失的情况,本发明还可以进一步为无标签图书添加符合其内容的标签属性,然后从所有图书中挑选合适图书向用户推荐,如图3所示,本发明还可以包括有:
步骤A1、挑选一定数量的用户作为样本用户,并提取每个样本用户的历史阅读图书记录,然后计算每个样本用户对已阅读图书所包含的每个通用标签的偏好值,再从中挑选出多个偏好值最大的通用标签作为每个样本用户的偏好标签,并构成每个样本用户的偏好标签集,所有样本用户的偏好标签集构成用户偏好标签集群;
步骤A2、提取未添加标签图书的所有阅读用户,然后从用户偏好标签集群中寻找所有阅读用户对应的偏好标签集,最后从所有阅读用户的偏好标签集中挑选多个标签作为所述未添加标签图书的标签属性。
步骤A1中,计算每个样本用户对已阅读图书所包含的每个通用标签的偏好值,再从中挑选出多个偏好值最大的通用标签作为每个样本用户的偏好标签,与图2中的步骤11、步骤12相同,不在此赘述。
如图4所示,步骤A2还可以进一步包括有:
步骤A21、获取未添加标签图书的所有阅读用户,为所述未添加标签图书新建一个图书标签集,然后从所有阅读用户的偏好标签集中逐一提取每个偏好标签;
步骤A23、判断所提取的偏好标签的出现频率是否大于预设值?如果是,则将所提取的偏好标签写入图书标签集中,然后继续下一步;如果否,则转向步骤A25;例如,预设值可以是20%;
步骤A24、计算所提取的偏好标签的用户偏好平均值:其中,prefer(Lp)是标签Lp的用户偏好平均值,Ux是偏好标签集包含标签Lp的阅读用户,是偏好标签集包含标签Lp的所有阅读用户对标签Lp的偏好值之和,TAG(Lp,Ux)是用户Ux对标签Lp的偏好值;
步骤A25、判断所有阅读用户的偏好标签集中是否还有未提取的偏好标签?如果是,则继续提取下一个未提取的偏好标签,然后转向步骤A22;如果否,则继续下一步;
步骤A26、从图书标签集的所有标签中,挑选出其用户偏好平均值最大的前若干个标签,并将其他未挑选的标签从图书标签集中删除;
步骤A27、将图书标签集中的所有标签添加为所述未添加标签图书的标签属性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (4)
1.一种基于标签的图书推荐方法,其特征在于,包括有:
步骤一、根据用户的历史阅读图书记录,计算用户对已阅读图书所包含的每个通用标签的偏好值,并从中挑选出多个偏好值最大的通用标签作为用户的偏好标签,所述通用标签是图书编辑人工为图书所添加的标签属性;
步骤二、从用户的每本未阅读图书的通用标签中挑选出用户的偏好标签,并根据用户对通用标签的偏好值,计算用户对未阅读图书的偏好值,以据此向用户推荐图书,
还包括有:
步骤A1、挑选一定数量的用户作为样本用户,并提取每个样本用户的历史阅读图书记录,然后计算每个样本用户对已阅读图书所包含的每个通用标签的偏好值,再从中挑选出多个偏好值最大的通用标签作为每个样本用户的偏好标签,并构成每个样本用户的偏好标签集,所有样本用户的偏好标签集构成用户偏好标签集群;
步骤A2、提取未添加标签图书的所有阅读用户,然后从用户偏好标签集群中寻找所有阅读用户对应的偏好标签集,最后从所有阅读用户的偏好标签集中挑选多个标签作为所述未添加标签图书的标签属性,
步骤A2进一步包括有:
步骤A21、获取未添加标签图书的所有阅读用户,为所述未添加标签图书新建一个图书标签集,然后从所有阅读用户的偏好标签集中逐一提取每个偏好标签;
步骤A23、判断所提取的偏好标签的出现频率是否大于预设值,如果是,则将所提取的偏好标签写入图书标签集中,然后继续下一步;如果否,则转向步骤A25;
步骤A24、计算所提取的偏好标签的用户偏好平均值:
其中,prefer(Lp)是标签Lp的用户偏好平均值,Ux是偏好标签集包含标签Lp的阅读用户,是偏好标签集包含标签Lp的所有阅读用户对标签Lp的偏好值之和,TAG(Lp,Ux)是用户Ux对标签Lp的偏好值;
步骤A25、判断所有阅读用户的偏好标签集中是否还有未提取的偏好标签,如果是,则继续提取下一个未提取的偏好标签,然后转向步骤A22;如果否,则继续下一步;
步骤A26、从图书标签集的所有标签中,挑选出其用户偏好平均值最大的前若干个标签,并将其他未挑选的标签从图书标签集中删除;
步骤A27、将图书标签集中的所有标签添加为所述未添加标签图书的标签属性。
2.根据权利要求1所述的方法,其特征在于,步骤一进一步包括有:
步骤11、从用户的历史阅读图书中挑选出包含有通用标签的阅读图书,然后计算用户的阅读图书包含的每个通用标签对于其所属图书的重要值:TFIDF(Li,Bj)=TF(Bj)×IDF(Li),其中,TFIDF(Li,Bj)是标签Li对于其所属图书Bj的重要值,TF(Bj)是标签Li的词频,IDF(Li)是标签Li的逆向文件频率,并对所有通用标签对于其所属图书的重要值进行归一化处理;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710651464.2A CN107437215B (zh) | 2017-08-02 | 2017-08-02 | 一种基于标签的图书推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710651464.2A CN107437215B (zh) | 2017-08-02 | 2017-08-02 | 一种基于标签的图书推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107437215A CN107437215A (zh) | 2017-12-05 |
CN107437215B true CN107437215B (zh) | 2020-07-24 |
Family
ID=60459815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710651464.2A Active CN107437215B (zh) | 2017-08-02 | 2017-08-02 | 一种基于标签的图书推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107437215B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522401A (zh) * | 2018-09-19 | 2019-03-26 | 咪咕数字传媒有限公司 | 一种信息推荐方法及装置 |
CN109670922B (zh) * | 2018-12-29 | 2022-02-08 | 北京工业大学 | 一种基于混合特征的线上图书价值发现方法 |
CN109885766A (zh) * | 2019-02-11 | 2019-06-14 | 武汉理工大学 | 一种基于书评的书籍推荐方法及系统 |
CN110232157B (zh) * | 2019-06-18 | 2024-02-02 | 绍兴文理学院 | 一种基于内容的隐私保护图书推荐方法及系统 |
CN110532470A (zh) * | 2019-08-23 | 2019-12-03 | 掌阅科技股份有限公司 | 图书推送方法、电子设备及计算机存储介质 |
CN110826850B (zh) * | 2019-09-24 | 2022-09-30 | 深圳市一德文化科技有限公司 | 基于信息处理的智慧校园图书馆管理方法及其系统 |
CN110674410B (zh) * | 2019-10-08 | 2022-05-24 | 北京物灵科技有限公司 | 用户画像构建、内容推荐方法、装置及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902744A (zh) * | 2012-09-17 | 2013-01-30 | 杭州东信北邮信息技术有限公司 | 一种图书推荐方法 |
CN102929959A (zh) * | 2012-10-10 | 2013-02-13 | 杭州东信北邮信息技术有限公司 | 一种基于用户行为的图书推荐方法 |
CN103745381A (zh) * | 2013-12-26 | 2014-04-23 | 方正国际软件有限公司 | 漫画推荐系统和漫画推荐方法 |
CN104111939A (zh) * | 2013-04-18 | 2014-10-22 | 中国移动通信集团浙江有限公司 | 一种图书推荐方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002269106A (ja) * | 2001-03-08 | 2002-09-20 | Dainippon Printing Co Ltd | 書籍紹介装置 |
-
2017
- 2017-08-02 CN CN201710651464.2A patent/CN107437215B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902744A (zh) * | 2012-09-17 | 2013-01-30 | 杭州东信北邮信息技术有限公司 | 一种图书推荐方法 |
CN102929959A (zh) * | 2012-10-10 | 2013-02-13 | 杭州东信北邮信息技术有限公司 | 一种基于用户行为的图书推荐方法 |
CN104111939A (zh) * | 2013-04-18 | 2014-10-22 | 中国移动通信集团浙江有限公司 | 一种图书推荐方法和装置 |
CN103745381A (zh) * | 2013-12-26 | 2014-04-23 | 方正国际软件有限公司 | 漫画推荐系统和漫画推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107437215A (zh) | 2017-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107437215B (zh) | 一种基于标签的图书推荐方法 | |
CN107679211B (zh) | 用于推送信息的方法和装置 | |
CN107491996B (zh) | 一种网页广告投放方法与系统 | |
WO2019024496A1 (zh) | 企业推荐方法及应用服务器 | |
CN104731917A (zh) | 一种推荐方法及装置 | |
CN107911448A (zh) | 一种内容推送方法及装置 | |
EP2624531A1 (en) | Intelligent grouping system and method for mobile terminal contact book | |
CN109492152B (zh) | 推送定制内容的方法、装置、计算机设备及存储介质 | |
CN105956008A (zh) | 一种图片管理方法及终端 | |
CN105095470A (zh) | 用于应用程序的数据推荐方法及装置 | |
CN108734110A (zh) | 基于最长公共子序列的文本段落识别对比方法及系统 | |
CN109284367B (zh) | 用于处理文本的方法和装置 | |
CN103577400A (zh) | 一种提供地点信息的方法及系统 | |
CN103617221B (zh) | 软件推荐方法及系统 | |
CN104135718B (zh) | 一种位置信息的获取方法及装置 | |
CN103179248A (zh) | 一种显示联系人的方法、装置及移动设备 | |
CA2530289A1 (en) | Managing network-accessible accounts | |
CN107330081A (zh) | 一种信息特征提取方法 | |
EP2518667A1 (en) | Apparatus and method for estimating developing speed of technology | |
CN107506398B (zh) | 一种为图书添加标签属性的方法 | |
CN107153712B (zh) | 支持移动终端的时间空间关联的个性化定制图片管理方法 | |
CN105894242A (zh) | 一种日历事件显示方法及装置 | |
JP5673520B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
CN114861614A (zh) | 用于填充数据的方法及装置、电子设备、介质 | |
CN109460518B (zh) | 一种基于用户网站访问记录的图书推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: 310013 4th floor, No.398 Wensan Road, Xihu District, Hangzhou City, Zhejiang Province Patentee after: Xinxun Digital Technology (Hangzhou) Co.,Ltd. Address before: 310013 4th floor, No.398 Wensan Road, Xihu District, Hangzhou City, Zhejiang Province Patentee before: EB Information Technology Ltd. |
|
CP01 | Change in the name or title of a patent holder |