CN107729416B - 一种书籍的推荐方法及系统 - Google Patents

一种书籍的推荐方法及系统 Download PDF

Info

Publication number
CN107729416B
CN107729416B CN201710890806.6A CN201710890806A CN107729416B CN 107729416 B CN107729416 B CN 107729416B CN 201710890806 A CN201710890806 A CN 201710890806A CN 107729416 B CN107729416 B CN 107729416B
Authority
CN
China
Prior art keywords
reading
book
reader
books
readers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710890806.6A
Other languages
English (en)
Other versions
CN107729416A (zh
Inventor
李成敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU TAIKU TECHNOLOGY Co.,Ltd.
Original Assignee
Hangzhou Taiku Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Taiku Technology Co ltd filed Critical Hangzhou Taiku Technology Co ltd
Priority to CN201710890806.6A priority Critical patent/CN107729416B/zh
Publication of CN107729416A publication Critical patent/CN107729416A/zh
Application granted granted Critical
Publication of CN107729416B publication Critical patent/CN107729416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种书籍的推荐方法及系统,方法包括:S10根据每位读者的阅读行为数据,统计出所有读者的阅读行为总数据后,得到阅读参考总数据;S20根据所述阅读参考总数据以及每位读者的阅读行为,得到每位读者各自对应的阅读参考数据;S30分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;S40根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者;S50将所述推荐读者对应的阅读行为数据推荐给所述当前读者。通过本发明,能够快速地找到相似读者,并向读者推送书籍。

Description

一种书籍的推荐方法及系统
技术领域
本发明涉及互联网信息处理领域,特别是一种书籍的推荐方法及系统。
背景技术
互联网技术的快速发展和电子产品的普及极大地方便了人们的网络生活。在上下班坐公交车、乘地铁等零碎的时间里,很多人习惯打开手机,看看电子书打发时间,手机阅读作为一种阅读的方式,为人们所青睐。
然而,随着互联网时代网络信息的爆发式增长,很多人在选择书籍时越来越困难,想要找到一本自己喜欢的书犹如海底捞针,网络平台也没有发挥应有的效力,没有给人们选择阅读书籍时带来很好的体验感。人们如何能在短时间内搜索要自己需要的书籍,非常重要。
现有的一些书籍推荐的方法一般都是直接给读者推荐畅销书,完全没有对读者的阅读行为进行分析,推荐的书籍不具有针对性,往往推荐的书籍也不是读者所喜爱的,没有起到良好的推荐效果。
因此,在向读者推荐书籍的时候,一定要通过挖掘读者的阅读行为,了解读者的喜好,有针对性地向读者推荐书籍。
发明内容
本发明提供的技术方案如下:
本发明提供了一种书籍的推荐方法,包括步骤:S10根据每位读者的阅读行为数据,统计出所有读者的阅读行为总数据后,得到阅读参考总数据;所述阅读行为数据包括每位读者所阅读的书籍、每种书籍的阅读次数;S20根据所述阅读参考总数据以及每位读者的阅读行为,得到每位读者各自对应的阅读参考数据;S30分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;S40根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者;S50将所述推荐读者对应的阅读行为数据推荐给所述当前读者。
优选的,步骤S10还包括:S101采集每位读者的阅读行为数据,将所述阅读行为数据中的书籍储存在书籍库中,并统计每一种书籍的阅读量;S102将所述书籍库中的书籍信息分为N类,并统计得到每一类书籍中阅读量最高的书籍;S103将每一类书籍中阅读量最高的书籍,以及每一类书籍中阅读量最高的书籍所对应的阅读量作为所述阅读参考总数据。
优选的,步骤S20还包括:S201根据每一类书籍中阅读量最高的书籍、每一类书籍中阅读量最高的书籍所对应的阅读量,以及每位读者所阅读的书籍,得到每位读者阅读每一类书籍的阅读参考量作为所述阅读参考数据。
优选的,步骤S201还包括:S2011查找出每位读者所阅读的书籍中,是否存在与每一类书籍中阅读量最高的书籍相同的书籍;S2012若存在,则将该类书籍中阅读量最高的书籍所对应的阅读量作为该位读者阅读该类书籍的阅读参考量;S2013若不存在,则将该位读者阅读该类书籍的阅读参考量标记为0。
优选的,步骤S30还包括:S301根据所述书籍库中的N类书籍,建立N维坐标系,每一类书籍代表一个维度;S302将每位读者阅读的每一类书籍对应的阅读参考量作为每位读者在N维坐标系中该类书籍对应维度的坐标系值;S303根据当前读者在N维坐标系中的坐标系值与其他读者在N维坐标系中的坐标系值,计算出当前读者坐标系与其他读者坐标系的曼哈顿距离D作为相似度的参考标准,其计算公式为:
Figure BDA0001421112570000021
其中,X1k=(X11,X12...X1k)表示当前读者在N维坐标系中的坐标系,X2k=(X21,X22...X2k)表示其他读者中的其中一个读者在N维坐标系中的坐标系。
优选的,步骤S40还包括:S401根据当前读者与其他读者之间的多个曼哈顿距离,找到多个曼哈顿距离中最小的最小曼哈顿距离;S402找到所述最小曼哈顿距离对应的读者作为推荐读者。
优选的,还包括步骤:S51根据所述推荐读者的阅读行为数据和所述当前读者的阅读行为数据,得到存在于推荐读者的阅读行为数据中、且不存在于当前读者的阅读行为数据中的书籍;并将该书籍推荐给所述当前读者。
一种书籍的推荐系统,包括:统计模块,根据每位读者的阅读行为数据,统计出所有读者的阅读行为总数据后,得到阅读参考总数据;所述阅读行为数据包括每位读者所阅读的书籍、每种书籍的阅读次数;处理模块,与所述统计模块电连接,用于根据所述阅读参考总数据以及每位读者的阅读行为,得到每位读者各自对应的阅读参考数据;计算模块,与所述处理模块电连接,用于分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;查找模块,与所述计算模块电连接,用于根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者;推荐模块,与所述查找模块电连接,用于将所述推荐读者对应的阅读行为数据推荐给所述当前读者。
优选的,还包括采集模块,所述采集模块与统计模块电连接,用于采集每位读者的阅读行为数据,将所述阅读行为数据中的书籍储存在书籍库中,并统计每一种书籍的阅读量;所述统计模块还用于将所述书籍库中的书籍信息分为N类,并统计得到每一类书籍中阅读量最高的书籍;所述处理模块还用于将每一类书籍中阅读量最高的书籍,以及每一类书籍中阅读量最高的书籍所对应的阅读量作为所述阅读参考总数据。
优选的,所述处理模块还用于根据每一类书籍中阅读量最高的书籍、每一类书籍中阅读量最高的书籍所对应的阅读量,以及每位读者所阅读的书籍,得到每位读者阅读每一类书籍的阅读参考数量作为所述阅读参考数据。
根据本发明提供的一种书籍的推荐方法及系统,能够带来以下至少一种有益效果:
1、能够根据读者阅读行为向读者推荐书籍。在当前的一些书籍的推荐方法中,有的没有分析读者的阅读行为,直接将阅读量较高的书籍推荐给读者,其中很多都不是读者喜欢的书,给读者造成了不好的体验。本发明首先统计了读者的阅读行为,了解读者的阅读喜好,然后再通过大数据找到与读者阅读行为相似度最高的其他读者,并将相似度最高的其他读者所阅读的书籍推荐给读者,这样可以使书籍的推荐更有针对性。
2、运用曼哈顿距离算法能够准确计算出读者之间阅读行为的相似度。本发明将书籍分为N类,并建立N维坐标系,每一类书籍代表一个维度,获取到读者的阅读行为后,在N维坐标系标记出对应的坐标,通过每位读者在N维坐标系标记出对应的坐标,可以计算出读者之间的曼哈顿距离,距离越小,相似度越高。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种书籍的推荐方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种书籍的推荐方法的一个实施例流程图;
图2是本发明一种书籍的推荐方法的另一个实施例流程图;
图3是本发明一种书籍的推荐方法的另一个实施例流程图;
图4是本发明一种书籍的推荐方法的另一个实施例流程图;
图5是本发明一种书籍的推荐方法的另一个实施例流程图;
图6是本发明一种书籍的推荐系统的一个结构示意图;
图7是本发明一种书籍的推荐系统的另一个结构示意图。
附图标号说明:
1-采集模块、2-统计模块、3-处理模块、4-构建模块、5-计算模块、6-查找模块、7-推荐模块。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
如图1所示,本实施例提供了一种书籍的推荐方法的一个实施例,包括步骤:
S10根据每位读者的阅读行为数据,统计出所有读者的阅读行为总数据后,得到阅读参考总数据;所述阅读行为数据包括每位读者所阅读的书籍、每种书籍的阅读次数;
S20根据所述阅读参考总数据以及每位读者的阅读行为,得到每位读者各自对应的阅读参考数据;
S30分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;
S40根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者;
S50将所述推荐读者对应的阅读行为数据推荐给所述当前读者。
具体的,可以通过大数据技术,在互联网上采集每位读者的阅读行为数据,包括每位读者所阅读的书籍和该书籍阅读的次数,由此统计出所有读者的阅读行为总数据,得到阅读参考总数据,即统计得到的所有读者所看的书籍,以及每种书籍对应的阅读量;之后,根据所述阅读参考总数据以及每位读者阅读的书籍,得到每位读者各自对应的阅读参考数据;之后,可以计算出当前读者的阅读参考数据和其他读者的阅读参考数据之间的相似度,根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者,并将所述推荐读者对应的阅读行为数据推荐给所述当前读者。通过本实施例提供的一种书籍的推荐方法,能够通过采集读者的阅读行为,运用大数据,计算得到与读者阅读行为相似的其他读者,并给读者推送其他读者阅读的书籍。
如图2所示,本实施例提供了一种书籍的推荐方法的另一个实施例,包括步骤:
S101采集每位读者的阅读行为数据,将所述阅读行为数据中的书籍储存在书籍库中,并统计每一种书籍的阅读量;
S102将所述书籍库中的书籍信息分为N类,并统计得到每一类书籍中阅读量最高的书籍;
S103将每一类书籍中阅读量最高的书籍,以及每一类书籍中阅读量最高的书籍所对应的阅读量作为所述阅读参考总数据;
S20根据所述阅读参考总数据以及每位读者的阅读行为,得到每位读者各自对应的阅读参考数据;
S30分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;
S40根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者;
S50将所述推荐读者对应的阅读行为数据推荐给所述当前读者。
具体的,在本实施例中,具体说明了所述的阅读参考总数据是如何采集得到的。首先采集每位读者的阅读行为数据,包括读者阅读过的书籍和该书籍的阅读量,之后将所述阅读行为数据中的书籍储存在书籍库中,并统计每一种书籍的阅读量;将所述书籍库中的书籍信息分为N类,具体的分类方法可以按照书籍馆的分类方法来进行分类;之后统计得到每一类书籍中阅读量最高的书籍;将每一类书籍中阅读量最高的书籍,以及每一类书籍中阅读量最高的书籍所对应的阅读量作为所述的阅读参考总数据。如可以将书籍库中的书籍信息分为A、B、C三类,统计得到A类书籍中a1这本书时其中阅读量最高的书籍,其阅读量为100万次,即本实施例所述的阅读参考总数据。
之后,根据所述阅读参考总数据以及每位读者所阅读的书籍,得到每位读者各自对应的阅读参考数据;分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;根据计算出的相似度,在所述其他读者中找到一位和当前读者的阅读行为最为相似的读者作为推荐读者,并将所述推荐读者对应的阅读行为数据推荐给所述当前读者。
如图3所示,本实施例提供了一种书籍的推荐方法的另一个实施例,包括步骤:
S101采集每位读者的阅读行为数据,将所述阅读行为数据中的书籍储存在书籍库中,并统计每一种书籍的阅读量;
S102将所述书籍库中的书籍信息分为N类,并统计得到每一类书籍中阅读量最高的书籍;
S103将每一类书籍中阅读量最高的书籍,以及每一类书籍中阅读量最高的书籍所对应的阅读量作为所述阅读参考总数据;
S201根据每一类书籍中阅读量最高的书籍、每一类书籍中阅读量最高的书籍所对应的阅读量,以及每位读者所阅读的书籍,得到每位读者阅读每一类书籍的阅读参考量作为所述阅读参考数据;
S30分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;
S40根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者;
S50将所述推荐读者对应的阅读行为数据推荐给所述当前读者。
具体的,在本实施中,采用大数据技术,能够采集每位读者的阅读行为数据,包括读者阅读过的书籍和该书籍的阅读量,之后将采集到的书籍储存在书籍库中,并统计每一种书籍的阅读量;之后,将所述书籍库中的书籍信息分为N类,如地理类A、历史类B、数学类C、等等,并根据N类书籍建立N维坐标系,每一类书籍代表一个维度。
根据采集到的每一类书籍中阅读量最高的书籍、每一类书籍中阅读量最高的书籍所对应的阅读量,以及每位读者所阅读的书籍,得到每位读者阅读每一类书籍的阅读参考量作为所述阅读参考数据;将每位读者阅读的每一类书籍对应的阅读参考量作为每位读者在N维坐标系中该类书籍对应维度的坐标系值。比如书籍a1、b1、c1是对应的A类、B类、C类书籍中阅读量最大的书籍,当前读者阅读了b1这本书2次,没有阅读a1、c1两本书籍,会得到A类、B类、C类书籍对应的阅读参考量,在A类、B类、C类书籍对应的坐标维度上,会得到相应的坐标值。由上述方法还可得到其他类别书籍对应的维度的坐标,从而得到当前读者在N维坐标系中的坐标值。
分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;根据计算出的相似度,在所述其他读者中找到一位最为相似的读者作为推荐读者;将所述推荐读者对应的阅读行为数据推荐给所述当前读者。
如图4所示,本实施例提供了一种书籍的推荐方法的另一个实施例,包括步骤:
S101采集每位读者的阅读行为数据,将所述阅读行为数据中的书籍储存在书籍库中,并统计每一种书籍的阅读量;
S102将所述书籍库中的书籍信息分为N类,并统计得到每一类书籍中阅读量最高的书籍;
S103将每一类书籍中阅读量最高的书籍,以及每一类书籍中阅读量最高的书籍所对应的阅读量作为所述阅读参考总数据;
S2011查找出每位读者所阅读的书籍中,是否存在与每一类书籍中阅读量最高的书籍相同的书籍;
S2012若存在,则将该类书籍中阅读量最高的书籍所对应的阅读量作为该位读者阅读该类书籍的阅读参考量;
S2013若不存在,则将该位读者阅读该类书籍的阅读参考量标记为0;
S30分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;
S40根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者;
S50将所述推荐读者对应的阅读行为数据推荐给所述当前读者。
在本实施例中,具体阐述了阅读参考数据是如何取值的,由于将书籍分成了N类,并根据此N类书籍建立了N维的坐标系,每一类别的书籍都对应一个维度,每位读者在该坐标系中都有相应的坐标,即步骤S30中所述的阅读参考数据。
每位读者在该坐标系中的坐标具体取值方式为:查找出每位读者所阅读的书籍中,是否存在与每一类书籍中阅读量最高的书籍相同的书籍;若存在,则将该类书籍中阅读量最高的书籍所对应的阅读量作为该位读者阅读该类书籍的阅读参考量;若不存在,则将该位读者阅读该类书籍的阅读参考量标记为0。
例如,在分类时,将书籍分为A、B、C三类,并统计得到A、B、C三类中阅读量最高的书籍a2、b2、c2,其中a2的阅读量为20万次、b2的阅读量为50万次、c2的阅读量为70万次,所述的阅读参考总数据即为书籍a2、b2、c2以及他们对应的阅读量。查找每位读者查找出每位读者所阅读的书籍中时,查找到当前读者读过书籍a2和书籍c2,存在与A类、C类书籍中阅读量最高的书籍a2和c2相同的书籍,因此,将该读者的阅读书籍a2的阅读参考量标记为20万,将阅读书籍c2的阅读参考量标记为70万,将阅读书籍b2的阅读参考量标记为0。根据分出的三类书籍,建立三维坐标系,A、B、C三类书籍分别代表一个维度,将每位读者阅读的每一类书籍对应的阅读参考量作为每位读者在该三维坐标系中该类书籍对应维度的坐标系值,即得到当前读者在该三维坐标系中的坐标为(20w,0,70w)。
优选的,查找每位读者查找出每位读者所阅读的书籍中时,查找到当前读者读过书籍a2和书籍c2,存在与A类、C类书籍中阅读量最高的书籍a2和c2相同的书籍,则可以将该读者的阅读书籍a2的阅读参考量标记为1,同理,将阅读书籍c2的阅读参考量标记为1,将阅读书籍b2的阅读参考量标记为0。根据分出的三类书籍,建立三维坐标系,A、B、C三类书籍分别代表一个维度,将每位读者阅读的每一类书籍对应的阅读参考量作为每位读者在该三维坐标系中该类书籍对应维度的坐标系值,即得到当前读者在该三维坐标系中的坐标为(1,0,1)。
通过上述的方法,也能计算得到其他读者在该三维坐标系中的坐标,通过当前读者和其他读者在该三维坐标系中的坐标关系,能够计算的到他们之间的相似度,根据计算出的相似度,在所述其他读者中找到一位阅读行为最相思的读者作为推荐读者;将所述推荐读者对应的阅读行为数据推荐给所述当前读者。
如图5所示,本实施例提供了一种书籍的推荐方法的另一个实施例,包括步骤:
S101采集每位读者的阅读行为数据,将所述阅读行为数据中的书籍储存在书籍库中,并统计每一种书籍的阅读量;
S102将所述书籍库中的书籍信息分为N类,并统计得到每一类书籍中阅读量最高的书籍;
S103将每一类书籍中阅读量最高的书籍,以及每一类书籍中阅读量最高的书籍所对应的阅读量作为所述阅读参考总数据;
S2011查找出每位读者所阅读的书籍中,是否存在与每一类书籍中阅读量最高的书籍相同的书籍;
S2012若存在,则将该类书籍中阅读量最高的书籍所对应的阅读量作为该位读者阅读该类书籍的阅读参考量;
S2013若不存在,则将该位读者阅读该类书籍的阅读参考量标记为0;
S301根据所述书籍库中的N类书籍,建立N维坐标系,每一类书籍代表一个维度;
S302将每位读者阅读的每一类书籍对应的阅读参考量作为每位读者在N维坐标系中该类书籍对应维度的坐标系值。
S301根据当前读者在N维坐标系中的坐标系值与其他读者在N维坐标系中的坐标系值,计算出当前读者坐标系与其他读者坐标系的曼哈顿距离D作为相似度的参考标准,其计算公式为:
Figure BDA0001421112570000101
其中,X1k=(X11,X12...X1k)表示当前读者在N维坐标系中的坐标系,X2k=(X21,X22...X2k)表示其他读者中的其中一个读者在N维坐标系中的坐标系。
S401根据当前读者与其他读者之间的多个曼哈顿距离,找到多个曼哈顿距离中最小的最小曼哈顿距离;
S402找到所述最小曼哈顿距离对应的读者作为推荐读者。
S50将所述推荐读者对应的阅读行为数据推荐给所述当前读者;
优选的,S51根据所述推荐读者的阅读行为数据和所述当前读者的阅读行为数据,得到存在于推荐读者的阅读行为数据中、且不存在于当前读者的阅读行为数据中的数据;并将该数据推荐给所述当前读者。
具体的,在本实施例中,具体描述了如何计算读者之间的阅读参考书籍的相似度,如上个实施例所述的,可以得到当前读者在坐标系中的坐标为(20w,0,70w),假如计算得到另外两个读者的坐标为(20w,50W,0)、(0,50W,0),可以通过公式计算得到当前读者与第一个读者之间的曼哈顿距离为120w,与第一个读者的曼哈顿距离为140w。由于曼哈顿距离越小,两者间的相似程度越高,因此,当前读者与第一个读者的相似程度就高于与第二个读者的相似程度。由此方法,可以计算得到当前读者与其他所有读者的曼哈顿距离,其中,计算出来的最小的曼哈顿距离所对应的读者,即为与当前读者的阅读行为数据最为相似的读者。
找到相似度最大的读者之后,将所述推荐读者对应的阅读行为数据推荐给所述当前读者,比如找到的最相似的读者就是上述的第一个读者,就会将第一个读者所阅读的书籍推荐给当前读者,或者将第一个读者阅读过的书籍,而当前读者没有阅读的书籍推荐给当前读者。
当然上述只列举的在三维坐标系中的一个例子,在大数据时代,可以将所有的书籍分为很多类,分的越精细,所推荐的书籍就越能满足读者的需求。除了上述的实施例以外,还可以将书籍分为N类,通过大数据统计人们在每一类中所阅读的书籍,以及每本书籍的阅读量,将每一类中所阅读书籍的阅读量总和即为读者在此类书籍对应维度的坐标值,比如读者在历史类这一类别看过中国近代史2次,看过世界历史1次,可以将读者在历史类这个维度的坐标记为3。同样的,可以以这种方式标记在其他维度的坐标,得到在N维坐标系的坐标,其他的读者也可以得到N维坐标系的坐标,由此也可以通过曼哈顿距离计算出读者之间的相似度。在找到最相思的读者之后,将推荐读者所看过的所有的书籍都推荐给当前读者,或者将当前读者没有看过的书籍推荐给当前读者。
本实施例提供了一种书籍的推荐方法的另一个实施例,包括:
S1:对书籍库中的书籍分成N种类;
S2:从每一种类中筛选出阅读量最高的书籍(阅读量:定义为点击并看了一定章节,如果只有点击没有阅读不算阅读量),得到N个阅读量最高的书籍,每个代表一个书籍种类;
S3:将以上N个阅读量最高的书籍定义为N维向量空间的坐标值;
S4:将当前阅读读者阅读以上N本书籍的阅读行为定位为N维向量空间中各坐标的值;
S5:计算N维向量空间的读者与其他读者间的曼哈顿距离,找出最相似的阅读者。如:二维平面两点a(x1,y1)与b(x2,y2)间的曼哈顿距离为:
d12=|x1-x2|+|y1-y2|
两个N维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的曼哈顿距离为:
Figure BDA0001421112570000121
S6:根据以上的计算结果,找出相似度最大的读者,根据相似度最大的读者的阅读行为给当前读者推荐书籍。
具体的,在本实施例中,首先将书籍库中的书籍分成N种类,通过大数据技术从每一种类中筛选出阅读量最高的书籍,得到N个阅读量最高的书籍,每个代表一个书籍种类;将当前阅读读者阅读以上N本书籍的阅读行为定位为N维向量空间中各坐标的值,若读者看了其中某一本书,则将此读者在此书籍对应维度的坐标记为此书籍的阅读量,若读者没有看;其次,计算N维向量空间的读者与其他读者间的曼哈顿距离,由于计算出来的曼哈顿距离越小,其相似度越大,则根据以上的计算结果,找出相似度最大的读者,根据相似度最大的读者的阅读行为给当前读者推荐书籍。
如图6所示,本实施例提供了一种书籍的推荐系统的一个实施例,包括:
统计模块,根据每位读者的阅读行为数据,统计出所有读者的阅读行为总数据后,得到阅读参考总数据;所述阅读行为数据包括每位读者所阅读的书籍、每种书籍的阅读次数;
处理模块,与所述统计模块电连接,用于根据所述阅读参考总数据以及每位读者的阅读行为,得到每位读者各自对应的阅读参考数据;
计算模块,用于分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;
查找模块,与所述计算模块电连接,用于根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者;
推荐模块,与所述查找模块电连接,用于将所述推荐读者对应的阅读行为数据推荐给所述当前读者。
具体的,统计模块可以运用大数据技术,在互联网上统计每位读者的阅读行为数据,包括每位读者所阅读的书籍和该书籍阅读的次数,如统计到的第一位读者阅读了a1这本书1次,b1这本书2次,c1这本书0次,统计到的第二位读者阅读了a1这本书0次,b1这本书1次,c1这本书1次,第三位读者的阅读书籍等等;由此统计出所有读者的阅读行为总数据,得到阅读参考总数据,如a1这本书阅读量为20万次,b1这本书阅读量为50万次,c1这本书阅读量为70万次,即统计得到的所有读者所看的书籍,以及每种书籍对应的阅读量;然后,根据所述阅读参考总数据以及每位读者阅读的书籍及该书籍阅读量,得到每位读者各自对应的阅读参考数据;之后,可以计算出当前读者的阅读参考数据和其他读者的阅读参考数据之间的相似度,根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者,并将所述推荐读者对应的阅读行为数据推荐给所述当前读者。通过本实施例提供的一种书籍的推荐方法,能够通过采集读者的阅读行为,运用大数据,计算得到与读者阅读行为相似的其他读者,并给读者推送其他读者阅读的书籍。
如图7所示,本实施例提供了一种书籍的推荐系统的一个实施例,包括:
统计模块,根据每位读者的阅读行为数据,统计出所有读者的阅读行为总数据后,得到阅读参考总数据;所述阅读行为数据包括每位读者所阅读的书籍、每种书籍的阅读次数;
处理模块,与所述统计模块电连接,用于根据所述阅读参考总数据以及每位读者的阅读行为,得到每位读者各自对应的阅读参考数据;
计算模块,用于分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;
查找模块,与所述计算模块电连接,用于根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者;
推荐模块,与所述查找模块电连接,用于将所述推荐读者对应的阅读行为数据推荐给所述当前读者;
还包括采集模块,采集每位读者的阅读行为数据,将所述阅读行为数据中的书籍储存在书籍库中,并统计每一种书籍的阅读量;
统计模块还用于将所述书籍库中的书籍信息分为N类,并统计得到每一类书籍中阅读量最高的书籍;
处理模块还用于将每一类书籍中阅读量最高的书籍,以及每一类书籍中阅读量最高的书籍所对应的阅读量作为所述阅读参考总数据;
处理模块还用于根据每一类书籍中阅读量最高的书籍、每一类书籍中阅读量最高的书籍所对应的阅读量,以及每位读者所阅读的书籍,得到每位读者阅读每一类书籍的阅读参考数量作为所述阅读参考数据;
还包括查找模块,用于查找出每位读者所阅读的书籍中,是否存在与每一类书籍中阅读量最高的书籍相同的书籍;若存在,则将该类书籍中阅读量最高的书籍所对应的阅读量作为该位读者阅读该类书籍的阅读参考量;若不存在,则将该位读者阅读该类书籍的阅读参考量标记为0;
构建模块,根据所述书籍库中的N类书籍,建立N维坐标系,每一类书籍代表一个维度;
处理模块还用于将每位读者阅读每一类书籍对应的阅读参考量作为每位读者在N维坐标系中一个维度的坐标系值;
计算模块还用于根据当前读者在N维坐标系中的坐标系值与其他读者在N维坐标系中的坐标系值,计算出当前读者坐标系与其他读者坐标系的曼哈顿距离D作为相似度的参考标准,其计算公式为:
Figure BDA0001421112570000151
所述X1k表示当前读者在N维坐标系中的坐标系(X11,X12...X1k),X2k表示其他读者中的其中一个读者在N维坐标系中的坐标系(X21,X22...X2k);
查找模块还用于根据当前读者与其他读者之间的多个曼哈顿距离,找到多个曼哈顿距离中最小的最小曼哈顿距离;找到所述最小曼哈顿距离对应的读者作为推荐读者。
具体的,在本实施例中,具体说明了所述的阅读参考总数据时如何采集得到的。首先采集每位读者的阅读行为数据,包括读者阅读过的书籍和该书籍的阅读量,如统计到第一读者读的书籍为a1、b2、c2,其阅读的次数分别为2次、1次、1次;第二读者读的书籍为a1、b3、c3,其阅读的次数分别为1次、1次、3次;第三读者读的书籍为a2、b2、c3,其阅读的次数分别为1次、2次、2次。
之后将所述阅读行为数据中的书籍储存在书籍库中,并统计每一种书籍的阅读量;因此可以统计得到a1阅读次数3次,a2阅读次数1次,b2阅读次数3次,b3阅读次数1次,c2阅读次数1次,c3阅读次数5次。
将所述书籍库中的书籍信息分为N类,具体的分类方法可以按照书籍馆的分类方法来进行分类,如分为A、B、C三类;之后统计得到每一类书籍中阅读量最高的书籍,如A类书籍中阅读量最高的书籍为a1,B类书籍阅读量最高的书籍为b2,C类书籍中阅读量最高的书籍为c3;将每一类书籍中阅读量最高的书籍,以及每一类书籍中阅读量最高的书籍所对应的阅读量作为所述的阅读参考总数据。
之后,根据所述阅读参考总数据以及每位读者所阅读的书籍,得到每位读者各自对应的阅读参考数据;在过的每位读者各自对应的阅读参考数据的时候,需要根据书籍的分类建立坐标系,在本实施例中,将书籍分为了A、B、C三类,因此建立三维坐标系,每一类书籍对应一个维度。
然后查找出每位读者所阅读的书籍中,是否存在与每一类书籍中阅读量最高的书籍相同的书籍;若存在,则将该类书籍中阅读量最高的书籍所对应的阅读量作为该位读者阅读该类书籍的阅读参考量;若不存在,则将该位读者阅读该类书籍的阅读参考量标记为0。在本实施例中,第一读者阅读了a1、b2、c2三本书,其中a1是A类书籍中阅读量最高的书籍,b2不是B类书籍中阅读量最高的书籍、c2不是C类书籍中阅读量最高的书籍,因此第一读者在三维坐标系中的坐标为(3,0,0),同理,可以得到第二读者在三维坐标系中的坐标为(3,0,5),第三读者在三维坐标系中的坐标为(0,3,5)。
通过曼哈顿距离计算相似度的方法,可以分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;在本实施例中,可以算出第一读者与第二读者之间的曼哈顿距离为5,第一读者与第三读者之间的曼哈顿距离为11,第二读者与第三读者之间的曼哈顿距离为6。由此可以得到第一读者和第二读者之间的曼哈顿距离是最小的,也就是最近似的,若是第一读者需要找寻最相似的读者,那么第二读者就是第一读者最相似的读者;若是第三读者需要找寻最相似的读者,那么第二读者与第三读者的曼哈顿距离最小,也就是第三读者最相似的读者。
根据计算出的相似度,找到和当前读者的阅读行为最为相似的读者作为推荐读者,并将所述推荐读者对应的阅读行为数据推荐给所述当前读者;或者将第一个读者阅读过的书籍,而当前读者没有阅读的书籍推荐给当前读者。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种书籍的推荐方法,其特征在于,包括步骤:
S10根据每位读者的阅读行为数据,统计出所有读者的阅读行为总数据后,得到阅读参考总数据;所述阅读行为数据包括每位读者所阅读的书籍、每种书籍的阅读次数;步骤S10还包括:
S101采集每位读者的阅读行为数据,将所述阅读行为数据中的书籍储存在书籍库中,并统计每一种书籍的阅读量;
S102将所述书籍库中的书籍信息分为N类,并统计得到每一类书籍中阅读量最高的书籍;
S103将每一类书籍中阅读量最高的书籍,以及每一类书籍中阅读量最高的书籍所对应的阅读量作为所述阅读参考总数据;
S20根据所述阅读参考总数据以及每位读者的阅读行为,得到每位读者各自对应的阅读参考数据;
S30分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;
S40根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者;
S50将所述推荐读者对应的阅读行为数据推荐给所述当前读者。
2.如权利要求1所述的一种书籍的推荐方法,其特征在于,步骤S20还包括:
S201根据每一类书籍中阅读量最高的书籍、每一类书籍中阅读量最高的书籍所对应的阅读量,以及每位读者所阅读的书籍,得到每位读者阅读每一类书籍的阅读参考量作为所述阅读参考数据。
3.如权利要求2所述的一种书籍的推荐方法,其特征在于,步骤S201还包括:
S2011查找出每位读者所阅读的书籍中,是否存在与每一类书籍中阅读量最高的书籍相同的书籍;
S2012若存在,则将该类书籍中阅读量最高的书籍所对应的阅读量作为该位读者阅读该类书籍的阅读参考量;
S2013若不存在,则将该位读者阅读该类书籍的阅读参考量标记为0。
4.如权利要求3所述的一种书籍的推荐方法,其特征在于,步骤S30还包括:
S301根据所述书籍库中的N类书籍,建立N维坐标系,每一类书籍代表一个维度;
S302将每位读者阅读的每一类书籍对应的阅读参考量作为每位读者在N维坐标系中该类书籍对应维度的坐标系值;
S303根据当前读者在N维坐标系中的坐标系值与其他读者在N维坐标系中的坐标系值,计算出当前读者坐标系与其他读者坐标系的曼哈顿距离D作为相似度的参考标准,其计算公式为:
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE004
表示当前读者在N维坐标系中的坐标系,
Figure DEST_PATH_IMAGE006
表示其他读者中的其中一个读者在N维坐标系中的坐标系。
5.如权利要求4所述的一种书籍的推荐方法,其特征在于,步骤S40还包括:
S401根据当前读者与其他读者之间的多个曼哈顿距离,找到多个曼哈顿距离中最小的最小曼哈顿距离;
S402找到所述最小曼哈顿距离对应的读者作为推荐读者。
6.如权利要求1~5中任一项所述的一种书籍的推荐方法,其特征在于,还包括步骤:
S51根据所述推荐读者的阅读行为数据和所述当前读者的阅读行为数据,得到存在于推荐读者的阅读行为数据中、且不存在于当前读者的阅读行为数据中的书籍;并将该书籍推荐给所述当前读者。
7.一种书籍的推荐系统,其特征在于,包括:
统计模块,根据每位读者的阅读行为数据,统计出所有读者的阅读行为总数据后,得到阅读参考总数据;所述阅读行为数据包括每位读者所阅读的书籍、每种书籍的阅读次数;
处理模块,与所述统计模块电连接,用于根据所述阅读参考总数据以及每位读者的阅读行为,得到每位读者各自对应的阅读参考数据;
计算模块,与所述处理模块电连接,用于分别计算出当前读者的阅读参考数据与其他读者的阅读参考数据之间的相似度;
查找模块,与所述计算模块电连接,用于根据计算出的相似度,在所述其他读者中找到一位读者作为推荐读者;
推荐模块,与所述查找模块电连接,用于将所述推荐读者对应的阅读行为数据推荐给所述当前读者;
采集模块,与统计模块电连接,用于采集每位读者的阅读行为数据,将所述阅读行为数据中的书籍储存在书籍库中,并统计每一种书籍的阅读量;
所述统计模块还用于将所述书籍库中的书籍信息分为N类,并统计得到每一类书籍中阅读量最高的书籍;
所述处理模块还用于将每一类书籍中阅读量最高的书籍,以及每一类书籍中阅读量最高的书籍所对应的阅读量作为所述阅读参考总数据。
8.如权利要求7所述的一种书籍的推荐系统,其特征在于:
所述处理模块还用于根据每一类书籍中阅读量最高的书籍、每一类书籍中阅读量最高的书籍所对应的阅读量,以及每位读者所阅读的书籍,得到每位读者阅读每一类书籍的阅读参考数量作为所述阅读参考数据。
CN201710890806.6A 2017-09-27 2017-09-27 一种书籍的推荐方法及系统 Active CN107729416B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710890806.6A CN107729416B (zh) 2017-09-27 2017-09-27 一种书籍的推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710890806.6A CN107729416B (zh) 2017-09-27 2017-09-27 一种书籍的推荐方法及系统

Publications (2)

Publication Number Publication Date
CN107729416A CN107729416A (zh) 2018-02-23
CN107729416B true CN107729416B (zh) 2021-11-19

Family

ID=61207405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710890806.6A Active CN107729416B (zh) 2017-09-27 2017-09-27 一种书籍的推荐方法及系统

Country Status (1)

Country Link
CN (1) CN107729416B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763456A (zh) * 2018-05-28 2018-11-06 华北理工大学 一种研究读者阅读心理的阅读引导系统
CN109255520A (zh) * 2018-08-10 2019-01-22 成都明途科技有限公司 一种基于用户工作行为的数据推送方法
CN109522401A (zh) * 2018-09-19 2019-03-26 咪咕数字传媒有限公司 一种信息推荐方法及装置
CN109785212B (zh) * 2018-12-28 2022-04-26 佛山科学技术学院 一种基于大数据的社区图书馆的图书管理方法及装置
CN112019621B (zh) * 2020-08-28 2023-11-21 上海连尚网络科技有限公司 一种用于定制化推送消息的方法与设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760163A (zh) * 2012-06-12 2012-10-31 奇智软件(北京)有限公司 一种特征信息的个性化推荐方法及装置
CN103425799A (zh) * 2013-09-04 2013-12-04 北京邮电大学 基于主题的个性化研究方向推荐系统和推荐方法
CN105488233A (zh) * 2016-01-25 2016-04-13 广东顺德中山大学卡内基梅隆大学国际联合研究院 阅读信息推荐方法和系统
CN106897284A (zh) * 2015-12-17 2017-06-27 腾讯科技(深圳)有限公司 电子书籍的推荐方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10032208B2 (en) * 2015-12-15 2018-07-24 International Business Machines Corporation Identifying recommended electronic books with detailed comparisons

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760163A (zh) * 2012-06-12 2012-10-31 奇智软件(北京)有限公司 一种特征信息的个性化推荐方法及装置
CN103425799A (zh) * 2013-09-04 2013-12-04 北京邮电大学 基于主题的个性化研究方向推荐系统和推荐方法
CN106897284A (zh) * 2015-12-17 2017-06-27 腾讯科技(深圳)有限公司 电子书籍的推荐方法及装置
CN105488233A (zh) * 2016-01-25 2016-04-13 广东顺德中山大学卡内基梅隆大学国际联合研究院 阅读信息推荐方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A collaborative filtering recommendation based on user profile and user behavior in online social networks;Lu Yang等;《2014 International Computer Science and Engineering Conference(ICSEC)》;20141208;273-277页 *
个性化书籍推荐系统研究与设计;宫丽萍;《中国优秀硕士学位论文全文数据库信息科技辑》;20120515;论文正文第35-45页 *

Also Published As

Publication number Publication date
CN107729416A (zh) 2018-02-23

Similar Documents

Publication Publication Date Title
CN107729416B (zh) 一种书籍的推荐方法及系统
CN109271512B (zh) 舆情评论信息的情感分析方法、装置及存储介质
US10810870B2 (en) Method of processing passage record and device
CN106506705B (zh) 基于位置服务的人群分类方法及装置
CN108108821A (zh) 模型训练方法及装置
CN106326391B (zh) 多媒体资源推荐方法及装置
CN111190939A (zh) 一种用户画像构建方法及装置
CA3066029A1 (en) Image feature acquisition
US10089358B2 (en) Methods and apparatus to partition data
CN111198988B (zh) 业务推荐方法、训练方法、装置、计算机设备和存储介质
CN105118518B (zh) 一种声音的语义分析方法及装置
CN110472154A (zh) 一种资源推送方法、装置、电子设备及可读存储介质
CN106709318A (zh) 一种用户设备唯一性的识别方法、装置和计算设备
CN105447147A (zh) 一种数据处理方法及装置
CN110909868A (zh) 基于图神经网络模型的节点表示方法和装置
US20190164001A1 (en) Logistics Parcel Picture Processing Method, Device and System
CN110475132A (zh) 直播间类型识别方法、装置及数据处理设备
CN113383362B (zh) 用户识别方法及相关产品
CN105589798A (zh) 征信值计算方法及装置
US20130108180A1 (en) Information processing device, information processing method, and program
CN107665202B (zh) 一种构建兴趣模型的方法、装置及电子设备
CN110188277B (zh) 一种资源的推荐方法及装置
CN115965439A (zh) 数据召回方法、数据召回装置、电子设备及存储介质
CN111475720A (zh) 推荐方法、装置、服务器及存储介质
CN111444933A (zh) 一种对象分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201113

Address after: Room 10242, No. 260, Jiangshu Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Hangzhou Jiji Intellectual Property Operation Co., Ltd

Address before: 201616 Shanghai city Songjiang District Sixian Road No. 3666

Applicant before: Phicomm (Shanghai) Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211022

Address after: 310012 room 329, No. 197, Jiaogong Road, Cuiyuan street, Xihu District, Hangzhou City, Zhejiang Province

Applicant after: HANGZHOU TAIKU TECHNOLOGY Co.,Ltd.

Address before: Room 10242, No. 260, Jiangshu Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant before: Hangzhou Jiji Intellectual Property Operation Co., Ltd

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant