CN109460518B - 一种基于用户网站访问记录的图书推荐方法 - Google Patents

一种基于用户网站访问记录的图书推荐方法 Download PDF

Info

Publication number
CN109460518B
CN109460518B CN201811494487.8A CN201811494487A CN109460518B CN 109460518 B CN109460518 B CN 109460518B CN 201811494487 A CN201811494487 A CN 201811494487A CN 109460518 B CN109460518 B CN 109460518B
Authority
CN
China
Prior art keywords
content
recommended
user
recommendation
website
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811494487.8A
Other languages
English (en)
Other versions
CN109460518A (zh
Inventor
符俊涛
鄢军
王超芸
应文佳
李曲
那龙鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinxun Digital Technology Hangzhou Co ltd
Original Assignee
EB INFORMATION TECHNOLOGY Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EB INFORMATION TECHNOLOGY Ltd filed Critical EB INFORMATION TECHNOLOGY Ltd
Priority to CN201811494487.8A priority Critical patent/CN109460518B/zh
Publication of CN109460518A publication Critical patent/CN109460518A/zh
Application granted granted Critical
Publication of CN109460518B publication Critical patent/CN109460518B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种基于用户网站访问记录的图书推荐方法,包括:从内容类网站和待推荐的图书阅读网站上获取发布内容,将内容添加到网站内容库中;寻找网站内容库中每条内容记录在待推荐的图书阅读网站上的关联图书,并在内容记录中添加关联图书ID信息;获取所有用户手机在一定时间周期内对内容类网站和待推荐的图书阅读网站的访问记录,写入用户手机内容访问记录表;从用户手机内容访问记录表中提取待推荐用户访问记录,获取待推荐用户在内容类网站上访问过的内容,并判断访问过的内容在网站内容库中是否存在有关联图书ID信息,如果有,则提取关联图书向用户推荐。本发明属于信息技术领域,能基于用户在各个内容类网站上的访问记录来实现图书的个性化推荐。

Description

一种基于用户网站访问记录的图书推荐方法
技术领域
本发明涉及一种基于用户网站访问记录的图书推荐方法,属于信息技术领域。
背景技术
随着移动互联网的飞速发展,图书、视频、音频等内容类网站已深度普及到了人们的生活中,用户在这些内容类网站上的访问行为充分代表了用户的个性化偏好。如何从用户在这些内容类网站上的访问行为中挖掘用户偏好,已成为移动运营商们普遍关注的技术问题。
专利CN 201110430910.X(申请名称:一种电子图书推荐的方法及系统,申请日:2011-12-20,申请人:中国移动通信集团浙江有限公司)提供了一种电子图书推荐的方法及系统。其中所述方法以用户在网站上发布的数据为基础,通过综合考察待分析用户及其关联用户访问网站的频率以及在网站上发布的数据,来判断待分析用户对于图书的偏好。该技术方案主要基于用户在网站上发布的数据来分析用户对于图书的偏好,而不是从用户对各个内容类网站上的访问行为中分析用户的图书偏好。目前还未发现有基于用户在各个内容类网站上的访问记录来实现图书的个性化推荐的相关技术。
因此,如何基于用户在各个内容类网站上的访问记录来实现图书的个性化推荐,已成为技术人员急需解决的技术问题。
发明内容
有鉴于此,本发明的目的是提供一种基于用户网站访问记录的图书推荐方法,能基于用户在各个内容类网站上的访问记录来实现图书的个性化推荐。
为了达到上述目的,本发明提供了一种基于用户网站访问记录的图书推荐方法,包括有:
步骤一、从若干个内容类网站和待推荐的图书阅读网站上获取其发布的每条内容信息,然后将获取到的每条内容信息作为一条内容记录添加到网站内容库中;
步骤二、寻找网站内容库中每条从内容类网站获取的内容记录在待推荐的图书阅读网站上的关联图书,并在对应的内容记录中添加其关联图书ID信息;
步骤三、获取所有用户手机在一定时间周期内对各个内容类网站和待推荐的图书阅读网站的访问记录,并写入用户手机内容访问记录表中;
步骤四、从用户手机内容访问记录表中提取待推荐用户的访问记录,获取待推荐用户在各个内容类网站上访问过的内容,并判断待推荐用户访问过的内容在网站内容库中是否存在有关联图书ID信息,如果有,则提取关联图书向待推荐用户推荐,
步骤四进一步包括有:
步骤41、从用户手机内容访问记录表中提取待推荐用户的访问记录,获取待推荐用户在各个内容类网站上访问过的内容信息,并从中挑选出在网站内容库中存在有关联图书ID信息的内容写入到待推荐用户的推荐内容记录表中;
步骤42、判断待推荐用户的推荐内容记录表中的每条内容的关联图书是否是待推荐用户在待推荐的图书阅读网站上未阅读过、且未被推荐过的图书,如果否,则从推荐内容记录表中删除该条内容;
步骤43、计算待推荐用户对推荐内容记录表中每条内容的推荐指数:
Figure GDA0002484914380000021
其中,preferz是待推荐用户对推荐内容记录表中第z条内容的推荐指数,Δdz是待推荐用户对第z条内容的最近一次访问日期距离当前的天数,cum_dz是待推荐用户对第z条内容的累计访问天数,设定用户对内容的记忆偏好是按指数衰减的,半衰期为t,然后以待推荐用户对推荐内容记录表中每条内容的推荐指数作为主要排序指标,待推荐用户对推荐内容记录表中每条内容的累计请求次数作为次要排序指标,按照排序指标从大到小的顺序,对待推荐用户的推荐内容记录表中的所有内容进行排序,挑选出排在最前的多项内容,查找所挑选内容在网站内容库中的关联图书ID信息,最后将查找到的关联图书推荐给待推荐用户。
与现有技术相比,本发明的有益效果是:本发明基于用户对各个内容类网站的访问记录,挑选用户访问过内容的关联图书,从而能将代表用户偏好的关联图书推荐给用户,实现图书的个性化推荐;本发明还进一步构建二级推荐分类体系,将不同内容类网站下的内容和待推荐图书网站的图书进行关联,并根据用户在各个内容类网站的访问记录来计算用户偏好的1级或2级推荐分类,然后从用户偏好的1级或2级推荐分类下的热书库中挑选多本图书向用户推荐,从而能从用户的访问记录中充分挖掘用户喜好,实现图书的精准个性化推荐。
附图说明
图1是本发明一种基于用户网站访问记录的图书推荐方法的流程图。
图2是步骤四的具体步骤流程图。
图3是从用户偏好的2级推荐分类中选取部分图书进行推荐的具体步骤流程图。
图4是从用户偏好的1级推荐分类中选取部分图书进行推荐的具体步骤流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
如图1所示,本发明一种基于用户网站访问记录的图书推荐方法,包括有:
步骤一、从若干个内容类网站和待推荐的图书阅读网站上获取其发布的每条内容信息,然后将获取到的每条内容信息作为一条内容记录添加到网站内容库中;
步骤二、寻找网站内容库中每条从内容类网站获取的内容记录在待推荐的图书阅读网站上的关联图书,并在对应的内容记录中添加其关联图书ID信息;
步骤三、获取所有用户手机在一定时间周期内对各个内容类网站和待推荐的图书阅读网站的访问记录,并写入用户手机内容访问记录表中;
步骤四、从用户手机内容访问记录表中提取待推荐用户的访问记录,获取待推荐用户在各个内容类网站上访问过的内容,并判断待推荐用户访问过的内容在网站内容库中是否存在有关联图书ID信息,如果有,则提取关联图书向待推荐用户推荐。
内容类网站提供的内容可以包括有:阅读图书、视频、音频等。步骤一可以进一步包括有:
选取若干个主流的内容类网站,并使用若干主流型号手机作为测试机,在测试机上安装各内容类网站的手机APP,然后采用网络抓包技术,获取测试机访问内容类网站所发布的内容页面时产生的有效URL地址,以获取从各内容类网站的URL地址中提取内容ID的提取规则,再采用提取规则和网络爬虫技术,从内容类网站的内容库中获取内容信息,所述内容信息包括内容ID、内容名称、内容分类、内容作者、内容标签等,将从内容类网站获得的每条内容信息作为一条外站内容记录写入网站内容库中,同时,将从待推荐的图书阅读网站获取到的每条内容信息作为一条内站内容记录添加到网站内容库中。
步骤二可以进一步包括有:
步骤21、从网站内容库中顺序提取一条外站内容记录,并读取其中的内容名称、内容作者;
步骤22、将读取的内容名称、内容作者和待推荐的图书阅读网站上的每本图书的图书名称、图书作者分别进行模糊比对,以判断待推荐的图书阅读网站上是否存在有图书名称、图书作者和读取的内容名称、内容作者均一致的图书?如果是,则该图书是所提取的外站内容记录的关联图书,将该图书ID作为关联图书ID信息添加到网站内容库对应的外站内容记录中;如果否,则所提取的外站内容记录不存在有关联图书,继续从网站内容库中提取下一条外站内容记录,读取其中的内容名称、内容作者,然后转向步骤22。
由于各个内容类网站上的内容分类、待推荐的图书阅读网站上的图书分类可能都互不相同,因而本发明还可以通过构建一个二级推荐分类体系,将各个内容类网站上的内容分类、待推荐的图书阅读网站上的图书分类都对应到二级推荐分类体系中来,本发明还可以包括有:
构建一个二级推荐分类体系,所述二级推荐分类体系由若干个1级推荐分类和2级推荐分类组成,每个1级推荐分类下包含有多个2级推荐分类,分别设置每个内容类网站的所有内容分类和二级推荐分类体系中的2级推荐分类的关联关系,即每个内容类网站的每个内容分类都和其中一个2级推荐分类存在有关联关系,并设置关联关系的强弱度,关联关系的强弱度可以包括有强关联、一般关联、弱关联三种,同样,设置待推荐的图书阅读网站上的所有图书分类和二级推荐分类体系中的2级推荐分类之间的关联关系、以及关联关系的强弱度,即待推荐的图书阅读网站上的每个图书分类也都和其中一个2级推荐分类存在有关联关系。
例如,二级推荐分类体系中的1级推荐分类可以是男生网文、女生网文和出版这三个事业部,根据内容类网站提供的内容类型和其内容分类的相关程度,将关联关系的强弱度分为强关联、一般关联和弱关联三种。
步骤三可以进一步包括有:
根据用户手机在一定时间周期内对各个内容类网站和待推荐的图书阅读网站的访问记录,统计用户手机所访问的内容类网站、在内容类网站上访问的内容、最近一次访问日期、累计访问天数、累计请求次数等信息,然后查找网站内容库,获取其在内容类网站上访问的内容对应的内容分类和关联图书ID信息,最后将用户手机所访问的内容类网站、在内容类网站上访问的内容、最近一次访问日期、累计访问天数、累计请求次数、内容分类、关联图书ID、以及和该内容分类具有关联关系的2级推荐分类、关联关系的强弱度、关联的2级推荐分类所属的1级推荐分类等信息写入用户手机内容访问记录表中。
如图2所示,步骤四可以进一步包括有:
步骤41、从用户手机内容访问记录表中提取待推荐用户的访问记录,获取待推荐用户在各个内容类网站上访问过的内容信息,并从中挑选出在网站内容库中存在有关联图书ID信息的内容写入到待推荐用户的推荐内容记录表中;
步骤42、判断待推荐用户的推荐内容记录表中的每条内容的关联图书是否是待推荐用户在待推荐的图书阅读网站上未阅读过、且未被推荐过的图书,如果否,则从推荐内容记录表中删除该条内容;
步骤43、计算待推荐用户对推荐内容记录表中每条内容的推荐指数:
Figure GDA0002484914380000051
其中,preferz是待推荐用户对推荐内容记录表中第z条内容的推荐指数,Δdz是待推荐用户对第z条内容的最近一次访问日期距离当前的天数,cum_dz是待推荐用户对第z条内容的累计访问天数,设定用户对内容的记忆偏好是按指数衰减的,半衰期为t(例如t可设为30天),然后以待推荐用户对推荐内容记录表中每条内容的推荐指数作为主要排序指标,待推荐用户对推荐内容记录表中每条内容的累计请求次数作为次要排序指标,按照排序指标从大到小的顺序,对待推荐用户的推荐内容记录表中的所有内容进行排序,挑选出排在最前的多项内容,查找所挑选内容在网站内容库中的关联图书ID信息,最后将查找到的关联图书推荐给待推荐用户。
当步骤43挑选的图书数达不到要求或者待推荐用户没有图书选择时,本发明还可以计算用户偏好的2级推荐分类,然后从用户偏好的2级推荐分类中选取部分图书进行推荐,从而实现图书的个性化推荐,如图3所示,还可以包括有:
步骤A1、从用户手机内容访问记录表中提取所有用户在各个内容类网站上访问过的内容,并挑选出其在网站内容库中存在有关联图书ID信息的内容写入到热书库访问内容表中;
步骤A2、将热书库访问内容表中的所有内容按照其所属内容类网站的内容分类所关联的二级推荐分类体系中的2级推荐分类进行分组,即将热书库访问内容表中内容分类关联同一个2级推荐分类的所有内容划分在同一个2级推荐分类组中,根据用户手机内容访问记录表,统计每个2级推荐分类组下的每条内容在一定时间周期内的用户访问量,然后从每个2级推荐分类组中各挑选出若干个用户访问量最大的内容,最后将挑选出的若干个内容在网站内容库中的关联图书构成每个2级推荐分类组的热书库;
步骤A3、根据用户手机内容访问记录表,计算待推荐用户对二级推荐分类体系中的每个2级推荐分类的偏好权重:
Figure GDA0002484914380000052
其中,class2-preferj是待推荐用户对第j个2级推荐分类的偏好权重,
Figure GDA0002484914380000053
是待推荐用户对自己访问过的、且其内容分类关联于第j个2级推荐分类的所有内容的推荐值之和,
Figure GDA0002484914380000061
是待推荐用户对自己访问过的、且其内容分类关联于第j个2级推荐分类的第c条内容的推荐值,SUMj是待推荐用户访问过的、其内容分类关联于第j个2级推荐分类的所有内容数,wc是待推荐用户访问过的第c条内容的内容分类和第j个2级推荐分类之间的关联关系的强弱度,cum_dc是待推荐用户对第c条内容的累计访问天数,Δdc是待推荐用户对第c条内容的最近一次访问日期距离当前的天数,
Figure GDA0002484914380000062
是待推荐用户对自己访问过的所有内容的推荐值之和,
Figure GDA0002484914380000063
是待推荐用户对自己访问过的第i条内容的推荐值,SUM-ALL是待推荐用户访问过的所有内容数,wi是待推荐用户访问过的第i条内容的内容分类和其关联的2级推荐分类之间的关联关系的强弱度,cum_di是待推荐用户对访问过的第i条内容的累计访问天数,Δdi是待推荐用户对访问过的第i条内容的最近一次访问日期距离当前的天数,最后从中挑选多个偏好权重最大的2级推荐分类作为待推荐用户偏好的2级推荐分类;
关联关系的强弱度可以根据实际业务需要而设置,例如分为三档:强关联的强弱度为1、一般关联的强弱度为0.5、弱关联的强弱度为0.2,这样,wc、wi的值为1、0.5、或者0.2;
步骤A4、从待推荐用户偏好的2级推荐分类组下的热书库中挑选多本图书,并通过待推荐的图书阅读网站的客户端、客户端上的专属推荐板块、或者下发短信等各种形式向用户推送推荐图书信息。
同样,如图4所示,本发明还可以从用户偏好的1级推荐分类中也选取部分图书进行推荐,还包括有:
步骤B1、将热书库访问内容表中的所有内容按照其所属内容类网站的内容分类所关联的二级推荐分类体系中的1级推荐分类进行分组,即将热书库访问内容表中其内容分类所关联的2级推荐分类属于同一个1级推荐分类的所有内容划分在同一个1级推荐分类组中,根据用户手机内容访问记录表,统计每个1级推荐分类组下的每条内容在一定时间周期内的用户访问量,然后从每个1级推荐分类组中各挑选出若干个用户访问量最大的内容,将挑选出的若干个内容在网站内容库中的关联图书构成每个1级推荐分类组的热书库;
步骤B2、计算待推荐用户对每个1级推荐分类的偏好权重:
Figure GDA0002484914380000071
其中,class1-preferk是待推荐用户对第k个1级推荐分类的偏好权重,
Figure GDA0002484914380000072
是待推荐用户对自己访问过的、且其内容分类关联于第k个1级推荐分类下的2级推荐分类的所有内容的推荐值之和,
Figure GDA0002484914380000073
是待推荐用户对自己访问过的、且其内容分类关联于第k个1级推荐分类下的2级推荐分类的第m条内容的推荐值,SUMk是待推荐用户访问过的、其内容分类关联于第k个1级推荐分类下的2级推荐分类的所有内容数,wm是待推荐用户访问过的第m条内容的内容分类和第k个1级推荐分类下的2级推荐分类之间的关联关系的强弱度,cum_dm是待推荐用户对第m条内容的累计访问天数,Δdm是待推荐用户对第m条内容的最近一次访问日期距离当前的天数,
Figure GDA0002484914380000074
是待推荐用户对自己访问过的所有内容的推荐值之和,
Figure GDA0002484914380000075
是待推荐用户对自己访问过的第i条内容的推荐值,SUM-ALL是待推荐用户访问过的所有内容数,wi是待推荐用户访问过的第i条内容的内容分类和其关联的2级推荐分类之间的关联关系的强弱度,cum_di是待推荐用户对访问过的第i条内容的累计访问天数,Δdi是待推荐用户对访问过的第i条内容的最近一次访问日期距离当前的天数,wm、wi的值为1、0.5、或者0.2,最后从中挑选多个偏好权重最大的1级推荐分类作为待推荐用户偏好的1级推荐分类;
步骤B3、从待推荐用户偏好的1级推荐分类组下的热书库中挑选多本图书,并通过待推荐的图书阅读网站的客户端、客户端上的专属推荐板块、或者下发短信等各种形式向用户推送推荐图书信息。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (9)

1.一种基于用户网站访问记录的图书推荐方法,其特征在于,包括有:
步骤一、从若干个内容类网站和待推荐的图书阅读网站上获取其发布的每条内容信息,然后将获取到的每条内容信息作为一条内容记录添加到网站内容库中;
步骤二、寻找网站内容库中每条从内容类网站获取的内容记录在待推荐的图书阅读网站上的关联图书,并在对应的内容记录中添加其关联图书ID信息;
步骤三、获取所有用户手机在一定时间周期内对各个内容类网站和待推荐的图书阅读网站的访问记录,并写入用户手机内容访问记录表中;
步骤四、从用户手机内容访问记录表中提取待推荐用户的访问记录,获取待推荐用户在各个内容类网站上访问过的内容,并判断待推荐用户访问过的内容在网站内容库中是否存在有关联图书ID信息,如果有,则提取关联图书向待推荐用户推荐,
步骤四进一步包括有:
步骤41、从用户手机内容访问记录表中提取待推荐用户的访问记录,获取待推荐用户在各个内容类网站上访问过的内容信息,并从中挑选出在网站内容库中存在有关联图书ID信息的内容写入到待推荐用户的推荐内容记录表中;
步骤42、判断待推荐用户的推荐内容记录表中的每条内容的关联图书是否是待推荐用户在待推荐的图书阅读网站上未阅读过、且未被推荐过的图书,如果否,则从推荐内容记录表中删除该条内容;
步骤43、计算待推荐用户对推荐内容记录表中每条内容的推荐指数:
Figure FDA0002484914370000011
其中,preferz是待推荐用户对推荐内容记录表中第z条内容的推荐指数,Δdz是待推荐用户对第z条内容的最近一次访问日期距离当前的天数,cum_dz是待推荐用户对第z条内容的累计访问天数,设定用户对内容的记忆偏好是按指数衰减的,半衰期为t,然后以待推荐用户对推荐内容记录表中每条内容的推荐指数作为主要排序指标,待推荐用户对推荐内容记录表中每条内容的累计请求次数作为次要排序指标,按照排序指标从大到小的顺序,对待推荐用户的推荐内容记录表中的所有内容进行排序,挑选出排在最前的多项内容,查找所挑选内容在网站内容库中的关联图书ID信息,最后将查找到的关联图书推荐给待推荐用户。
2.根据权利要求1所述的方法,其特征在于,内容类网站提供的内容包括但不限于:阅读图书、视频、音频。
3.根据权利要求1所述的方法,其特征在于,步骤一进一步包括有:
选取若干个内容类网站,并使用若干型号手机作为测试机,在测试机上安装各内容类网站的手机APP,然后采用网络抓包技术,获取测试机访问内容类网站所发布的内容页面时产生的有效URL地址,以获取从各内容类网站的URL地址中提取内容ID的提取规则,再采用提取规则和网络爬虫技术,从内容类网站的内容库中获取内容信息,所述内容信息包括但不限于:内容ID、内容名称、内容分类、内容作者、内容标签,将从内容类网站获得的每条内容信息作为一条外站内容记录写入网站内容库中,同时,将从待推荐的图书阅读网站获取到的每条内容信息作为一条内站内容记录添加到网站内容库中。
4.根据权利要求3所述的方法,其特征在于,步骤二进一步包括有:
步骤21、从网站内容库中顺序提取一条外站内容记录,并读取其中的内容名称、内容作者;
步骤22、将读取的内容名称、内容作者和待推荐的图书阅读网站上的每本图书的图书名称、图书作者分别进行模糊比对,以判断待推荐的图书阅读网站上是否存在有图书名称、图书作者和读取的内容名称、内容作者均一致的图书,如果是,则该图书是所提取的外站内容记录的关联图书,将该图书ID作为关联图书ID信息添加到网站内容库对应的外站内容记录中;如果否,则所提取的外站内容记录不存在有关联图书,继续从网站内容库中提取下一条外站内容记录,读取其中的内容名称、内容作者,然后转向步骤22。
5.根据权利要求1所述的方法,其特征在于,还包括有:
构建一个二级推荐分类体系,所述二级推荐分类体系由若干个1级推荐分类和2级推荐分类组成,每个1级推荐分类下包含有多个2级推荐分类,分别设置每个内容类网站的所有内容分类和二级推荐分类体系中的2级推荐分类的关联关系,即每个内容类网站的每个内容分类都和其中一个2级推荐分类存在有关联关系,并设置关联关系的强弱度,关联关系的强弱度包括有强关联、一般关联、弱关联三种,同样,设置待推荐的图书阅读网站上的所有图书分类和二级推荐分类体系中的2级推荐分类之间的关联关系、以及关联关系的强弱度,即待推荐的图书阅读网站上的每个图书分类也都和其中一个2级推荐分类存在有关联关系。
6.根据权利要求5所述的方法,其特征在于,步骤三进一步包括有:
根据用户手机在一定时间周期内对各个内容类网站和待推荐的图书阅读网站的访问记录,统计用户手机所访问的内容类网站、在内容类网站上访问的内容、最近一次访问日期、累计访问天数、累计请求次数,然后查找网站内容库,获取其在内容类网站上访问的内容对应的内容分类和关联图书ID信息,最后将用户手机所访问的内容类网站、在内容类网站上访问的内容、最近一次访问日期、累计访问天数、累计请求次数、内容分类、关联图书ID、以及和该内容分类具有关联关系的2级推荐分类、关联关系的强弱度、关联的2级推荐分类所属的1级推荐分类写入用户手机内容访问记录表中。
7.根据权利要求5所述的方法,其特征在于,还包括有:
步骤A1、从用户手机内容访问记录表中提取所有用户在各个内容类网站上访问过的内容,并挑选出其在网站内容库中存在有关联图书ID信息的内容写入到热书库访问内容表中;
步骤A2、将热书库访问内容表中的所有内容按照其所属内容类网站的内容分类所关联的二级推荐分类体系中的2级推荐分类进行分组,即将热书库访问内容表中内容分类关联同一个2级推荐分类的所有内容划分在同一个2级推荐分类组中,根据用户手机内容访问记录表,统计每个2级推荐分类组下的每条内容在一定时间周期内的用户访问量,然后从每个2级推荐分类组中各挑选出若干个用户访问量最大的内容,最后将挑选出的若干个内容在网站内容库中的关联图书构成每个2级推荐分类组的热书库;
步骤A3、根据用户手机内容访问记录表,计算待推荐用户对二级推荐分类体系中的每个2级推荐分类的偏好权重:
Figure FDA0002484914370000031
其中,class2-preferj是待推荐用户对第j个2级推荐分类的偏好权重,
Figure FDA0002484914370000032
是待推荐用户对自己访问过的、且其内容分类关联于第j个2级推荐分类的所有内容的推荐值之和,
Figure FDA0002484914370000033
是待推荐用户对自己访问过的、且其内容分类关联于第j个2级推荐分类的第c条内容的推荐值,SUMj是待推荐用户访问过的、其内容分类关联于第j个2级推荐分类的所有内容数,wc是待推荐用户访问过的第c条内容的内容分类和第j个2级推荐分类之间的关联关系的强弱度,cum_dc是待推荐用户对第c条内容的累计访问天数,Δdc是待推荐用户对第c条内容的最近一次访问日期距离当前的天数,
Figure FDA0002484914370000034
是待推荐用户对自己访问过的所有内容的推荐值之和,
Figure FDA0002484914370000035
是待推荐用户对自己访问过的第i条内容的推荐值,SUM-ALL是待推荐用户访问过的所有内容数,wi是待推荐用户访问过的第i条内容的内容分类和其关联的2级推荐分类之间的关联关系的强弱度,cum_di是待推荐用户对访问过的第i条内容的累计访问天数,Δdi是待推荐用户对访问过的第i条内容的最近一次访问日期距离当前的天数,最后从中挑选多个偏好权重最大的2级推荐分类作为待推荐用户偏好的2级推荐分类;
步骤A4、从待推荐用户偏好的2级推荐分类组下的热书库中挑选多本图书,并通过待推荐的图书阅读网站的客户端、客户端上的专属推荐板块、或者下发短信向用户推送推荐图书信息。
8.根据权利要求5所述的方法,其特征在于,还包括有:
步骤B1、从用户手机内容访问记录表中提取所有用户在各个内容类网站上访问过的内容,并挑选出其在网站内容库中存在有关联图书ID信息的内容写入到热书库访问内容表中;
步骤B2、将热书库访问内容表中的所有内容按照其所属内容类网站的内容分类所关联的二级推荐分类体系中的1级推荐分类进行分组,即将热书库访问内容表中其内容分类所关联的2级推荐分类属于同一个1级推荐分类的所有内容划分在同一个1级推荐分类组中,根据用户手机内容访问记录表,统计每个1级推荐分类组下的每条内容在一定时间周期内的用户访问量,然后从每个1级推荐分类组中各挑选出若干个用户访问量最大的内容,将挑选出的若干个内容在网站内容库中的关联图书构成每个1级推荐分类组的热书库;
步骤B3、计算待推荐用户对每个1级推荐分类的偏好权重:
Figure FDA0002484914370000041
其中,class1-preferk是待推荐用户对第k个1级推荐分类的偏好权重,
Figure FDA0002484914370000042
是待推荐用户对自己访问过的、且其内容分类关联于第k个1级推荐分类下的2级推荐分类的所有内容的推荐值之和,
Figure FDA0002484914370000043
是待推荐用户对自己访问过的、且其内容分类关联于第k个1级推荐分类下的2级推荐分类的第m条内容的推荐值,SUMk是待推荐用户访问过的、其内容分类关联于第k个1级推荐分类下的2级推荐分类的所有内容数,wm是待推荐用户访问过的第m条内容的内容分类和第k个1级推荐分类下的2级推荐分类之间的关联关系的强弱度,cum_dm是待推荐用户对第m条内容的累计访问天数,Δdm是待推荐用户对第m条内容的最近一次访问日期距离当前的天数,
Figure FDA0002484914370000051
是待推荐用户对自己访问过的所有内容的推荐值之和,
Figure FDA0002484914370000052
是待推荐用户对自己访问过的第i条内容的推荐值,SUM-ALL是待推荐用户访问过的所有内容数,wi是待推荐用户访问过的第i条内容的内容分类和其关联的2级推荐分类之间的关联关系的强弱度,cum_di是待推荐用户对访问过的第i条内容的累计访问天数,Δdi是待推荐用户对访问过的第i条内容的最近一次访问日期距离当前的天数,最后从中挑选多个偏好权重最大的1级推荐分类作为待推荐用户偏好的1级推荐分类;
步骤B4、从待推荐用户偏好的1级推荐分类组下的热书库中挑选多本图书,并通过待推荐的图书阅读网站的客户端、客户端上的专属推荐板块、或者下发短信向用户推送推荐图书信息。
9.根据权利要求7或8所述的方法,其特征在于,关联关系的强弱度分为三档:强关联的强弱度为1、一般关联的强弱度为0.5、弱关联的强弱度为0.2。
CN201811494487.8A 2018-12-07 2018-12-07 一种基于用户网站访问记录的图书推荐方法 Active CN109460518B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811494487.8A CN109460518B (zh) 2018-12-07 2018-12-07 一种基于用户网站访问记录的图书推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811494487.8A CN109460518B (zh) 2018-12-07 2018-12-07 一种基于用户网站访问记录的图书推荐方法

Publications (2)

Publication Number Publication Date
CN109460518A CN109460518A (zh) 2019-03-12
CN109460518B true CN109460518B (zh) 2020-07-24

Family

ID=65612713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811494487.8A Active CN109460518B (zh) 2018-12-07 2018-12-07 一种基于用户网站访问记录的图书推荐方法

Country Status (1)

Country Link
CN (1) CN109460518B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111310058B (zh) * 2020-03-27 2023-08-08 北京百度网讯科技有限公司 资讯主题的推荐方法、装置、终端及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793419A (zh) * 2012-10-31 2014-05-14 深圳市世纪光速信息技术有限公司 信息推送的方法和装置
CN106570031A (zh) * 2015-10-13 2017-04-19 阿里巴巴集团控股有限公司 一种业务对象的推荐方法和装置
CN107423343A (zh) * 2017-05-12 2017-12-01 中国地质大学(武汉) 一种基于混合协同过滤的图书馆图书推荐方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080294624A1 (en) * 2007-05-25 2008-11-27 Ontogenix, Inc. Recommendation systems and methods using interest correlation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793419A (zh) * 2012-10-31 2014-05-14 深圳市世纪光速信息技术有限公司 信息推送的方法和装置
CN106570031A (zh) * 2015-10-13 2017-04-19 阿里巴巴集团控股有限公司 一种业务对象的推荐方法和装置
CN107423343A (zh) * 2017-05-12 2017-12-01 中国地质大学(武汉) 一种基于混合协同过滤的图书馆图书推荐方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于社会化标签的图书推荐系统模型研究;付凯丽;《情报探索》;20161015;全文 *

Also Published As

Publication number Publication date
CN109460518A (zh) 2019-03-12

Similar Documents

Publication Publication Date Title
Jäschke et al. Tag recommendations in folksonomies
CN107862022B (zh) 文化资源推荐系统
CN103455538B (zh) 信息处理装置、信息处理方法和程序
JP4797069B2 (ja) キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法
CN103049440A (zh) 一种相关文章的推荐处理方法和处理系统
CN107885745A (zh) 一种歌曲推荐方法及装置
CN110362740B (zh) 一种水利门户信息混合推荐方法
CN103324666A (zh) 一种基于微博数据的话题跟踪方法及装置
CN106708841B (zh) 网站访问路径的聚合方法和装置
CN110888990A (zh) 文本推荐方法、装置、设备及介质
CN111125528B (zh) 信息推荐方法及装置
CN111008321A (zh) 基于逻辑回归推荐方法、装置、计算设备、可读存储介质
CN103294692A (zh) 一种信息推荐方法及系统
CN107562939A (zh) 垂直领域新闻推荐方法、装置及可读储存介质
US20130346385A1 (en) System and method for a purposeful sharing environment
CN102857471A (zh) 多媒体交互方法及系统
CN106354867A (zh) 多媒体资源的推荐方法及装置
CN107977678A (zh) 用于输出信息的方法和装置
JP4569380B2 (ja) ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体
CN107977445A (zh) 应用程序推荐方法及装置
Bischoff et al. Bridging the gap between tagging and querying vocabularies: Analyses and applications for enhancing multimedia IR
CN103262079B (zh) 检索装置及检索方法
CN106776640A (zh) 一种股票资讯信息展示方法和装置
KR100671077B1 (ko) 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템
CN109460518B (zh) 一种基于用户网站访问记录的图书推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 310013 4th floor, No.398 Wensan Road, Xihu District, Hangzhou City, Zhejiang Province

Patentee after: Xinxun Digital Technology (Hangzhou) Co.,Ltd.

Address before: 310013 4th floor, No.398 Wensan Road, Xihu District, Hangzhou City, Zhejiang Province

Patentee before: EB Information Technology Ltd.