CN105335491B - 基于用户点击行为来向用户推荐图书的方法和系统 - Google Patents

基于用户点击行为来向用户推荐图书的方法和系统 Download PDF

Info

Publication number
CN105335491B
CN105335491B CN201510684976.XA CN201510684976A CN105335491B CN 105335491 B CN105335491 B CN 105335491B CN 201510684976 A CN201510684976 A CN 201510684976A CN 105335491 B CN105335491 B CN 105335491B
Authority
CN
China
Prior art keywords
user
books
recommended
recommended books
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510684976.XA
Other languages
English (en)
Other versions
CN105335491A (zh
Inventor
廖建新
应文佳
李曲
王超芸
彭刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dongxin Beiyou Information Technology Co Ltd
Original Assignee
Hangzhou Dongxin Beiyou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dongxin Beiyou Information Technology Co Ltd filed Critical Hangzhou Dongxin Beiyou Information Technology Co Ltd
Priority to CN201510684976.XA priority Critical patent/CN105335491B/zh
Publication of CN105335491A publication Critical patent/CN105335491A/zh
Application granted granted Critical
Publication of CN105335491B publication Critical patent/CN105335491B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于用户点击行为来向用户推荐图书的方法和系统,方法包括:选取若干位用户构成样本用户集,并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书;抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型;逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从而得到目标用户点击新推荐图书的概率,并根据所述概率向目标用户选择新推荐图书。本发明属于数据业务领域,能基于用户对图书的点击行为来对用户的个性化图书偏好进行预测,从而提高推荐点击率和提升推荐效果。

Description

基于用户点击行为来向用户推荐图书的方法和系统
技术领域
本发明涉及一种基于用户点击行为来向用户推荐图书的方法和系统,属于数据业务领域。
背景技术
在移动阅读日益发展并为广大用户逐渐接受的当下,准确把握移动终端用户的阅读偏好、快速将符合用户喜好的信息以直线距离推送到用户面前显得尤为重要。而在图书推荐领域中,用户通常会从大量的推荐图书中选择点击符合其偏好的图书来浏览和阅读,因此,通过对用户的图书点击行为进行分析,可以有效预测出用户对图书的个性化偏好,从而向用户推荐符合其偏好的图书。
专利申请CN 201210436266.1(申请名称:推荐网络信息的方法和系统,申请日:2012-11-05,申请人:腾讯科技(深圳)有限公司)提供了一种推荐网络信息的方法和系统。所述方法包括:根据网络信息的点击次数对网络平台中的网络信息进行划分得到信息集合和对应的评级;对信息集合中的网络信息进行特征抽取得到浏览行为特征,并根据所述浏览行为特征训练得到所述信息集合对应的分类模型;将更新的网络信息输入分类模型得到所属的信息集合;根据所述更新的网络信息所属的信息集合对应的评级进行所述更新的网络信息的推荐。该技术方案主要根据网络信息的点击次数和浏览行为来向用户推荐网络信息,并不涉及到基于用户点击行为来实现用户对图书的个性化偏好预测。
因此,如何基于用户对图书的点击行为来对用户的个性化图书偏好进行预测,从而提高推荐点击率和提升推荐效果,仍是一个未解决的技术问题。
发明内容
有鉴于此,本发明的目的是提供一种基于用户点击行为来向用户推荐图书的方法和系统,能基于用户对图书的点击行为来对用户的个性化图书偏好进行预测,从而提高推荐点击率和提升推荐效果。
为了达到上述目的,本发明提供了一种基于用户点击行为来向用户推荐图书的方法,包括有:
步骤一、选取若干位用户构成样本用户集,并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书;
步骤二、抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型,所述logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,输出数据是用户点击推荐图书的概率;
步骤三、逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从而得到目标用户点击新推荐图书的概率,并根据所述概率向目标用户选择新推荐图书,
当用户和推荐图书之间的关联特征值包括有推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度时,还包括有:
步骤A1、提取推荐图书的所有关键字,将推荐图书的所有关键字的个数记为n;
步骤A2、构建推荐图书的用户相似图书集,所述用户相似图书集初始化为空,然后从用户的阅读历史记录中提取一本用户阅读过的历史图书;
步骤A3、统计提取的历史图书所包含的推荐图书的关键字或与关键字相似的词语个数k,并计算所述历史图书和推荐图书的相似度:然后判断所述相似度是否大于相似度阈值,如果是,则将所述历史图书作为相似图书保存到推荐图书的用户相似图书集中,然后继续下一步;如果否,则继续下一步;
步骤A4、判断是否已从用户的阅读历史记录中提取完所有用户阅读过的历史图书,如果是,则继续下一步;如果否,则继续从用户的阅读历史记录中提取下一本用户阅读过的历史图书,然后转向步骤A3;
步骤A5、从用户的阅读历史记录中读取用户相似图书集中所有相似图书对应的用户历史行为和阅读时间,并按照阅读时间、和用户历史行为的优先级对所有相似图书进行排序,最后从用户相似图书集中挑选出一本阅读时间最近、且用户历史行为的优先级最高的相似图书,所挑选出的相似图书对应的用户历史行为即是推荐图书的用户相似图书历史行为,所挑选出的相似图书和推荐图书的相似度即是用户相似图书和推荐图书的相似度。
为了达到上述目的,本发明还提供了一种基于用户点击行为来向用户推荐图书的系统,包括有:
样本构建装置,用于选取若干位用户构成样本用户集,并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书;
分类模型训练装置,用于抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型,所述logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,输出数据是用户点击推荐图书的概率;
图书推荐装置,用于逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从而得到目标用户点击新推荐图书的概率,并根据所述概率向目标用户选择新推荐图书,
当用户和推荐图书之间的关联特征值包括推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度时,分类模型训练装置中进一步包括有:
相似度计算单元,用于提取推荐图书的所有关键字,将推荐图书的所有关键字的个数记为n,统计历史图书所包含的推荐图书的关键字或与关键字相似的词语个数k,并计算历史图书和推荐图书的相似度:
相似图书集构建单元,用于构建推荐图书的用户相似图书集,所述用户相似图书集初始化为空,然后从用户的阅读历史记录中逐一提取每一本用户阅读过的历史图书,通过相似度计算单元来计算推荐图书和所提取的历史图书的相似度,当相似度大于相似度阈值时,则将所提取的历史图书作为相似图书保存到推荐图书的用户相似图书集中;
相似图书历史行为计算单元,用于从用户的阅读历史记录中读取用户相似图书集中所有相似图书对应的用户历史行为和阅读时间,并按照阅读时间、和用户历史行为的优先级对所有相似图书进行排序,最后从用户相似图书集中挑选出一本阅读时间最近、且用户历史行为的优先级最高的相似图书,所挑选出的相似图书对应的用户历史行为即是推荐图书的用户相似图书历史行为,所挑选出的相似图书和推荐图书的相似度即是用户相似图书和推荐图书的相似度。
与现有技术相比,本发明的有益效果是:本发明可以根据用户对现有推荐图书的点击和未点击行为,训练生成logistic分类模型,然后通过logistic分类模型计算得到目标用户点击新推荐图书的概率,从而有效提高推荐点击率和提升推荐效果;通过用户相似图书历史行为、相似度等关联特征值的计算,可以对用户的个性化图书偏好进行更精准的分析和预测。
附图说明
图1是本发明一种基于用户点击行为来向用户推荐图书的方法的流程图。
图2是推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度的具体计算流程图。
图3是本发明一种基于用户点击行为来向用户推荐图书的系统的组成结构示意图。
图4是分类模型训练装置的组成结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
如图1所示,本发明一种基于用户点击行为来向用户推荐图书的方法,包括有:
步骤一、选取若干位用户构成样本用户集,并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书;
步骤二、抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型,所述logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,输出数据是用户点击推荐图书的概率;
步骤三、逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从而得到目标用户点击新推荐图书的概率,并根据所述概率向目标用户选择新推荐图书。
步骤一中,为样本用户集中每位用户选取多本其点击和未点击过的推荐图书,还可以进一步包括有:
步骤11、选取用户最新日期的图书推荐列表,并将用户最新日期的图书推荐列表中用户点击过的推荐图书按照点击时间进行排序,从而为用户挑选出多本点击时间最近的推荐图书;
步骤12、采用skip-above(即跳略法)方式,即从用户点击的item(即图书)位置以上的展现图书中随机选取多本用户未点击过的推荐图书。值得一提的是,步骤11和步骤12中所选取的点击和未点击过的推荐图书数量相同时,本发明所取得的技术效果最佳。
步骤二和步骤三中,用户和推荐图书之间的关联特征值可以是图书推荐次数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类、推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度等。其中,图书推荐次数是向用户推荐图书的次数;用户换单次数是用户的图书推荐列表在一段时期内的变化次数;推荐率是图书推荐次数和换单次数的比值;历史图书数量是用户阅读过的图书数量;图书推荐次数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类这些值可以从用户的阅读历史记录、以及推荐图书的属性库中获取。如图2所示,推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度的计算过程可以进一步如下:
步骤A1、提取推荐图书的所有关键字,将推荐图书的所有关键字的个数记为n;图书网站编辑可从推荐图书中挑选若干具有代表性的词语作为每本推荐图书的关键字;
步骤A2、构建推荐图书的用户相似图书集,所述用户相似图书集初始化为空,然后从用户的阅读历史记录中提取一本用户阅读过的历史图书;
步骤A3、统计提取的历史图书所包含的推荐图书的关键字或与关键字相似的词语个数k,并计算所述历史图书和推荐图书的相似度:然后判断所述相似度是否大于相似度阈值?如果是,则将所述历史图书作为相似图书保存到推荐图书的用户相似图书集中,然后继续下一步;如果否,则继续下一步,其中,相似度阈值可根据业务实际需要而设定;
步骤A4、判断是否已从用户的阅读历史记录中提取完所有用户阅读过的历史图书?如果是,则继续下一步;如果否,则继续从用户的阅读历史记录中提取下一本用户阅读过的历史图书,然后转向步骤A3;
步骤A5、从用户的阅读历史记录中读取用户相似图书集中所有相似图书对应的用户历史行为和阅读时间,并按照阅读时间、和用户历史行为的优先级对所有相似图书进行排序,最后从用户相似图书集中挑选出一本阅读时间最近、且用户历史行为的优先级最高的相似图书,所挑选出的相似图书对应的用户历史行为即是推荐图书的用户相似图书历史行为,所挑选出的相似图书和推荐图书的相似度即是用户相似图书和推荐图书的相似度。
图书对应的用户历史行为可以包括有:浏览、开始阅读、深度长期阅读、弃读。根据对用户点击行为的影响程度,可以将用户历史行为按优先级从高到低的次序进行排序为:浏览>开始阅读>深度长期阅读>弃读。例如,当用户对推荐图书包括有浏览和开始阅读两种用户历史行为时,由于浏览对用户点击的影响力大于开始阅读,因此,可以选取浏览作为用户历史行为。
步骤二和步骤三中,还可以将用户和推荐图书之间的关联特征值设置不同类型的变量,其中分类特征值设定为因子型变量,数值特征值设定为数值型变量,如下表所示,例如,推荐图书的用户相似图书历史行为分别是浏览、开始阅读、深度长期阅读、弃读、无时,其值分别设置为1、2、3、4、0。
步骤二中,对于logistic分类模型所使用的训练样本来说,输出数据是样本用户集中每位用户点击推荐图书概率,其值为1或0,即当推荐图书是用户点击过的推荐图书时,其值为1;当推荐图书是用户未点击过的推荐图书时,其值为0。这样,步骤三中,进一步包括有:判断目标用户点击新推荐图书的概率是否大于或等于点击概率阈值,如果是,则将所述新推荐图书写入用户的图书推荐列表中,所述点击概率阈值可以根据实际情况而设定,例如取值为0.5。
如图3所示,本发明一种基于用户点击行为来向用户推荐图书的系统,包括有:
样本构建装置,用于选取若干位用户构成样本用户集,并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书;
分类模型训练装置,用于抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型,所述logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,输出数据是用户点击推荐图书的概率;
图书推荐装置,用于逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从而得到目标用户点击新推荐图书的概率,并根据所述概率向目标用户选择新推荐图书。
所述样本构建装置还可以进一步包括有:
点击图书选取单元,用于选取用户最新日期的图书推荐列表,并将用户最新日期的图书推荐列表中用户点击过的推荐图书按照点击时间进行排序,从而为用户挑选出多本点击时间最近的推荐图书;
未点击图书选取单元,用于采用skip-above(即跳略法)方式,即从用户点击的item(即图书)位置以上的展现图书中随机选取多本用户未点击过的推荐图书。
在分类模型训练装置中,用户和推荐图书之间的关联特征值可以是图书推荐次数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类、推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度等。其中,图书推荐次数是向用户推荐图书的次数,用户换单次数是用户的图书推荐列表在一段时期内的变化次数,推荐率是图书推荐次数和换单次数的比值,历史图书数量是用户阅读过的图书数量,图书推荐次数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类这些值可以从用户的阅读历史记录、以及推荐图书的属性库中获取。如图4所示,分类模型训练装置中还可以进一步包括有:
相似度计算单元,用于提取推荐图书的所有关键字,将推荐图书的所有关键字的个数记为n,统计历史图书所包含的推荐图书的关键字或与关键字相似的词语个数k,并计算历史图书和推荐图书的相似度:
相似图书集构建单元,用于构建推荐图书的用户相似图书集,所述用户相似图书集初始化为空,然后从用户的阅读历史记录中逐一提取每一本用户阅读过的历史图书,通过相似度计算单元来计算推荐图书和所提取的历史图书的相似度,当相似度大于相似度阈值时,则将所提取的历史图书作为相似图书保存到推荐图书的用户相似图书集中,相似度阈值可根据业务实际需要而设定;
相似图书历史行为计算单元,用于从用户的阅读历史记录中读取用户相似图书集中所有相似图书对应的用户历史行为和阅读时间,并按照阅读时间、和用户历史行为的优先级对所有相似图书进行排序,最后从用户相似图书集中挑选出一本阅读时间最近、且用户历史行为的优先级最高的相似图书,所挑选出的相似图书对应的用户历史行为即是推荐图书的用户相似图书历史行为,所挑选出的相似图书和推荐图书的相似度即是用户相似图书和推荐图书的相似度。
值得一提的是,图书对应的用户历史行为可以包括有:浏览、开始阅读、深度长期阅读、弃读。根据对用户点击行为的影响程度,可以将用户历史行为按优先级从高到低的次序进行排序为:浏览>开始阅读>深度长期阅读>弃读。例如,当用户对推荐图书包括有浏览和开始阅读两种用户历史行为时,由于浏览对用户点击的影响力大于开始阅读,因此,可以选取浏览作为用户历史行为。
对于分类模型训练装置来说,logistic分类模型的训练样本的输出数据是样本用户集中每位用户点击推荐图书概率,其值为1或0,即当推荐图书是用户点击过的推荐图书时,其值为1;当推荐图书是用户未点击过的推荐图书时,其值为0。这样,图书推荐装置还可以进一步包括有:
点击概率判断单元,用于判断目标用户点击新推荐图书的概率是否大于或等于点击概率阈值,如果是,则将所述新推荐图书写入用户的图书推荐列表中,所述点击概率阈值的值可以根据实际情况而定,例如取值为0.5。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种基于用户点击行为来向用户推荐图书的方法,其特征在于,包括有:
步骤一、选取若干位用户构成样本用户集,并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书;
步骤二、抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型,所述logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,输出数据是用户点击推荐图书的概率;
步骤三、逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从而得到目标用户点击新推荐图书的概率,并根据所述概率向目标用户选择新推荐图书,
当用户和推荐图书之间的关联特征值包括有推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度时,还包括有:
步骤A1、提取推荐图书的所有关键字,将推荐图书的所有关键字的个数记为n;
步骤A2、构建推荐图书的用户相似图书集,所述用户相似图书集初始化为空,然后从用户的阅读历史记录中提取一本用户阅读过的历史图书;
步骤A3、统计提取的历史图书所包含的推荐图书的关键字或与关键字相似的词语个数k,并计算所述历史图书和推荐图书的相似度:然后判断所述相似度是否大于相似度阈值,如果是,则将所述历史图书作为相似图书保存到推荐图书的用户相似图书集中,然后继续下一步;如果否,则继续下一步;
步骤A4、判断是否已从用户的阅读历史记录中提取完所有用户阅读过的历史图书,如果是,则继续下一步;如果否,则继续从用户的阅读历史记录中提取下一本用户阅读过的历史图书,然后转向步骤A3;
步骤A5、从用户的阅读历史记录中读取用户相似图书集中所有相似图书对应的用户历史行为和阅读时间,并按照阅读时间、和用户历史行为的优先级对所有相似图书进行排序,最后从用户相似图书集中挑选出一本阅读时间最近、且用户历史行为的优先级最高的相似图书,所挑选出的相似图书对应的用户历史行为即是推荐图书的用户相似图书历史行为,所挑选出的相似图书和推荐图书的相似度即是用户相似图书和推荐图书的相似度。
2.根据权利要求1所述的方法,其特征在于,步骤一中,为样本用户集中每位用户选取多本其点击和未点击过的推荐图书,进一步包括有:
步骤11、选取用户最新日期的图书推荐列表,并将用户最新日期的图书推荐列表中用户点击过的推荐图书按照点击时间进行排序,从而为用户挑选出多本点击时间最近的推荐图书;
步骤12、采用skip-above方式,即从用户点击的item位置以上的展现图书中随机选取多本用户未点击过的推荐图书。
3.根据权利要求1所述的方法,其特征在于,步骤二和步骤三中,用户和推荐图书之间的关联特征值包括但不限于:图书推荐次数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类、推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度。
4.根据权利要求1所述的方法,其特征在于,图书对应的用户历史行为包括有:浏览、开始阅读、深度长期阅读、弃读,且将用户历史行为按优先级从高到低的次序进行排序为:浏览>开始阅读>深度长期阅读>弃读。
5.根据权利要求1所述的方法,其特征在于,步骤二中,对于logistic分类模型所使用的训练样本来说,输出数据是样本用户集中每位用户点击推荐图书概率,其值为1或0,即当推荐图书是用户点击过的推荐图书时,其值为1;当推荐图书是用户未点击过的推荐图书时,其值为0,步骤三中,进一步包括有:
判断目标用户点击新推荐图书的概率是否大于或等于点击概率阈值,如果是,则将所述新推荐图书写入用户的图书推荐列表中。
6.一种基于用户点击行为来向用户推荐图书的系统,其特征在于,包括有:
样本构建装置,用于选取若干位用户构成样本用户集,并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书;
分类模型训练装置,用于抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型,所述logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,输出数据是用户点击推荐图书的概率;
图书推荐装置,用于逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从而得到目标用户点击新推荐图书的概率,并根据所述概率向目标用户选择新推荐图书,
当用户和推荐图书之间的关联特征值包括推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度时,分类模型训练装置中进一步包括有:
相似度计算单元,用于提取推荐图书的所有关键字,将推荐图书的所有关键字的个数记为n,统计历史图书所包含的推荐图书的关键字或与关键字相似的词语个数k,并计算历史图书和推荐图书的相似度:
相似图书集构建单元,用于构建推荐图书的用户相似图书集,所述用户相似图书集初始化为空,然后从用户的阅读历史记录中逐一提取每一本用户阅读过的历史图书,通过相似度计算单元来计算推荐图书和所提取的历史图书的相似度,当相似度大于相似度阈值时,则将所提取的历史图书作为相似图书保存到推荐图书的用户相似图书集中;
相似图书历史行为计算单元,用于从用户的阅读历史记录中读取用户相似图书集中所有相似图书对应的用户历史行为和阅读时间,并按照阅读时间、和用户历史行为的优先级对所有相似图书进行排序,最后从用户相似图书集中挑选出一本阅读时间最近、且用户历史行为的优先级最高的相似图书,所挑选出的相似图书对应的用户历史行为即是推荐图书的用户相似图书历史行为,所挑选出的相似图书和推荐图书的相似度即是用户相似图书和推荐图书的相似度。
7.根据权利要求6所述的系统,其特征在于,样本构建装置进一步包括有:
点击图书选取单元,用于选取用户最新日期的图书推荐列表,并将用户最新日期的图书推荐列表中用户点击过的推荐图书按照点击时间进行排序,从而为用户挑选出多本点击时间最近的推荐图书;
未点击图书选取单元,用于采用skip-above方式,即从用户点击的item位置以上的展现图书中随机选取多本用户未点击过的推荐图书。
8.根据权利要求6所述的系统,其特征在于,在分类模型训练装置中,用户和推荐图书之间的关联特征值包括但不限于:图书推荐次数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类、推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度。
9.根据权利要求6所述的系统,其特征在于,图书对应的用户历史行为包括有:浏览、开始阅读、深度长期阅读、弃读,且将用户历史行为按优先级从高到低的次序进行排序为:浏览>开始阅读>深度长期阅读>弃读。
10.根据权利要求6所述的系统,其特征在于,对于分类模型训练装置来说,logistic分类模型的训练样本的输出数据是样本用户集中每位用户点击推荐图书概率,其值为1或0,即当推荐图书是用户点击过的推荐图书时,其值为1;当推荐图书是用户未点击过的推荐图书时,其值为0,图书推荐装置进一步包括有:
点击概率判断单元,用于判断目标用户点击新推荐图书的概率是否大于或等于点击概率阈值,如果是,则将所述新推荐图书写入用户的图书推荐列表中。
CN201510684976.XA 2015-10-20 2015-10-20 基于用户点击行为来向用户推荐图书的方法和系统 Expired - Fee Related CN105335491B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510684976.XA CN105335491B (zh) 2015-10-20 2015-10-20 基于用户点击行为来向用户推荐图书的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510684976.XA CN105335491B (zh) 2015-10-20 2015-10-20 基于用户点击行为来向用户推荐图书的方法和系统

Publications (2)

Publication Number Publication Date
CN105335491A CN105335491A (zh) 2016-02-17
CN105335491B true CN105335491B (zh) 2018-11-09

Family

ID=55286018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510684976.XA Expired - Fee Related CN105335491B (zh) 2015-10-20 2015-10-20 基于用户点击行为来向用户推荐图书的方法和系统

Country Status (1)

Country Link
CN (1) CN105335491B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423308B (zh) * 2016-05-24 2020-07-07 华为技术有限公司 主题推荐方法以及装置
CN107516235B (zh) * 2016-06-17 2021-06-15 阿里巴巴集团控股有限公司 商品偏好预估方法和装置
CN106202184B (zh) * 2016-06-27 2019-05-31 华中科技大学 一种面向高校图书馆的图书个性化推荐方法和系统
CN106846191A (zh) * 2016-11-25 2017-06-13 北京粉笔蓝天科技有限公司 一种课程列表的编排方法、系统及服务器
CN106611050B (zh) * 2016-12-22 2018-08-03 掌阅科技股份有限公司 电子书推荐方法、装置和服务器
CN106982250B (zh) * 2017-03-03 2020-06-02 北京小米移动软件有限公司 信息推送方法及装置
CN107169586A (zh) * 2017-03-29 2017-09-15 北京百度网讯科技有限公司 基于人工智能的资源组合优化方法、装置及存储介质
CN107392645A (zh) * 2017-06-20 2017-11-24 小草数语(北京)科技有限公司 用户挖掘方法、装置及其设备
CN107979687A (zh) * 2017-10-31 2018-05-01 维沃移动通信有限公司 一种壁纸切换方法、移动终端
CN110428295A (zh) * 2018-08-01 2019-11-08 北京京东尚科信息技术有限公司 商品推荐方法和系统
CN109446431A (zh) * 2018-12-10 2019-03-08 网易传媒科技(北京)有限公司 用于信息推荐的方法、装置、介质、和计算设备
CN111125543B (zh) * 2019-12-17 2023-03-10 掌阅科技股份有限公司 书籍推荐排序模型的训练方法、计算设备及存储介质
CN111190934A (zh) * 2019-12-30 2020-05-22 青岛海尔科技有限公司 数据的推送方法及装置、存储介质和电子装置
CN112381615B (zh) * 2020-11-27 2022-09-02 华中科技大学 基于用户重复行为模式挖掘的短序列推荐方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320375A (zh) * 2008-07-04 2008-12-10 浙江大学 基于用户点击行为的数字图书搜索方法
CN102542046A (zh) * 2011-12-27 2012-07-04 纽海信息技术(上海)有限公司 一种基于图书内容的图书推荐方法
CN102982131A (zh) * 2012-11-16 2013-03-20 杭州东信北邮信息技术有限公司 一种基于马尔科夫链的图书推荐方法
CN103810162A (zh) * 2012-11-05 2014-05-21 腾讯科技(深圳)有限公司 推荐网络信息的方法和系统
CN103870454A (zh) * 2012-12-07 2014-06-18 盛乐信息技术(上海)有限公司 数据推荐方法及系统
CN104063476A (zh) * 2014-06-30 2014-09-24 北京奇虎科技有限公司 基于社交网络的内容推荐方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050080670A1 (en) * 2003-10-14 2005-04-14 Kehoe Thomas David Book recommendation cards and database

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320375A (zh) * 2008-07-04 2008-12-10 浙江大学 基于用户点击行为的数字图书搜索方法
CN102542046A (zh) * 2011-12-27 2012-07-04 纽海信息技术(上海)有限公司 一种基于图书内容的图书推荐方法
CN103810162A (zh) * 2012-11-05 2014-05-21 腾讯科技(深圳)有限公司 推荐网络信息的方法和系统
CN102982131A (zh) * 2012-11-16 2013-03-20 杭州东信北邮信息技术有限公司 一种基于马尔科夫链的图书推荐方法
CN103870454A (zh) * 2012-12-07 2014-06-18 盛乐信息技术(上海)有限公司 数据推荐方法及系统
CN104063476A (zh) * 2014-06-30 2014-09-24 北京奇虎科技有限公司 基于社交网络的内容推荐方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NSTL文献检索系统中相关文献推荐功能的设计及实现;张志平 等;《现代图书情报技术》;20100825(第7/8期);第110-113页,第111页第2.2节 *
基于主题模型的个性化图书推荐算法;郑祥云 等;《计算机应用》;20150910;第35卷(第9期);第2569-2573页 *

Also Published As

Publication number Publication date
CN105335491A (zh) 2016-02-17

Similar Documents

Publication Publication Date Title
CN105335491B (zh) 基于用户点击行为来向用户推荐图书的方法和系统
CN104679743B (zh) 一种确定用户的偏好模式的方法及装置
CN104281622B (zh) 一种社交媒体中的信息推荐方法和装置
CN107992531A (zh) 基于深度学习的新闻个性化智能推荐方法与系统
CN103870001B (zh) 一种生成输入法候选项的方法及电子装置
CN102033949B (zh) 基于修正的k近邻文本分类方法
CN103810162B (zh) 推荐网络信息的方法和系统
CN104933622A (zh) 一种基于用户和微博主题的微博流行度预测方法及系统
CN104166668A (zh) 基于folfm模型的新闻推荐系统及方法
CN105446970A (zh) 推荐项目的方法和装置
CN105426514A (zh) 个性化的移动应用app推荐方法
CN104572797A (zh) 基于主题模型的个性化服务推荐系统和方法
WO2016000555A1 (zh) 基于社交网络的内容、新闻推荐方法和系统
CN105718579A (zh) 一种基于上网日志挖掘和用户活动识别的信息推送方法
CN108694647A (zh) 一种商户推荐理由的挖掘方法及装置,电子设备
CN105005589A (zh) 一种文本分类的方法和装置
CN108038237A (zh) 一种信息推荐方法与系统
CN104077417A (zh) 社交网络中的人物标签推荐方法和系统
CN104484431A (zh) 一种基于领域本体的多源个性化新闻网页推荐方法
CN104679738A (zh) 互联网热词挖掘方法及装置
CN103869998A (zh) 一种对输入法所产生的候选项进行排序的方法及装置
CN103869999B (zh) 对输入法所产生的候选项进行排序的方法及装置
CN112950276B (zh) 一种基于多阶特征组合的种子人群拓展方法
CN104951435A (zh) 聊天过程中智能显示关键词的方法及装置
CN106354867A (zh) 多媒体资源的推荐方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 310013, Zhejiang, Xihu District, Wensanlu Road, No. 398, 4 floor, Hangzhou

Applicant after: Dongxin Beiyou Information Technology Co., Ltd., Hangzhou

Address before: 100191 Beijing, Zhichun Road, No. 9, hearing the building on the floor of the 7 floor,

Applicant before: Dongxin Beiyou Information Technology Co., Ltd., Hangzhou

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181109

Termination date: 20201020

CF01 Termination of patent right due to non-payment of annual fee