CN106777139A - 基于阅读时间的用户阅读偏好统计的个性化推送方法 - Google Patents

基于阅读时间的用户阅读偏好统计的个性化推送方法 Download PDF

Info

Publication number
CN106777139A
CN106777139A CN201611175971.5A CN201611175971A CN106777139A CN 106777139 A CN106777139 A CN 106777139A CN 201611175971 A CN201611175971 A CN 201611175971A CN 106777139 A CN106777139 A CN 106777139A
Authority
CN
China
Prior art keywords
user
reading
preference
reading time
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611175971.5A
Other languages
English (en)
Inventor
徐俊
项倩红
朱书苗
徐育忠
余永海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201611175971.5A priority Critical patent/CN106777139A/zh
Publication of CN106777139A publication Critical patent/CN106777139A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于阅读时间的用户阅读偏好统计的个性化推送方法,包括以下步骤:步骤1:建立电子读物平均阅读时间的计算标准;步骤2:对用户的阅读行为进行判断;步骤3:用户平均阅读速度的建立;步骤4:用户单一文章阅读时间的计算;步骤5:根据用户实际阅读时间和平均阅读时间判断阅读完整度;步骤6:根据用户阅读完整度建立用户偏好程度;步骤7:对用户偏好向量和文章内容特征向量进行匹配相似运算,得出用户对未阅读文章的兴趣评价值,可将兴趣评价值较高的一系列文章推荐给用户。本发明主要根据用户对文章的阅读时间和文本信息来判断用户的偏好程度,从而向用户推荐其所感兴趣的文章。

Description

基于阅读时间的用户阅读偏好统计的个性化推送方法
技术领域
本发明属于电子读物技术领域,尤其涉及一种手机端电子读物基于阅读时间的偏好统计方法,并提出个性化推送方案。
背景技术
互联网是人们进行资源共享活动最有效的工具。然而在信息爆炸的今天,困扰人们的不再是有没有自己所想获取的信息,而是如何高校、精确地找到所需要的信息。个性化的信息推荐技术作为信息过滤的手段是解决当前信息过载问题的有效方法。
当前,学术界就用户的行为兴趣来实现个性化已经有所研究。邢玲等人提出了根据用户的浏览内容和浏览时间建立用户的兴趣模型的表示和更新机制,从而根据兴趣模型给用户进行推送;蒲彬等人基于用户的社交信号来对用户实现个性化新闻推荐。专利申请号为:CN104111820A,发明名称为一种为电子读物添加阅读时间的方法和装置的中国发明专利,介绍了如何根据用户的行为来统计用户的实际阅读时间和平均阅读时间。准确地建立用户阅读偏好模型对于提高用户的信息获取效率具有极其重要的意义。
发明内容
为了克服已有推送方式的用户信息获取效率较低的不足,本发明提供了一种有效提高用户信息获取效率的基于阅读时间的用户阅读偏好统计的个性化推送方法。本发明主要根据用户对文章的阅读时间和文本信息来判断用户的偏好程度,从而向用户推荐其所感兴趣的文章。
本发明解决其技术问题所采用的技术方案是:
一种基于阅读时间的用户阅读偏好统计的个性化推送方法,包括以下步骤:
步骤1:建立电子读物平均阅读时间的计算标准;
步骤2:对用户的阅读行为进行判断;
步骤3:用户平均阅读速度的建立;
步骤4:用户单一文章阅读时间的计算;
步骤5:根据用户实际阅读时间和平均阅读时间判断阅读完整度;
步骤6:根据用户阅读完整度建立用户偏好程度;
步骤7:对用户偏好向量和文章内容特征向量进行匹配相似运算,得出用户对未阅读文章的兴趣评价值,可将兴趣评价值较高的一系列文章推荐给用户。
进一步,所述个性化推送方法还包括以下步骤:
步骤8:根据不同用户的阅读偏好建立用户间的相似模型,将相似度较高的用户所阅读的部分文章进行相互推送。
再进一步,所述个性化推送方法还包括以下步骤:
步骤9:将热门新闻、短期的爆炸性新闻推荐给用户。
更进一步,所述步骤1中,电子读物平均阅读时间计算方法包括如下步骤:
1.1)统计电子读物中不同语言分别对应的字数以及其它媒体文件的总播放时长;
1.2)给定不同语言的平均阅读速度;
1.3)依据不同语言的字数和相应的平均阅读速度计算出此语言的阅读时间;
1.4)对各种不同语言的阅读时间和媒体文件的播放时长计算出该文章的总阅读时间。
所述步骤3中,用户平均阅读速度的建立过程如下:首先给定一个初始状态,即先给定一个平均阅读速度保存至其平均速度列表中,该平均速度列表中保存有不同语言的平均速度初始状态值,并记录用户不同语言的实际阅读速度,用实际阅读速度对其初始平均阅读速度进行实时矫正训练,并保存在平均速度列表中作为用户的平均阅读速度。
所述步骤4中,用户单一文章阅读时间的计算:电子读物不同语言对应的字数和用户不同语言的平均阅读速度的比值即为用户不同语言的阅读时间,对不同语言的阅读时间和媒体文件的播放时长求和即为用户单一文章的平均阅读时间;
T=T1+T2+…+TN+Ta+Tb=M1/V1+M2/V2+…+
MN/VN+Ta+Tb (1)
其中,T为用户单一文章的平均阅读时间;T1,T2…TN分别为用户对不同语言的阅读时间;Ta,Tb分别表示媒体文件总的播放时长和图片的阅读时间;M1,M2…MN分别表示不同语言的总字数;V1,V2…VN分别表示用户对不同语言的平均阅读速度;
所述步骤5中,用户单一文章阅读完整度的判定:用户完成点击、拖动到底、退出三个步骤并且其阅读时间满足相应的阈值时表明是完整阅读,否则被认为是未完整阅读;根据步骤4中用户单一文章阅读时间的计算,再结合用户对该文章的实际阅读时间确定阅读完整度,定义单一文章的实际阅读时间和平均阅读时间的比值为阅读完整度:即
α=a/b (2)
其中,α为阅读完整度,a表示用户单一文章的实际阅读时间,b表示平均阅读时间。
所述步骤6中,根据步骤5中所得阅读完整度,建立用户偏好度,用户偏好度度量值与阅读完整度密切相关,建立如下算法:
其中,αmin0表示阅读时间比设定的阈值,当阅读时间小于αmin0时用户的偏好度为0;αmin1和αmax1之间是用户偏好度为1的情况下设定的阅读时间比上下阈值,即可认为用户对此文章十分感兴趣;在αmin0和αmin1之间其偏好度满足如上的函数关系;当阅读时间比大于αmax1时说明用户的阅读时间过长。
所述步骤7中,根据阅读完整度建立的用户偏好度和关键字等来建立用户偏好模型,个性化地向用户推荐感兴趣但又从未浏览过的文章。对于一篇新的文章,可先根据其内容转换为内容特征向量,再与用户偏好模型进行匹配运算得出相似度,由相似度得到用户对未阅读文章的兴趣评价值;从而将兴趣评价值较高的一系列文章推荐给用户。
所述步骤7的过程如下:
用户在进行阅读文章的过程中会根据文章的内容和步骤6中所述的偏好度转化为用户的偏好向量,用如下公式来计算:
其中,ω(t,d)表示关键词t在文本d中出现的权重;tf(t,d)表示关键词t在文本d中出现的频率;N为样本出现的总次数;Nt表示所有样本中t出现的文本数;在步骤6中引入的用户偏好度后,文章的用户偏好向量表示为:
I={(t11),(t22),…,(tmm),f(α)} (5)
对此偏好向量进行扩展,其不仅包含文章的内容信息,还携带着用户的阅读行为,用户的兴趣模型表征形式如下:
其中,n为兴趣向量的个数,m为每个兴趣向量所包含的维数。
再引入偏好矩阵I来刻画任意两个偏好向量的相似度,并找出最大相似度Smax,运用夹角余弦法来计算相似度,公式如下:
其中,Vs,Vr为偏好矩阵I中两个兴趣向量;sim(Vs,Vr)为Vs,Vr的相似度;ωri和ωsj分别为Vs,Vr中特征词tri、tsj所对应的权值;
对于新的文章,其内容特征向量表示为:
Vnew=((t11),(t22),…,(tmm)) (8)
最后通过如下评价得出用户对未阅读文章的兴趣评价值为:
其中,Vi表示用户兴趣模型中第i个兴趣向量对应的内容特征向量;f(αi)为兴趣向量Vi对应的偏好度;sim(Vi,Vnew)为未阅读文章与兴趣向量Vi之间的相似度;
由此得出用户对未阅读文章的兴趣评价值,从而将兴趣评价值较高的一系列文章推荐给用户。
在所述步骤8中,通过计算用户间的相似度,将与其相似度较高的用户所阅读的系列文章推荐给对方,从而扩展并发掘用户的潜在兴趣,过程如下:
其中a和b分别表示两个不同的用户,wk表示某一文本关键词k对应的权重,Vak,Vbk分别表示用户a和b对该文本的兴趣向量;
针对用户b所阅读的文本k建立用户a与b之间的相似度,如果相似度高,就把用户b所阅读过的,并且用户a对其相似度较高的文章推荐给用户a。
本发明的有益效果主要表现在:基于阅读时间的偏好统计方法通过阅读时间、阅读完整度、偏好程度等计算,能够得出用户对未阅读文章的感兴趣程度,从而将其最感兴趣的文章推荐给用户,或者实现兴趣相似度较高的用户间相互推送,真正地实现个性化推荐。
附图说明
图1是基于阅读时间的用户阅读偏好统计方法实现流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,一种基于阅读时间的用户阅读偏好统计的个性化推送方法,包括以下步骤:
步骤1:建立电子读物平均阅读时间的计算标准;
步骤2:对用户的阅读行为进行判断;
步骤3:用户平均阅读速度的建立;
步骤4:用户单一文章阅读时间的计算;
步骤5:根据用户实际阅读时间和平均阅读时间判断阅读完整度;
步骤6:根据用户阅读完整度建立用户偏好程度;
步骤7:对用户偏好向量和文章内容特征向量进行匹配相似运算,得出用户对未阅读文章的兴趣评价值,可将兴趣评价值较高的一系列文章推荐给用户。
步骤8:根据不同用户的阅读偏好建立用户间的相似模型,将相似度较高的用户所阅读的部分文章进行相互推送。
步骤9:将热门新闻、短期的爆炸性新闻推荐给用户。
进一步,所述步骤1中,电子读物平均阅读时间计算方法包括如下步骤:
1.1)统计电子读物中不同语言分别对应的字数以及其它媒体文件的总播放时长;
1.2)给定不同语言的平均阅读速度;
1.3)依据不同语言的字数和相应的平均阅读速度计算出此语言的阅读时间;
1.4)对各种不同语言的阅读时间和媒体文件的播放时长计算出该文章的总阅读时间。
其中,上述方法中的媒体文件具体可包括视频文件、音频文件等。
再进一步,所述步骤2中,文章的阅读行为分为点击、拖动和退出三大类,一个完整的阅读上述三种阅读行为缺一不可。
所述步骤3中,用户平均阅读速度的建立过程如下:首先给定一个初始状态,即先给定一个平均阅读速度保存至其平均速度列表中,该平均速度列表中保存有不同语言的平均速度初始状态值,并记录用户不同语言的实际阅读速度,用实际阅读速度对其初始平均阅读速度进行实时矫正训练,并保存在平均速度列表中作为用户的平均阅读速度。
所述步骤4中,用户单一文章阅读时间的计算:电子读物不同语言对应的字数和用户不同语言的平均阅读速度的比值即为用户不同语言的阅读时间,对不同语言的阅读时间和媒体文件的播放时长求和即为用户单一文章的平均阅读时间。
T=T1+T2+…+TN+Ta+Tb=M1/V1+M2/V2+…+
MN/VN+Ta+Tb (1)
其中,T为用户单一文章的平均阅读时间;T1,T2…TN分别为用户对不同语言的阅读时间;Ta,Tb分别表示媒体文件总的播放时长和图片的阅读时间;M1,M2…MN分别表示不同语言的总字数;V1,V2…VN分别表示用户对不同语言的平均阅读速度。
所述步骤5中,用户单一文章阅读完整度的判定:用户完成点击、拖动到底、退出三个步骤并且其阅读时间满足相应的阈值时表明是完整阅读,否则被认为是未完整阅读。
为了更精确地量化阅读的完整性,引入完整度这一概念。根据步骤4中用户单一文章阅读时间的计算,再结合用户对该文章的实际阅读时间确定阅读完整度,定义单一文章的实际阅读时间和平均阅读时间的比值为阅读完整度:即
α=a/b (2)
其中,α为阅读完整度,a表示用户单一文章的实际阅读时间,b表示平均阅读时间;
所述步骤6中,根据步骤5中所得阅读完整度,建立用户偏好度,用户偏好度度量值与阅读完整度密切相关,建立如下算法:
其中,αmin0表示阅读时间比设定的阈值,当阅读时间小于αmin0时用户的偏好度为0;αmin1和αmax1之间是用户偏好度为1的情况下设定的阅读时间比上下阈值,即可认为用户对此文章十分感兴趣;在αmin0和αmin1之间其偏好度满足如上的函数关系;当阅读时间比大于αmax1时说明用户的阅读时间过长,此行为已无法准确的量化用户的偏好度。
该用户偏好度量化方法中当阅读时间比大于αmax1时,可能用户面临其它情况没有处于阅读状态而导致阅读时间过长,从而此时的阅读时间并没有实际意义。
所述步骤7中,根据阅读完整度建立的用户偏好度和关键字等来建立用户偏好模型,个性化地向用户推荐感兴趣但又从未浏览过的文章。对于一篇新的文章,可先根据其内容转换为内容特征向量,再与用户偏好模型进行匹配运算得出相似度,由相似度得到用户对未阅读文章的兴趣评价值;从而将兴趣评价值较高的一系列文章推荐给用户。
过程如下:
用户在进行阅读文章的过程中会根据文章的内容和步骤6中所述的偏好度转化为用户的偏好向量。本发明用如下公式来计算:
其中,ω(t,d)表示关键词t在文本d中出现的权重;tf(t,d)表示关键词t在文本d中出现的频率;N为样本出现的总次数;Nt表示所有样本中t出现的文本数。在步骤6中引入的用户偏好度后,文章的用户偏好向量可表示为:
I={(t11),(t22),…,(tmm),f(α)} (5)
对此偏好向量进行扩展,其不仅包含文章的内容信息,还携带着用户的阅读行为。用户的兴趣模型表征形式如下:
其中,n为兴趣向量的个数,m为每个兴趣向量所包含的维数。
再引入偏好矩阵I来刻画任意两个偏好向量的相似度,并找出最大相似度Smax,运用夹角余弦法来计算相似度,公式如下:
其中,Vs,Vr为偏好矩阵I中两个兴趣向量;sim(Vs,Vr)为Vs,Vr的相似度;ωri和ωsj分别为Vs,Vr中特征词tri、tsj所对应的权值。
对于新的文章,其内容特征向量可表示为:
Vnew=((t11),(t22),…,(tmm)) (8)
最后通过如下评价得出用户对未阅读文章的兴趣评价值为:
其中,Vi表示用户兴趣模型中第i个兴趣向量对应的内容特征向量;f(αi)为兴趣向量Vi对应的偏好度;sim(Vi,Vnew)为未阅读文章与兴趣向量Vi之间的相似度。
由此得出用户对未阅读文章的兴趣评价值,从而将兴趣评价值较高的一系列文章推荐给用户。
所述步骤7中,所建立的根据阅读时间来建立用户的兴趣评价值,并将评价值较高的文章推荐给用户,此方法的弊端是推荐的文章范围很狭窄,只能推荐用户过去感兴趣的文章,而不能发掘用户的潜在兴趣。故在步骤8中,为了发掘用户潜在的兴趣,我们可以通过计算用户间的相似度(我们认为相似度较高的用户间有相同的兴趣爱好),将与其相似度较高的的用户所阅读的系列文章推荐给对方,从而扩展并发掘用户的潜在兴趣。
具体过程如下:
其中a和b分别表示两个不同的用户,wk表示某一文本关键词k对应的权重,Vak,Vbk分别表示用户a和b对该文本的兴趣向量。
针对用户b所阅读的文本k建立用户a与b之间的相似度,如果相似度高,就可以把用户b所阅读过的,并且用户a对其相似度较高的文章推荐给用户a。从而实现用户之间的相互推送,发掘具有相似偏好用户间的阅读兴趣来拓展用户的阅读兴趣。
以上8个步骤都是基于用户的阅读特征(历史行为和兴趣信息等)所建立的个性化推荐技术,但是对于一些时效性很强的文体(如新闻),只通过用户的历史行为兴趣进行推荐往往会使用户遗漏很多有用信息。故在步骤9中,我们不仅要考虑用户的个人兴趣,还要兼顾公众兴趣,从而发掘用户的潜在兴趣。将大众兴趣、爆炸性的信息每天给用户推荐一定数量的文章。
综上所述,本发明提出的基于用户阅读时间的阅读偏好统计的个性化推送方法。通过对用户平均阅读时间和实际阅读时间的计算,得出用户的阅读完整度,从而根据阅读完整度转化为用户的偏好程度,由用户的偏好程度和未阅读文本的特征向量进行匹配相似运算,从而将兴趣评价值较高的文章推荐给用户。在此基础上还给用户推荐与其具有相似兴趣的用户所阅读的文章、热门文章等,从而避免仅仅根据用户的历史行为进行推送所带来的兴趣狭隘等问题。本发明可以有效地为用户提供其感兴趣的一类文章,从而减小筛选信息所带来的浪费。

Claims (10)

1.一种基于阅读时间的用户阅读偏好统计的个性化推送方法,其特征在于:包括以下步骤:
步骤1:建立电子读物平均阅读时间的计算标准;
步骤2:对用户的阅读行为进行判断;
步骤3:用户平均阅读速度的建立;
步骤4:用户单一文章阅读时间的计算;
步骤5:根据用户实际阅读时间和平均阅读时间判断阅读完整度;
步骤6:根据用户阅读完整度建立用户偏好程度;
步骤7:对用户偏好向量和文章内容特征向量进行匹配相似运算,得出用户对未阅读文章的兴趣评价值,可将兴趣评价值较高的一系列文章推荐给用户。
2.如权利要求1所述的一种基于阅读时间的用户阅读偏好统计的个性化推送方法,其特征在于:所述个性化推送方法还包括以下步骤:
步骤8:根据不同用户的阅读偏好建立用户间的相似模型,将相似度较高的用户所阅读的部分文章进行相互推送。
3.如权利要求2所述的一种基于阅读时间的用户阅读偏好统计的个性化推送方法,其特征在于:所述个性化推送方法还包括以下步骤:
步骤9:将热门新闻、短期的爆炸性新闻推荐给用户。
4.如权利要求1~3之一所述的一种基于阅读时间的用户阅读偏好统计的个性化推送方法,其特征在于:所述步骤1中,电子读物平均阅读时间计算方法包括如下步骤:
1.1)统计电子读物中不同语言分别对应的字数以及其它媒体文件的总播放时长;
1.2)给定不同语言的平均阅读速度;
1.3)依据不同语言的字数和相应的平均阅读速度计算出此语言的阅读时间;
1.4)对各种不同语言的阅读时间和媒体文件的播放时长计算出该文章的总阅读时间。
5.如权利要求1~3之一所述的一种基于阅读时间的用户阅读偏好统计的个性化推送方法,其特征在于:所述步骤3中,用户平均阅读速度的建立过程如下:首先给定一个初始状态,即先给定一个平均阅读速度保存至其平均速度列表中,该平均速度列表中保存有不同语言的平均速度初始状态值,并记录用户不同语言的实际阅读速度,用实际阅读速度对其初始平均阅读速度进行实时矫正训练,并保存在平均速度列表中作为用户的平均阅读速度。
6.如权利要求1~3之一所述的一种基于阅读时间的用户阅读偏好统计的个性化推送方法,其特征在于:所述步骤4中,用户单一文章阅读时间的计算:电子读物不同语言对应的字数和用户不同语言的平均阅读速度的比值即为用户不同语言的阅读时间,对不同语言的阅读时间和媒体文件的播放时长求和即为用户单一文章的平均阅读时间;
T=T1+T2+…+TN+Ta+Tb=M1/V1+M2/V2+…+MN/VN+Ta+Tb (1)
其中,T为用户单一文章的平均阅读时间;T1,T2…TN分别为用户对不同语言的阅读时间;Ta,Tb分别表示媒体文件总的播放时长和图片阅读所需要的时间;M1,M2…MN分别表示不同语言的总字数;V1,V2…VN分别表示用户对不同语言的平均阅读速度;
所述步骤5中,用户单一文章阅读完整度的判定:用户完成点击、拖动到底、退出三个步骤并且其阅读时间满足相应的阈值时表明是完整阅读,否则被认为是未完整阅读;根据步骤4中用户单一文章阅读时间的计算,再结合用户对该文章的实际阅读时间确定阅读完整度,定义单一文章的实际阅读时间和平均阅读时间的比值为阅读完整度:即
α=a/b (2)
其中,α为阅读完整度,a表示用户单一文章的实际阅读时间,b表示平均阅读时间。
7.如权利要求6所述的一种基于阅读时间的用户阅读偏好统计的个性化推送方法,其特征在于:所述步骤6中,根据步骤5中所得阅读完整度,建立用户偏好度,用户偏好度度量值与阅读完整度密切相关,建立如下算法:
其中,αmin0表示阅读时间比设定的阈值,当阅读时间小于αmin0时用户的偏好度为0;αmin1和αmax1之间是用户偏好度为1的情况下设定的阅读时间比上下阈值,即可认为用户对此文章十分感兴趣;在αmin0和αmin1之间其偏好度满足如上的函数关系;当阅读时间比大于αmax1时说明用户的阅读时间过长。
8.如权利要求1~3之一所述的一种基于阅读时间的用户阅读偏好统计的个性化推送方法,其特征在于:所述步骤7中,根据阅读完整度建立的用户偏好度和关键字等来建立用户偏好模型,个性化地向用户推荐感兴趣但又从未浏览过的文章。对于一篇新的文章,可先根据其内容转换为内容特征向量,再与用户偏好模型进行匹配运算得出相似度,由相似度得到用户对未阅读文章的兴趣评价值;从而将兴趣评价值较高的一系列文章推荐给用户。
9.如权利要求8所述的一种基于阅读时间的用户阅读偏好统计的个性化推送方法,其特征在于:所述步骤7的过程如下:
用户在进行阅读文章的过程中会根据文章的内容和步骤6中所述的偏好度转化为用户的偏好向量,用如下公式来计算:
其中,ω(t,d)表示关键词t在文本d中出现的权重;tf(t,d)表示关键词t在文本d中出现的频率;N为样本出现的总次数;Nt表示所有样本中t出现的文本数;在步骤6中引入的用户偏好度后,文章的用户偏好向量表示为:
I={(t11),(t22),…,(tmm),f(α)} (5)
对此偏好向量进行扩展,其不仅包含文章的内容信息,还携带着用户的阅读行为,用户的兴趣模型表征形式如下:
其中,n为兴趣向量的个数,m为每个兴趣向量所包含的维数。
再引入偏好矩阵I来刻画任意两个偏好向量的相似度,并找出最大相似度Smax,运用夹角余弦法来计算相似度,公式如下:
其中,Vs,Vr为偏好矩阵I中两个兴趣向量;sim(Vs,Vr)为Vs,Vr的相似度;ωri和ωsj分别为Vs,Vr中特征词tri、tsj所对应的权值;
对于新的文章,其内容特征向量表示为:
Vnew=((t11),(t22),…,(tmm)) (8)
最后通过如下评价得出用户对未阅读文章的兴趣评价值为:
其中,Vi表示用户兴趣模型中第i个兴趣向量对应的内容特征向量;f(αi)为兴趣向量Vi对应的偏好度;sim(Vi,Vnew)为未阅读文章与兴趣向量Vi之间的相似度;
由此得出用户对未阅读文章的兴趣评价值,从而将兴趣评价值较高的一系列文章推荐给用户。
10.如权利要求2或3所述的一种基于阅读时间的用户阅读偏好统计的个性化推送方法,其特征在于:在所述步骤8中,通过计算用户间的相似度,将与其相似度较高的用户所阅读的系列文章推荐给对方,从而扩展并发掘用户的潜在兴趣,过程如下:
其中a和b分别表示两个不同的用户,wk表示某一文本关键词k对应的权重,Vak,Vbk分别表示用户a和b对该文本的兴趣向量;
针对用户b所阅读的文本k建立用户a与b之间的相似度,如果相似度高,就把用户b所阅读过的,并且用户a对其相似度较高的文章推荐给用户a。
CN201611175971.5A 2016-12-19 2016-12-19 基于阅读时间的用户阅读偏好统计的个性化推送方法 Pending CN106777139A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611175971.5A CN106777139A (zh) 2016-12-19 2016-12-19 基于阅读时间的用户阅读偏好统计的个性化推送方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611175971.5A CN106777139A (zh) 2016-12-19 2016-12-19 基于阅读时间的用户阅读偏好统计的个性化推送方法

Publications (1)

Publication Number Publication Date
CN106777139A true CN106777139A (zh) 2017-05-31

Family

ID=58891340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611175971.5A Pending CN106777139A (zh) 2016-12-19 2016-12-19 基于阅读时间的用户阅读偏好统计的个性化推送方法

Country Status (1)

Country Link
CN (1) CN106777139A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657033A (zh) * 2017-09-28 2018-02-02 泰康保险集团股份有限公司 阅读行为监控方法及装置、存储介质和电子设备
CN107657030A (zh) * 2017-09-27 2018-02-02 风变科技(深圳)有限公司 收集用户阅读数据的方法、装置、终端设备及存储介质
CN107807958A (zh) * 2017-09-30 2018-03-16 广东南都全媒体网络科技有限公司 一种文章列表个性化推荐方法、电子设备及存储介质
CN107833093A (zh) * 2017-10-27 2018-03-23 咪咕数字传媒有限公司 确定阅读推荐顺序的方法、装置和存储介质
CN108062415A (zh) * 2018-01-02 2018-05-22 武汉斗鱼网络科技有限公司 用户行为的统计方法、装置及终端设备
CN108804583A (zh) * 2018-05-25 2018-11-13 武汉市华太培文教育科技有限公司 基于用户阅读兴趣进行文献推送的系统及方法
CN109189892A (zh) * 2018-09-17 2019-01-11 北京点网聚科技有限公司 一种基于文章评论的推荐方法及装置
CN109241452A (zh) * 2018-11-19 2019-01-18 天津网之易创新科技有限公司 信息推荐方法及装置、存储介质和电子设备
CN109325223A (zh) * 2018-07-24 2019-02-12 广州神马移动信息科技有限公司 文章推荐方法、装置及电子设备
CN109992602A (zh) * 2019-04-02 2019-07-09 海南颖川科技有限公司 少儿数字阅读指引设备
CN110020126A (zh) * 2017-07-26 2019-07-16 谷歌有限责任公司 电子内容的内容选择和呈现
CN110020377A (zh) * 2018-01-02 2019-07-16 北大方正集团有限公司 网络阅读活动互动方法、装置、服务器、终端和存储介质
CN110175326A (zh) * 2019-05-07 2019-08-27 首都师范大学 一种获取阅读心像信息量的计算方法及装置
CN110263189A (zh) * 2019-06-24 2019-09-20 腾讯科技(深圳)有限公司 媒体内容的推荐方法、装置、存储介质和计算机设备
WO2019184582A1 (zh) * 2018-03-30 2019-10-03 掌阅科技股份有限公司 电子书消费需求的确定方法、电子设备及计算机存储介质
CN111104486A (zh) * 2019-12-25 2020-05-05 郑州师范学院 现代文学作品对照讲解系统
CN112328861A (zh) * 2020-11-24 2021-02-05 郑州航空工业管理学院 一种基于大数据处理的新闻传播方法
CN112328881A (zh) * 2020-11-05 2021-02-05 中国平安人寿保险股份有限公司 文章推荐方法、装置、终端设备及存储介质
CN113065062A (zh) * 2021-03-09 2021-07-02 北京工业大学 一种基于用户阅读时间行为的新闻推荐方法及系统
CN115601825A (zh) * 2022-10-25 2023-01-13 扬州市职业大学(扬州开放大学)(Cn) 一种基于视觉定位技术评价阅读能力的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622445A (zh) * 2012-03-15 2012-08-01 华南理工大学 一种基于用户兴趣感知的网页推送系统及方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622445A (zh) * 2012-03-15 2012-08-01 华南理工大学 一种基于用户兴趣感知的网页推送系统及方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
吴兵: "《多Agent推荐系统及应用》", 1 July 2014 *
唐积益: "推荐系统中相似度计算方法的研究11", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
宋亦芳: "《社区数字化学习资源建设研究》", 1 July 2013 *
宋章浩: "基于web浏览行为的用户兴趣模型研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
朱文奇: "推荐系统用户相似度计算方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
熊拥军: "《数字图书馆个性化服务研究与实践 基于新型决策支持系统》", 1 September 2012 *
罗军: "考虑物品相似权重的用户相似度计算方法", 《计算机工程与应用》 *
赵向宇: "Top-N协同过滤推荐技术研究", 《中国博士学位论文全文数据库信息科技辑》 *

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020126B (zh) * 2017-07-26 2023-10-13 谷歌有限责任公司 电子内容的内容选择和呈现
CN110020126A (zh) * 2017-07-26 2019-07-16 谷歌有限责任公司 电子内容的内容选择和呈现
US11663277B2 (en) 2017-07-26 2023-05-30 Google Llc Content selection and presentation of electronic content
CN107657030A (zh) * 2017-09-27 2018-02-02 风变科技(深圳)有限公司 收集用户阅读数据的方法、装置、终端设备及存储介质
CN107657033B (zh) * 2017-09-28 2020-07-10 泰康保险集团股份有限公司 阅读行为监控方法及装置、存储介质和电子设备
CN107657033A (zh) * 2017-09-28 2018-02-02 泰康保险集团股份有限公司 阅读行为监控方法及装置、存储介质和电子设备
CN107807958B (zh) * 2017-09-30 2021-11-19 广东南都全媒体网络科技有限公司 一种文章列表个性化推荐方法、电子设备及存储介质
CN107807958A (zh) * 2017-09-30 2018-03-16 广东南都全媒体网络科技有限公司 一种文章列表个性化推荐方法、电子设备及存储介质
CN107833093A (zh) * 2017-10-27 2018-03-23 咪咕数字传媒有限公司 确定阅读推荐顺序的方法、装置和存储介质
CN108062415A (zh) * 2018-01-02 2018-05-22 武汉斗鱼网络科技有限公司 用户行为的统计方法、装置及终端设备
CN110020377A (zh) * 2018-01-02 2019-07-16 北大方正集团有限公司 网络阅读活动互动方法、装置、服务器、终端和存储介质
CN110020377B (zh) * 2018-01-02 2021-02-09 北大方正集团有限公司 网络阅读活动互动方法、装置、服务器、终端和存储介质
WO2019184582A1 (zh) * 2018-03-30 2019-10-03 掌阅科技股份有限公司 电子书消费需求的确定方法、电子设备及计算机存储介质
CN108804583A (zh) * 2018-05-25 2018-11-13 武汉市华太培文教育科技有限公司 基于用户阅读兴趣进行文献推送的系统及方法
CN109325223A (zh) * 2018-07-24 2019-02-12 广州神马移动信息科技有限公司 文章推荐方法、装置及电子设备
CN109325223B (zh) * 2018-07-24 2023-08-25 阿里巴巴(中国)有限公司 文章推荐方法、装置及电子设备
CN109189892A (zh) * 2018-09-17 2019-01-11 北京点网聚科技有限公司 一种基于文章评论的推荐方法及装置
CN109241452A (zh) * 2018-11-19 2019-01-18 天津网之易创新科技有限公司 信息推荐方法及装置、存储介质和电子设备
CN109241452B (zh) * 2018-11-19 2022-03-22 天津网之易创新科技有限公司 信息推荐方法及装置、存储介质和电子设备
CN109992602A (zh) * 2019-04-02 2019-07-09 海南颖川科技有限公司 少儿数字阅读指引设备
CN110175326A (zh) * 2019-05-07 2019-08-27 首都师范大学 一种获取阅读心像信息量的计算方法及装置
CN110175326B (zh) * 2019-05-07 2022-06-21 首都师范大学 一种获取阅读心像信息量的计算方法及装置
CN110263189A (zh) * 2019-06-24 2019-09-20 腾讯科技(深圳)有限公司 媒体内容的推荐方法、装置、存储介质和计算机设备
CN110263189B (zh) * 2019-06-24 2024-01-09 深圳市雅阅科技有限公司 媒体内容的推荐方法、装置、存储介质和计算机设备
CN111104486A (zh) * 2019-12-25 2020-05-05 郑州师范学院 现代文学作品对照讲解系统
CN112328881A (zh) * 2020-11-05 2021-02-05 中国平安人寿保险股份有限公司 文章推荐方法、装置、终端设备及存储介质
CN112328881B (zh) * 2020-11-05 2024-04-02 中国平安人寿保险股份有限公司 文章推荐方法、装置、终端设备及存储介质
CN112328861B (zh) * 2020-11-24 2023-06-23 郑州航空工业管理学院 一种基于大数据处理的新闻传播方法
CN112328861A (zh) * 2020-11-24 2021-02-05 郑州航空工业管理学院 一种基于大数据处理的新闻传播方法
CN113065062A (zh) * 2021-03-09 2021-07-02 北京工业大学 一种基于用户阅读时间行为的新闻推荐方法及系统
CN115601825A (zh) * 2022-10-25 2023-01-13 扬州市职业大学(扬州开放大学)(Cn) 一种基于视觉定位技术评价阅读能力的方法
CN115601825B (zh) * 2022-10-25 2023-09-19 扬州市职业大学(扬州开放大学) 一种基于视觉定位技术评价阅读能力的方法

Similar Documents

Publication Publication Date Title
CN106777139A (zh) 基于阅读时间的用户阅读偏好统计的个性化推送方法
CN112784130B (zh) 孪生网络模型训练、度量方法、装置、介质和设备
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN106339507B (zh) 流媒体消息推送方法和装置
CN107391760A (zh) 用户兴趣识别方法、装置及计算机可读存储介质
CN106354818B (zh) 基于社交媒体的动态用户属性提取方法
CN111274440B (zh) 一种基于视觉和音频内容相关度挖掘的视频推荐方法
CN109509010B (zh) 一种多媒体信息处理方法、终端及存储介质
CN103533390A (zh) 基于社交网络信息进行电视节目推荐的方法及系统
CN111177559B (zh) 文旅服务推荐方法、装置、电子设备及存储介质
CN110134792A (zh) 文本识别方法、装置、电子设备以及存储介质
CN106022877A (zh) 一种基于用户手游行为图谱的游戏推荐方法
CN108322317A (zh) 一种账号识别关联方法及服务器
Liu et al. Using collaborative filtering algorithms combined with Doc2Vec for movie recommendation
CN111737426A (zh) 问答模型的训练方法、计算机设备以及可读存储介质
Jia et al. Multi-modal learning for video recommendation based on mobile application usage
CN110198482A (zh) 一种视频重点桥段标注方法、终端及存储介质
CN113342968A (zh) 文本摘要提取方法及装置
CN110728983B (zh) 一种信息显示方法、装置、设备及可读存储介质
CN111125428A (zh) 基于评分预测函数拟合结构的时间相关电影推荐方法
CN110727864A (zh) 一种基于手机App安装列表的用户画像方法
CN113779245A (zh) 一种评论情感原因三元组抽取方法
CN112464106B (zh) 对象推荐方法及装置
CN106056137A (zh) 一种基于数据挖掘多分类算法的电信集团业务推荐方法
CN110516086B (zh) 一种基于深度神经网络影视标签自动获取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531