CN105740468B - 一种结合内容发布方信息的个性化推荐方法及系统 - Google Patents

一种结合内容发布方信息的个性化推荐方法及系统 Download PDF

Info

Publication number
CN105740468B
CN105740468B CN201610127435.1A CN201610127435A CN105740468B CN 105740468 B CN105740468 B CN 105740468B CN 201610127435 A CN201610127435 A CN 201610127435A CN 105740468 B CN105740468 B CN 105740468B
Authority
CN
China
Prior art keywords
publisher
content
score
list
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610127435.1A
Other languages
English (en)
Other versions
CN105740468A (zh
Inventor
纪传俊
陈运文
纪达麒
文辉
郑马利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daguan Data Co ltd
Original Assignee
Daerguan Information Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daerguan Information Technology (shanghai) Co Ltd filed Critical Daerguan Information Technology (shanghai) Co Ltd
Priority to CN201610127435.1A priority Critical patent/CN105740468B/zh
Publication of CN105740468A publication Critical patent/CN105740468A/zh
Application granted granted Critical
Publication of CN105740468B publication Critical patent/CN105740468B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明公开了一种结合内容发布方信息的个性化推荐方法及系统,系统包括:发布方属性挖掘模块,发布方内容挖掘模块,相似发布方计算模块,相似发布方推荐模块,用户建模模块,个性化推荐模块,结果整合模块。本发明充分考虑到用户的兴趣往往是多变的,而用户浏览某个发布方的行为可以从一定程度上反应用户当时的兴趣点。相比业界通用的个性化推荐技术,本发明中的结合内容发布方信息的个性化推荐方法,通过挖掘用户当前浏览的发布方信息,更充分地捕捉当前用户兴趣点,更加及时和准确的应对用户兴趣的多变性。

Description

一种结合内容发布方信息的个性化推荐方法及系统
技术领域
本发明涉及计算机数据处理技术领域,特别涉及结合内容发布方信息的个性化推荐方法及系统。
背景技术
随着移动互联网的迅猛发展,自媒体如雨后春笋般涌现,导致互联网上的资讯信息量呈现爆炸式的增长。以微信为例,目前微信公众号总数已超过1000万,每天都会新产生大量的资讯信息。此外,与PC时代有所不同的是,移动互联网有明显的去中心化特征,即没有一个集中的地方可以让用户方便的找到感兴趣的资讯。PC时代用户主要通过百度搜索网页和文章,而在手机端用户进行打字搜索较为不便。仍以微信为例,微信的搜索功能也非常弱,用户主要通过朋友转发和关注公众号被动的接收资讯并从中筛选出自己喜欢的。因为用户需求各异且随时会发生变化,用户往往很难找到感兴趣的内容。
目前针对资讯信息量的个性化推荐技术是解决移动端用户获取感兴趣内容的有效方法。但现有个性化推荐只使用了用户浏览记录,并没有很好的利用用户当前阅读的内容发布方(以下简称“发布方”)的信息。用户浏览某个发布方的行为包含了时效性很强的兴趣信息(比如浏览某个公众号的所有帖子),结合该信息进行个性化推荐能更好的反应用户当时的需求。
发明内容
本发明要解决的技术问题是,通过挖掘用户当前浏览的发布方信息,更充分地捕捉当前用户兴趣点,更加及时和准确的应对用户兴趣的多变性。
解决上述技术问题,本发明提供了一种结合内容发布方信息的个性化推荐方法,
在内容发布方,
对所述内容发布方的属性信息和发布的内容数据进行挖掘,得到发布方的类别及标签;
根据所述发布方标签和类别,计算得到每个发布方的相似发布方列表;
根据所述相似发布方列表,对所述相似发布方近期发布内容进行整合,得到相似发布方推荐列表;
在内容接收方,
对所述内容接收方的历史行为信息进行挖掘,得到所述内容接收方的内容偏好;
根据所述内容偏好与所述内容接收方当前正在浏览的内容相结合,得到个性化推荐列表;
将所述相似发布方推荐列表和个性化推荐列表整合后进行个性化推荐。
更进一步,所述发布方标签获取方法具体为:
根据所述发布方中的属性和内容进行中文分词处理,得到候选词列表,
对所述候选词列表中的每一个候选词进行评分,并保留得分大于阈值的候选词作为关键词;
通过所述关键词对应得到发布方的标签列表。
更进一步,得到发布方的类别的具体方法为:
将所述内容和属性标签组成的标签列表转化为特征向量;
根据对标签的评分分数,进行维度取值,得到特征向量;
将所述特征向量输入机器学习进行分类,得到所述发布方的类别信息,所述类别信息包括分类和置信度。
更进一步,根据所述发布方标签和类别,计算得到每个发布方的相似发布方列表的方法具体为:
将所述发布方标签和类别合并成一个列表,根据标签和类别的分数,进行维度取值,得到特征向量;
计算发布方特征向量两两之间的欧几里得距离,假设发布方A和发布方B的特征向量维数为n,则距离其中,Ah和Bh分别表示发布方A,B的特征向量的第h个维度;
所述发布方A,B的相似度sim(A,B)=exp(-dist(A,B));根据所述A,B的相似度进行相似度取值,并生成相似发布方列表。
更进一步,对所述相似发布方列表进行整合,得到相似发布方推荐列表的方法包括:
对于需要生成推荐结果的发布方A,将其他发布方按照每个发布方的相似发布方列表中计算出的相似度从大到小排序,选取相似度大于一定阈值的发布方组成相似发布方列表;
将相似发布方列表中所有相似发布方的近期发布的内容作为候选推荐结果,
基于所述推荐结果计算得到每个内容对于发布方A的分数:
socre(A,i)=∑i∈B,B∈S(A)sim(A,B)×content_score(i),
其中,内容i是发布方B近期发布的内容,S(A)表示A的相似发布方集合,sim(A,B)表示发布方A和B的相似度,content_score(i)表示内容i的内容质量得分;
对所述socre(A,i)得分进行取值,并构建相似发布方推荐列表。
更进一步,对所述内容接收方的历史行为信息进行挖掘,得到所述内容接收方的内容偏好的方法具体为:
分析每个用户一段时间内浏览过的所有内容,并将所有内容的标签进行加权合并:
以及类别进行加权合并:
其中,weighti是内容i的权重,scorei(tag)是标签tag在内容i的置信度,scorei(cate)是类别cate在内容i的置信度。
更进一步,所述得到个性化推荐列表的方法为:
计算每篇内容的偏好得分:
score_like(i)=score_lable(i)×content_score(i)
其中,
score_lable(i)是用户感兴趣的类别或标签在内容i的分数,即“score_lable(i)”中包含了“tag”“cate”。content_score(i)是内容i的内容质量分;
把用户当前浏览的内容的相关推荐结果合并,得到每篇内容的最终得分:
score(i)=max(score_like(i),score_rel(i))
其中,score_rel(i)是内容i在相关推荐结果中的得分,相关推荐即根据用户正在看的内容,推荐相关的内容,运作原理是网页或者app会把用户正在看的文章信息发送到后台获取相关推荐结果,因此后台必然知道用户正在看的文章。
更进一步,将所述相似发布方推荐列表和个性化推荐列表整合的方法具体为:
结合推荐排名对所述相似发布方推荐列表和个性化推荐列表的得分分别作调整,得分调整公式为;
scorenew=weight1×scoreold+weight2×exp(-α×(pos-1))
其中,scoreold是推荐结果的原始得分,pos是推荐列表的排名,weight1、weight2和α是权重参数,可以进行人工设定;
根据调整后的得分scorenew进行做整合,整合过程中对于内容i的最终得分计算公式为:
score_app(i)=weight_app×score_app(i)+weight_rec×score_rec(i),
其中,score_app(i)是内容i在相似发布方推荐结果中的调整得分,score_re(c)i是内容i在个性化推荐结果中的调整得分,weight_app和weight_rec分别是相似发布方算法的权重和个性化推荐的权重;
根据最终得分score_app(i),进行分数筛选,进行个性化推荐。
基于上述方法,本发明还提供了一种结合内容发布方信息的个性化推荐方系统,包括:
发布方属性挖掘模块,所述发布方属性挖掘模块用以对所述内容发布方的属性信息进行挖掘,得到发布方属性的类别及标签;
发布方内容挖掘模块,所述发布方内容挖掘模块用以对所述发布的内容数据进行挖掘,得到发布方的内容类别及标签;
相似发布方计算模块,所述相似发布方计算模块用以根据所述发布方标签和类别,计算得到每个发布方的相似发布方列表;
相似发布方推荐模块,所述相似发布方推荐模块用以对所述相似发布方列表进行整合,得到相似发布方推荐列表;
用户建模模块,所述用户建模模块用以对所述内容接收方的历史行为信息进行挖掘,得到所述内容接收方的内容偏好;
个性化推荐模块,所述个性化推荐模块用以根据所述内容偏好与所述内容接收方当前正在浏览的内容相结合,得到个性化推荐列表;
结果整合模块,所述结果整合模块用以将所述相似发布方推荐列表和个性化推荐列表整合后进行个性化推荐。
更进一步,所述个性化推荐为微信公众号或者微信服务号中的内容。
本发明的有益效果:
1)本发明充分考虑到用户的兴趣往往是多变的,而用户浏览某个发布方的行为可以从一定程度上反应用户当时的兴趣点。相比业界通用的个性化推荐技术,本发明中的结合内容发布方信息的个性化推荐方法,通过挖掘用户当前浏览的发布方信息,更充分地捕捉当前用户兴趣点,更加及时和准确的应对用户兴趣的多变性。
2)在本发明中,由于对所述内容发布方的属性信息和发布的内容数据进行挖掘,得到发布方的类别及标签;根据发布方的属性信息和历史发布内容,生成刻画发布方的类别和标签信息。
3)在本发明中,由于根据所述发布方标签和类别,计算得到每个发布方的相似发布方列表;根据发布方的类别和标签信息计算两个发布方的相似度。
4)在本发明中,由于将所述相似发布方推荐列表和个性化推荐列表整合后进行个性化推荐,具体地,利用推荐结果在原推荐列表的排名对原始分数进行调整,使结果更具稳定性和可比性,在此基础上对两个推荐列表的结果做加权求和得到最终推荐结果。通过结合推荐排名对推荐列表的得分作调整,弥合了不同推荐列表的得分布波动。同时推荐排名的引入同时使得不同推荐列表的推荐结果之间具备可比性。
附图说明
图1是本发明一实施例中的结合内容发布方信息的个性化推荐方法操作流程示意图。
图2是图1中的发布方标签获取方法的流程示意图。
图3是图1中的得到发布方的类别的流程示意图。
图4是本发明一实施例中的结合内容发布方信息的个性化推荐系统结构示意图。
图5(a)、图5(b)为本发明一具体实施例中的效果示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
图1是本发明一实施例中的结合内容发布方信息的个性化推荐方法操作流程示意图。
在本实施例中的一种结合内容发布方信息的个性化推荐方法,包括,
在内容发布方101,
步骤S101对所述内容发布方的属性信息和发布的内容数据进行挖掘,得到发布方的类别及标签;
作为本实施例中的优选,如图2所示,是图1中的发布方标签获取方法的流程示意图。
作为本实施例中的优选,所述发布方标签获取方法具体为:
步骤S201根据所述发布方中的属性和内容进行中文分词处理,得到候选词列表,
步骤S202对所述候选词列表中的每一个候选词进行评分,并保留得分大于阈值的候选词作为关键词;
步骤S203通过所述关键词对应得到发布方的标签列表。
作为本实施例中的优选,如图3所示,是图1中的得到发布方的类别的流程示意图。
得到发布方的类别的具体方法为:
步骤S301将所述内容和属性标签组成的标签列表转化为特征向量;
步骤S302根据对标签的评分分数,进行维度取值,得到特征向量;
步骤S303将所述特征向量输入机器学习进行分类,得到所述发布方的类别信息,所述类别信息包括分类和置信度。
步骤S102根据所述发布方标签和类别,计算得到每个发布方的相似发布方列表;
步骤S103根据所述相似发布方列表,对所述相似发布方近期发布内容进行整合,得到相似发布方推荐列表;
在内容接收方102,
步骤S104对所述内容接收方的历史行为信息进行挖掘,得到所述内容接收方的内容偏好;
步骤S105根据所述内容偏好与所述内容接收方当前正在浏览的内容相结合,得到个性化推荐列表;
步骤S106将所述相似发布方推荐列表和个性化推荐列表整合后进行个性化推荐。
图4是本发明一实施例中的结合内容发布方信息的个性化推荐系统结构示意图。
在本实施例中的一种结合内容发布方信息的个性化推荐系统,包括:
发布方属性挖掘模块401,所述发布方属性挖掘模块用以对所述内容发布方的属性信息进行挖掘,得到发布方属性的类别及标签;所述内容来自从发布方属性数据;
发布方内容挖掘模块402,所述发布方内容挖掘模块用以对所述发布的内容数据进行挖掘,得到发布方的内容类别及标签;所述内容来自从发布方内容数据;
相似发布方计算模块403,所述相似发布方计算模块用以根据所述发布方标签和类别,计算得到每个发布方的相似发布方列表;
相似发布方推荐模块404,所述相似发布方推荐模块用以对所述相似发布方列表进行整合,得到相似发布方推荐列表;
用户建模模块405,所述用户建模模块用以对所述内容接收方的历史行为信息进行挖掘,得到所述内容接收方的内容偏好;
个性化推荐模块406,所述个性化推荐模块用以根据所述内容偏好与所述内容接收方当前正在浏览的内容相结合,得到个性化推荐列表;
结果整合模块407,所述结果整合模块用以将所述相似发布方推荐列表和个性化推荐列表整合后进行个性化推荐。
具体地,结合上述模块,在本实施例中对结合内容发布方信息的个性化推荐系统的详细说明。
1.发布方属性挖掘模块401:
对发布方的属性进行挖掘,提取发布方的类别和标签信息。首先使用发布方的名称、详细描述文本等进行中文分词,提取候选词的词性、长度、出现次数、是否是无用词等特征,并根据这些特征综合打分,保留分数比较高的关键词作为标签信息。
分类信息的获取,要先将标签列表转换为特征向量,特征向量的每一维度代表一个标签,每个维度的取值即为前面计算出的标签分数。将特征向量代入机器学习的分类方法,即可得到发布方的分类和置信度。在此以微信公众号为例,表格1给出了一个公众号的属性挖掘结果示意:
表1公众号属性挖掘结果举例
2.发布方内容挖掘模块402:
对发布方的内容(文章)进行挖掘,提取内容的类别和标签信息。与“发布方属性挖掘”方法类似,该模块使用发布方内容的标题、正文等进行中文分词处理,得到内容的标签信息。再将标签信息转换为特征向量,利用分类器得到内容的分类信息。表格2给出了某个公众号4篇文章的标签信息和类别信息。
最后,把发布方最近一段时间发布的所有内容的标签信息和分类信息,与上一个模块得到的发布方标签和分类信息进行合并,得到发布方的综合标签和分类信息。合并方法是将所有标签和分类分别求平均置信度。
首先计算每个标签在所有内容的平均置信度:
其中scorei(tag)是标签tag在内容i的置信度,N是内容总数。比如标签“官方”,在表格2的4篇文章中总共出现2次,其分数为(0.109+0.154)/4=0.066。
再把标签在所有内容的平均置信度和标签在发布方属性中的置信度进行平均,即得到最终的标签置信度。类别置信度的计算方法也是如此。
表2公众号文章标签和类别挖掘示例
3.相似发布方计算模块403:
该模块为每个发布方计算其相似发布方列表。具体方法是,将之前模块挖掘得到的发布方标签信息和类别信息转换成特征向量,计算发布方特征向量两两之间的欧几里得距离:其中Ah和Bh分别表示发布方A和B的特征向量的第h个维度。最终发布方A和B的相似度计算公式为sim(A,B)=exp(-dist(A,B))。计算出发布方两两之间的相似度之后,取相似度足够高的发布方构成相似发布方列表。
4.相似发布方推荐模块404:
该模块基于已经生成的相似发布方列表,将当前发布方的相似发布方的近期发布内容进行整合,生成“相似发布方推荐列表”。具体做法是,对于需要生成推荐结果的发布方A,取出其所有相似发布方,将所有相似发布方的近期内容作为候选推荐结果,计算每个内容对于发布方A的分数,计算公式为:socre(A,i)=∑i∈B,B∈S(A)sim(A,B)×content_score(i),其中内容i是发布方B近期发布的内容,S(A)表示A的相似发布方集合,sim(A,B)表示发布方A和B的相似度,content_score(i)代表内容i的内容质量得分。最终取分数足够高的内容构建出“相似发布方推荐列表”。
5.用户建模模块405
该模块通过分析用户历史行为记录得出用户偏好信息。系统会分析每个用户一段时间内(比如一年)浏览过的所有内容,将所有内容的类别和标签信息进行加权合并,权重和浏览行为发生的时间相关,越早之前的行为权重越低,
计算公式为:
其中,weighti是内容i的权重,scorei(tag)是tag在内容i的置信度,scorei(cate)是类别cate在内容i的置信度。类别偏好得分的计算方式与此相同。最后只取分数足够高的标签和分类,生成每个用户偏好的类别和标签。
6.个性化推荐模块406:
该模块功能是为每个用户生成“个性化推荐列表”。模块根据之前挖掘得到的用户偏好的类别和标签信息,找到属于这些类别或带有这些标签的高质量内容列表,计算每篇内容的偏好得分:score_like(i)=score_lable(i)×content_score(i),其中score_lable(i),是用户感兴趣的类别或标签在内容i的分数,content_score(i)是内容i的内容质量分。同时该模块会把用户当前浏览的内容的相关推荐结果合并进来,得到最终的“个性化推荐列表”。每篇内容的最终得分score(i)=max(score_like(i),score_rel(i)),其中score_rel(i)是内容i在相关推荐结果中的得分。
7.结果整合模块407:
该模块整合“相似发布方推荐列表”和“个性化推荐列表”,生成最终推荐结果。推荐列表中的每一个推荐结果都有得分和排名两个属性,不同列表的相同排名的得分会有差异。为了弥合不同推荐列表的得分布波动,需要结合推荐排名对推荐列表的得分作调整。推荐排名的引入同时使得不同推荐列表的推荐结果之间具备可比性,是整合推荐列表的基础。得分调整公式为scorenew=weight1×scoreold+weight2×exp(-α×(pos-1)),其中scoreold是推荐结果的原始得分,pos是推荐列表的排名,weight1、weight2和α是权重参数。
根据调整后的得分对“相似发布方推荐列表”和“个性化推荐列表”做整合,合并过程中对于内容i的最终得分计算公式为:
score_app(i)=weight_app×score_app(i)+weight_rec×score_rec(i)
其中,score_app(i)是内容i在相似发布方推荐结果中的调整得分,score_rec(i),是内容i在个性化推荐结果中的调整得分,weight_app和weight_rec分别是相似发布方算法的权重和个性化推荐的权重。根据最终得分,选出分数足够高的内容生成最终推荐列表展示给用户。
作为本实施例中的优选,所述个性化推荐为微信公众号或者微信服务号中的内容。如图5(a)、图5(b)所示,为本发明一具体实施例中的效果示意图,图5(a)为某互联网行业中微信公众账号,图5(b)为某旅游行业公众号,经过本发明结合内容发布方信息的个性化推荐系统的效果示意图。
所属领域的普通技术人员应当理解:以上,所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种结合内容发布方信息的个性化推荐方法,其特征在于包括,
在内容发布方,
对所述内容发布方的属性信息和发布的内容数据进行挖掘,得到发布方的类别及标签;
根据所述发布方标签和类别,计算得到每个发布方的相似发布方列表;
根据所述相似发布方列表,对所述相似发布方近期发布内容进行整合,得到相似发布方推荐列表;
在内容接收方,
对所述内容接收方的历史行为信息进行挖掘,得到所述内容接收方的内容偏好;
根据所述内容偏好与所述内容接收方当前正在浏览的内容相结合,得到个性化推荐列表;
将所述相似发布方推荐列表和个性化推荐列表整合后进行个性化推荐。
2.根据权利要求1所述的个性化推荐方法,其特征在于,所述发布方标签获取方法具体为:
根据所述发布方中的属性和内容进行中文分词处理,得到候选词列表,
对所述候选词列表中的每一个候选词进行评分,并保留得分大于阈值的候选词作为关键词;
通过所述关键词对应得到发布方的标签列表。
3.根据权利要求1所述的个性化推荐方法,其特征在于,得到发布方的类别的具体方法为:
将所述内容和属性标签组成的标签列表转化为特征向量;
根据对标签的评分分数,进行维度取值,得到特征向量;
将所述特征向量输入机器学习进行分类,得到所述发布方的类别信息,所述类别信息包括分类和置信度。
4.根据权利要求1所述的个性化推荐方法,其特征在于,根据所述发布方标签和类别,计算得到每个发布方的相似发布方列表的方法具体为:
将所述发布方标签和类别合并成一个列表,根据标签和类别的分数,进行维度取值,得到特征向量;
计算发布方特征向量两两之间的欧几里得距离,假设发布方A和发布方B的特征向量维数为n,则距离其中,Ah和Bh分别表示发布方A,B的特征向量的第h个维度;
所述发布方A,B的相似度sim(A,B)=exp(-dist(A,B));根据所述A,B的相似度进行相似度取值,并生成相似发布方列表。
5.根据权利要求1所述的个性化推荐方法,其特征在于,对所述相似发布方列表进行整合,得到相似发布方推荐列表的方法包括:
对于需要生成推荐结果的发布方A,将其他发布方按照每个发布方的相似发布方列表中计算出的相似度从大到小排序,选取相似度大于一定阈值的发布方组成相似发布方列表;
将相似发布方列表中所有相似发布方的近期发布的内容作为候选推荐结果,
基于所述推荐结果计算得到每个内容对于发布方A的分数:
socre(A,i)=∑i∈B,B∈S(A)sim(A,B)×content_score(i),
其中,内容i是发布方B近期发布的内容,S(A)表示A的相似发布方集合,sim(A,B)表示发布方A和B的相似度,content_score(i)表示内容i的内容质量得分;
对所述socre(A,i)得分进行取值,并构建相似发布方推荐列表。
6.根据权利要求1所述的个性化推荐方法,其特征在于,对所述内容接收方的历史行为信息进行挖掘,得到所述内容接收方的内容偏好的方法具体为:
分析每个用户一段时间内浏览过的所有内容,并将所有内容的标签进行加权合并得到标签偏好得分:
以及类别进行加权合并得到类别偏好得分:
其中,weighti是内容i的权重,scorei(tag)是标签tag在内容i的置信度,scorei(cate)是类别cate在内容i的置信度;
取偏好得分足够高的标签和分类,生成用户偏好的类别和标签。
7.根据权利要求6所述的个性化推荐方法,其特征在于,所述得到个性化推荐列表的方法为:
计算每篇内容的偏好得分:
score_like(i)=score_lable(i)×content_score(i)
其中,
score_lable(i)是用户感兴趣的类别或标签在内容i的分数,content_score(i)是内容i的内容质量分;
把用户当前浏览的内容的相关推荐结果合并,得到每篇内容的最终得分:
score(i)=max(score_like(i),score_rel(i))
其中,score_rel(i)是内容i在相关推荐结果中的得分。
8.根据权利要求7所述的个性化推荐方法,其特征在于,将所述相似发布方推荐列表和个性化推荐列表整合的方法具体为:
结合推荐排名对所述相似发布方推荐列表和个性化推荐列表的得分分别作调整,得分调整公式为;
scorenew=weight1×scoreold+weight2×exp(-α×(pos-1))
其中,scoreold是推荐结果的原始得分,pos是推荐列表的排名,weight1、weight2和α是权重参数;
根据调整后的得分scorenew进行整合,整合过程中对于内容i的最终得分计算公式为:
score_app(i)=weight_app×score_app(i)+weight_rec×score_rec(i),
其中,score_app(i)是内容i在相似发布方推荐结果中的调整得分,score_rec(i)是内容i在个性化推荐结果中的调整得分,
weight_app和weight_rec分别是相似发布方算法的权重和个性化推荐的权重;根据最终得分score_app(i),进行分数筛选,进行个性化推荐。
9.一种结合内容发布方信息的个性化推荐系统,其特征在于,包括:
发布方属性挖掘模块,所述发布方属性挖掘模块用以对内容发布方的属性信息进行挖掘,得到发布方属性的类别及标签;
发布方内容挖掘模块,所述发布方内容挖掘模块用以对所述内容发布方发布的内容数据进行挖掘,得到发布方的内容类别及标签;
相似发布方计算模块,所述相似发布方计算模块用以根据所述发布方标签和类别,计算得到每个发布方的相似发布方列表;
相似发布方推荐模块,所述相似发布方推荐模块用以对所述相似发布方列表进行整合,得到相似发布方推荐列表;
用户建模模块,所述用户建模模块用以对内容接收方的历史行为信息进行挖掘,得到所述内容接收方的内容偏好;
个性化推荐模块,所述个性化推荐模块用以根据所述内容偏好与所述内容接收方当前正在浏览的内容相结合,得到个性化推荐列表;
结果整合模块,所述结果整合模块用以将所述相似发布方推荐列表和个性化推荐列表整合后进行个性化推荐。
10.根据权利要求9所述的个性化推荐系统,其特征在于,所述个性化推荐为微信公众号或者微信服务号中的内容。
CN201610127435.1A 2016-03-07 2016-03-07 一种结合内容发布方信息的个性化推荐方法及系统 Active CN105740468B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610127435.1A CN105740468B (zh) 2016-03-07 2016-03-07 一种结合内容发布方信息的个性化推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610127435.1A CN105740468B (zh) 2016-03-07 2016-03-07 一种结合内容发布方信息的个性化推荐方法及系统

Publications (2)

Publication Number Publication Date
CN105740468A CN105740468A (zh) 2016-07-06
CN105740468B true CN105740468B (zh) 2019-10-18

Family

ID=56249326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610127435.1A Active CN105740468B (zh) 2016-03-07 2016-03-07 一种结合内容发布方信息的个性化推荐方法及系统

Country Status (1)

Country Link
CN (1) CN105740468B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447464A (zh) * 2016-10-22 2017-02-22 肇庆市联高电子商务有限公司 电子商务数据处理系统
CN106850780A (zh) * 2017-01-16 2017-06-13 北京奇虎科技有限公司 系统级的应用程序信息推荐方法、装置和移动终端
CN108389066B (zh) * 2017-02-03 2022-02-01 北京京东尚科信息技术有限公司 内容分配方法、装置、系统和计算机可读存储介质
CN108429666B (zh) * 2017-02-13 2021-06-15 江苏侨拓信息科技有限公司 一种自媒体管理系统
CN109743341B (zh) * 2017-10-27 2021-10-01 富泰华工业(深圳)有限公司 活动推荐系统
CN107885841A (zh) * 2017-11-10 2018-04-06 郑州云海信息技术有限公司 一种微信小程序智慧推荐系统
CN108494849A (zh) * 2018-03-20 2018-09-04 石家庄正和网络有限公司 一种回收网站精准推送方法及系统
CN109241451B (zh) * 2018-11-08 2021-07-16 北京一点网聚科技有限公司 一种内容组合推荐方法、装置及可读存储介质
CN110020200A (zh) * 2019-03-15 2019-07-16 微梦创科网络科技(中国)有限公司 一种基于历史素材的个性化推荐方法与系统
CN110727784B (zh) * 2019-09-05 2023-11-10 上海异势信息科技有限公司 基于内容的文章推荐方法及系统
CN111310058B (zh) * 2020-03-27 2023-08-08 北京百度网讯科技有限公司 资讯主题的推荐方法、装置、终端及存储介质
US11971934B2 (en) 2020-03-31 2024-04-30 Hithink Royalflush Information Network Co., Ltd. Methods and systems for refreshing current page information
CN114866603B (zh) * 2022-04-19 2024-05-03 北京安锐卓越信息技术股份有限公司 信息推送方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102523511A (zh) * 2011-11-09 2012-06-27 中国传媒大学 一种网络节目聚合及节目推荐系统和方法
CN102654859A (zh) * 2011-03-01 2012-09-05 北京彩云在线技术开发有限公司 一种歌曲推荐方法及系统
CN103164463A (zh) * 2011-12-16 2013-06-19 国际商业机器公司 推荐标签的方法和装置
CN103473354A (zh) * 2013-09-25 2013-12-25 焦点科技股份有限公司 基于电子商务平台的保险推荐系统框架及保险推荐方法
CN104219575A (zh) * 2013-05-29 2014-12-17 酷盛(天津)科技有限公司 相关视频推荐方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102654859A (zh) * 2011-03-01 2012-09-05 北京彩云在线技术开发有限公司 一种歌曲推荐方法及系统
CN102523511A (zh) * 2011-11-09 2012-06-27 中国传媒大学 一种网络节目聚合及节目推荐系统和方法
CN103164463A (zh) * 2011-12-16 2013-06-19 国际商业机器公司 推荐标签的方法和装置
CN104219575A (zh) * 2013-05-29 2014-12-17 酷盛(天津)科技有限公司 相关视频推荐方法及系统
CN103473354A (zh) * 2013-09-25 2013-12-25 焦点科技股份有限公司 基于电子商务平台的保险推荐系统框架及保险推荐方法

Also Published As

Publication number Publication date
CN105740468A (zh) 2016-07-06

Similar Documents

Publication Publication Date Title
CN105740468B (zh) 一种结合内容发布方信息的个性化推荐方法及系统
CN104035927B (zh) 一种基于用户行为的搜索方法及系统
CN109800352B (zh) 基于剪贴板进行信息推送的方法、系统及终端设备
CN103678335B (zh) 商品标识标签的方法、装置及商品导航的方法
US7917514B2 (en) Visual and multi-dimensional search
CN108009228A (zh) 一种内容标签的设置方法、装置及存储介质
US20080005091A1 (en) Visual and multi-dimensional search
CN107577759A (zh) 用户评论自动推荐方法
CN104991968A (zh) 基于文本挖掘的互联网媒体用户属性分析方法
CN110413780A (zh) 文本情感分析方法、装置、存储介质及电子设备
CN105718579A (zh) 一种基于上网日志挖掘和用户活动识别的信息推送方法
CN103235823A (zh) 根据相关网页和当前行为确定用户当前兴趣的方法和系统
CN106326413A (zh) 一种个性化视频推荐系统及方法
CN103235824A (zh) 根据浏览网页确定用户感兴趣的网页文本的方法和系统
CN101968802A (zh) 一种基于用户浏览行为进行互联网内容推荐的方法与设备
CN107562939A (zh) 垂直领域新闻推荐方法、装置及可读储存介质
CN111949869A (zh) 一种基于人工智能的内容信息推荐方法及系统
CN102033880A (zh) 基于结构化数据集合的标注方法和装置
CN108334610A (zh) 一种新闻文本分类方法、装置及服务器
CN106126605B (zh) 一种基于用户画像的短文本分类方法
CN103136213B (zh) 一种提供相关词的方法及装置
CN103235826B (zh) 一种时间窗口的调节方法
CN105989125B (zh) 对无结果词进行标签识别的搜索方法和系统
CN114971730A (zh) 文案素材提取方法及其装置、设备、介质、产品
CN109801119A (zh) 界面展示、信息提供、用户行为内容信息处理方法及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 501, 502, 503, No. 66 Boxia Road, China (Shanghai) Pilot Free Trade Zone, Pudong New Area, Shanghai, March 2012

Patentee after: Daguan Data Co.,Ltd.

Address before: Room 1208, No. 2305 Zuchongzhi Road, Zhangjiang, Pudong New Area, Shanghai, 200000

Patentee before: DATAGRAND INFORMATION TECHNOLOGY (SHANGHAI) Co.,Ltd.