CN104199872A - 一种信息推荐的方法以及装置 - Google Patents

一种信息推荐的方法以及装置 Download PDF

Info

Publication number
CN104199872A
CN104199872A CN201410410168.XA CN201410410168A CN104199872A CN 104199872 A CN104199872 A CN 104199872A CN 201410410168 A CN201410410168 A CN 201410410168A CN 104199872 A CN104199872 A CN 104199872A
Authority
CN
China
Prior art keywords
word
user
browse
group
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410410168.XA
Other languages
English (en)
Inventor
孟二利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201410410168.XA priority Critical patent/CN104199872A/zh
Publication of CN104199872A publication Critical patent/CN104199872A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息推荐的方法以及装置,该方法包括:获取第一用户的第一社交账号,所述第一社交账号内包括第一组兴趣标签,所述第一组兴趣标签包括一个或多个兴趣标签;基于兴趣标签与浏览词的关联关系,确定与所述第一组兴趣标签对应的第一组浏览词,所述第一组浏览词包括一个或多个浏览词;将所述第一组浏览词对应的信息推荐给所述第一用户。

Description

一种信息推荐的方法以及装置
技术领域
本发明涉及电子技术领域,尤其涉及一种信息推荐的方法以及装置。
背景技术
随着互联网的发展及用户生成内容(英文:User Generated Content;简称:UGC)的爆发,互联网信息种类和数量快速增长,用户需要花费大量的时间才能找到自己感兴趣的信息。因此,为了减少用户找寻到自己感兴趣的信息的时间,个性化推荐系统应运而生。
目前,个性化推荐系统均采用隐式投票的方式,具体来讲,也即基于特定用户的浏览、消费等历史行为,如该特定用户在网络上浏览的内容、发生评论的内容即为其感兴趣的内容,则为该特定用户推荐与这些感兴趣的内容相关的其他内容。
但是,上述的个性化推荐系统在推荐内容时的准确度较低,具体来讲:1、推荐内容包括计算用户的临时兴趣,用户会因为一些热点事件而对某个领域或者分类感兴趣,但在热点事件结束后,该临时兴趣随即消失,以体育领域的世界杯为例,在世界杯举行时,很多人对足球分类关注度十分高,但在是世界杯结束后,不会再关注世界杯以及足球的分类,但个性化推荐系统仍会根据用户的关注情况,持续地为用户推荐与此分类相关的信息;2、用户在网络上浏览时具有较大随意性,而个性化推荐系统会根据用户的随意性行为计算用户的兴趣点,并根据该兴趣点进行推荐,所推荐的内容就会大大偏离用户的兴趣点。
因此,现有技术中,个性化推荐系统在推荐内容时存在准确度较低的技术问题。
发明内容
本发明实施例通过提供一种信息推荐的方法以及装置,用以解决现有技术中个性化推荐系统在推荐内容时存在的准确度较低的技术问题。
本发明实施例一方面提供了一种信息推荐的方法,包括:
获取第一用户的第一社交账号,所述第一社交账号内包括第一组兴趣标签,所述第一组兴趣标签包括一个或多个兴趣标签;
基于兴趣标签与浏览词的关联关系,确定与所述第一组兴趣标签对应的第一组浏览词,所述第一组浏览词包括一个或多个浏览词;
将所述第一组浏览词对应的信息推荐给所述第一用户。
可选地,在所述获取第一用户的第一社交账号之前,还包括:
采集群体用户在使用其各自的至少一个社交账号时访问网络的浏览数据,所述至少一个社交账号中的每个社交账号至少包括一个兴趣标签;
从所述浏览数据中提取出浏览词;
建立所述兴趣标签和所述浏览词的关联关系。
可选地,所述建立所述兴趣标签和所述浏览词的关联关系,具体包括:
根据群体用户中的每个用户的浏览词与兴趣标签,进行单个用户的浏览词与兴趣标签的投票;
根据由所述多个单个用户构成的群体用户的投票数据,建立所述兴趣标签与所述浏览词的关联关系。
可选地,所述根据单个用户的浏览词与兴趣标签,进行浏览词与兴趣标签的投票,具体为:
通过频率逆文档频率(TF-IDF)模型计算权重,进行浏览词与兴趣标签的投票。
可选地,所述将所述第一组浏览词对应的信息推荐给所述第一用户,具体为:
将所述第一组浏览词对应的信息按照与所述第一组兴趣标签的关联度,按从高到低的顺序推荐给所述第一用户。
可选地,在所述第一组兴趣标签具体为多个兴趣标签时,所述将所述第一组浏览词对应的信息按照与所述第一组兴趣标签的关联度,按从高到低的顺序推荐给所述第一用户,具体包括:
将所述多个兴趣标签进行排序,获得第一排序结果;
按照所述第一排序结果中所述多个兴趣标签的排列顺序,将所述第一组浏览词所对应的信息推荐给所述第一用户。
可选地,在所述多个兴趣标签中任意一个兴趣标签对应M个浏览词时,其中M为大于等于2的整数,在将所述M个浏览词对应的信息推荐给所述第一用户时,所述方法还包括:
对所述M个浏览词进行排序,获得第二排序结果;
按照所述第二排序结果中所述M个浏览词的排列顺序,将所述M个浏览词对应的信息推荐给所述第一用户。
本发明实施例另一方面还提供一种信息推荐的装置,包括:
获取单元,用于获取第一用户的第一社交账号,所述第一社交账号内包括第一组兴趣标签,所述第一组兴趣标签包括一个或多个兴趣标签;
确定单元,用于基于兴趣标签与浏览词的关联关系,确定与所述第一组兴趣标签对应的第一组浏览词,所述第一组浏览词包括一个或多个浏览词;
推荐单元,用于将所述第一组浏览词对应的信息推荐给所述第一用户。
可选地,所述装置还包括:
采集单元,用于在所述获取单元获取第一用户的第一社交账号之前,采集群体用户在使用其各自的至少一个社交账号时访问网络的浏览数据,所述至少一个社交账号中的每个社交账号至少包括一个兴趣标签;
提取单元,用于从所述浏览数据中提取出浏览词;
建立单元,用于建立所述兴趣标签和所述浏览词的关联关系。
可选地,所述建立单元具体用于根据群体用户中的单个用户的浏览词与兴趣标签,进行单个用户的浏览词与兴趣标签的投票,并根据由所述多个单个用户构成的群体用户的投票数据,建立所述兴趣标签与所述浏览词的关联关系。
可选地,所述建立单元具体用于通过TF-IDF模型计算权重,进行浏览词与兴趣标签的投票。
可选地,所述推荐单元具体用于将所述第一组浏览词对应的信息按照与所述第一组兴趣标签的关联度,按从高到低的顺序推荐给所述用户。
可选地,所述推荐单元具体用于在所述第一组兴趣标签具体为多个兴趣标签时,将所述多个兴趣标签进行排序,获得第一排序结果,并按照所述第一排序结果中所述多个兴趣标签的排列顺序,将所述第一组浏览词所对应的信息推荐给所述第一用户。
可选地,所述推荐单元具体用于在所述多个兴趣标签中任意一个兴趣标签对应M个浏览词时,其中M为大于等于2的整数,对所述M个浏览词进行排序,获得第二排序结果,并按照所述第二排序结果中所述M个浏览词的排列顺序,将所述M个浏览词对应的信息推荐给所述第一用户。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
1、由于采用了根据第一用户的第一社交账号的第一组兴趣标签,从兴趣标签与浏览词的关联关系中确定与第一组兴趣标签对应的第一组浏览词,最后将第一组浏览词推荐给所述第一用户的技术方案,避免了现有技术中个性化推荐系统会计算用户的临时兴趣、以及会根据用户的随意性较大的浏览行为计算用户的兴趣点而导致在推荐内容时的准确度较低的缺陷,实现了准确地为用户推荐长期感兴趣的内容的技术效果,提高了向用户推荐内容时的准确度。
2、由于在获取第一用户的第一社交账号后,即能够根据该第一用户的第一社交账号的第一组兴趣标签,为第一用户进行信息推荐,并且推荐的信息为根据第一组兴趣标签确定,在保证了准确度较高的同时不需要向用户询问兴趣点,也降低了直接为用户推荐当前热点信息如新闻、电影等等信息导致用户产生不满情绪的可能性,用户体验较好。
附图说明
图1为本发明实施例提供的信息推荐的方法流程图。
具体实施方式
本发明实施例通过提供一种信息推荐的方法以及装置,用以解决现有技术中个性化推荐系统在推荐内容时存在的准确度较低的技术问题。
本发明实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明实施例提供一种信息推荐的方法,该方法包括:
首先,获取第一用户的第一社交账号,第一社交账号例如可以是第一用户使用的微博账号、论坛账号等等,第一社交账号内包括第一组兴趣标签,第一组兴趣标签包括一个或多个兴趣标签,该第一组兴趣标签即表明了第一用户长期感兴趣的内容;
然后,基于兴趣标签与浏览词的关联关系,确定与第一组兴趣标签对应的第一组浏览词,第一组浏览词包括一个或多个浏览词;
最后,将第一组浏览词对应的信息推荐给第一用户。
通过上述部分可以看出,由于采用了根据第一用户的第一社交账号的第一组兴趣标签,从第一组兴趣标签与浏览词的关联关系中确定与第一组兴趣标签对应的第一组浏览词,最后将第一组浏览词对应的信息推荐给第一用户的技术方案,避免了现有技术中个性化推荐系统会计算用户的临时兴趣、以及会根据用户的随意性较大的浏览行为计算用户的兴趣点而导致在推荐内容时的准确度较低的缺陷,实现了准确地为用户推荐长期感兴趣的内容的技术效果,提高了向用户推荐内容时的准确度。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例一
请参考图1,图1是本发明实施例提供的信息推荐的方法的流程图,如图1所示,本发明实施例提供的信息推荐的方法包括:
101:获取第一用户的第一社交账号,第一社交账号内包括第一组兴趣标签,第一组兴趣标签包括一个或多个兴趣标签;
102:基于兴趣标签与浏览词的关联关系,确定与第一组兴趣标签对应的第一组浏览词,第一组浏览词包括一个或多个浏览词;
103:将第一组浏览词对应的信息推荐给第一用户。
在步骤101之前,本发明实施例提供的方法还包括如下步骤:采集群体用户在使用其各自的至少一个社交账号时访问网络的浏览数据,至少一个社交账号中的每个社交账号至少包括一个兴趣标签;从浏览数据中提取出浏览词;建立兴趣标签和浏览词的关联关系。
在具体实施过程中,首先,可以是在获得群体用户的授权之后,采集群体用户在使用如微博账号、论坛账号、贴吧账号等社交账号时的浏览数据,例如浏览的网页、帖子、搜索内容或者评论内容等等,接着,从这些采集出的浏览数据中提取浏览词,例如,可以通过分词技术,对网页或者帖子的主题、搜索内容或者回复内容进行分词,并基于分词之后所获得的内容提取出浏览词。需要说明的是,为了提高向用户推荐的内容的准确度,本发明实施例提供的信息推荐的方法需要尽可能多的采集样本数据(单个用户的浏览数据算一个样本)。
然后,即能够根据提取出的浏览词与群体用户使用的社交账号内包括的兴趣标签,建立兴趣标签与浏览词的关联关系。
具体来讲,首先,可以根据单个用户的浏览词与兴趣标签,进行浏览词与兴趣标签的投票,例如,在采集用户A通过社交账号A1访问网络时的浏览数据之后,通过频率逆文档频率(英文:term frequency–inverse documentfrequency;简称:TF-IDF)模型计算权重,能够进行社交账号A1的兴趣标签A11与根据该浏览数据提取出的浏览词的投票,从而建立起兴趣标签A11与提取出的浏览词之间的关联关系,获得单个用户的兴趣标签与浏览词的投票数据。当然,用户A可以使用多个社交账号,每个账号内可以包括多个兴趣标签,在此不做限制。然后,通过多个用户也即群体用户的投票数据,建立兴趣标签与浏览词的关联关系。
在具体实施过程中,以兴趣标签A11为社交账号A1内的一个兴趣标签为例。设定通过TF-IDF模型,从用户A通过社交账号A1访问网络时的浏览数据中提取出了10个浏览词,则该10个浏览词即对兴趣标签A11进行了一次投票,也就是说,兴趣标签A11与该10个浏览词建立了关联关系,这样,即获得了单个用户的兴趣标签与浏览词的投票数据。然后,通过多个用户的投票数据,将不同的兴趣标签与各自对应的浏览词合并起来,即能够建立兴趣标签与浏览词的关联关系。若A11为多个兴趣标签时,例如具体为两个兴趣标签,在从浏览数据中提取出10个浏览词后,需要先将2兴趣标签和10个浏览词进行一个匹配,例如可以根据词语意义进行匹配,设定兴趣标签1对应3个浏览词,兴趣标签2对应7个浏览词,则该3个浏览词对兴趣标签1进行了一次投票,该7个浏览词对兴趣标签2进行了一次投票,这样即获得了单个用户的兴趣标签与浏览词的投票数据。然后再通过多个用户的投票数据的整合,建立兴趣标签与浏览词的关联关系。
通过本实施例的介绍,本领域所属的技术人员除了上述所介绍的通过TF-IDF模型计算权重之外,还可以根据实际情况通过互信息、条件熵等方式来计算权重,以满足实际情况的需要,在此就不再赘述了。在具体实施过程中,兴趣标签与浏览词的关联关系具体可以是一个关联矩阵,当然,通过本实施例的介绍,本领域所属的普通技术人员,也能够根据实际情况,为兴趣标签与浏览词的关联关系设置其他合适的形式,以满足实际情况的需要,在此就不再赘述了。
需要说明的是,在具体实施过程中,上述部分所介绍的建立兴趣标签与浏览词的关联关系这一过程不是每次向用户推荐内容时都需要重新进行,该关联关系完成之后,可以进行多次使用,当然,也可以根据所采集的用户的浏览数据对该关联关系进行更新,例如,不停的采集群体用户的浏览数据,每隔一预设时间段例如1分钟或者3分钟等等,就重新建立一次兴趣标签和浏览词的关联关系,这样能够提高该关联关系的实时性,避免使用已经过时的关联关系向用户推荐信息,从而保证本发明实施例提供的信息推荐的方法所推荐的信息的准确性,在此就不再赘述了。
在兴趣标签与浏览词的关联关系建立之后,本发明实施例提供信息推荐的方法进入步骤101,即:获取第一用户的第一社交账号,第一社交账号内至少包括第一组兴趣标签,第一组兴趣标签包括一个或多个兴趣标签。
例如,在第一用户使用本发明实施例提供的信息推荐的方法时,可以通过请求授权等方式来获取第一用户的第一社交账号,第一社交账号例如可以是如前述所介绍的微博账号、论坛账号、贴吧账号等社交账号中的至少一个,在此不做限制。这些社交账号中的任一社交账号内都包括第一组兴趣标签,以微博账号为例,第一组兴趣标签可以包括一个或者多个兴趣标签,如“足球”、“健身”、“美容”或者“机器学习”等等,再以贴吧账号为例,第一组兴趣标签具体可以是该账号关注的一个或者多个贴吧名称,如“宠物猫”、“恐怖片”或者“网络游戏”等等,在此就不再赘述了。
在步骤101之后,本发明实施例提供的信息推荐的方法进入步骤102,也即:基于兴趣标签与浏览词的关联关系,确定与第一组兴趣标签对应的第一组浏览词。
具体来讲,也即是根据第一用户的第一社交账号内的第一组兴趣标签,从前述部分所介绍的兴趣标签与浏览词的关联关系中,确定出与该第一组兴趣标签对应的第一组浏览词,第一组浏览词包括一个或多个浏览词。
可以看出,由于第一组浏览词与第一用户的第一社交账号的第一组兴趣标签相关联,且兴趣标签与浏览词的关联关系为根据多个用户即群体用户的兴趣标签与浏览数据的关联关系建立,所以与现有技术相比,避免了现有技术中个性化推荐系统会计算用户的临时兴趣、以及会根据用户的随意性较大的浏览行为计算用户的兴趣点而导致在推荐内容时的准确度较低的缺陷,实现了准确地为用户推荐长期感兴趣的内容的技术效果,提高了向用户推荐内容时的准确度。
进一步地,由于在获取第一用户的第一社交账号后,即能够根据该第一用户的第一社交账号的第一组兴趣标签,为第一用户进行信息推荐,并且推荐的信息为根据第一组兴趣标签确定,在保证了准确度较高的同时不需要向用户询问兴趣点,也降低了直接为用户推荐当前热点信息如新闻、电影等等信息导致用户产生不满情绪的可能性,用户体验较好。
在步骤102之后,本发明实施例提供的信息处理方法进入步骤103,即:将第一组浏览词对应的信息推荐给第一用户。
在具体实施过程中,为了便于用户阅读所推荐的信息,可以将第一组浏览词按照与第一组兴趣标签的关联度,按从高到低的顺序推荐给用户。
当然了,在第一组兴趣标签具体包含多个兴趣标签时,为了保证向第一用户推荐信息时的准确度,在将第一组浏览词排序之前,可以先将多个兴趣标签进行第一次排序,例如按照与当前时事的关联程度进行第一次排序,再将第一组浏览词按照与第一组兴趣标签的关联程度进行第二次排序,例如可以将第一组浏览词中的浏览词按照与经过第一次排序的第一组兴趣标签的关联程度进行第二次排序,同时为了避免向用户推荐关联程度较低的信息,可以只向第一用户推荐兴趣标签中每个标签对应的排名前几位的浏览词对应的信息即可。
例如,用户A的第一组兴趣标签包括A、B两个兴趣标签,其中A为“机器学习”,B为“足球”,先对兴趣标签进行第一次排序,排序的依据可以是用户设置的优先度,如用户A设定了A标签为重要的标签,B为次要的标签,则A兴趣标签应当排在B之前;也可以各个兴趣标签在各自领域中的热点程度,例如,当前“足球”领域中正在举办世界杯,而“机器学习”领域没有任何热点事件,则B标签应当排在A标签之前;当然,通过本实施例的介绍,本领域所属的技术人员能够根据实际情况,选择其他合适的排序方式,以满足实际情况的需要,在此就不再赘述了。
在本实施例中,设定A标签排在B标签之前。
接着,再将浏览词按照与兴趣标签的关联程度进行第二次排序,例如,A标签对应有10个浏览词,B标签对应有20个浏览词,则在本实施例中,可以先向用户推荐A标签对应的10个浏览词对应的信息,再向用户推荐B标签对应的20个浏览词对应的信息。
在具体实施过程中,由于A标签对应10个浏览词,所以在向用户A推荐A标签对应的10个浏览词对应的信息时,还可以先根据与A标签的关联程度对这10个浏览词进行排序,以A标签为例,设定“机器学习”标签对应的10个浏览词与A标签的关联程度由高到低为:“数据挖掘”、“深度学习”、“算法”、“learning”、“Google”、“豆瓣”、“研究生”、“ON”、“数据库”和“阿里”。则可以按照这10个浏览词与A标签关联程度,依次向用户A推荐该10个浏览词对应的信息。
当然,为了避免向用户A推荐与兴趣标签关联程度较低的信息,可以先只向用户A推荐A标签对应的关联程度排名前5位的浏览词对应的信息,再向用户推荐B标签对应的关联程度排名前5位的浏览词对应的信息,最后再向用户推荐剩余的浏览词对应的信息,在此就不再赘述了。
基于同一发明构思,本发明实施例另一方面还提供一种信息推荐的装置,包括:
获取单元,用于获取第一用户的第一社交账号,第一社交账号内包括第一组兴趣标签;
确定单元,用于基于兴趣标签与浏览词的关联关系,确定与第一组兴趣标签对应的第一组浏览词;
推荐单元,用于将第一组浏览词对应的信息推荐给第一用户。
在具体实施过程中,本发明实施例提供的装置还包括:
采集单元,用于在获取单元获取第一用户的第一社交账号之前,采集群体用户在使用其各自的至少一个社交账号时访问网络的群体用户浏览数据,至少一个社交账号中的每个社交账号至少包括一个兴趣标签;
提取单元,用于从浏览数据中提取出浏览词;
建立单元,用于建立兴趣标签和浏览词的关联关系。
在具体实施过程中,建立单元具体用于根据群体用户中的每个用户的浏览词与兴趣标签,进行单个用户的浏览词与兴趣标签的投票,并根据由多个单个用户构成的群体用户的投票数据,建立兴趣标签与浏览词的关联关系。在具体实施过程中,建立单元具体用于通过TF-IDF模型计算权重,进行浏览词与兴趣标签的投票。
在具体实施过程中,推荐单元具体用于将第一组浏览词对应的信息按照与第一组兴趣标签的关联度,按从高到低的顺序推荐给第一用户。
在具体实施过程中,推荐单元具体用于在第一组兴趣标签具体为多个兴趣标签时,将多个兴趣标签进行排序,获得第一排序结果,并按照第一排序结果中多个兴趣标签的排列顺序,将第一组浏览词所对应的信息推荐给第一用户。
在具体实施过程中,推荐单元具体用于在多个兴趣标签中任意一个兴趣标签对应M个浏览词时,其中M为大于等于2的整数,对M个浏览词进行排序,获得第二排序结果,并按照第二排序结果中M个浏览词的排列顺序,将M个浏览词对应的信息推荐给第一用户。
本发明实施例中的信息推荐的装置与前述实施例中的信息推荐的方法是基于同一发明构思下的两个方面,在前面已经对信息推荐的方法的实施过程做了详细的描述,所以本领域所属的技术人员可根据前述描述清楚地了解本实施例中的信息推荐的装置的结构及实施过程,为了说明书的简洁,在此就不再赘述了。
上述本发明实施例中的技术方案,至少具有如下的技术效果或优点:
1、由于采用了根据第一用户的第一社交账号的第一组兴趣标签,从兴趣标签与浏览词的关联关系中确定与第一组兴趣标签对应的第一组浏览词,最后将第一组浏览词推荐给第一用户的技术方案,避免了现有技术中个性化推荐系统会计算用户的临时兴趣、以及会根据用户的随意性较大的浏览行为计算用户的兴趣点而导致在推荐内容时的准确度较低的缺陷,实现了准确地为用户推荐长期感兴趣的内容的技术效果,提高了向用户推荐内容时的准确度。
2、由于在获取第一用户的第一社交账号后,即能够根据该第一用户的第一社交账号的第一组兴趣标签,为第一用户进行信息推荐,并且推荐的信息为根据第一组兴趣标签确定,在保证了准确度较高的同时不需要向用户询问兴趣点,也降低了直接为用户推荐当前热点信息如新闻、电影等等信息导致用户产生不满情绪的可能性,用户体验较好。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种信息推荐的方法,其特征在于,包括:
获取第一用户的第一社交账号,所述第一社交账号内包括第一组兴趣标签,所述第一组兴趣标签包括一个或多个兴趣标签;
基于兴趣标签与浏览词的关联关系,确定与所述第一组兴趣标签对应的第一组浏览词,所述第一组浏览词包括一个或多个浏览词;
将所述第一组浏览词对应的信息推荐给所述第一用户。
2.如权利要求1所述的方法,其特征在于,在所述获取第一用户的第一社交账号之前,还包括:
采集群体用户在使用其各自的至少一个社交账号时访问网络的浏览数据,所述至少一个社交账号中的每个社交账号至少包括一个兴趣标签;
从所述浏览数据中提取出所述浏览词;
建立所述兴趣标签和所述浏览词的关联关系。
3.如权利要求2所述的方法,其特征在于,所述建立所述兴趣标签和所述浏览词的关联关系,具体包括:
根据群体用户中的每个用户的浏览词与兴趣标签,进行单个用户的浏览词与兴趣标签的投票;
基于由所述多个单个用户构成的群体用户的投票数据,建立所述兴趣标签与所述浏览词的关联关系。
4.如权利要求3所述的方法,其特征在于,所述进行单个用户的浏览词与兴趣标签的投票,具体为:
通过频率逆文档频率(TF-IDF)模型计算权重,进行所述浏览词与所述兴趣标签的投票。
5.如权利要求1所述的方法,其特征在于,所述将所述第一组浏览词对应的信息推荐给所述第一用户,具体为:
将所述第一组浏览词对应的信息按照与所述第一组兴趣标签的关联度,按从高到低的顺序推荐给所述第一用户。
6.如权利要求5所述的方法,其特征在于,在所述第一组兴趣标签具体为多个兴趣标签时,所述将所述第一组浏览词对应的信息按照与所述第一组兴趣标签的关联度,按从高到低的顺序推荐给所述第一用户,具体包括:
将所述多个兴趣标签进行排序,获得第一排序结果;
按照所述第一排序结果中所述多个兴趣标签的排列顺序,将所述第一组浏览词所对应的信息推荐给所述第一用户。
7.如权利要求6所述的方法,其特征在于,在所述多个兴趣标签中任意一个兴趣标签对应M个浏览词时,其中M为大于等于2的整数,在将所述M个浏览词对应的信息推荐给所述第一用户时,所述方法还包括:
对所述M个浏览词进行排序,获得第二排序结果;
按照所述第二排序结果中所述M个浏览词的排列顺序,将所述M个浏览词对应的信息推荐给所述第一用户。
8.一种信息推荐的装置,其特征在于,包括:
获取单元,用于获取第一用户的第一社交账号,所述第一社交账号内包括第一组兴趣标签,所述第一组兴趣标签包括一个或多个兴趣标签;
确定单元,用于基于兴趣标签与浏览词的关联关系,确定与所述第一组兴趣标签对应的第一组浏览词,所述第一组浏览词包括一个或多个浏览词;
推荐单元,用于将所述第一组浏览词对应的信息推荐给所述第一用户。
9.如权利要求8所述的装置,其特征在于,所述装置还包括:
采集单元,用于在所述获取单元获取第一用户的第一社交账号之前,采集群体用户在使用其各自的至少一个社交账号时访问网络的浏览数据,所述至少一个社交账号中的每个社交账号至少包括一个兴趣标签;
提取单元,用于从所述浏览数据中提取出所述浏览词;
建立单元,用于建立所述兴趣标签和所述浏览词的关联关系。
10.如权利要求9所述的装置,其特征在于,所述建立单元具体用于根据群体用户中的每个用户的浏览词与兴趣标签,进行单个用户的浏览词与兴趣标签的投票,并根据由所述多个单个用户构成的群体用户的投票数据,建立所述兴趣标签与所述浏览词的关联关系。
11.如权利要求10所述的装置,其特征在于,所述建立单元具体用于通过TF-IDF模型计算权重,进行所述浏览词与所述兴趣标签的投票。
12.如权利要求8所述的装置,其特征在于,所述推荐单元具体用于将所述第一组浏览词对应的信息按照与所述第一组兴趣标签的关联度,按从高到低的顺序推荐给所述第一用户。
13.如权利要求12所述的装置,其特征在于,所述推荐单元具体用于在所述第一组兴趣标签具体为多个兴趣标签时,将所述多个兴趣标签进行排序,获得第一排序结果,并按照所述第一排序结果中所述多个兴趣标签的排列顺序,将所述第一组浏览词所对应的信息推荐给所述第一用户。
14.如权利要求13所述的装置,其特征在于,所述推荐单元具体用于在所述多个兴趣标签中任意一个兴趣标签对应M个浏览词时,其中M为大于等于2的整数,对所述M个浏览词进行排序,获得第二排序结果,并按照所述第二排序结果中所述M个浏览词的排列顺序,将所述M个浏览词对应的信息推荐给所述第一用户。
CN201410410168.XA 2014-08-19 2014-08-19 一种信息推荐的方法以及装置 Pending CN104199872A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410410168.XA CN104199872A (zh) 2014-08-19 2014-08-19 一种信息推荐的方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410410168.XA CN104199872A (zh) 2014-08-19 2014-08-19 一种信息推荐的方法以及装置

Publications (1)

Publication Number Publication Date
CN104199872A true CN104199872A (zh) 2014-12-10

Family

ID=52085165

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410410168.XA Pending CN104199872A (zh) 2014-08-19 2014-08-19 一种信息推荐的方法以及装置

Country Status (1)

Country Link
CN (1) CN104199872A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446218A (zh) * 2016-09-30 2017-02-22 北京奇虎科技有限公司 推荐数据的方法及装置
CN107104875A (zh) * 2016-02-22 2017-08-29 腾讯科技(深圳)有限公司 信息推送的方法和装置
CN107124451A (zh) * 2017-04-18 2017-09-01 腾讯科技(深圳)有限公司 应用资源的获取方法及装置
CN107992531A (zh) * 2017-11-21 2018-05-04 吉浦斯信息咨询(深圳)有限公司 基于深度学习的新闻个性化智能推荐方法与系统
CN108346066A (zh) * 2018-01-19 2018-07-31 广东欧珀移动通信有限公司 广告推送方法、装置、服务器及存储介质
CN108536702A (zh) * 2017-03-02 2018-09-14 腾讯科技(深圳)有限公司 一种相关实体确定方法、装置及计算设备
CN109493199A (zh) * 2019-01-04 2019-03-19 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质
CN110020178A (zh) * 2017-12-30 2019-07-16 中国移动通信集团辽宁有限公司 兴趣点识别方法、装置、设备及存储介质
CN110110207A (zh) * 2018-01-18 2019-08-09 北京搜狗科技发展有限公司 一种信息推荐方法、装置及电子设备
CN110413882A (zh) * 2019-07-15 2019-11-05 阿里巴巴集团控股有限公司 信息推送方法、装置及设备
CN110704578A (zh) * 2019-10-09 2020-01-17 精硕科技(北京)股份有限公司 关联关系确定方法、装置、电子设备及可读存储介质
CN110866805A (zh) * 2019-11-13 2020-03-06 第四范式(北京)技术有限公司 一种推荐对象的方法和系统
CN111026968A (zh) * 2019-12-09 2020-04-17 湖南快乐阳光互动娱乐传媒有限公司 对象推送方法、装置及系统
CN111291263A (zh) * 2020-01-22 2020-06-16 京东数字科技控股有限公司 数据推送方法、装置、系统及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN103778260A (zh) * 2014-03-03 2014-05-07 哈尔滨工业大学 一种个性化微博信息推荐系统和方法
WO2014071782A1 (zh) * 2012-11-09 2014-05-15 腾讯科技(深圳)有限公司 用户兴趣推荐方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
WO2014071782A1 (zh) * 2012-11-09 2014-05-15 腾讯科技(深圳)有限公司 用户兴趣推荐方法和装置
CN103778260A (zh) * 2014-03-03 2014-05-07 哈尔滨工业大学 一种个性化微博信息推荐系统和方法

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107104875A (zh) * 2016-02-22 2017-08-29 腾讯科技(深圳)有限公司 信息推送的方法和装置
CN107104875B (zh) * 2016-02-22 2020-08-25 腾讯科技(深圳)有限公司 信息推送的方法和装置
CN106446218A (zh) * 2016-09-30 2017-02-22 北京奇虎科技有限公司 推荐数据的方法及装置
CN108536702A (zh) * 2017-03-02 2018-09-14 腾讯科技(深圳)有限公司 一种相关实体确定方法、装置及计算设备
CN108536702B (zh) * 2017-03-02 2022-12-02 腾讯科技(深圳)有限公司 一种相关实体确定方法、装置及计算设备
CN107124451B (zh) * 2017-04-18 2020-09-01 腾讯科技(深圳)有限公司 应用资源的获取方法及装置
CN107124451A (zh) * 2017-04-18 2017-09-01 腾讯科技(深圳)有限公司 应用资源的获取方法及装置
CN107992531A (zh) * 2017-11-21 2018-05-04 吉浦斯信息咨询(深圳)有限公司 基于深度学习的新闻个性化智能推荐方法与系统
CN110020178A (zh) * 2017-12-30 2019-07-16 中国移动通信集团辽宁有限公司 兴趣点识别方法、装置、设备及存储介质
CN110110207A (zh) * 2018-01-18 2019-08-09 北京搜狗科技发展有限公司 一种信息推荐方法、装置及电子设备
CN110110207B (zh) * 2018-01-18 2023-11-03 北京搜狗科技发展有限公司 一种信息推荐方法、装置及电子设备
CN108346066A (zh) * 2018-01-19 2018-07-31 广东欧珀移动通信有限公司 广告推送方法、装置、服务器及存储介质
CN109493199A (zh) * 2019-01-04 2019-03-19 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质
CN110413882A (zh) * 2019-07-15 2019-11-05 阿里巴巴集团控股有限公司 信息推送方法、装置及设备
CN110413882B (zh) * 2019-07-15 2023-10-31 创新先进技术有限公司 信息推送方法、装置及设备
CN110704578B (zh) * 2019-10-09 2022-08-09 北京秒针人工智能科技有限公司 关联关系确定方法、装置、电子设备及可读存储介质
CN110704578A (zh) * 2019-10-09 2020-01-17 精硕科技(北京)股份有限公司 关联关系确定方法、装置、电子设备及可读存储介质
CN110866805A (zh) * 2019-11-13 2020-03-06 第四范式(北京)技术有限公司 一种推荐对象的方法和系统
CN111026968A (zh) * 2019-12-09 2020-04-17 湖南快乐阳光互动娱乐传媒有限公司 对象推送方法、装置及系统
CN111291263A (zh) * 2020-01-22 2020-06-16 京东数字科技控股有限公司 数据推送方法、装置、系统及存储介质
CN111291263B (zh) * 2020-01-22 2023-11-03 京东科技控股股份有限公司 数据推送方法、装置、系统及存储介质

Similar Documents

Publication Publication Date Title
CN104199872A (zh) 一种信息推荐的方法以及装置
CN105989074B (zh) 一种通过移动设备信息进行推荐冷启动的方法和装置
US9858308B2 (en) Real-time content recommendation system
WO2015188699A1 (zh) 推荐项目的方法和装置
CN103455522B (zh) 应用程序扩展工具推荐方法及系统
CN104111941B (zh) 信息展示的方法及设备
CN107862022B (zh) 文化资源推荐系统
CN103870538B (zh) 针对用户进行个性化推荐的方法、用户建模设备及系统
US10402479B2 (en) Method, server, browser, and system for recommending text information
CN105824911B (zh) 基于lda用户主题模型的视频推荐方法
CN110428298A (zh) 一种店铺推荐方法、装置及设备
CN110704674A (zh) 一种视频播放完整度预测方法及装置
CN104636371A (zh) 信息推荐方法及设备
CN103886090A (zh) 基于用户喜好的内容推荐方法及装置
CN106168980A (zh) 多媒体资源推荐排序方法及装置
CN103942712A (zh) 基于产品相似度的电子商务推荐系统及其方法
CN108959329B (zh) 一种文本分类方法、装置、介质及设备
CN103020845A (zh) 一种移动应用的推送方法及系统
CN105243087A (zh) It资讯聚合阅读个性化推荐方法
CN104021140B (zh) 一种网络视频的处理方法及装置
WO2014194689A1 (en) Method, server, browser, and system for recommending text information
CN103577478A (zh) 网页推送方法及系统
CN107578263A (zh) 一种广告异常访问的检测方法、装置和电子设备
CN107369058A (zh) 一种关联推荐方法及服务器
CN111639255B (zh) 搜索关键词的推荐方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20141210