CN103888466A - 用户兴趣发现方法和装置 - Google Patents

用户兴趣发现方法和装置 Download PDF

Info

Publication number
CN103888466A
CN103888466A CN201410124527.5A CN201410124527A CN103888466A CN 103888466 A CN103888466 A CN 103888466A CN 201410124527 A CN201410124527 A CN 201410124527A CN 103888466 A CN103888466 A CN 103888466A
Authority
CN
China
Prior art keywords
user
access
netwoks
classification
behavioral data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410124527.5A
Other languages
English (en)
Other versions
CN103888466B (zh
Inventor
李达
郭奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201410124527.5A priority Critical patent/CN103888466B/zh
Publication of CN103888466A publication Critical patent/CN103888466A/zh
Application granted granted Critical
Publication of CN103888466B publication Critical patent/CN103888466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了用户兴趣发现方法和装置,其中的一种用户兴趣发现方法包括:向网络侧发送用户的兴趣信息请求,并接收网络侧根据所述请求返回的用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区;接收用户针对话题选择区输入的话题选择信息,并根据所述话题选择信息确定用户选择的类别和实体词;将用户选择的类别和实体词传输至网络侧,所述用户选择的类别和实体词用于网络侧修正网络侧预先存储的所述用户的兴趣信息。本发明提供的技术方案可以进一步准确的确定出用户兴趣。

Description

用户兴趣发现方法和装置
技术类别 
本发明涉及网络访问技术领域,具体涉及用户兴趣发现方法以及相应的用户兴趣发现装置。 
背景技术
个性化信息推荐技术由于其能够使网络侧向用户下发符合用户兴趣的信息,因此,个性化信息推荐技术可以有效提高网络资源的点击量和阅读量。有鉴于此,个性化信息推荐技术逐渐在网络访问中得到越来越多的应用。 
在个性化信息推荐技术中,准确及时的发现用户兴趣是该技术中的一个非常重要的环节。 
现有的用户兴趣发现方式主要包括两种,即一种方式为引导用户主动将其兴趣告知网络侧;而另一种方式为自动发现用户兴趣,即根据用户的行为信息(即用户的网络访问行为数据)发现用户兴趣;其中,上述用户的行为信息可以包括:用户浏览过的网页的信息、用户搜索过的关键词、用户发表的微博的信息、用户发表的博客(blog)的信息以及用户购买的商品等等。 
目前,根据用户的行为信息发现用户兴趣的具体实现方式通常为:在用户阅读一篇文档或者阅读网页等内容时,确定出该文档所属的类别,从而可以将该类别确定为用户的兴趣;当然,也可以进一步将该用户所涉足的多个类别进行比对,将用户涉足最多的一个或者两个类别确定为用户的兴趣。 
发明人在实现本发明过程中发现,现有的发现用户兴趣的实现方式易产生误判现象,下面举两个具体的例子进行说明: 
第一个具体的例子,用户阅读某一内容有时是存在干扰性因素的,而依据该干扰性因素所发现的用户兴趣很可能并不是用户真正的兴趣;如某一类别是热门类别,从而用户阅读该类别的内容的机会往往更多,然而,这并不代表用户对该类别真正感兴趣;再如,由于弹窗推送或者用户被标题误导会引发用户浏览相关内容,然而,用户浏览的这些内容并不能表示出用户真正的兴趣所在。 
第二个具体的例子,用户的阅读可能会表现出其浅度且暂时的兴趣,而如果根据用户阅读的这部分内容将用户浅度且暂时的兴趣识别为用户真正的兴趣,则产生用户兴趣的误判;如用户在看一部电视剧的过程中,有时会对电视剧中的演员进行搜索,以阅读了一些有关于该演员的介绍信息,用户的这种阅读行为通常并不具有高阅读量以及持续发生的特点,如果据此识别出用户对该 演员感兴趣,并向用户推送与该演员相关的信息显然并不合适。 
发明内容
本发明的目的在于,克服现有的用户兴趣发现方式所存在的技术问题,提供一种用户兴趣发现方法以及相应的用户兴趣发现装置,所要解决的技术问题是,进一步准确的确定出用户兴趣。 
本发明的目的以及解决其技术问题可以采用以下的技术方案来实现。 
依据本发明提出的一种用户兴趣发现方法,包括:向网络侧发送用户的兴趣信息请求,并接收网络侧根据所述请求返回的用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区;接收用户针对话题选择区输入的话题选择信息,并根据所述话题选择信息确定用户选择的类别和实体词;将用户选择的类别和实体词传输至网络侧,所述用户选择的类别和实体词用于网络侧修正网络侧预先存储的所述用户的兴趣信息。 
依据本发明提出的一种用户兴趣发现装置,包括:请求模块,用于向网络侧发送用户的兴趣信息请求,并接收网络侧根据所述请求返回的用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;显示模块,用于将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区;确定模块,用于接收用户针对话题选择区输入的话题选择信息,并根据所述话题选择信息确定用户选择的类别和实体词;传输模块,用于将用户选择的类别和实体词传输至网络侧,所述用户选择的类别和实体词用于网络侧修正网络侧预先存储的所述用户的兴趣信息。 
依据本发明提出的另一种用户兴趣发现方法,包括:接收用户的兴趣信息请求,并根据预先存储的兴趣信息向用户的网络终端设备返回所述用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;接收来自所述网络终端设备的所述用户选择的类别和实体词;根据所述用户选择的类别和实体词对所述预先存储的兴趣信息中的所述用户的兴趣信息进行修正。 
依据本发明提出的另一种用户兴趣发现装置,包括:请求响应模块,用于接收用户的兴趣信息请求,并根据预先存储的兴趣信息向用户的网络终端设备返回所述用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;接收模块,用于接收来自所述网络终端设备的所述用户选择的类别和实体词;修正模块,用于根据所述用户选择的类别和实体词对所述预先存储的兴趣信息中的所述用户的兴趣信息进行修正。 
借由上述技术方案,本发明提供的用户兴趣发现方法和装置至少具有下列优点及有益效果:本发明实施例通过将网络侧传输来的用户的兴趣信息显示在话题选择区,使用户可以选择其感兴趣的类别和实体词,这样,网络侧可以根据用户选择的类别和实体词修正其存储的用户的兴趣信息;从而本发明可以更加准确的确定出用户感兴趣的类别和实体词,最终可以更为精准的为用户下发其真正感兴趣的内容。 
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述以及其他目的、特征和优点能够更明显易懂,以下特举较佳的实施例,详细说明如下。 
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。 
图1是本发明实施例提供的用户兴趣发现方法流程图; 
图2是本发明实施例提供的网络侧设置用户的兴趣信息的流程图; 
图3是本发明实施例提供的网络侧设置用户的兴趣信息的框架示意图; 
图4是本发明实施例提供的用户兴趣发现装置示意图; 
图5是本发明实施例提供的设置于网络侧的用户兴趣发现装置示意图。 
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,说明书所描述的实施例仅仅是本发明部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员依次所获得的、而没有经过创造性劳动付出的其他实施例,都属于本发明保护的范围。 
实施例一、用户兴趣发现方法。该用户兴趣发现方法的流程以及示意如图1所示。 
S100、向网络侧发送用户的兴趣信息请求,并接收网络侧根据该请求返回的用户的兴趣信息。 
具体的,用户的网络终端设备可以在用户启动相应的应用(如话题推荐应用或者浏览器客户端等)时,产生承载有用户标识的用户的兴趣信息请求,并向网络侧发送该用户的兴趣信息请求。该用户的兴趣信息请求可以为基于 HTTP(HTTP-Hypertext transfer protocol,超文本转移协议)的消息等。 
上述用户标识应为可以唯一标识出一个用户的信息,如该用户标识可以为浏览器客户端标识等。 
S110、网络侧接收用户的兴趣信息请求,并根据预先存储的兴趣信息向用户的网络终端设备返回所述用户的兴趣信息。 
具体的,网络侧预先存储有网络中多个用户的兴趣信息,如网络侧预先存储有网络中多个用户的用户标识与类别和实体词的对应关系信息。网络侧在接收到网络终端设备传输来的用户的兴趣信息请求后,从该用户的兴趣信息请求中获取用户标识,然后,从其存储的兴趣信息中查找该用户标识对应的兴趣信息(包括类别和实体词),并将查找到的全部兴趣信息或者查找到的部分兴趣信息返回给用户的网络终端设备。 
在网络侧查找到的该用户的全部兴趣信息的数量较多时,可以从该用户的全部兴趣信息中选取部分兴趣信息,如按照用户感兴趣的程度选取用户最感兴趣的多个兴趣信息。上述数量较多可以是指类别数量较多(如查找到的全部兴趣信息中的类别的数量超过第一预定值,第一预定值的取值可以根据实际画面的布局设计来决定,如第一预定值为20),也可以是指类别下的实体词数量较多(如查找到的兴趣信息中的某个类别所对应的实体词的数量超过第二预定值,同样的,第二预定值的取值可以根据实际画面的布局设计来决定,如第二预定值为20)。也就是说,网络侧选取的部分兴趣信息可以是网络侧从查找到的全部类别中选取的部分类别,也可以是网络侧从查找到的某个类别的全部实体词中选取的部分实体词。 
网络侧预先存储的网络中多个用户的兴趣信息可以是网络侧对其采集到的多个用户的网络访问行为数据进行分析而获得并存储的,且网络侧存储的各用户的兴趣信息可以基于后续采集到的各用户的网络访问行为数据通过离线方式或者在线方式而更新。 
另外,需要特别说明的是,在网络侧查找到的该用户的全部兴趣信息的数量较少或者没有查找到该用户的兴趣信息等情况下,网络侧可以为该用户添加一些兴趣信息,如在查找到的用户的兴趣信息的数量较少的情况下,网络侧将与该用户具有相同类别兴趣的其他用户的该类别下的该用户所不具有的实体词添加在该用户的该类别下。网络侧可以将为该用户添加的实体词作为该用户感兴趣的实体词存储在相应的类别下。网络侧可以对上述添加的实体词进行特别标注,以便于后续网络侧对该实体词的删减处理;再如,在没有查找到该用户的兴趣信息的情况下,网络侧可以将类似于当前热门类别中的热门实体词等类别和实体词信息作为该用户的兴趣信息,也可以通过IP地址来确定用户进 一步的兴趣信息,如所在地理区域(例如北京市五道口地区)可对应消费水平和对邻近地信息感兴趣,甚至进一步地确定用户所在行业(如位于搜狐网络大厦的地址推断在互联网行业)对应消费倾向和对行业相关信息感兴趣,或者可以通过用户之前在网络上留下的访问痕迹,如发表的微博,论坛的留言等信息来辅助确定用户的兴趣信息。 
一个具体的例子,网络侧可以将网络中与该用户兴趣最相近的用户分拣出来,然后,将分拣出来的用户的某些感兴趣的实体词抽取出来,这些抽取出来的实体词可以下发给用户,从而本实施例可以形成一种群体个性化的概念。 
一个更具体的例子,用户喜欢娱乐类别(也可以称为娱乐话题),且经常关注范冰冰和黄晓明这两个实体词,从而网络侧会在其存储多个用户的兴趣信息中查找同样关注这两个实体词的其他用户,其他用户形成一个用户群,如果该用户群中关注赵薇这一实体词的阈值达到了预定指标,则可以将赵薇这个实体词一起下发给该用户,且网络侧可以在其存储的兴趣信息中为该用户增加相应的实体词。 
网络侧设置并存储各用户的兴趣信息的过程的一个具体的例子如下述实施例二中的描述,在此不再详细说明。 
S120、将接收到的用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区。 
具体的,网络终端设备在用户启动上述应用后会为用户显示相应的话题选择画面;在网络终端设备第一次为用户显示相应的话题选择画面的情况下,该话题选择画面可以称为冷启动页面,即在从未获得过用户选择的类别和实体词的情况下,为用户展示的话题选择画面为冷启动页面。 
为用户显示的话题选择画面上包含有话题选择区,且该画面上还可以包含有产品说明区,该产品说明区中的内容通常不能够被用户所点选,产品说明区主要用于展示预定数量的实体词的说明信息,产品说明区还可以用于展示预定数量的类别的说明信息,另外,产品说明区还可以用于展示本应用的说明信息等;产品说明区可以使用户充分了解本应用中的话题选择的功能等。 
用户的网络终端设备在接收到网络侧下发的用户的兴趣信息后,将用户的兴趣信息展示在该话题选择区。用户的兴趣信息在话题选择区的展示方式可以多种形式,如在话题选择区显示接收到的兴趣信息中所有的类别,在用户点击某个类别时,以弹窗的形式展示接收到的兴趣信息中该类别所对应的所有实体词;再如在话题选择区同时显示接收到的兴趣信息中的所有的类别以及类别所对应的实体词。 
S130、接收用户针对话题选择区输入的话题选择信息,并根据话题选择信 息确定用户选择的类别和实体词。 
具体的,用户可以通过在话题选择区中相应位置的点击来选择类别或者选择实体词;如果用户通过点击选择了某个类别,然而并没有选择该类别下的实体词,则可以认为用户选择了该类别以及该类别下的所有实体词;如果用户通过点击选择了某个类别下的一个或者多个实体词,则可以认为用户选择了该类别以及该类别下的一个或者多个实体词。 
S140、将用户选择的类别和实体词传输至网络侧,这里的用户选择的类别和实体词主要用于网络侧修正其预先存储的该用户的兴趣信息。 
具体的,用户的网络终端设备可以将用户选择的类别和实体词通过基于HTTP的消息等传输至网络侧。 
S150、网络侧接收来自网络终端设备的用户选择的类别和实体词,且网络侧根据接收到的类别和实体词来修正其预先存储的该用户的兴趣信息。 
具体的,网络侧修正用户的兴趣信息的一个例子为:如果网络侧为该用户添加了其他用户感兴趣的实体词并没有被用户所选择,则网络侧应删除上述为用户添加的实体词;如果网络侧为该用户添加了其他用户感兴趣的实体词被用户所选择,则网络侧应保留上述为用户添加的实体词,并去除为该实体词设置的用于表示该实体词为基于其他用户感兴趣的实体词而为用户添加的实体词的特别标记;例如,用户对足球类别中的实体词C罗感兴趣,然而,用户并没有选择网络侧为其推荐的与C罗相关的实体词,则网络侧应将与C罗相关的实体词删除。 
网络侧根据接收到的类别和实体词来修正其预先存储的该用户的兴趣信息的另一个例子为:网络侧根据用户选择的类别和实体词增强其存储的用户对该类别和/或实体词的感兴趣程度,同时,网络侧根据用户未选择的类别和实体词减弱其存储的用户对该类别和/或实体词的感兴趣程度。 
网络侧根据接收到的类别和实体词来修正其预先存储的该用户的兴趣信息的再一个例子为:网络侧确定与用户选择的实体词相关的其他实体词,在网络侧存储的用户的感兴趣信息中包含有上述其他实体词的情况下,网络侧增强用户对上述其他实体词的感兴趣程度;在网络侧存储的用户的感兴趣信息中没有包含上述其他实体词的情况下,网络侧将上述其他实体词存储在用户的感兴趣信息中,并相应设置用户对其他实体词的感兴趣程度。 
网络侧可以根据群体个性化的概念来找到与某实体词相关的其他实体词。具体地,网络侧可以将网络中与该用户兴趣最相近的用户分拣出来,然后,将分拣出来的用户的某些感兴趣的实体词抽取出来,这些抽取出来的实体词可以下发给用户,从而本实施例可以形成一种群体个性化的概念。 
一个更具体的例子:用户选择了“赵薇”这个实体词,则网络侧首先会增强用户对“赵薇”这个实体词感兴趣的程度;其次,网络侧会增强用户对“赵薇”所属的“娱乐”这个类别的感兴趣程度;还有,在用户的感兴趣信息中包含有属于“娱乐”类别的与“赵薇”相关的其他实体词(如“黄晓明”)(网络侧会在其存储多个用户的兴趣信息中查找关注赵薇这个实体词的其他用户,其他用户形成一个用户群,如果该用户群中关注黄晓明这一实体词的阈值达到了预定指标,则可以确定黄晓明为赵薇的其他实体词)的情况下,网络侧增强用户对上述其他实体词的感兴趣程度;在用户的感兴趣信息中没有包含有属于“娱乐”类别的与“赵薇”相关的其他实体词(如“黄晓明”)的情况下,网络侧将上述其他实体词作为用户感兴趣的实体词添加“娱乐”类别下,并相应设置新增加的实体词的感兴趣程度。实施例二、用户兴趣发现方法。该用户兴趣发现方法的流程以及示意如图2和图3所示。 
图2中,S200、采集用户的网络访问行为数据。 
具体的,本实施例中的用户的网络访问行为数据包括:用户浏览过的网页的信息、用户搜索过的关键词、用户发表的微博的信息(如从微博中提取出的至少一个关键词等)、用户发表的博客的信息(如从博客中提取出的至少一个关键词等)以及用户购买的商品的信息等等。上述网络访问行为数据还可以包括用户进行网络访问行为的时间信息,如用户激活浏览器客户端的时间、用户关闭浏览器客户端的时间、用户登录网络的时间、用户浏览网页的时间、用户搜索关键词的时间、用户发表微博的时间、用户发表博客的时间以及用户购买商品的时间等等。上述用户进行网络访问行为的时间信息可以用于后续的访问频度以及访问间隔等的计算。 
本实施例可以利用用户的网络终端设备中的浏览器客户端来采集用户的网络访问行为数据。一个具体的例子,用户的网络终端设备中的浏览器客户端可以方便的获取到用户执行网络访问操作的相关信息,即用户的网络访问行为数据,这样,浏览器客户端可以根据其内部预先设定的网络设备地址,将其采集到的用户的网络访问行为数据传输给相应的网络设备(如浏览器服务器端所在的网络设备或者其他设备),从而使相应的网络设备可以方便的采集到用户的网络访问行为数据。需要特别说明的是,本实施例在进行用户的网络访问行为数据的传输过程中,浏览器客户端还应将其标识信息随网络访问行为数据一起传输至相应的网络设备,这样,网络设备可以基于浏览器客户端的标识信息来确定出其接收到的网络访问行为数据所对应的用户;也就是说,在本实施例中,用户可以使用浏览器客户端的标识信息来表示。 
浏览器客户端可以将其采集到的网络访问行为数据实时传输给相应的网 络设备,浏览器客户端也可以将其采集到的网络访问行为数据定时或者不定时的传输给相应的网络设备,例如每到整点时刻,浏览器客户端将其采集并本地存储的由用户在前一小时中所进行的网络访问操作而产生的网络访问行为数据传输给相应的网络设备,在成功传输后,浏览器客户端删除上述本地存储的已经成功传输至相应的网络设备的网络访问行为数据;再例如,浏览器客户端在其采集并本地存储的网络访问行为数据达到预定数量(如采集并本地存储的网络访问行为数据所占用的存储空间达到预定存储空间大小)时,将本地存储的所有网络访问行为数据传输给相应的网络设备,并在成功传输后,浏览器客户端删除上述本地存储的已经成功传输至相应的网络设备的网络访问行为数据。 
本实施例也可以利用API(Application Programming Interface,应用程序接口)从网络侧来采集用户的网络访问行为数据。在利用API从网络侧来采集用户的网络访问行为数据的情况下,本实施例可以获取到用户更多的网络访问行为数据,如本实施例可以利用API获取到在浏览器客户端开始向网络设备上报网络访问行为数据之前用户执行的网络访问所产生并存储在网络侧的网络访问行为数据(该数据可以用于进行针对全网用户的群体数据分析),也就是说,在浏览器客户端在被配置为获取用户的网络访问行为数据并向相应的网络设备发送网络访问行为数据之前,用户利用该浏览器客户端所执行的网络访问操作对应的网络访问行为数据可以通过API采集。 
利用API采集用户的网络访问行为数据的第一个具体的例子为:网络设备(如浏览器服务器端所在的网络设备等)在接收到浏览器客户端通过其所在的网络终端设备传输来的信息时,立即判断其接收到的信息中是否包含有微博或者博客等的登录信息,如果网络设备判断出其接收到的信息中包含有登录信息,则网络设备从登录信息中获取登录用户的登录账户信息,并利用API从相应的服务器中获取登录用户利用其登录账号所发表的内容(如登录用户发表的博客或者微博等内容),然后,网络设备针对其获取的内容进行提取关键词等处理,从而网络设备采集到用户(即浏览器客户端标识所表示的用户)的网络访问行为数据;其中,利用API获取登录用户利用其登录账号所发表的内容并不仅限于登录用户利用其登录账号本次发表的内容,还可以包括登录用户利用其登录账号在之前一段时间(如当前时间的前一个月)所发表的内容。 
利用API采集用户的网络访问行为数据的第二个具体的例子为:网络设备根据预先设定的时间(如每天的凌晨)定时的针对其在预定时间间隔(如24小时)内接收到的所有浏览器客户端通过其网络终端设备传输来的所有信息进行集中分析,以从其接收到的所有信息中识别出包含有微博或者博客等的登录 信息的信息,然后,网络设备根据这些识别出的信息中所包含的登录用户的登录信息利用API从相应的服务器(如微博或者博客等对应的服务器)中获取各登录用户利用其登录账号所发表的内容(如登录用户发表的博客或者微博等内容),之后,网络设备针对其获取的内容进行提取关键词等处理,从而网络设备采集到用户(即浏览器客户端标识所表示的用户)的网络访问行为数据;其中,利用API获取登录用户利用其登录账号所发表的内容并不仅限于登录用户利用其登录账号本次发表的内容,还可以包括登录用户利用其登录账号在之前一段时间(如当前时间的前一个月)所发表的内容。 
需要说明的是,在上述第一个具体的例子和第二个具体的例子中,如果一台网络终端设备存在多人使用的情况,则来自该网络终端设备中的浏览器客户端的多条信息中可能会包括多个不同的登录用户的登录信息;在该情况下,本实施例可以将来自一台网络终端设备中的浏览器客户端的多条信息中的多个不同的登录用户的登录信息分别对应的内容中的关键词都作为一个用户(即浏览器客户端标识所表示的用户)的网络访问行为数据,也就是说,不对登录用户进行区分;当然,本实施例也可以将来自一台网络终端设备中的浏览器客户端的多条信息中的多个不同的登录用户中的其中一个登录用户的登录信息对应的内容中的关键词作为一个用户(即浏览器客户端所表示的用户)的网络访问行为数据,也就是说,本实施例可以对登录用户进行区分;例如,本实施例可以将多个登录用户中登录次数最多的一个登录用户的登录信息对应的内容中的关键词作为本实施例中的用户(即浏览器客户端所表示的用户)的网络访问行为数据,而对其他登录用户的登录信息不进行获取相应内容以及提取关键词等的处理操作,即将登录次数最多的一个登录用户与浏览器客户端标识所表示的用户相关联。 
本实施例还可以采用除上述两种例举的利用浏览器客户端采集方式以及API采集方式之外的其他方式来获取用户的网络访问行为数据。另外,本实施例中的用户的网络终端设备可以是用户的计算机或者智能移动电话或者平板电脑等可以进行网络访问的网络终端设备。 
S210、根据网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定上述步骤采集到的网络访问行为数据所属的类别。 
具体的,本实施例可以预先将每个类别表示为由一系列的实体词构成的一个向量,针对网络设备接收到的一网络访问行为数据而言,网络设备可以先将该网络访问行为数据所包含的实体词(如包含一个或者多个实体词)通过预定算法计算出一向量,然后,通过预定的距离函数度量该网络访问行为数据所对应的向量与各类别对应的向量之间的距离,之后,根据度量出的各距离确定出 上述接收到的网络访问行为数据所属的类别(如将距离最近的类别确定为该网络访问行为数据所属的类别)。 
本实施例也可以采用其他方式来确定上述采集到的网络访问行为数据所属的类别,在此不再一一例举说明。 
S220、根据网络访问行为数据对应的多个维度上的属性信息计算网络访问行为数据的权重值。 
具体的,本实施例中的网络访问行为数据对应有多个维度(这里的维度也可以称为统计维度),且在每一个维度上均对应有相应的属性信息,该属性信息并不表示网络访问行为数据在其对应的维度上所固有的属性,而是一种由于用户的访问行为而使其在维护上所具有的临时属性。 
一个具体的例子,本实施例中的网络访问行为数据对应的多个维度上的属性信息可以包括:网络访问行为数据所属类别的触达次数、网络访问行为数据所属类别的访问频度、产生该网络访问行为数据的访问方式以及网络访问行为数据所对应的内容资源的信息质量。 
另一个具体的例子,本实施例中的网络访问行为数据对应的多个维度上的属性信息可以包括:网络访问行为数据所属类别的触达次数、网络访问行为数据所属类别的访问间隔、产生该网络访问行为数据的访问方式以及网络访问行为数据所对应的内容资源的信息质量。 
再一个具体的例子,本实施例中的网络访问行为数据对应的多个维度上的属性信息可以包括:网络访问行为数据所属类别的触达次数、网络访问行为数据所属类别的访问频度、网络访问行为数据所属类别的访问间隔、产生该网络访问行为数据的访问方式以及网络访问行为数据所对应的内容资源的信息质量。 
其中,上述网络访问行为数据所属类别的触达次数表示用户对该类别的触达次数,也就是说,在一个类别范围内,如果对该类别的所有网络访问行为数据的触达进行顺序计次的话,则该网络访问行为数据对应的顺序计次值即为该网络访问行为数据所属类别的触达次数。上述网络访问行为数据所属类别的触达次数可以由网络设备来设置。 
其中,上述网络访问行为数据所属类别的访问频度表示用户对该类别的访问频度,也就是说,在一个类别范围内,如果将该类别中的每一条网络访问行为数据均作为用户对该类别的一次访问,则在将该网络访问行为数据实时纳入到对该类别的访问频度的计算时所获得的访问频度值可以作为该网络访问行为数据所述类别的访问频度。上述网络访问行为数据所属类别的访问频度可以由网络设备来计算并设置。触达次数和访问频度之间是存在关系的,如在一段 时间内的触达次数越多,则访问频度会越高,一个具体的例子,如果用户经常看NBA新闻,则实体词NBA的触达次数会很多,与此同时,实体词NBA在时间维度上所表现出的访问频度也会越高。 
其中,上述产生该网络访问行为数据的访问方式是指用户在进行相应的网络访问而产生该网络访问行为数据时所采用的具体的访问方式,如网络访问行为数据是用户由于主动访问而产生的(如主动打开浏览器客户端并在地址栏中输入相应的URL的网页浏览以及主动搜索关键词的网页浏览等),还是用户由于点击推送的弹窗或者网页中的内容而产生的。上述产生该网络访问行为数据的访问方式可以由浏览器客户端来设置,并随网络访问行为数据一起传输至网络设备。 
其中,上述网络访问行为数据所对应的内容资源的信息质量可以在一定程度上表示出相应的内容资源的专业程度,内容资源的信息质量可以利用该内容资源所属类别中至少一个高端用户对该网络访问行为数据所对应的内容资源的访问情况来确定;这里的高端用户可以为已经被确定为对该类别(上述接收到的网络访问行为数据所属的类别)具有兴趣的用户(也可以称为该类别中的资深用户)。一个具体的例子,本实施例可以根据网络访问行为数据所对应的内容资源是否被相应类别中的一个或多个高端用户所访问和/或被相应类别中的所有高端用户所访问的次数等相关信息来决定该网络访问行为数据所对应的内容资源在信息质量上的具体取值。上述网络访问行为数据所对应的内容资源的信息质量可以由网络设备来设置。另外,上述高端用户也可以为不但被确定为对该类别具有兴趣且还应对该类别的兴趣达到发烧程度的用户,如在用户对内容资源所属类别的关注度不但达到相应的兴趣阈值,而且还达到预定阈值的情况下,该用户被确定为该类别的高端用户,该预定阈值高于网络资源所属类别对应的兴趣阈值;再如,在用户对内容资源所属类别的关注度不但达到相应的兴趣阈值,而且该用户还对预定网站进行过访问,则可以将该用户确定为高端用户;上述预定网站通常为专业性较强的网站。 
其中,上述网络访问行为数据所属类别的访问间隔表示用户对该类别的访问间隔;即在用户的多次上网过程中,对一类别的前一次访问和对该类别的下一次访问之间间隔的用户上网次数;这里的上网次数可以以天为单位计算(即用户在一天之内的多次上网作为该用户的一次上网),本实施例中的上网次数也可以以其他单位来计算,如以用户打开浏览器客户端的次数为单位计算。上述网络访问行为数据所属类别的访问间隔可以由网络设备来计算并设置。一个具体的例子,用户在1月7日上网访问了体育类别中的内容资源,之后,用户一直没有上网,直到1月10日,用户才再次上网,并再次访问了体育类别中 的内容资源,那么可以将相应的网络访问行为数据所属类别的访问间隔设置为1,而并不是将该访问间隔设置为1月7日与1月10日之间间隔的天数。 
本实施例可以预先为所有维度或者部分维度上的不同属性信息分别设置相应的系数,如为主动访问设置的系数高于为被动访问设置的系数,再如为被高端用户访问的内容资源对应的信息质量设置的系数高于没有被高端用户访问的内容资源对应的信息质量设置的系数。这样,本实施例在确定出网络访问行为数据对应的多个维度上的属性信息后,可以利用各属性信息以及相对应的系数计算出网络访问行为数据的权重值。本实施例可以根据实际情况采用相应的计算方法来进行网络访问行为数据的权重值的计算,具体的计算方法在此不再一一详细举例说明。 
本实施例可以在接收到一条网络访问行为数据或者同时接收到多条网络访问行为数据时,立即计算接收到的网络访问行为数据的权重值,并将计算出的权重值与网络访问行为数据以及其所对应的各维度上的属性信息一起本地存储。当然,本实施例也可以采用定时或者不定时的方式来处理其接收到的网络访问行为数据,例如,每到整点时刻,网络设备将其接收并本地存储的所有未进行计算的网络访问行为数据进行权重值计算,并在计算完成后,将计算出的权重值连同相应的网络访问行为数据以及网络访问行为数据对应的各维度上的属性信息一起存储;再例如,网络设备在其本地存储的网络访问行为数据达到预定数量(如接收并本地存储的网络访问行为数据所占用的存储空间达到预定存储空间大小)时,对本地存储的所有未进行权重值计算的网络访问行为数据进行权重值计算,并在计算完成后,将计算出的各权重值连同对应的网络访问行为数据以及网络访问行为数据对应的各维度上的属性信息一起存储。 
用户的网络访问行为数据、网络访问行为数据对应的多个维度上的属性信息以及计算出的权重值等可以一起存储在该用户的特征库(如图3所示)中。 
本实施例可以采用多种方式来计算网络访问行为数据的权重值,具体的实现方式可以根据实际应用情况来设置,在此不再详细例举说明。 
S230、根据用户的网络访问行为数据的权重值确定用户对网络访问行为数据所属的类别的关注度。 
具体的,本实施例可以实时的方式计算用户对网络访问行为数据所属的类别的关注度,也就是说,网络设备每接收到一条网络访问行为数据或者网络设备同时接收到多条网络访问行为数据时,可以立即进行网络访问行为数据的关注度计算,并利用当前计算出的关注度来修正用户对该网络访问行为数据所属类别的关注度(如图3中的“在线处理”,并利用“在线处理”的结果修正“特征库”中的存储信息)。 
本实施例也可以采用非实时的方式(即离线方式)计算用户对网络访问行为数据所属的类别的关注度,例如,在每天的凌晨对前一天接收到的该用户的网络访问行为数据进行关注度的计算处理,在计算处理完成后,利用当前计算出的关注度来修正用户对各网络访问行为数据所属类别的关注度(如图2中的“离线处理”,并利用“离线处理”的结果修正“特征库”中的存储信息)。 
本实施例可以采用多种方式利用用户的网络访问行为数据的权重值来计算用户对网络访问行为数据所属类别的关注度,具体的实现方式可以根据实际情况来设置,在此不再详细例举说明。 
S240、根据用户对网络访问行为数据所属类别的关注度和预先设定的相应类别对应的兴趣阈值识别用户的兴趣。 
具体的,本实施例中预先设定的相应类别对应的兴趣阈值是根据网络中多个用户(如全网用户)对属于该类别中的内容资源进行访问所产生的网络访问行为数据而设置的。 
由于多个用户(如全网用户)对一个类别的访问情况可以体现出该类别被不同用户所关注的程度的差异,因此,利用多个用户对一个类别的访问情况来设置该类别的兴趣阈值可以较准确的体现出对该类别感兴趣的用户对该类别的实际访问情况,从而本实施例通过利用这样的兴趣阈值来对用户是否对该类别有兴趣进行判断,可以使判断的结果更加准确。 
一个具体的例子,设定有两个类别,即第一类别和第二类别,第一类别是一个能够时常被大家接触到的类别(如NBA),而第二类别是一个不能够时常被大家接触到的类别(如观赏鱼),用户A对第一类别的访问次数往往会大大超出用户A对第二类别的访问次数,然而,这并不能准确的表示出第一类别是用户A的兴趣所在,也就是说,如果通过将用户A对第一类别的访问次数和对第二类别的访问次数进行比较来确定用户A的兴趣是第一类别,则很有可能确定出的兴趣并不是用户A的兴趣。从实际情况来看,由于多个用户(如全网用户)接触第一类别的机会都较多,而接触第二类别的机会都较少,因此,根据网络中多个用户对该第一类别和第二类别的访问情况来看,为第一类别设置的兴趣阈值应高于为第二类别设置的兴趣阈值。 
一个更具体的例子,体育新闻类别的内容更新量较大,用户A平均每天都有10篇体育新闻的阅读量,而观赏鱼类别的内容更新量较少,用户A平均每天有2篇观赏鱼内容的阅读量,而从全网用户的访问情况来看,每天有20篇体育新闻的阅读量的用户才算是对体育新闻类别感兴趣,而每天有2篇观赏鱼的阅读量的用户就可以算是对观赏鱼类别感兴趣了。 
不同用户对不同类别的网络访问分布情况与不同用户对同一类别的网络 访问分布情况如下述表1和表2所示。 
表1 
表1中,Total User14560表示本次参与统计的用户的数量,Info“**”表示**类别,User_num表示对类别的内容资源进行过访问的用户数量,User_prop表示对类别的内容资源进行过访问的用户占本次参与统计的用户的比例,一个具体的例子,针对“互联网”类别而言,User_prop=13095/14560=0.899。 
由表1可知,由于信息量(或者说信息更新量)的不同以及是否为热门类别等多种原因,使用户对不同类别的访问具有不同的特点,通过针对同一用户对不同类别的访问进行对比来确定用户感兴趣的类别是不合理的。 
表2 
Figure 2014101245275100002DEST_PATH_IMAGE002
表2是表1中“互联网”类别的进一步展示的具体内容,User_num表示 对该类别中的内容资源进行过访问的用户的数量,User_prop表示对该类别中的内容资源进行过访问的用户占本次参与统计的用户的比例,Days表示用户访问“互联网”类别的天数,pv表示用户对“互联网”类别的触达次数,entity_num表示用户访问“互联网”中的内容资源所包含的实体词的数量。 
表2中的数据可以表明对“互联网”进行过访问的不同用户在对该类别的触达次数、所触达的实体词数量以及对该类别的访问频度等方面存在的差异。 
在本实施例中,预先设置类别对应的兴趣阈值的一个具体的例子为,定时或者不定时的采集网络中多个用户(如全网用户)的网络访问行为数据(即以离线方式获取多个用户的网络访问行为数据,如图3中的“离线处理”方框所示);针对获取到的每一条网络访问行为数据而言,分别确定该网络访问行为数据所包含的实体词,根据网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定各网络访问行为数据分别所属的类别;之后,根据各网络访问行为数据对应的多个维度上的属性信息(这里的属性信息具体如上述S120中的描述)计算各网络访问行为数据的权重值(权重值的计算具体如上述S220中的描述);然后,针对每一个类别而言,根据各类别中的所有网络访问行为数据的权重值的分布情况分别设置各类别对应的兴趣阈值,如针对一个类别而言,可以将属于该类别的所有网络访问行为数据的权重值放入坐标中,每个权重值作为坐标中的一个点,将每个点连接起来可以形成一条折线,对该类别不感兴趣的用户对应的权重值通常会聚集在折线中的一个较平缓的区间中,而对该类别感兴趣的用户对应的权重值通常会聚集在折线中的另一个区间,且该另一个区间相对于前述区间通常会表现为突然上升的趋势,从而本实施例可以通过查找该折线中相应的拐点来确定该类别对应的兴趣阈值,本实施例可以将查找到的拐点的权重值作为该类别对应的兴趣阈值。本实施例确定拐点的一个具体的例子为,在覆盖一定比例的权重值的情况下,如果确定出相邻斜线的斜率的差异达到一定的阈值时,则可以将相邻斜线的交点确定为拐点;本实施例可以对选取的拐点进行人工调整。 
本实施例计算出的各类别对应的兴趣阈值可以存储于如图3所示类别分布库中。 
本实施例可以在判断出用户对网络访问行为数据所属类别的关注度达到或者超过预先设定的该类别对应的兴趣阈值时,将该类别作为用户的兴趣,并据此向用户推荐符合其兴趣的内容资源,即如图3所示,将“特征库”以及“类别分布库”中存储的数据作为“个性化引擎”的输入信息,从而“个性化引擎”可以输出符合用户兴趣的内容资源,进而本实施例可以向用户下发其感兴趣的内容资源。 
在用户具有被动浏览习惯的情况下,用户通常习惯于浏览各种头条新闻以及实时弹窗推送的内容,正是基于这样的被动浏览习惯,会造成用户可能对多个类别都会有较多的网络访问现象;然而,由于这些访问是即兴且随意的,因此,用户对其访问涉及到的多个类别的关注度很可能并不会达到相应类别的兴趣阈值,从而本实施例利用基于多个用户设置的各类别的兴趣阈值可以排除将用户即兴且随意的浏览的内容所属的类别确定为用户感兴趣的类别的现象。 
利用本实施例提供的上述技术方案,可以较准确的确定出用户感兴趣的类别,进一步的,本实施例还可以更细致的确定出用户所感兴趣的实体词,如本实施例中的网络访问行为数据对应的多个维度上的属性信息还可以包括:网络访问行为数据所包含的实体词在网络访问行为数据所属类别中的触达次数、网络访问行为数据所包含的实体词在网络访问行为数据所属类别中的访问频度以及网络访问行为数据所包含的实体词在所述网络访问行为数据所属类别中的访问间隔,这三个属性信息均是针对类别中的网络访问行为数据所包含的实体词的,而不是针对网络访问行为数据所属类别的。一个具体的例子,图3中示出的特征库中不但记录有用户的多条网络访问行为数据,且该特征库中还记录有针对类别的在触达次数、访问频度、访问间隔、访问方式和信息质量维度上的属性信息以及针对类别中的实体词的触达次数、访问频度和访问间隔。 
基于上述针对实体词的属性信息,本实施例在设置类别对应的兴趣阈值时,还可以进一步设置类别中的各实体词的兴趣阈值,这样,不仅可以根据类别中的各实体词的兴趣阈值来判断用户所感兴趣的类别中的更具体细化的内容,而且,即便是在用户不感兴趣的类别中,也可以通过比较判断出用户更关注一些的内容。 
设置实体词的兴趣阈值的方式与上述设置类别对应的兴趣阈值的方式基本相同,在此不再详细说明。本实施例为类别中的实体词设置的兴趣阈值也可以存储于如图3所示的类别分布库中。 
需要特别说明的是,在预先为实体词设置了兴趣阈值的情况下,本实施例在为类别设置对应的兴趣阈值时,不仅应考虑多个用户对类别的关注度,还可以将该类别中的各实体词对应的兴趣阈值作为确定类别对应的兴趣阈值的一个参考因素。另外,上述产生网络访问行为数据的访问方式以及网络访问行为数据所对应的内容资源的信息质量可以用于为实体词设置兴趣阈值以及识别用户感兴趣的实体词的过程中,也就是说,产生网络访问行为数据的访问方式可以作为产生网络访问行为数据所包含的实体词的访问方式,网络访问行为数据所对应的内容资源的信息质量可以作为网络访问行为数据中所包含的实体词的访问方式。 
本实施例在确定出用户感兴趣的类别以及感兴趣的实体词之后,在向用户推送其感兴趣的内容资源时,可以参考用户感兴趣的类别中用户感兴趣的实体词,从而可以向用户下发符合其更细致的兴趣的内容资源。 
本实施例也可以在向用户推荐内容资源时,考虑推荐内容资源集合中的各内容资源在信息质量维度上的取值,例如,针对用户感兴趣的类别,在向该用户推荐其感兴趣类别中的内容资源时,可以向该用户推荐其感兴趣的类别中的在信息质量维度上取值较高的内容资源;一个具体的例子,如果用户对观赏鱼类别感兴趣(即该用户为观赏鱼类别的资深用户),则在向该用户推荐观赏鱼的内容资源时,应向其推荐在信息质量维度上取值较高的内容资源,这样,可以避免向其推荐观赏鱼养殖的基础知识等不符合用户实际需求的内容的现象。 
本实施例还可以根据用户当前的访问场景向用户下发相应的内容资源,一个具体的例子,网络设备接收到浏览器客户端采集并传输来的用户的网络访问行为数据后,网络设备从该网络访问行为数据中提取实体词,并利用提取出的实体词判断该网络访问行为数据所属的类别,进而,在根据其特征库和类别分布库中存储的信息确定出该用户对正在访问的内容资源所在的类别不感兴趣时,网络设备可以在特征库中查找该类别下的所有实体词对应的关注度,然后,选取关注度最高的实体词所对应的内容资源(即信息源),并将该内容资源下发给用户;当然,本实施例也可以在确定出该用户对该类别不感兴趣时,向该用户推荐一些该类别中的在信息质量维度上取值较低的内容资源;一个具体的例子,如果用户对观赏鱼类别不感兴趣,则在根据用户当前的访问场景向该用户推荐观赏鱼中的相应的内容资源时,应向其推荐在信息质量维度上取值较低的内容资源,如向用户推荐观赏鱼养殖的基础知识以及入门指导等相关内容。 
另外,本实施例也可以根据用户的网络访问行为数据所包含的实体词向用户下发相应的内容。 
实施例三、用户兴趣发现装置,该装置如图4所示。 
图4中的用户兴趣发现装置包括:请求模块400、请求响应模块410、显示模块420、确定模块430、传输模块440、接收模块450以及修正模块460。 
另外,上述用户兴趣发现装置还可以包括:采集模块500、确定类别模块510、权重值模块520、关注度模块530以及兴趣识别模块540;同时,该用户兴趣发现装置还可以包括:阈值设置模块550以及下发模块560。这部分模块所执行的具体操作在下述实施例四中详细描述。 
请求模块400主要用于向网络侧发送用户的兴趣信息请求,并接收网络侧根据该请求返回的用户的兴趣信息。这里的用户的兴趣信息主要包括:类别和实体词。 
具体的,请求模块400可以在用户启动网络终端设备中相应的应用(如话题推荐应用或者浏览器客户端等)时,产生承载有用户标识的用户的兴趣信息请求,并向网络侧发送该用户的兴趣信息请求。请求模块400所产生的用户的兴趣信息请求可以为基于HTTP的消息等。上述用户标识应为可以唯一标识出一个用户的信息,如该用户标识可以为浏览器客户端标识等。 
请求响应模块410主要用于接收用户的兴趣信息请求,并根据预先存储的兴趣信息向用户的网络终端设备返回该用户的兴趣信息。 
具体的,网络侧预先存储有网络中多个用户的兴趣信息,如网络侧预先存储有网络中多个用户的用户标识与类别和实体词的对应关系信息。请求响应模块410在网络侧接收到网络终端设备传输来的用户的兴趣信息请求后,从该用户的兴趣信息请求中获取用户标识,然后,从网络侧存储的兴趣信息中查找该用户标识对应的兴趣信息(包括类别和实体词),并将查找到的全部兴趣信息或者查找到的部分兴趣信息返回给用户的网络终端设备。 
请求响应模块410在查找到的该用户的全部兴趣信息的数量较多时,可以从该用户的全部兴趣信息中选取部分兴趣信息,如请求响应模块410按照用户感兴趣的程度选取用户最感兴趣的多个兴趣信息。上述数量较多可以是指类别数量较多(如查找到的全部兴趣信息中的类别的数量超过第一预定值,第一预定值的取值可以根据实际画面的布局设计来决定,如第一预定值为20),也可以是指类别下的实体词数量较多(如查找到的兴趣信息中的某个类别所对应的实体词的数量超过第二预定值,同样的,第二预定值的取值可以根据实际画面的布局设计来决定,如第二预定值为20)。也就是说,请求响应模块410选取的部分兴趣信息可以是请求响应模块410从查找到的全部类别中选取的部分类别,也可以是请求响应模块410从查找到的某个类别的全部实体词中选取的部分实体词。 
网络侧预先存储的网络中多个用户的兴趣信息可以是网络侧对其采集到的多个用户的网络访问行为数据进行分析而获得并存储的,且网络侧存储的各用户的兴趣信息可以基于后续采集到的各用户的网络访问行为数据通过离线方式或者在线方式而更新。 
另外,需要特别说明的是,请求响应模块410在查找到的该用户的全部兴趣信息的数量较少或者没有查找到该用户的兴趣信息等情况下,请求响应模块410可以为该用户添加一些兴趣信息,如请求响应模块410在查找到的用户的兴趣信息的数量较少的情况下,请求响应模块410将与该用户具有相同类别兴趣的其他用户的该类别下的该用户所不具有的实体词添加在该用户的该类别下。请求响应模块410可以将为该用户添加的实体词作为该用户感兴趣的实体 词存储在相应的类别下。请求响应模块410可以对上述添加的实体词进行特别标注,以便于后续修正模块460对该实体词的删减处理;再如,请求响应模块410在没有查找到该用户的兴趣信息的情况下,请求响应模块410可以将类似于当前热门类别中的热门实体词等类别和实体词信息作为该用户的兴趣信息,也可以通过IP地址来确定用户进一步的兴趣信息,如所在地理区域(例如北京市五道口地区)可对应消费水平和对邻近地信息感兴趣,甚至进一步地确定用户所在行业(如位于搜狐网络大厦的地址推断在互联网行业)对应消费倾向和对行业相关信息感兴趣,或者可以通过用户之前在网络上留下的访问痕迹,如发表的微博,论坛的留言等信息来辅助确定用户的兴趣信息。 
一个具体的例子,请求响应模块410可以将网络中与该用户兴趣最相近的用户分拣出来,然后,请求响应模块410将分拣出来的用户的某些感兴趣的实体词抽取出来,这些抽取出来的实体词可以下发给用户,从而本实施例可以形成一种群体个性化的概念。 
一个更具体的例子,用户喜欢娱乐类别(也可以称为娱乐话题),且经常关注范冰冰和黄晓明这两个实体词,从而请求响应模块410会在网络侧存储的多个用户的兴趣信息中查找同样关注这两个实体词的其他用户,其他用户形成一个用户群,如果该用户群中关注赵薇这一实体词的阈值达到了预定指标,则请求响应模块410可以将赵薇这个实体词一起下发给该用户,且请求响应模块410可以在网络侧存储的兴趣信息中为该用户增加相应的实体词。 
用户兴趣发现装置在网络侧设置并存储各用户的兴趣信息的过程的一个具体的例子如下述实施例四中的描述,在此不再详细说明。 
显示模块420主要用于将用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区。 
具体的,显示模块420在用户启动上述应用后会为用户显示相应的话题选择画面;在显示模块420第一次为用户显示相应的话题选择画面的情况下,该话题选择画面可以称为冷启动页面,即在从未获得过用户选择的类别和实体词的情况下,显示模块420为用户展示的话题选择画面为冷启动页面。 
显示模块420为用户显示的话题选择画面上包含有话题选择区,且该画面上还可以包含有产品说明区,该产品说明区中的内容通常不能够被用户所点选,产品说明区主要用于展示预定数量的实体词的说明信息,产品说明区还可以用于展示预定数量的类别的说明信息,另外,产品说明区还可以用于展示本应用的说明信息等;产品说明区可以使用户充分了解本应用中的话题选择的功能等。 
显示模块420在用户的网络终端设备接收到网络侧下发的用户的兴趣信 息后,将用户的兴趣信息展示在该话题选择区。用户的兴趣信息在话题选择区的展示方式可以多种形式,如显示模块420在话题选择区显示接收到的兴趣信息中所有的类别,在用户点击某个类别时,显示模块420以弹窗的形式展示接收到的兴趣信息中该类别所对应的所有实体词;再如显示模块420在话题选择区同时显示接收到的兴趣信息中的所有的类别以及类别所对应的实体词。 
确定模块430主要用于接收用户针对话题选择区输入的话题选择信息,并根据话题选择信息确定用户选择的类别和实体词。 
具体的,用户可以通过在话题选择区中相应位置的点击来选择类别或者选择实体词;如果用户通过点击选择了某个类别,然而并没有选择该类别下的实体词,则确定模块430可以认为用户选择了该类别以及该类别下的所有实体词;如果用户通过点击选择了某个类别下的一个或者多个实体词,则确定模块430可以认为用户选择了该类别以及该类别下的一个或者多个实体词。 
传输模块440主要用于将用户选择的类别和实体词传输至网络侧。这里的用户选择的类别和实体词主要用于网络侧修正网络侧预先存储的用户的兴趣信息。 
具体的,传输模块440可以将用户选择的类别和实体词通过基于HTTP的消息等传输至网络侧。 
接收模块450主要用于接收来自网络终端设备的用户选择的类别和实体词。 
修正模块460主要用于根据接收模块450接收到的用户选择的类别和实体词对网络侧预先存储的兴趣信息中的用户的兴趣信息进行修正。 
具体的,修正模块460修正用户的兴趣信息的一个例子为:如果请求响应模块410为该用户添加了其他用户感兴趣的实体词并没有被用户所选择,则修正模块460应删除上述为用户添加的实体词;如果请求响应模块410为该用户添加了其他用户感兴趣的实体词被用户所选择,则修正模块460应保留上述为用户添加的实体词,并去除为该实体词设置的用于表示该实体词为基于其他用户感兴趣的实体词而为用户添加的实体词的特别标记;例如,用户对足球类别中的实体词C罗感兴趣,然而,用户并没有选择网络侧为其推荐的与C罗相关的实体词,则修正模块460应将与C罗相关的实体词删除。 
修正模块460根据接收模块450接收到的类别和实体词来修正网络侧预先存储的该用户的兴趣信息的另一个例子为:修正模块460根据用户选择的类别和实体词增强网络侧存储的该用户对该类别和/或实体词的感兴趣程度,同时,修正模块460根据用户未选择的类别和实体词减弱网络侧存储的用户对该类别和/或实体词的感兴趣程度。 
修正模块460根据接收模块450接收到的类别和实体词来修正网络侧预先存储的该用户的兴趣信息的再一个例子为:修正模块460确定与用户选择的实体词相关的其他实体词,在网络侧存储的用户的感兴趣信息中包含有上述其他实体词的情况下,修正模块460增强用户对上述其他实体词的感兴趣程度;在网络侧存储的用户的感兴趣信息中没有包含上述其他实体词的情况下,修正模块460将上述其他实体词存储在用户的感兴趣信息中,并相应设置用户对其他实体词的感兴趣程度。 
请求响应模块410可以根据群体个性化的概念来找到与某实体词相关的其他实体词。具体地,请求响应模块410可以将网络中与该用户兴趣最相近的用户分拣出来,然后,将分拣出来的用户的某些感兴趣的实体词抽取出来,这些抽取出来的实体词可以下发给用户,从而本实施例可以形成一种群体个性化的概念。 
一个更具体的例子:用户选择了“赵薇”这个实体词,则修正模块460首先会增强用户对“赵薇”这个实体词感兴趣的程度;其次,修正模块460会增强用户对“赵薇”所属的“娱乐”这个类别的感兴趣程度;还有,在用户的感兴趣信息中包含有属于“娱乐”类别的与“赵薇”相关的其他实体词(如“黄晓明”)的情况下,修正模块460增强用户对上述其他实体词的感兴趣程度;在用户的感兴趣信息中没有包含有属于“娱乐”类别的与“赵薇”相关的其他实体词(如“黄晓明”)的情况下,修正模块460将上述其他实体词作为用户感兴趣的实体词添加“娱乐”类别下,并相应设置新增加的实体词的感兴趣程度。 
实施例四、设置于网络侧的用户兴趣发现装置,该装置如图5所示。 
图5中的装置主要包括:采集模块500、确定类别模块510、权重值模块520、关注度模块530以及兴趣识别模块540。该装置还可以包括:阈值设置模块550以及下发模块560。 
采集模块500与确定类别模块510和权重值模块520分别连接。采集模块500主要用于采集用户的网络访问行为数据。 
具体的,采集模块500采集的用户的网络访问行为数据包括:用户浏览过的网页的信息、用户搜索过的关键词、用户发表的微博的信息(如从微博中提取出的至少一个关键词等)、用户发表的博客的信息(如从博客中提取出的至少一个关键词等)以及用户购买的商品的信息等等。采集模块500采集的用户的网络访问行为数据还可以包括用户进行网络访问行为的时间信息,该时间信息可以用于后续的访问频度以及访问间隔等的计算。 
采集模块500可以利用用户的网络终端设备中的浏览器客户端来采集用 户的网络访问行为数据,采集模块500也可以利用API来采集用户的网络访问行为数据。在利用API来采集用户的网络访问行为数据的情况下,采集模块500可以获取到用户更多的网络访问行为数据。采集模块500还可以采用除上述两种例举的利用浏览器客户端采集方式以及API采集方式之外的其他方式来获取用户的网络访问行为数据。具体如上述方法实施例的描述,在此不再重复说明。 
确定类别模块510还与关注度模块530连接。确定类别模块510主要用于根据网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定网络访问行为数据所属的类别。 
具体的,确定类别模块510可以预先将每个类别表示为由一系列的实体词构成的一个向量,针对网络设备接收到的一网络访问行为数据而言,确定类别模块510可以先将该网络访问行为数据所包含的实体词(如包含一个或者多个实体词)通过预定算法计算出一向量,然后,确定类别模块510通过预定的距离函数度量该网络访问行为数据所对应的向量与各类别对应的向量之间的距离,之后,确定类别模块510根据度量出的各距离确定出上述接收到的网络访问行为数据所属的类别(如将距离最近的类别确定为该网络访问行为数据所属的类别)。 
权重值模块520还与关注度模块530连接。权重值模块520主要用于根据网络访问行为数据对应的多个维度上的属性信息计算网络访问行为数据的权重值。 
具体的,本实施例中的网络访问行为数据对应有多个维度(这里的维度也可以称为统计维度),且在每一个维度上均对应有相应的属性信息,该属性信息并不表示网络访问行为数据在其对应的维度上所固有的属性,而是一种由于用户的访问行为而使其在维护上所具有的临时属性。 
本实施例中的网络访问行为数据对应的多个维度上的属性信息所包括的具体参数以及各参数所表示的含义如上述方法实施例的描述。 
权重值模块520可以预先为所有维度或者部分维度上的不同属性信息分别设置相应的系数,如为主动访问设置的系数高于为被动访问设置的系数,再如为被高端用户访问的内容资源对应的信息质量设置的系数高于没有被高端用户访问的内容资源对应的信息质量设置的系数。这样,权重值模块520在确定出网络访问行为数据对应的多个维度上的属性信息后,可以利用各属性信息以及相对应的系数计算出网络访问行为数据的权重值。权重值模块520可以根据实际情况采用相应的计算方法来进行网络访问行为数据的权重值的计算,具体的计算方法在此不再一一详细举例说明。 
权重值模块520可以在采集模块500接收到一条网络访问行为数据或者同时接收到多条网络访问行为数据时,立即计算接收到的网络访问行为数据的权重值,并将计算出的权重值与网络访问行为数据以及其所对应的各维度上的属性信息一起本地存储。当然,权重值模块520也可以采用定时或者不定时的方式来处理其接收到的网络访问行为数据,例如,每到整点时刻,权重值模块520将采集模块500接收并本地存储的所有未进行计算的网络访问行为数据进行权重值计算,并在计算完成后,权重值模块520将计算出的权重值连同相应的网络访问行为数据以及网络访问行为数据对应的各维度上的属性信息一起存储;再例如,权重值模块520在本地存储的网络访问行为数据达到预定数量(如接收并本地存储的网络访问行为数据所占用的存储空间达到预定存储空间大小)时,对本地存储的所有未进行权重值计算的网络访问行为数据进行权重值计算,并在计算完成后,权重值模块520将计算出的各权重值连同对应的网络访问行为数据以及网络访问行为数据对应的各维度上的属性信息一起存储。 
权重值模块520可以采用多种方式来计算网络访问行为数据的权重值,具体的实现方式可以根据实际应用情况来设置,在此不再详细例举说明。 
关注度模块530还与兴趣识别模块540连接。关注度模块530主要用于根据用户的网络访问行为数据的权重值确定用户对网络访问行为数据所属的类别的关注度。 
具体的,关注度模块530可以实时的方式计算用户对网络访问行为数据所属的类别的关注度,也就是说,采集模块500每接收到一条网络访问行为数据或者采集模块500同时接收到多条网络访问行为数据时,关注度模块530可以立即进行网络访问行为数据的关注度计算,并利用当前计算出的关注度来修正用户对该网络访问行为数据所属类别的关注度。 
关注度模块530也可以采用非实时的方式(即离线方式)计算用户对网络访问行为数据所属的类别的关注度,例如,在每天的凌晨关注度模块530对前一天采集模块500采集的用户的网络访问行为数据进行关注度的计算处理,在计算处理完成后,关注度模块530利用当前计算出的关注度来修正用户对各网络访问行为数据所属类别的关注度。 
关注度模块530可以采用多种方式利用用户的网络访问行为数据的权重值来计算用户对网络访问行为数据所属类别的关注度,具体的实现方式可以根据实际情况来设置,在此不再详细例举说明。 
兴趣识别模块540还与阈值设置模块550以及下发模块560分别连接。兴趣识别模块540主要用于根据用户对网络访问行为数据所属类别的关注度和 预先设定的相应类别对应的兴趣阈值识别用户的兴趣。兴 
具体的,兴趣识别模块540可以在判断出用户对网络访问行为数据所属类别的关注度达到或者超过预先设定的该类别对应的兴趣阈值时,将该类别作为用户的兴趣,并使下发模块560据此向用户推荐符合其兴趣的内容资源。 
阈值设置模块550主要用于根据各类别中的网络访问行为数据的权重值的分布设置各类别分别对应的兴趣阈值。 
具体的,阈值设置模块550预先设置类别对应的兴趣阈值的一个具体的例子为,采集模块500定时或者不定时的采集网络中多个用户(如全网用户)的网络访问行为数据(即以离线方式获取多个用户的网络访问行为数据);针对获取到的每一条网络访问行为数据而言,确定类别模块510分别确定该网络访问行为数据所包含的实体词,确定类别模块510根据网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定各网络访问行为数据分别所属的类别;之后,权重值模块520根据各网络访问行为数据对应的多个维度上的属性信息(这里的属性信息具体如上述S120中的描述)计算各网络访问行为数据的权重值(权重值的计算具体如上述S120中的描述);然后,针对每一个类别而言,阈值设置模块550根据各类别中的所有网络访问行为数据的权重值的分布情况分别设置各类别对应的兴趣阈值,如针对一个类别而言,阈值设置模块550可以将属于该类别的所有网络访问行为数据的权重值放入坐标中,每个权重值作为坐标中的一个点,阈值设置模块550将每个点连接起来可以形成一条折线,阈值设置模块550可以通过查找该折线中相应的拐点来确定该类别对应的兴趣阈值,阈值设置模块550可以将查找到的拐点的权重值作为该类别对应的兴趣阈值。 
下发模块560还可以用于根据实时采集到的用户的网络访问行为数据所属的类别中的各实体词所对应的关注度,向用户下发相应的内容。 
具体的,兴趣识别模块540还可以更细致的确定出用户所感兴趣的实体词,如本实施例中的网络访问行为数据对应的多个维度上的属性信息还可以包括:网络访问行为数据所包含的实体词在网络访问行为数据所属类别中的触达次数、网络访问行为数据所包含的实体词在网络访问行为数据所属类别中的访问频度以及网络访问行为数据所包含的实体词在所述网络访问行为数据所属类别中的访问间隔,这三个属性信息均是针对类别中的网络访问行为数据所包含的实体词的,而不是针对网络访问行为数据所属类别的。 
基于上述针对实体词的属性信息,阈值设置模块550在设置类别对应的兴趣阈值时,还可以进一步设置类别中的各实体词的兴趣阈值,这样,兴趣识别模块540不仅可以根据类别中的各实体词的兴趣阈值来判断用户所感兴趣的 类别中的更具体细化的内容,而且,即便是在用户不感兴趣的类别中,下发模块560也可以通过比较判断出用户更关注一些的内容。 
阈值设置模块550设置实体词的兴趣阈值的方式与上述设置类别对应的兴趣阈值的方式基本相同,在此不再详细说明。 
在确定出用户感兴趣的类别以及感兴趣的实体词之后,下发模块560在向用户推送其感兴趣的内容资源时,可以参考用户感兴趣的类别中用户感兴趣的实体词,从而可以向用户下发符合其更细致的兴趣的内容资源。 
下发模块560也可以在向用户推荐内容资源时,考虑推荐内容资源集合中的各内容资源在信息质量维度上的取值,例如,针对用户感兴趣的类别,下发模块560在向该用户推荐其感兴趣类别中的内容资源时,可以向该用户推荐其感兴趣的类别中的在信息质量维度上取值较高的内容资源。 
下发模块560还可以根据用户当前的访问场景向用户下发相应的内容资源,一个具体的例子,采集模块500接收到浏览器客户端采集并传输来的用户的网络访问行为数据后,确定类别模块510从该网络访问行为数据中提取实体词,并利用提取出的实体词判断该网络访问行为数据所属的类别,进而,在兴趣识别模块540根据特征库和类别分布库中存储的信息确定出该用户对正在访问的内容资源所在的类别不感兴趣时,下发模块560可以在特征库中查找该类别下的所有实体词对应的关注度,然后,下发模块560选取关注度最高的实体词所对应的内容资源(即信息源),并将该内容资源下发给用户;当然,下发模块560也可以在兴趣识别模块540确定出该用户对该类别不感兴趣时,向该用户推荐一些该类别中的在信息质量维度上取值较低的内容资源;一个具体的例子,如果用户对观赏鱼类别不感兴趣,则下发模块560在根据用户当前的访问场景向该用户推荐观赏鱼中的相应的内容资源时,下发模块560应向其推荐在信息质量维度上取值较低的内容资源,如下发模块560向用户推荐观赏鱼养殖的基础知识以及入门指导等相关内容。下发模块560也可以根据用户的网络访问行为数据所包含的实体词向用户下发相应的内容。 
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。 
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之 处。尤其,对于装置或者系统的实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。 
以上对本发明所提供的用户兴趣发现方法和装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。 

Claims (22)

1.一种用户兴趣发现方法,其特征在于,包括:
向网络侧发送用户的兴趣信息请求,并接收网络侧根据所述请求返回的用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;
将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区;
接收用户针对话题选择区输入的话题选择信息,并根据所述话题选择信息确定用户选择的类别和实体词;
将用户选择的类别和实体词传输至网络侧,所述用户选择的类别和实体词用于网络侧修正网络侧预先存储的所述用户的兴趣信息。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
在将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区的情况下,在用户的网络终端设备所显示的产品说明区中展示类别的说明信息、实体词的说明信息以及所述方法对应的产品的说明信息中的至少一个。
3.如权利要求1或2所述的方法,其特征在于,所述用户的兴趣信息包括:网络侧基于所述用户的网络访问行为数据与网络中多个用户的网络访问行为数据的比较结果而设置的用户感兴趣的类别和实体词。
4.如权利要求3所述的方法,其特征在于,所述用户的兴趣信息还包括:
属于所述用户的兴趣信息中的类别但不是所述用户的兴趣信息中的实体词而是其他用户的兴趣信息中的实体词;所述其他用户为其兴趣信息中具有所述用户的兴趣信息中的类别的用户。
5.如权利要求3所述的方法,其特征在于,所述网络侧设置用户感兴趣的类别包括下述步骤:
采集用户的网络访问行为数据;
根据所述网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定所述网络访问行为数据所属的类别;
根据所述网络访问行为数据对应的多个维度上的属性信息计算所述网络访问行为数据的权重值;
根据所述用户的网络访问行为数据的权重值确定所述用户对所述网络访问行为数据所属的类别的关注度;
根据所述用户对所述网络访问行为数据所属类别的关注度和预先设定的相应类别对应的兴趣阈值识别所述用户感兴趣的类别,其中,所述类别对应的兴趣阈值是根据网络中多个用户对该类别进行访问的网络访问行为数据设置的。
6.如权利要求5所述的方法,其特征在于,所述网络侧设置用户感兴趣的实体词包括下述步骤:
根据所述用户的网络访问行为数据对应的多个维度上的属性信息计算所述用户的网络访问行为数据中的实体词的权重值;
根据所述用户的网络访问行为数据中的实体词的权重值确定所述用户对所述网络访问行为数据所属的类别中的实体词的关注度;
根据所述用户对所述网络访问行为数据所属类别中的实体词的关注度和预先设定的相应类别中的实体词对应的兴趣阈值识别所述用户感兴趣的实体词。
7.一种用户兴趣发现装置,其特征在于,包括:
请求模块,用于向网络侧发送用户的兴趣信息请求,并接收网络侧根据所述请求返回的用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;
显示模块,用于将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区;
确定模块,用于接收用户针对话题选择区输入的话题选择信息,并根据所述话题选择信息确定用户选择的类别和实体词;
传输模块,用于将用户选择的类别和实体词传输至网络侧,所述用户选择的类别和实体词用于网络侧修正网络侧预先存储的所述用户的兴趣信息。
8.如权利要求7所述的装置,其特征在于,所述显示模块还用于:
在将所述用户的兴趣信息展示在用户的网络终端设备所显示的话题选择区的情况下,在用户的网络终端设备所显示的产品说明区中展示类别的说明信息、实体词的说明信息以及所述方法对应的产品的说明信息中的至少一个。
9.如权利要求7或8所述的装置,其特征在于,所述用户的兴趣信息包括:网络侧基于所述用户的网络访问行为数据与网络中多个用户的网络访问行为数据的比较结果而设置的用户感兴趣的类别和实体词。
10.如权利要求9所述的装置,其特征在于,所述用户的兴趣信息还包括:
属于所述用户的兴趣信息中的类别但不是所述用户的兴趣信息中的实体词而是其他用户的兴趣信息中的实体词;所述其他用户为其兴趣信息中具有所述用户的兴趣信息中的类别的用户。
11.如权利要求9所述的装置,其特征在于,所述装置还包括:
采集模块,用于采集用户的网络访问行为数据;
确定类别模块,用于根据所述网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定所述网络访问行为数据所属的类别;
权重值模块,用于根据所述网络访问行为数据对应的多个维度上的属性信息计算所述网络访问行为数据的权重值;
关注度模块,用于根据所述用户的网络访问行为数据的权重值确定所述用户对所述网络访问行为数据所属的类别的关注度;
兴趣识别模块,用于根据所述用户对所述网络访问行为数据所属类别的关注度和预先设定的相应类别对应的兴趣阈值识别所述用户感兴趣的类别,其中,所述类别对应的兴趣阈值是根据网络中多个用户对该类别进行访问的网络访问行为数据设置的。
12.如权利要求11所述的装置,其特征在于:
权重值模块还用于,根据所述用户的网络访问行为数据对应的多个维度上的属性信息计算所述用户的网络访问行为数据中的实体词的权重值;
关注度模块还用于,根据所述用户的网络访问行为数据中的实体词的权重值确定所述用户对所述网络访问行为数据所属的类别中的实体词的关注度;
兴趣识别模块还用于,根据所述用户对所述网络访问行为数据所属类别中的实体词的关注度和预先设定的相应类别中的实体词对应的兴趣阈值识别所述用户感兴趣的实体词。
13.一种用户兴趣发现方法,其特征在于,包括:
接收用户的兴趣信息请求,并根据预先存储的兴趣信息向用户的网络终端设备返回所述用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;
接收来自所述网络终端设备的所述用户选择的类别和实体词;
根据所述用户选择的类别和实体词对所述预先存储的兴趣信息中的所述用户的兴趣信息进行修正。
14.如权利要求13所述的方法,其特征在于,所述预先存储的兴趣信息包括:基于所述用户的网络访问行为数据与网络中多个用户的网络访问行为数据的比较结果而设置的用户感兴趣的类别和实体词。
15.如权利要求14所述的方法,其特征在于,所述预先存储的兴趣信息还包括:
属于所述用户的兴趣信息中的类别但不是所述用户的兴趣信息中的实体词而是其他用户的兴趣信息中的实体词;所述其他用户为其兴趣信息中具有所述用户的兴趣信息中的类别的用户。
16.如权利要求14所述的方法,其特征在于,所述预先存储的用户感兴趣的类别是通过下述步骤设置的:
采集用户的网络访问行为数据;
根据所述网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定所述网络访问行为数据所属的类别;
根据所述网络访问行为数据对应的多个维度上的属性信息计算所述网络访问行为数据的权重值;
根据所述用户的网络访问行为数据的权重值确定所述用户对所述网络访问行为数据所属的类别的关注度;
根据所述用户对所述网络访问行为数据所属类别的关注度和预先设定的相应类别对应的兴趣阈值识别所述用户感兴趣的类别,其中,所述类别对应的兴趣阈值是根据网络中多个用户对该类别进行访问的网络访问行为数据设置的。
17.如权利要求16所述的方法,其特征在于,所述预先存储的用户感兴趣的实体词是通过下述步骤设置的:
根据所述用户的网络访问行为数据对应的多个维度上的属性信息计算所述用户的网络访问行为数据中的实体词的权重值;
根据所述用户的网络访问行为数据中的实体词的权重值确定所述用户对所述网络访问行为数据所属的类别中的实体词的关注度;
根据所述用户对所述网络访问行为数据所属类别中的实体词的关注度和预先设定的相应类别中的实体词对应的兴趣阈值识别所述用户感兴趣的实体词。
18.一种用户兴趣发现装置,其特征在于,包括:
请求响应模块,用于接收用户的兴趣信息请求,并根据预先存储的兴趣信息向用户的网络终端设备返回所述用户的兴趣信息,所述用户的兴趣信息包括:类别和实体词;
接收模块,用于接收来自所述网络终端设备的所述用户选择的类别和实体词;
修正模块,用于根据所述用户选择的类别和实体词对所述预先存储的兴趣信息中的所述用户的兴趣信息进行修正。
19.如权利要求18所述的装置,其特征在于,所述预先存储的兴趣信息包括:基于所述用户的网络访问行为数据与网络中多个用户的网络访问行为数据的比较结果而设置的用户感兴趣的类别和实体词。
20.如权利要求19所述的装置,其特征在于,所述预先存储的兴趣信息还包括:
属于所述用户的兴趣信息中的类别但不是所述用户的兴趣信息中的实体词而是其他用户的兴趣信息中的实体词;所述其他用户为其兴趣信息中具有所述用户的兴趣信息中的类别的用户。
21.如权利要求14所述的装置,其特征在于,所述装置还包括:
采集模块,用于采集用户的网络访问行为数据;
确定类别模块,用于根据所述网络访问行为数据所包含的实体词以及预先设定的各类别分别对应的多个实体词确定所述网络访问行为数据所属的类别;
权重值模块,用于根据所述网络访问行为数据对应的多个维度上的属性信息计算所述网络访问行为数据的权重值;
关注度模块,用于根据所述用户的网络访问行为数据的权重值确定所述用户对所述网络访问行为数据所属的类别的关注度;
兴趣识别模块,用于根据所述用户对所述网络访问行为数据所属类别的关注度和预先设定的相应类别对应的兴趣阈值识别所述用户感兴趣的类别,其中,所述类别对应的兴趣阈值是根据网络中多个用户对该类别进行访问的网络访问行为数据设置的。
22.如权利要求21所述的装置,其特征在于:
权重值模块还用于,根据所述用户的网络访问行为数据对应的多个维度上的属性信息计算所述用户的网络访问行为数据中的实体词的权重值;
关注度模块还用于,根据所述用户的网络访问行为数据中的实体词的权重值确定所述用户对所述网络访问行为数据所属的类别中的实体词的关注度;
兴趣识别模块还用于,根据所述用户对所述网络访问行为数据所属类别中的实体词的关注度和预先设定的相应类别中的实体词对应的兴趣阈值识别所述用户感兴趣的实体词。
CN201410124527.5A 2014-03-28 2014-03-28 用户兴趣发现方法和装置 Active CN103888466B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410124527.5A CN103888466B (zh) 2014-03-28 2014-03-28 用户兴趣发现方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410124527.5A CN103888466B (zh) 2014-03-28 2014-03-28 用户兴趣发现方法和装置

Publications (2)

Publication Number Publication Date
CN103888466A true CN103888466A (zh) 2014-06-25
CN103888466B CN103888466B (zh) 2018-01-02

Family

ID=50957186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410124527.5A Active CN103888466B (zh) 2014-03-28 2014-03-28 用户兴趣发现方法和装置

Country Status (1)

Country Link
CN (1) CN103888466B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104254851A (zh) * 2012-03-17 2014-12-31 海智网聚网络技术(北京)有限公司 用于向用户推荐内容的方法和系统
CN104361063A (zh) * 2014-11-04 2015-02-18 北京字节跳动网络技术有限公司 用户兴趣发现方法和装置
CN104462336A (zh) * 2014-12-03 2015-03-25 北京国双科技有限公司 信息推送方法和装置
CN105677910A (zh) * 2016-02-26 2016-06-15 中国银联股份有限公司 智能推荐方法及系统
CN105763947A (zh) * 2016-02-19 2016-07-13 四川长虹电器股份有限公司 一种智能电视用户的特征兴趣提取方法
CN106649347A (zh) * 2015-10-30 2017-05-10 北京国双科技有限公司 一种兴趣信息的识别方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070239535A1 (en) * 2006-03-29 2007-10-11 Koran Joshua M Behavioral targeting system that generates user profiles for target objectives
CN101329674A (zh) * 2007-06-18 2008-12-24 北京搜狗科技发展有限公司 一种提供个性化搜索的系统和方法
CN101515360A (zh) * 2009-04-13 2009-08-26 阿里巴巴集团控股有限公司 向用户推荐网络目标信息的方法和服务器
CN102479366A (zh) * 2010-11-25 2012-05-30 阿里巴巴集团控股有限公司 一种商品推荐方法及系统
CN103324742A (zh) * 2013-06-28 2013-09-25 百度在线网络技术(北京)有限公司 推荐关键词的方法和设备
CN103631954A (zh) * 2013-12-13 2014-03-12 百度在线网络技术(北京)有限公司 个性化推荐方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070239535A1 (en) * 2006-03-29 2007-10-11 Koran Joshua M Behavioral targeting system that generates user profiles for target objectives
CN101329674A (zh) * 2007-06-18 2008-12-24 北京搜狗科技发展有限公司 一种提供个性化搜索的系统和方法
CN101515360A (zh) * 2009-04-13 2009-08-26 阿里巴巴集团控股有限公司 向用户推荐网络目标信息的方法和服务器
CN102479366A (zh) * 2010-11-25 2012-05-30 阿里巴巴集团控股有限公司 一种商品推荐方法及系统
CN103324742A (zh) * 2013-06-28 2013-09-25 百度在线网络技术(北京)有限公司 推荐关键词的方法和设备
CN103631954A (zh) * 2013-12-13 2014-03-12 百度在线网络技术(北京)有限公司 个性化推荐方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104254851A (zh) * 2012-03-17 2014-12-31 海智网聚网络技术(北京)有限公司 用于向用户推荐内容的方法和系统
CN104361063A (zh) * 2014-11-04 2015-02-18 北京字节跳动网络技术有限公司 用户兴趣发现方法和装置
CN104361063B (zh) * 2014-11-04 2018-03-16 北京字节跳动网络技术有限公司 用户兴趣发现方法和装置
CN104462336A (zh) * 2014-12-03 2015-03-25 北京国双科技有限公司 信息推送方法和装置
CN106649347A (zh) * 2015-10-30 2017-05-10 北京国双科技有限公司 一种兴趣信息的识别方法及装置
CN105763947A (zh) * 2016-02-19 2016-07-13 四川长虹电器股份有限公司 一种智能电视用户的特征兴趣提取方法
CN105677910A (zh) * 2016-02-26 2016-06-15 中国银联股份有限公司 智能推荐方法及系统

Also Published As

Publication number Publication date
CN103888466B (zh) 2018-01-02

Similar Documents

Publication Publication Date Title
US11263217B2 (en) Method of and system for determining user-specific proportions of content for recommendation
US10922327B2 (en) Search guidance
CN103886090B (zh) 基于用户喜好的内容推荐方法及装置
CN102340514B (zh) 网络信息推送方法及系统
US9405746B2 (en) User behavior models based on source domain
CN103780625A (zh) 用户兴趣发现方法和装置
CN103888466A (zh) 用户兴趣发现方法和装置
CN104462573A (zh) 一种视频搜索结果展示方法及装置
US11176574B2 (en) Contextual secondary content for search results
CN107273489A (zh) 内容推送方法、电子设备及计算机存储介质
CN105976161A (zh) 一种基于时间轴上的智能推荐日历及基于用户的呈现方法
US9996630B2 (en) System and/or method for linking network content
CN101802865A (zh) 创建个性化主页的方法和系统
US10402479B2 (en) Method, server, browser, and system for recommending text information
CN104090990A (zh) 新闻推送方法和系统
CN104239450A (zh) 搜索推荐方法和装置
CN106878405B (zh) 一种调整推送项目的方法及装置
CA2646656A1 (en) Targeted content delivery for networks
CN103106208A (zh) 一种移动互联网中的流媒体内容推荐方法和系统
CN105468630A (zh) 提供用户信息的方法及装置
CN110163703B (zh) 一种分类模型建立方法、文案推送方法和服务器
CN102298615A (zh) 一种计算机实现的用于展示搜索结果的方法与设备
US20200092611A1 (en) Method and system for determining a relevancy parameter for content item
CN103678479A (zh) 浏览器预读取加速方法、装置及浏览器
CN103838748A (zh) 用于浏览器新建标签页的展现方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant