CN103870538B - 针对用户进行个性化推荐的方法、用户建模设备及系统 - Google Patents

针对用户进行个性化推荐的方法、用户建模设备及系统 Download PDF

Info

Publication number
CN103870538B
CN103870538B CN201410040954.5A CN201410040954A CN103870538B CN 103870538 B CN103870538 B CN 103870538B CN 201410040954 A CN201410040954 A CN 201410040954A CN 103870538 B CN103870538 B CN 103870538B
Authority
CN
China
Prior art keywords
user
information
famous person
model
information model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410040954.5A
Other languages
English (en)
Other versions
CN103870538A (zh
Inventor
李本阳
秦锋剑
宋奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410040954.5A priority Critical patent/CN103870538B/zh
Publication of CN103870538A publication Critical patent/CN103870538A/zh
Application granted granted Critical
Publication of CN103870538B publication Critical patent/CN103870538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Abstract

本发明公开了一种针对用户进行个性化推荐的方法、用户建模设备及相应系统,其中,所述方法包括:从信息模型数据库中提取用户所关注的名人的信息模型,其中,所述名人为社交网络中满足预定条件的人,所述信息模型数据库中存储有基于第一建模策略为所述名人建立的信息模型;根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;获取根据所述用户模型提取的适合所述用户的信息,并向所述用户推荐该信息。根据用户所关注的名人的信息模型建立的用户模型能准确表征用户的兴趣,根据用户模型为用户推荐的信息能够准确匹配用户兴趣,因此,信息推荐的准确率高,并且解决了因用户缺少或没有历史行为而引起的冷启动问题。

Description

针对用户进行个性化推荐的方法、用户建模设备及系统
技术领域
本发明涉及通信领域,更为具体而言,涉及一种针对用户进行个性化推荐的方法、用户建模设备及系统,所述系统包括针对用户进行个性化推荐的服务器系统和包括该服务器系统的网络系统。
背景技术
随着互联网技术的强势发展以及网络信息的大范围覆盖,用户在浏览信息时通常需要从海量信息中选择自己感兴趣的内容,这不仅浪费了用户时间,并且存在严重的信息浪费。例如,在电子商务系统中,商品个数、种类等快速增长,用户需要花费大量时间才能找到自己想要的商品信息,这无疑会影响用户体验。因此,根据用户可能的兴趣点向用户推荐信息(例如:商品、经济、体育方面的信息)的个性化信息推荐方法应运而生。
根据现有的信息推荐技术,需要读取用户的行为日志,通过对用户的历史行为进行分析确定最终推荐哪些信息。但是,一方面,用户行为属于隐式的用户反馈,基于用户行为确定最终推荐哪些信息并不能准确地匹配用户兴趣(例如,根据用户对新闻的点击行为很难确定用户是因为该新闻热门还是因为感兴趣而进行点击);另一方面,对于没有历史行为的用户根本无法采用现有技术进行准确的信息推荐,即无法解决业界所谓的冷启动问题。
发明内容
为了准确地向用户推荐信息,本发明实施方式提供了一种针对用户进行个性化推荐的方法、用户建模设备及系统。
一方面,本发明实施方式提供了一种针对用户进行个性化推荐的方法,包括:
从信息模型数据库中提取用户所关注的名人的信息模型,其中,所述名人为社交网络中满足预定条件的人,所述信息模型数据库中存储有基于第一建模策略为所述名人建立的信息模型;
根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;
获取根据所述用户模型提取的适合所述用户的信息,并向所述用户推荐该信息。
在本发明的一种实施方式中,基于第一建模策略为所述名人建立的信息模型包括表示所述名人的个体属性和/或群体属性的组件。
由此,所述信息模型可以准确地表征所述名人,为后续建立可准确表征用户的用户模型提供了基础。
在本发明的另一种实施方式中,所述方法还包括:根据所述第一建模策略为所述名人建立信息模型,并将所述名人的信息模型存储至所述信息模型数据库。
由此,进行信息推荐的服务商(例如,信息推荐服务商)可以建立所述信息模型数据库。
在本发明的另一种实施方式中,根据所述第一建模策略为所述名人建立信息模型包括:
从第三方信息平台获取所述名人的信息;
根据所述名人的信息建立所述名人的信息模型。
由此,能方便地获取建立所述名人的信息模型所需要的信息。
在本发明的另一种实施方式中,所述第三方信息平台包括网络百科全书,并且,从第三方信息平台获取所述名人的信息包括:
通过所述网络百科全书搜索所述名人,并从搜索结果中抓取关于所述名人的百科词条。
由此,能方便且准确地获取建立所述名人的信息模型所需要的信息。
在本发明的另一种实施方式中,所述根据所述名人的信息建立所述名人的信息模型包括:
解析所述百科词条的文本,对所述百科词条进行分词;
进行词频-逆向文件频率计算获得所述百科词条中的关键词和关键词权重,其中,所述关键词和关键词权重表示所述名人的个体属性;
通过利用支持向量机建立的分类模型确定所述名人的分类,其中,所述名人的分类表示所述名人的群体属性;
将所述关键词和关键词权重作为第一组件,并且将所述名人的分类作为第二组件,建立所述名人的信息模型。
由此,根据所述关键词和权重以及所述名人的分类建立的信息模型,能够更加准确地表征所述名人,使得后续根据所述名人的信息模型建立的用户模型能更加准确地表征所述用户。
在本发明的另一种实施方式中,根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型包括:
根据所述用户所关注的名人的信息模型,对所述名人的个体属性和/或群体属性进行聚类,确定所述用户所关注的个体属性和/或群体属性;
根据所述用户所关注的个体属性和/或群体属性建立所述用户模型。
由此,能够建立准确表征所述用户(例如,表征所述用户的兴趣点,包括兴趣词和兴趣分类)的用户模型。
相应的,本发明实施方式提供了一种针对用户进行个性化推荐的服务器系统,包括:
信息模型提取模块,用于从信息模型数据库中提取用户所关注的名人的信息模型,所述信息模型数据库存储有基于第一建模策略为社交网络中满足预定条件的名人建立的信息模型;
用户模型处理模块,用于根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;
信息推荐服务器,用于根据所述用户模型提取适合所述用户的信息并向所述用户推荐该信息。
相应的,本发明实施方式还提供一种针对用户进行个性化推荐的网络系统,该网络系统包括上述的服务器系统。
另一方面,本发明实施方式还提供了一种针对用户进行个性化推荐的服务器系统,包括:
信息模型提取模块,用于从信息模型数据库中提取用户所关注的名人的信息模型,所述信息模型数据库存储有基于第一建模策略为社交网络中满足预定条件的名人建立的信息模型;
通信模块,用于将用户所关注的名人的信息模型发送至用户建模设备,以及用于接收从用户建模设备发送的用户模型,所述用户模型是根据所述用户所关注的名人的信息模型和第二建模策略建立的;
信息推荐服务器,用于根据所述用户模型提取适合所述用户的信息,并向所述用户推荐该信息。
相应的,本发明实施方式提供了一种用户建模设备,包括:
接收模块,用于接收由服务器系统发送的用户所关注的名人的信息模型,所述信息模型是基于第一建模策略建立的,所述名人为社交网络中满足预定条件的人;
用户模型处理模块,用于根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型,所述用户模型包括表示用户所关注的个体属性和/或群体属性的组件;
发送模块,用于将所述用户模型发送至所述服务器系统。
相应的,本发明实施方式还提供一种针对用户进行个性化推荐的网络系统,该网络系统包括上述的服务器系统和用户建模设备。
实施本发明的各种实施方式具有以下有益效果:
根据用户所关注的名人的信息模型建立的用户模型能够准确的表征用户的兴趣,根据所述用户模型向用户推荐的信息能够准确匹配用户兴趣,因此,推荐的信息的准确率高(此处的准确率可以理解为与用户兴趣的契合程度,或被用户点击、阅读、收藏、转发、分享、评论等的概率等),并且解决了因用户缺少或没有历史行为而引起的冷启动问题。
附图说明
图1是根据本发明实施方式的针对用户进行个性化推荐的方法的流程图;
图2是根据本发明实施方式的针对用户进行个性化推荐的方法的流程图;
图3示出了图2所示的处理方式S11的一种实施方式;
图4是根据本发明实施方式的为名人建立信息模型的方法的流程图;
图5示出了图1-4中所示的处理方式S13的一种实施方式;
图6示出了根据本发明实施方式的服务器系统的一例方框图;
图7示出了根据本发明实施方式的服务器系统的另一例方框图;
图8示出了图7中所示信息模型处理模块的方框图;
图9示出了根据本发明实施方式的服务器系统的再一例方框图;
图10示出了根据本发明实施方式的服务器系统的又一例方框图;
图11示出了根据本发明实施方式的用户建模设备的一例方框图;
图12示出了根据本发明实施方式的网络系统的一例方框图。
具体实施方式
以下结合附图和具体实施方式对本发明的各个方面进行详细阐述。其中,众所周知的模块、单元及其相互之间的连接、链接、通信或操作没有示出或未作详细说明。并且,所描述的特征、架构或功能可在一个或一个以上实施方式中以任何方式组合。本领域技术人员应当理解,下述的各种实施方式只用于举例说明,而非用于限制本发明的保护范围。还可以容易理解,本文所述和附图所示的各实施方式中的模块或单元或处理方式可以按各种不同配置进行组合和设计。
图1是根据本发明实施方式的针对用户进行个性化推荐的方法的流程图。在本发明实施方式中,所述方法包括:
S12:从信息模型数据库中提取用户所关注的名人的信息模型,其中,所述名人为社交网络中满足预定条件的人,所述信息模型数据库中存储有基于第一建模策略为所述名人建立的信息模型。
S13:根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型。
S14:获取根据所述用户模型提取的适合所述用户的信息并向所述用户推荐该信息。
其中,“社交网络”包括:用于进行信息交流、分享、评价、讨论、传播等行为的平台,示例性的,诸如微博、推特(twitter)、博客、人人网、开心网、论坛、社区、微信圈之类的信息平台。
“满足预定条件的人”/“名人”包括:在社交网络中具有一定知名度、影响力或权威性的人,换言之,“预定条件”包括:能从社交网络中区别出(或在一定程度上区别出)具有知名度、影响力或权威性的用户的条件。满足预定条件的人可以是,例如,微博中粉丝超过预定数目(例如:300万或500万等)的用户(例如,大V)、论坛或贴吧中等级达到预定级别的用户、在百度百科中有相应百科词条的人、以及网络社区或博客中文章点击数达到预定值的用户等等。
“信息模型”用于表征名人,包括用于表征所述名人的兴趣、爱好、经历、行业、位置区域等信息的组件。例如,基于所述第一建模策略为所述名人建立的信息模型可包括表示所述名人的个体属性和/或群体属性的组件,其中的个体属性可以包括所述名人的经历、兴趣或爱好等,其中的群体属性可以包括所述名人的行业、领域或国籍等。
“用户模型”用于表征用户,包括用于表征所述用户的兴趣、爱好等信息的组件。用户所关注的名人的兴趣、经历、行业等信息可以一定程度上反映或作为所述用户的兴趣爱好。
在S14中,根据用户模型提取的信息可以是信息的整体内容(例如:新闻内容),也可以是反映信息核心内容的诸如主题、标题之类(例如:新闻标题)。本发明对推荐给用户的信息的内容、形式等不做具体限制。
此外,可以通过用户的社交网络接口获取用户的关注名单,并根据该关注名单确定用户所关注的名人,本发明对此不做赘述。
此外,在建立所述用户模型之后,可以将所述用户模型存储至数据库中以由下文将提及的信息推荐服务器提取,或者直接将所述用户模型发送至信息推荐服务器,本发明对此不做赘述。
此外,可以通过名人之间的关注关系确定社交网络中哪些人属于名人。以微博用户为例,大V之间通常是互相关注的,这样,将预定数目且满足预定条件的大V作为种子集合,从这些大V所关注的用户中确定满足预定条件的大V并加入种子集合,如此重复迭代可以确定微博中满足预定条件的大V。
以上,对本发明提供的方法的整体流程以及部分特征进行了说明,下面结合实施例对本发明的方法的详细流程进行说明。
【实施例1】
在实施例1中,针对用户进行个性化推荐的方法包括上述图1所示的方法中的所有处理方式,其中,如图2所示,所述方法还包括:
S11:根据第一建模策略为所述名人建立信息模型,并将所述名人的信息模型存储至所述信息模型数据库。
可选的,如图3所示,根据第一建模策略为所述名人建立信息模型可以通过以下第一方式实现:
S111:从第三方信息平台获取所述名人的信息;
S112:根据所述名人的信息建立所述名人的信息模型。之后,可以将所述名人的信息模型存储至信息模型数据库。
对于上述第一方式的详细说明,请参照实施例2。
可选的,根据第一建模策略为所述名人建立信息模型可以通过以下第二方式实现:
从第三方信息平台获取第一名人的信息;
根据所述第一名人的信息为所述第一名人建立信息模型;
根据第二名人所关注的第一名人的信息模型为所述第二名人建立信息模型(例如,参照实施例3中建立用户模型的方法)。
在上述第二方式中,“第一名人”和“第二名人”均指代“一类名人”。例如,第一名人可以指从第三方信息平台可获取其信息的名人,第二名人可以指从第三方信息平台不可获取其信息的名人。通过上述第二方式,并不会因为第三方信息平台没有关于所述第二名人的记载而无法为所述第二名人建立信息模型。
虽然,本实施例中基于第一建模策略建模,在本发明的其他实施例中也可以由人工基于第一建模策略建模,例如,人工从第三方信息平台浏览信息,然后基于浏览的信息建立信息模型,从存储有这样建立的信息模型的信息模型库中提取模型然后进行与本发明整体流程一致的处理,仍落在发明的保护范围内。
【实施例2】
在实施例2中,以所述第三方信息平台为网络百科全书为例对根据第一建模策略为所述名人建立信息模型的方法进行说明,如图4所示:
S111包括:
S1111:通过所述网络百科全书搜索所述名人;
S1112:从搜索结果中抓取关于所述名人的百科词条。
S112包括:
S1121:解析所述百科词条的文本,对所述百科词条进行分词。
S1122:进行tf-idf(term frequency–inverse document frequency,词频-逆向文件频率)计算获得所述百科词条中的关键词和关键词权重,其中,所述关键词和关键词权重表示所述名人的个体属性。
S1123:通过利用svm(Support Vector Machine支持向量机)建立的分类模型确定所述名人的分类,其中,所述名人的分类表示所述名人的群体属性。
S1124:将所述关键词和关键词权重作为第一组件,并且将所述名人的分类作为第二组件,建立所述名人的信息模型。
在S1124之后,可以将所述名人的信息模型存入信息模型数据库,并执行S12、S13和S14。
在实施例2中,“网络百科全书”可以是诸如“百度百科”、“维基百科”之类的百科全书,也可以是相关网页信息。
在S111中,虽然描述了直接从第三方信息平台抓取所述百科词条的方式,但S111也可以通过以下方式实现:从存储所述名人的信息的数据库(例如:专门存储名人信息的数据库)中提取名人的信息,该数据库中的数据来源于第三方信息平台(例如,由网络信息收集器从第三方信息平台收集名人信息,并存储至该数据库);或者,接收由相应模块或装置发送的名人信息,所述相应模块或装置(例如上述网络信息收集器)用于从第三方信息平台收集名人信息并进行上述发送操作;等。
在S1122中,在进行tf-idf计算获得所述关键词和关键词权重之后,可以根据关键词权重选取预定数目n(n为正整数)个关键词,例如,选取关键词权重排名前n(例如20)的关键词,然后对这n个词进行归一化处理,一种示例性的归一化公式如下:
其中,等号左边的wi表示第i个关键词在归一化之后的权重,等号右边的Wi表示第i个关键词在归一化之前的权重。
进行归一化处理之后的关键词和关键词权重可以组成所述第一组件。
在S1123中,示例性的,可根据S1122中进行tf-idf计算所获得的关键词和关键词权重、通过人工标注部分语料的分类、并通过svm训练,对百科词条进行预测形成该词条所对应的名人的分类,例如该名人的行业、领域等。将确定的所述名人的分类作为所述第二组件。
在实施例2中,示例性的,以名人李开复为例,通过百科词条可以提取出创新工场、google、微软等关键词(此处未考虑关键词权重),通过分类模型可以将李开复划分为互联网分类。
【实施例2的变形例】
在实施例2中,本领域技术人员应当理解,第三方信息平台可以包括这种平台:该平台能够提供关于所述名人的诸如兴趣、爱好、行业、领域、经历、位置、近期演讲内容以及近期关注点之类信息,而不限于网络百科全书。
示例性的,第三方信息平台可以是微博,通过提取名人在微博上发表的信息(例如某时间段内发表的信息,再例如最近一星期内所发表的言论)组成待分析文本,然后采用实施例2中的方法建立该名人的信息模型。
当然,第三方信息平台也可以是论坛、社区等。也就是说,在实施例2中,除了可以从网络百科全书中提取关于所述名人的信息之外,也可以从一个或多个第三方信息平台提取关于所述名人的零散的信息组成待分析信息,然后进行建模处理。
此外,在进行归一化处理时,可以采用现有的多种归一化方法而不限于实施例2中的公式。
此外,虽然在实施例2中的信息模型包括第一组件和第二组件,本领域技术人员应当理解,所述信息模型也可以只包括第一组件或第二组件,或者,所述信息模型也可以包括第三组件、第四组件等。本发明并不限制组件的多少,只要这些组件能够一定程度体现名人的兴趣或这些组件能一定程度反映用户关注该名人的原因,均在本发明的保护范围内。
【实施例3】
在实施例3中,针对用户进行个性化推荐的方法可以包括上述图1、图2、图3或图4所示方法的所有处理方式,其中,基于第一建模策略为所述名人建立的信息模型包括表示所述名人的个体属性和/或群体属性的组件。
可选的,在本实施例中,如图5所示,S13包括:
S131:根据所述用户所关注的名人的信息模型,对所述名人的个体属性和/或群体属性进行聚类,确定所述用户所关注的个体属性和/或群体属性;
S132:根据所述用户所关注的个体属性和/或群体属性建立所述用户模型。
在实施例3的一种示例中,可以通过以下方式对所述用户所关注的名人的个体属性和群体属性进行聚类:
统计用户所关注的名人的个体属性和群体属性,计算用户所关注的分类和分类词频、以及关键词和关键词词频,通过以下公式进行归一化处理:
ni=Ni/Nmax;
其中,ni表示第i个分类(属于群体属性)或关键词(属于个体属性)归一化之后的权重,相应的,Ni表示第i个分类或关键词的词频,Nmax表示分类或关键词中的最大词频。
然后,可以根据ni的值选取预定数目(例如,10、20、25等)个关键词作为用户模型的第一组件、选取预定数目(例如,1、3、4、5、7等)个分类作为用户模型的第二组件,建立用户模型。
当然,在计算ni的时候,也可以考虑各个关键词在名人的信息模型中的权重;在建立用户模型的时候,也可以考虑各个关键词的ni值,此处不赘述。
举例而言,假设用户关注的12个名人中有10位名人的群体属性为娱乐人物、2位为科技人物,在12个名人的关键词中“潜伏”一词出现的频率最高,则可以确定用户的兴趣分类为娱乐、兴趣词为潜伏。
【实施例4】
在实施例4中,结合图1,S12~S14均可在网络侧执行,例如:
网络侧的信息模型提取模块从信息模型数据库中提取用户所关注的名人的信息模型;
网络侧的用户模型处理模块根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;
网络侧的信息推荐服务器根据所述用户模型提取适合所述用户的信息,并向所述用户推荐该信息。
其中,信息模型提取模块、用户模型处理模块二者可相互耦合并且可同时耦合于信息推荐服务器,将在下文对它们进行具体说明。
关于信息模型提取模块、用户模型处理模块和信息推荐服务器所执行的处理的说明,请参照上文对于S12~S14的说明或参照下文将进行的描述。
【实施例5】
在实施例5中,结合图1,S12~S14可以由网络侧和用户侧协同执行,例如:
网络侧的信息模型提取模块从信息模型数据库中提取用户所关注的名人的信息模型,并由网络侧的通信模块将用户所关注的名人的信息模型发送至用户侧的用户建模设备(用户侧的用户建模设备可以是诸如pc、pad之类的用户终端),完成S12(换言之,完成用户终端从信息模型数据库中提取名人信息模型,所述信息模型数据库可位于网络侧);其中,可以由用户终端向网络侧设备/系统发起请求以提取相应信息模型,或者由网络侧设备/系统主动向用户终端发送相应信息模型。
用户终端根据用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型,完成S13;
用户终端将用户模型发送至网络侧(网络侧的通信模块接收用户终端发送的用户模型),网络侧的信息推荐服务器据所述用户模型提取适合所述用户的信息并向所述用户推荐该信息,完成S14。
其中,对于S12、S13和S14的具体处理过程的说明,请参照前文的相应说明;对于网络侧设备/系统以及对于用户终端的说明将在下文进行描述。
在本发明的另一种实施例中,与实施例5类似的,S12~S14也是由服务器系统和用户建模设备协同执行并且执行的处理与在实施例5中执行的处理相同或类似,其不同之处在于,用户建模设备并不是诸如pc、pad之类的用户终端,此时,用户建模设备可以作为独立于服务器系统之外的设备存在。由此可知,本发明所涉及的用户建模设备可以是用户侧的用户终端或者是可用于建立本发明提及的用户模型的设备(例如,处于网络侧的设备)。
以上对针对用户进行个性化推荐的方法进行了详细说明,下面对针对用户进行个性化推荐的服务器系统、用户建模设备以及网络系统进行说明。
【实施例6】
图6示出了针对用户进行个性化推荐的服务器系统的框图,参照图6,服务器系统60包括:
信息模型提取模块62,用于从信息模型数据库中提取用户所关注的名人的信息模型,所述信息模型数据库存储有基于第一建模策略为社交网络中满足预定条件的名人建立的信息模型;
用户模型处理模块63,用于根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;
信息推荐服务器64,用于根据所述用户模型提取适合所述用户的信息,并向所述用户推荐该信息。
在本实施例中,服务器系统60位于网络侧,其中,信息模型提取模块62可以与用户模型处理模块63耦合或通信(例如,信息模型提取模块62通过发射机将提取的信息模型发送至模型处理模块63);用户模型处理模块63可以与信息推荐服务器64耦合或通信(例如,用户模型处理模块63通过发射机将用户模型发送至信息推荐服务器64);用户模型处理模块63还可以将建立的用户模型存储至数据库(例如,用于存储用户模型的用户模型数据库)以由信息推荐服务器64提取;信息模型提取模块62、用户模型处理模块63和信息推荐服务器64可构成一个整体(例如构成一个独立的服务器),也可以以可行的方式分布于互相通信的服务器(例如分布于互相通信的数据库服务器和应用服务器)。
在本实施例中,基于第一建模策略为所述名人建立的信息模型可包括表示所述名人的个体属性和/或群体属性的组件。
【实施例7】
图7示出了针对用户进行个性化推荐的服务器系统的框图,参照图7,服务器系统70除了包括图6所示服务器系统60的各部分外,还包括(虚线框表示该部分为可选)信息模型处理模块71和/或信息模型数据库72。其中:
信息模型处理模块71,用于根据所述第一建模策略为所述名人建立信息模型,并将所述名人的信息模型存储至所述信息模型数据库72。
信息模型数据库72,用于存储基于第一建模策略为社交网络中满足预定条件的名人建立的信息模型。在本实施例中,信息模型处理模块71可以与信息模型数据库72耦合构成服务器系统70中的独立整体,或者通过发射机将建立的信息模型发送至信息模型数据库72(示例性的,此时的信息模型数据库72可以是独立于服务器系统70之外的数据库)。信息模型提取模块62可以与信息模型数据库72耦合或通信。
示例性的,信息模型处理模块71包括:
网络信息收集子模块711,用于从第三方信息平台获取所述名人的信息;
信息模型建立子模块712,用于根据所述名人的信息建立所述名人的信息模型。
示例性的,信息模型处理模块也可以仅包括信息模型建立子模块(功能同信息模型建立子模块712),此时,网络信息收集子模块可以是独立于信息模型处理模块之外的模块,该网络信息收集子模块用于从第三方信息平台获取所述名人的信息并采用现有的通信手段与信息模型处理模块进行通信,这种通信包括直接通信方式(例如,直接将所述名人信息发送至信息模型处理模块),也包括间接通信方式(例如,通过第三方设备/装置进行信息转发、转存等,例如,首先将所述名人的信息存储至数据库,然后由信息模型处理模块从数据库中提取)。
可选的,本实施例的服务器系统70的各个模块可以构成一个整体(例如,构成一个独立的服务),也可以分别布置在互相通信的服务器。
【实施例8】
图8示出了根据本发明实施方式的一种信息模型处理模块71的框图,该信息模型处理模块71适用于第三方信息平台为网络百科全书的环境。参照图8,信息模型处理模块71包括网络信息收集子模块711和信息模型建立子模块712,其中,
网络信息收集子模块711包括:
搜索单元,用于通过所述网络百科全书搜索所述名人;
信息抓取单元,用于从搜索结果中抓取关于所述名人的百科词条。
信息模型建立子模块712包括:
词条预处理单元,用于解析所述百科词条的文本,对所述百科词条进行分词;
个体属性计算单元,用于进行词频-逆向文件频率计算获得所述百科词条中的关键词和关键词权重,其中,所述关键词和关键词权重表示所述名人的个体属性;
群体属性计算单元,用于通过利用支持向量机建立的分类模型确定所述名人的分类,其中,所述名人的分类表示所述名人的群体属性;
信息模型建立单元,用于将所述关键词和关键词权重作为第一组件,并且将所述名人的分类作为第二组件,建立所述名人的信息模型。
【实施例9】
图9示出了针对用户进行个性化推荐的服务器系统的框图,在图9所示系统中,服务器系统90包括信息模型提取模块62、用户模型处理模块63和信息推荐服务器64,其中,在信息模型数据库61所存储的信息模型包括可表示所述名人的个体属性和/或群体属性的组件,用户模型处理模块63可包括:
属性聚类子模块631,用于根据所述用户所关注的名人的信息模型,对所述用户所关注的名人的个体属性和/或群体属性进行聚类,相应地确定所述用户所关注的个体属性和/或群体属性;
用户模型建立子模块632,用于根据所述用户所关注的个体属性和/或群体属性建立所述用户模型。
当然,除了上述组件之外,服务器系统90还可以包括图7或图8中所示的部分或全部组件,此处不赘述。
【实施例10】
图10示出了针对用户进行个性化推荐的服务器系统的框图,参照图10,服务器系统100包括:
信息模型提取模块102,用于从信息模型数据库中提取用户所关注的名人的信息模型,所述信息模型数据库存储有基于第一建模策略为社交网络中满足预定条件的名人建立的信息模型;
通信模块103,用于将用户所关注的名人的信息模型发送至用户建模设备,以及用于接收从用户建模设备发送的用户模型,所述用户模型是根据所述用户所关注的名人的信息模型和第二建模策略建立的;
信息推荐服务器104,用于根据所述用户模型提取适合所述用户的信息,并向所述用户推荐该信息。
其中,服务器系统100位于网络侧,其信息模型提取模块102可以与通信模块103耦合或通信(示例性的,二者耦合时可构成服务器系统100中一个整体,二者通信时可以分别位于不同的服务器或分别与不同的组成部分耦合);通信模块103可以主动向用户建模设备发送用户模型,也可以根据用户建模设备的请求发送;通信模块103可以与信息推荐服务器104耦合或通信;信息模型提取模块102、通信模块103和信息推荐服务器104可构成一个整体也可以以可行的方式分布于互相通信的服务器中。
可选的,与实施例7类似,本实施例10中的服务器100还可以包括(虚线框表示该部分为可选)所述信息模型数据库105和/或信息模型处理模块101,信息模型处理模块101用于根据所述第一建模策略为所述名人建立信息模型,并将所述名人的信息模型存储至所述信息模型数据库。
其中,示例性的,信息模型处理模块101可包括:
网络信息收集子模块,用于从第三方信息平台获取所述名人的信息,所述第三方信息平台包括网络百科全书;
信息模型建立子模块,用于根据所述名人的信息建立所述名人的信息模型,所述名人的信息模型包括表示所述名人的个体属性和/或群体属性的组件。
对于信息模型处理模块101和信息模型数据库105的说明请参照实施例7中对于信息模型处理模块71和信息模型数据库72的说明,此处不再赘述。
【实施例11】
图11示出了一种用户建模设备的框图,参照图11,用户建模设备110包括:
接收模块111,用于接收由服务器系统(例如:服务器系统100)发送的用户所关注的名人的信息模型,所述信息模型是基于第一建模策略建立的,所述名人为社交网络中满足预定条件的人;
用户模型处理模块112,用于根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;
发送模块113,用于将所述用户模型发送至所述服务器系统。
在本实施例中,接收模块111可以接收服务器系统主动发送的信息模型,也可以接收在用户建模设备110向服务器系统发送(例如:通过发送模块113发送)请求后,由服务器系统发送的信息模型。
示例性的,用户模型处理模块112可包括:
属性聚类子模块,用于根据所述用户所关注的名人的信息模型,对所述用户所关注的名人的个体属性和/或群体属性进行聚类,确定所述用户所关注的个体属性和/或群体属性;
用户模型建立子模块,用于根据所述用户所关注的个体属性和/或群体属性建立所述用户模型。
可选的,用户建模设备110还可以包括用于存储所述用户模型的存储模块。
【实施例12】
图12示出了一种针对用户进行个性化推荐的网络系统,参照图12,网络系统包括实施例10中的服务器系统100和实施例11中的用户建模设备110。
在本发明的另一种实施方式中,针对用户进行个性化推荐的网络系统(未图示)可以包括实施例6-9所示的服务器系统。
示例性的,在一种更为具体的网络系统的实施方式中,网络系统可包括:
用户终端,用于与服务器系统通信并授权服务器系统访问用户的社交网络账号;
社交网络服务器,用于存储用户的社交网络账号的信息,该信息包括用户的关注名单;
所述服务器系统,用于在得到用户授权后获取所述关注名单并确定用户所关注的名人,以及执行包括服务器60所执行的处理在内的处理;
信息模型数据库,用于存储名人的信息模型。
示例性的,在另一种更为具体的网络系统的实施方式中,网络系统可包括:
用户终端,用于与服务器系统通信并授权服务器系统访问用户的社交网络账号,以及用于执行用户建模设备110所执行的处理;
社交网络服务器,用于存储用户的社交网络账号的信息,该信息包括用户的关注名单;
所述服务器系统,用于在得到用户授权后获取所述关注名单并确定用户所关注的名人,以及执行服务器100所执行的处理;
信息模型数据库,用于存储名人的信息模型。
当然,上述列举的两种实施方式中,用户终端也可以不向服务器系统授权,而是由用户终端确定用户所关注的名人再上传给所述服务器系统。
本领域技术人员应当理解,本发明的设备和系统实施例中的各个组件可以根据本发明方法实施例中的处理方式、采用现有的通信手段通信。在方法实施例中对一些名词的解释同样适用于系统实施例。
本领域技术人员也应当理解,如果将本发明设备的系统实施例中的全部或部分组件通过耦合、物理连接等方式进行组合,则组合后的组件可以组成具有特定功能的设备/装置,用这样的设备/装置代替本发明的系统中的相应组件同样落在本发明的保护范围内。
采用本发明提供的方案,很准确地确定用户的兴趣,提高推荐的信息的准确度,避免所推荐的信息资源的浪费和冷启动问题,能有效改善用户体验,使用户在尽可能短的时间得到感兴趣的信息(例如:商品信息、新闻信息)。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,智能手机或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本发明说明书中使用的术语和措辞仅仅为了举例说明,并不意味构成限定。本领域技术人员应当理解,在不脱离所公开的实施方式的基本原理的前提下,对上述实施方式中的各细节可进行各种变化。因此,本发明的范围只由权利要求确定,在权利要求中,除非另有说明,所有的术语应按最宽泛合理的意思进行理解。

Claims (11)

1.一种针对用户进行个性化推荐的方法,其特征在于,所述方法包括:
根据第一建模策略为名人建立信息模型,并将所述名人的信息模型存储至信息模型数据库,其中,所述名人为社交网络中满足预定条件的人;
从所述信息模型数据库中提取用户所关注的名人的信息模型;
根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;
获取根据所述用户模型提取的适合所述用户的信息,并向所述用户推荐该信息;
其中,所述根据第一建模策略为名人建立信息模型包括:从第三方信息平台获取所述名人的信息,根据所述名人的信息建立所述名人的信息模型;
其中,所述第三方信息平台包括网络百科全书,所述从第三方信息平台获取所述名人的信息包括:通过所述网络百科全书搜索所述名人,并从搜索结果中抓取关于所述名人的百科词条;
其中,所述根据所述名人的信息建立所述名人的信息模型包括:
解析所述百科词条的文本,对所述百科词条进行分词,
进行词频-逆向文件频率计算获得所述百科词条中的关键词和关键词权重,其中,所述关键词和关键词权重表示所述名人的个体属性,
通过利用支持向量机建立的分类模型确定所述名人的分类,其中,所述名人的分类表示所述名人的群体属性,
将所述关键词和关键词权重作为第一组件,并且将所述名人的分类作为第二组件,建立所述名人的信息模型。
2.如权利要求1所述的方法,其特征在于,基于第一建模策略为所述名人建立的信息模型包括表示所述名人的个体属性和/或群体属性的组件。
3.如权利要求1或2所述的方法,其特征在于,根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型包括:
根据所述用户所关注的名人的信息模型,对所述用户所关注的名人的个体属性和/或群体属性进行聚类,确定所述用户所关注的个体属性和/或群体属性;
根据所述用户所关注的个体属性和/或群体属性建立所述用户模型。
4.一种针对用户进行个性化推荐的服务器系统,其特征在于,所述服务器系统包括:
信息模型数据库;
信息模型处理模块,用于根据第一建模策略为社交网络中满足预定条件的名人建立信息模型,并将所述名人的信息模型存储至所述信息模型数据库;
信息模型提取模块,用于从信息模型数据库中提取用户所关注的名人的信息模型;
用户模型处理模块,用于根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;
信息推荐服务器,用于根据所述用户模型提取适合所述用户的信息,并向所述用户推荐该信息;
其中,所述信息模型处理模块包括:
网络信息收集子模块,用于从第三方信息平台获取所述名人的信息,
信息模型建立子模块,用于根据所述名人的信息建立所述名人的信息模型;
其中,所述第三方信息平台包括网络百科全书,所述网络信息收集子模块包括:
搜索单元,用于通过所述网络百科全书搜索所述名人,
信息抓取单元,用于从搜索结果中抓取关于所述名人的百科词条以由信息模型处理模块进行处理;
其中,所述信息模型建立子模块包括:
词条预处理单元,用于解析所述百科词条的文本,对所述百科词条进行分词,
个体属性计算单元,用于进行词频-逆向文件频率计算获得所述百科词条中的关键词和关键词权重,其中,所述关键词和关键词权重表示所述名人的个体属性,
群体属性计算单元,用于通过利用支持向量机建立的分类模型确定所述名人的分类,其中,所述名人的分类表示所述名人的群体属性,
信息模型建立单元,用于将所述关键词和关键词权重作为第一组件,并且将所述名人的分类作为第二组件,建立所述名人的信息模型。
5.如权利要求4所述的服务器系统,其特征在于,基于第一建模策略为所述名人建立的信息模型包括表示所述名人的个体属性和/或群体属性的组件。
6.如权利要求4或5所述的服务器系统,其特征在于,所述用户模型处理模块包括:
属性聚类子模块,用于根据所述用户所关注的名人的信息模型,对所述用户所关注的名人的个体属性和/或群体属性进行聚类,确定所述用户所关注的个体属性和/或群体属性;
用户模型建立子模块,用于根据所述用户所关注的个体属性和/或群体属性建立所述用户模型。
7.一种针对用户进行个性化推荐的服务器系统,其特征在于,包括:
信息模型数据库;
信息模型处理模块,用于根据第一建模策略为社交网络中满足预定条件的名人建立信息模型,并将所述名人的信息模型存储至所述信息模型数据库;
信息模型提取模块,用于从信息模型数据库中提取用户所关注的名人的信息模型;
通信模块,用于将用户所关注的名人的信息模型发送至用户建模设备,以及用于接收从所述用户建模设备发送的用户模型,所述用户模型是由所述用户建模设备根据所述用户所关注的名人的信息模型和第二建模策略建立的;
信息推荐服务器,用于根据所述用户模型提取适合所述用户的信息,并向所述用户推荐该信息;
其中,所述信息模型处理模块包括:
网络信息收集子模块,用于从第三方信息平台获取所述名人的信息,所述第三方信息平台包括网络百科全书,
信息模型建立子模块,用于根据所述名人的信息建立所述名人的信息模型,所述名人的信息模型包括表示所述名人的个体属性和/或群体属性的组件;
其中,所述网络信息收集子模块包括:
搜索单元,用于通过所述网络百科全书搜索所述名人,
信息抓取单元,用于从搜索结果中抓取关于所述名人的百科词条以由信息模型处理模块进行处理;
其中,所述信息模型建立子模块包括:
词条预处理单元,用于解析所述百科词条的文本,对所述百科词条进行分词,
个体属性计算单元,用于进行词频-逆向文件频率计算获得所述百科词条中的关键词和关键词权重,其中,所述关键词和关键词权重表示所述名人的个体属性,
群体属性计算单元,用于通过利用支持向量机建立的分类模型确定所述名人的分类,其中,所述名人的分类表示所述名人的群体属性,
信息模型建立单元,用于将所述关键词和关键词权重作为第一组件,并且将所述名人的分类作为第二组件,建立所述名人的信息模型。
8.一种针对用户进行个性化推荐的网络系统,其特征在于,包括:如权利要求4-6中任一项所述的服务器系统。
9.一种针对用户进行个性化推荐的网络系统,其特征在于,包括:
如权利要求7所述的服务器系统,和用户建模设备;
其中,所述用户建模设备用于根据用户所关注的名人的信息模型和第二建模策略为用户建立用户模型。
10.如权利要求9所述的网络系统,其特征在于,所述用户建模设备包括:
接收模块,用于接收由服务器系统发送的用户所关注的名人的信息模型,所述信息模型是基于第一建模策略建立的,所述名人为社交网络中满足预定条件的人;
用户模型处理模块,用于根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;
发送模块,用于将所述用户模型发送至服务器系统。
11.如权利要求10所述的网络系统,其特征在于,所述用户模型处理模块包括:
属性聚类子模块,用于根据所述用户所关注的名人的信息模型,对所述用户所关注的名人的个体属性和/或群体属性进行聚类,确定所述用户所关注的个体属性和/或群体属性;
用户模型建立子模块,用于根据所述用户所关注的个体属性和/或群体属性建立所述用户模型。
CN201410040954.5A 2014-01-28 2014-01-28 针对用户进行个性化推荐的方法、用户建模设备及系统 Active CN103870538B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410040954.5A CN103870538B (zh) 2014-01-28 2014-01-28 针对用户进行个性化推荐的方法、用户建模设备及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410040954.5A CN103870538B (zh) 2014-01-28 2014-01-28 针对用户进行个性化推荐的方法、用户建模设备及系统

Publications (2)

Publication Number Publication Date
CN103870538A CN103870538A (zh) 2014-06-18
CN103870538B true CN103870538B (zh) 2017-02-15

Family

ID=50909068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410040954.5A Active CN103870538B (zh) 2014-01-28 2014-01-28 针对用户进行个性化推荐的方法、用户建模设备及系统

Country Status (1)

Country Link
CN (1) CN103870538B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197330B (zh) * 2014-11-10 2019-10-29 北京字节跳动网络技术有限公司 基于社交平台的数据挖掘方法及装置
CN104991973B (zh) * 2015-07-31 2018-11-13 网易传媒科技(北京)有限公司 一种用户兴趣领域的确定方法和设备
CN106815217A (zh) * 2015-11-30 2017-06-09 北京云莱坞文化传媒有限公司 故事推荐方法和故事推荐装置
CN106951422B (zh) * 2016-01-07 2021-05-28 腾讯科技(深圳)有限公司 网页训练的方法和装置、搜索意图识别的方法和装置
CN106095867B (zh) * 2016-06-03 2019-08-23 北京奇虎科技有限公司 一种基于行业分析的图书推荐方法及装置
CN106943747B (zh) * 2017-03-27 2021-02-12 网易(杭州)网络有限公司 虚拟角色名称推荐方法、装置、电子设备和存储介质
CN107665443B (zh) * 2017-05-10 2019-10-25 平安科技(深圳)有限公司 获取目标用户的方法及装置
CN107656918B (zh) * 2017-05-10 2019-07-05 平安科技(深圳)有限公司 获取目标用户的方法及装置
CN107357867B (zh) * 2017-06-28 2020-11-10 浙报融媒体科技(浙江)有限责任公司 一种推荐效果好的视频推荐系统
CN107918922B (zh) * 2017-11-15 2020-10-27 中国联合网络通信集团有限公司 业务推荐方法及业务推荐装置
CN108920649B (zh) * 2018-06-29 2021-09-17 北京百度网讯科技有限公司 一种信息推荐方法、装置、设备和介质
CN110209944B (zh) * 2019-06-10 2023-07-28 上海时廊人工智能科技有限公司 一种股票分析师推荐方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770487A (zh) * 2008-12-26 2010-07-07 聚友空间网络技术有限公司 社交网络中用户影响力的计算方法和系统
CN102567376A (zh) * 2010-12-16 2012-07-11 中国移动通信集团浙江有限公司 一种个性化搜索结果推荐方法和装置
CN102890689A (zh) * 2011-07-22 2013-01-23 北京百度网讯科技有限公司 一种用户兴趣模型的建立方法及系统
CN102999507A (zh) * 2011-09-13 2013-03-27 腾讯科技(北京)有限公司 网络微博名人信息的推荐处理方法和装置
WO2013123830A1 (zh) * 2012-02-24 2013-08-29 腾讯科技(深圳)有限公司 一种微博用户的推荐方法和系统、计算机存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770487A (zh) * 2008-12-26 2010-07-07 聚友空间网络技术有限公司 社交网络中用户影响力的计算方法和系统
CN102567376A (zh) * 2010-12-16 2012-07-11 中国移动通信集团浙江有限公司 一种个性化搜索结果推荐方法和装置
CN102890689A (zh) * 2011-07-22 2013-01-23 北京百度网讯科技有限公司 一种用户兴趣模型的建立方法及系统
CN102999507A (zh) * 2011-09-13 2013-03-27 腾讯科技(北京)有限公司 网络微博名人信息的推荐处理方法和装置
WO2013123830A1 (zh) * 2012-02-24 2013-08-29 腾讯科技(深圳)有限公司 一种微博用户的推荐方法和系统、计算机存储介质

Also Published As

Publication number Publication date
CN103870538A (zh) 2014-06-18

Similar Documents

Publication Publication Date Title
CN103870538B (zh) 针对用户进行个性化推荐的方法、用户建模设备及系统
US11847612B2 (en) Social media profiling for one or more authors using one or more social media platforms
CN108108821B (zh) 模型训练方法及装置
CN107526807B (zh) 信息推荐方法及装置
WO2020200199A1 (zh) 个性化推荐的方法、终端设备和系统
CN107220386A (zh) 信息推送方法和装置
CN109902216A (zh) 一种基于社交网络的数据采集与分析方法
CN112104642B (zh) 一种异常账号确定方法和相关装置
CN106126582A (zh) 推荐方法及装置
US20230034025A1 (en) Method and system for online user profiling
CN103778260A (zh) 一种个性化微博信息推荐系统和方法
CN102223393A (zh) 用于来自用户社交网络的关系表征和利用的方法和系统
CN105868267B (zh) 一种移动社交网络用户兴趣的建模方法
WO2013138968A1 (en) Method and system for hybrid information query
CN106682686A (zh) 一种基于手机上网行为的用户性别预测方法
CN106062743A (zh) 用于关键字建议的系统和方法
CN103761254A (zh) 多领域服务主题匹配推荐方法
CN109472027A (zh) 一种基于博文相似性的社交机器人检测系统及方法
CN104199872A (zh) 一种信息推荐的方法以及装置
CN110472008B (zh) 智能交互方法以及装置
CN103970891A (zh) 一种基于情境的用户兴趣信息查询方法
CN109727047A (zh) 一种确定数据关联度的方法和装置、数据推荐方法和装置
CN107977678A (zh) 用于输出信息的方法和装置
CN107634897A (zh) 群推荐方法和装置
CN109635192A (zh) 面向微服务的海量资讯热度排行更新方法及平台

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20140618

Assignee: Beijing small mutual Entertainment Technology Co., Ltd.

Assignor: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Contract record no.: 2017990000063

Denomination of invention: Method, user modeling equipment and system for carrying out personalized recommendation for users

Granted publication date: 20170215

License type: Exclusive License

Record date: 20170228

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model