CN103631896A - 社交平台下的领域专家发现方法和装置 - Google Patents

社交平台下的领域专家发现方法和装置 Download PDF

Info

Publication number
CN103631896A
CN103631896A CN201310585627.3A CN201310585627A CN103631896A CN 103631896 A CN103631896 A CN 103631896A CN 201310585627 A CN201310585627 A CN 201310585627A CN 103631896 A CN103631896 A CN 103631896A
Authority
CN
China
Prior art keywords
field
expert
user
bean vermicelli
seed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310585627.3A
Other languages
English (en)
Inventor
昝艳
谌贻荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weimeng Chuangke Network Technology China Co Ltd
Original Assignee
Weimeng Chuangke Network Technology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weimeng Chuangke Network Technology China Co Ltd filed Critical Weimeng Chuangke Network Technology China Co Ltd
Priority to CN201310585627.3A priority Critical patent/CN103631896A/zh
Publication of CN103631896A publication Critical patent/CN103631896A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种社交平台下的领域专家发现方法和装置,所述方法包括:对于一个领域,确定该领域的每个种子专家的粉丝;对于每个确定出的粉丝,计算该粉丝关注的该领域的种子专家的个数与该领域的种子专家的总数的比值;将比值高于设定阈值的粉丝作为所述优质粉丝;对于查找出的优质粉丝所关注的每个用户,计算该用户与该领域的相关度;选取N个与该领域的相关度最大的用户作为该领域的专家。应用本发明,可以使得发现领域专家的过程既简单又准确。

Description

社交平台下的领域专家发现方法和装置
技术领域
本发明涉及互联网技术,尤其涉及一种社交平台下的领域专家发现方法和装置。
背景技术
随着互联网技术的发展,通过社交平台来进行信息的分享、传播以及获取,已成为广大网民的主要社交方式之一。例如,通过微博或Twitter(推特)等社交平台,用户可以通过各种客户端组建个人社区,以140字左右的文字更新信息,并实现将自己的最新动态和想法即时分享。而UGC(User GeneratedContent,用户生成内容)标签就是在社交平台环境下由用户生成的描述了用户的身份、性格、兴趣情感等内容的标签。
实际应用中,在社交平台下,如何自动挖掘某个领域下的专家用户是个很基础且重要的问题。如果能够对于某个领域的专家进行准确的挖掘,对于很多上层应用来说都有很好的作用,比如可以利用挖掘结果为社交平台用户推荐其感兴趣的领域专家;或者为专家搜索提供基础服务等。
领域专家的传统发现方法是采用基于内容的信息检索技术来确定领域专家。具体地,以微博为例,在微博环境下,给定一个领域的关键词后,根据用户的博文内容,统计出该关键词出现在该用户的博文内容中的出现概率;结合统计出的出现概率以及预先建立的语言模型,确定出该用户在该领域成为专家的概率;最后,可以按照各用户在该领域成为专家的概率的大小排序找到该领域的专家。在上述传统的领域专家发现方法中,需要分析所有用户的博文内容才能得到某一领域的关键词出现在一个用户的博文内容中的出现概率,而实际应用中用户的博文内容是由用户生成的多媒体数据,形式复杂、歧义多,因此,博文内容分析难度大,使得传统的领域专家发现方法算法复杂、运行速度慢。
现有还提出了一种改进的领域专家发现方法,即利用网络节点之间的链接结构确定节点的重要性的方法。具体地,以微博为例,在微博环境下,将用户看作一个节点,用户之间的关注关系看作边,即可形成一个有向网络,根据各用户之间的关注关系,使用pagerank(网页级别)算法可找到各用户的权威度排序,将权威度排序靠前的用户作为领域专家。虽然,基于pagerank算法的领域专家发现方法避免了分析社交平台下的每个用户的博文内容,降低了发现领域专家的复杂度。但是,使用pagerank算法在社交平台上进行用户节点排序,忽略了用户与领域的相关性,使得发现的领域专家的准确性不高。
实际应用中,对于一个领域,还可以预先将少量的领域专家作为种子专家,然后通过HITS(Hyperlink-Induced Topic Search,基于超链接分析的主题搜索)算法,根据种子专家的关注关系,可找到各种子专家所关注的用户的权威度排序,将权威度排序靠前的用户作为该领域的领域专家,并将发现的领域专家作为下一次发现过程的种子专家,以得到该领域更多的领域专家。HITS算法虽然与领域密切相关,但是社交平台下的用户社交关系链接不完全等同于网页的超级链接关系,所以每次发现的领域专家是与该次发现过程中的种子专家具有直接链接指向关系的用户。然而,社交平台是自媒体,用户多是倾向于宣传自己的观点言论等,领域内的专家不一定也大量关注其他专家,所以基于HITS算法的领域专家发现方法存在准确性不高的不足。
综上所述,现有的领域专家发现方法存在算法复杂、运行速度慢,以及准确性不高的不足。
发明内容
本发明实施例提供了一种社交平台下的领域专家发现方法和装置,用以使得发现领域专家的过程既简单又准确。
根据本发明的一个方面,提供了一种社交平台下的领域专家发现方法,包括:
对于一个领域,查找所述社交平台下该领域的种子专家的优质粉丝;
从查找出的优质粉丝所关注的用户中选取出该领域的其它专家。
较佳地,所述领域的种子专家是预先确定出的:
将至少一个UGC标签与预先设定的该领域的关键词标签相同的所述社交平台下的用户作为该领域的相关用户;
确定该领域的各相关用户之间的关注关系;
使用pagerank算法对该领域的各相关用户基于确定出的关注关系进行权威度排序;
将权威度排序靠前的M个该领域的相关用户作为该领域的种子专家。
较佳地,所述查找所述社交平台下该领域的种子专家的优质粉丝,具体包括:
确定该领域的每个种子专家的粉丝;对于每个确定出的粉丝,计算该粉丝关注的该领域的种子专家的个数与该领域的种子专家的总数的比值;将比值高于设定阈值的粉丝作为所述优质粉丝。
较佳地,所述从查找出的优质粉丝所关注的用户中选取出该领域的其它专家,具体包括:
对于查找出的优质粉丝所关注的每个用户,计算该用户与该领域的相关度;
选取N个与该领域的相关度最大的用户作为该领域的其它专家。
较佳地,所述计算该用户与该领域的相关度,具体包括:
根据如下公式1计算出该用户与该领域的相关度DC:
DC=F(X,Y)/F(X)*F(Y)   (公式1)
其中,F(X)是指该用户的粉丝的数量;F(Y)是指该领域的种子专家的优质粉丝的数量;F(X,Y)是指该用户的粉丝中属于该领域的种子专家的优质粉丝的数量。
较佳地,在所述选取出该领域的其它专家后,还包括:
将选取出的该领域的其它专家作为该领域的种子专家。
根据本发明的另一个方面,还提供了一种社交平台下的领域专家发现装置,包括:
优质粉丝确定模块,用于对于一个领域,查找所述社交平台下该领域的种子专家的优质粉丝;
领域专家确定模块,用于从所述优质粉丝确定模块查找出的优质粉丝所关注的用户中选取出该领域的其它专家。
较佳地,所述社交平台下的领域专家发现装置还包括:
种子专家确定模块,用于将至少一个UGC标签与预先设定的该领域的关键词标签相同的所述社交平台的用户作为该领域的相关用户;确定该领域的各相关用户之间的关注关系;使用pagerank算法对该领域的各相关用户基于确定出的关注关系进行权威度排序;将权威度排序靠前的M个该领域的相关用户作为该领域的种子专家。
较佳地,所述优质粉丝确定模块具体用于确定该领域的每个种子专家的粉丝;对于每个确定出的粉丝,计算该粉丝关注的该领域的种子专家的个数与该领域的种子专家的总数的比值;将比值高于设定阈值的粉丝作为所述优质粉丝。
较佳地,所述领域专家确定模块具体用于对于查找出的优质粉丝所关注的每个用户,根据如下公式1计算该用户与该领域的相关度DC:
DC=F(X,Y)/F(X)*F(Y)   (公式1)
其中,F(X)是指该用户的粉丝的数量;F(Y)是指该领域的种子专家的优质粉丝的数量;F(X,Y)是指该用户的粉丝中属于该领域的种子专家的优质粉丝的数量;以及
所述领域专家确定模块选取N个与该领域的相关度最大的用户作为该领域的其它专家。
本发明实施例的技术方案中,对于一个领域,可以查找社交平台下该领域的种子专家的优质粉丝;从查找出的优质粉丝所关注的用户中选取出该领域的其它专家。这样,避免了分析社交平台下各个用户的博文内容,简化了领域专家的发现过程;而且,相比现有直接将忽略用户与领域的相关性的权威用户,或是将针对领域的种子专家所关注的用户作为领域专家的方法,通过针对某一领域的种子专家的优质粉丝所关注的用户来确定该领域的专家的方法更为准确。
附图说明
图1为本发明实施例的种子专家确定的方法的流程图;
图2为本发明实施例的社交平台下的领域专家发现方法的流程图;
图3为本发明实施例的社交平台下的领域专家发现装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举出优选实施例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以实现本发明的这些方面。
本申请使用的“模块”、“系统”等术语旨在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限于:处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。一个或多个模块可以位于执行中的一个进程和/或线程内。
本发明的发明人考虑到,对于一个领域,可以通过准备少量的领域专家作为种子专家;根据社交平台下各用户之间的关注关系,找出关注这些种子专家的优质粉丝;根据查找出的优质粉丝所关注的每个用户与该领域的相关度,选取设定数量的与该领域的相关度最大的用户作为该领域的专家。从而,避免了分析社交平台下各个用户的博文内容,简化了领域专家的发现过程;而且,相比现有直接将忽略用户与领域的相关性的权威用户,或是将针对领域的种子专家所关注的用户作为领域专家的方法,通过针对某一领域的种子专家的优质粉丝所关注的用户来确定该领域的专家的方法更为准确。
下面结合附图详细说明本发明的技术方案。
本发明实施例中,在发现社交平台下的领域专家之前,可以通过人工筛选的方式预先确定出每个领域的种子专家。
作为一种更优的实施方式,本发明的技术方案中还可以通过领域的关键词标签确定出该领域的种子专家,具体方法如图1所示,包括如下步骤:
S101:将至少一个UGC标签与预先设定的该领域的关键词标签相同的社交平台下的用户作为该领域的相关用户。
具体地,社交平台具体可以为微博、Twitter等;相应的,对于一个领域,针对该领域的关键词标签可以由本领域技术人员预先根据经验预先设定,以微博为例,对于美食领域,可以设定该领域的关键词标签包括:“美食家”、“做饭”、“食谱”、“川菜”等。
实际应用中,社交平台下,一个用户具有的UGC标签的数据格式为:
用户1:标签1,标签2,标签3,…;
由此,可以得出每个UGC标签所属的用户,数据格式为:
标签1:用户1,用户2,用户3,…;
这样,对于一个领域,就可以根据预先设定的该领域的关键词标签,将至少一个UGC标签与该领域的关键词标签相同的社交平台下的用户确定为该领域的相关用户。例如,根据美食领域的一个关键词标签“美食家”,查找到关键词标签“美食家”所属的用户包括:“美食微吧”、“摆渡大厨”、“海外美食家”等;根据美食领域的另一个关键词标签“大厨”,查找到关键词标签“大厨”所属的用户包括:“文怡”、“摆渡大厨”、“海外美食家”、“贝太厨房”等。因此,可以将“美食微吧”、“文怡”、“摆渡大厨”、“海外美食家”、“贝太厨房”等作为美食领域的相关用户。
S102:确定该领域的各相关用户之间的关注关系。
具体地,对于一个领域,在确定出该领域的相关用户后,可以根据各相关用户在社交平台上的关注关系和粉丝关系,确定出该领域的各相关用户之间的关注关系。
S103:使用pagerank算法对该领域的各相关用户基于确定出的关注关系进行权威度排序。
具体地,根据确定出的该领域的各相关用户之间的关注关系,使用pagerank算法得到该领域的各个相关用户的权威度,并对各相关用户进行权威度排序。关于如何使用pagerank算法得到相关用户的权威度为本领域技术人员所公知的技术,在此不再详述。
例如,对于由步骤S101确定出的美食领域的每个相关用户,使用pagerank算法,以及各相关用户之间的关注关系,得到按权威度降序排序的各相关用户,具体排序如下:“美食微吧”、“文怡”、“摆渡大厨”、“海外美食家”、“贝太厨房”。
S104:将权威度排序靠前的M个该领域的相关用户作为该领域的种子专家。
具体地,对于一个领域,根据得到的该领域的各相关用户的权威度排序,从中选取权威度排序靠前的M个该领域的相关用户,并将选取的相关用户作为该领域的种子专家。例如,当M取值为3时,则可以将权威度排序靠前的“美食微吧”、“文怡”、“摆渡大厨”作为美食领域的种子专家。
更优地,为了进一步提高种子专家的质量,还可以对选取的M个种子专家进行人工筛选,用以得到该领域的优质的种子专家,这样,可以使得后续根据确定出的种子专家发现的该领域的专家更为准确。
基于上述方法得到的领域的种子专家,本发明实施例提供的一种社交平台下的领域专家发现方法中,对于一个领域,查找社交平台下该领域的种子专家的优质粉丝后,从查找出的优质粉丝所关注的用户中可以选取出该领域的其它专家;具体流程,如图2所示,包括如下步骤:
S201:对于一个领域,确定该领域的每个种子专家的粉丝。
S202:对于每个确定出的粉丝,计算该粉丝关注的该领域的种子专家的个数与该领域的种子专家的总数的比值。
具体地,对于每个确定出的粉丝,确定该粉丝所关注的该领域的种子专家的个数后,计算该粉丝所关注的该领域的种子专家的个数与该领域的种子专家的总数的比值;将计算出的比值作为该粉丝的专家关注比例。
S203:将比值高于设定阈值的粉丝作为该领域的种子专家的优质粉丝。
具体地,对于一个领域,针对每个确定出的粉丝,将该粉丝所关注的该领域的种子专家的个数与该领域的种子专家的总数的比值与设定的阈值进行比较后,确定比值高于设定阈值的粉丝为该领域的种子专家的优质粉丝。
实际应用中,在社交平台下,相对用户所关注的对象,用户的粉丝对用户而言是被动选择的,所以,对种子用户而言,他的粉丝质量也是不可控的。因此,在本发明的发现领域专家的过程中,对于一个领域,可以先查找到关注了该领域大部分种子专家的优质粉丝,比如,可以将比值达到70%的粉丝作为美食领域的优质粉丝。这样,有利于提高后续对候选用户的筛选质量以及发现领域专家的准确性。
S204:对于查找出的优质粉丝所关注的每个用户,计算该用户与该领域的相关度。
具体地,针对一个领域,可以将查找出的该领域的种子专家的优质粉丝所关注的每个用户作为该领域的候选用户;对于每个候选用户,根据该候选用户的粉丝关系,计算出该候选用户与该领域的相关度。
本发明实施例中,对于每个该领域的候选用户,该候选用户与该领域的相关度DC(Domain correlation,领域相关度),具体可根据如下公式1计算出:
DC=F(X,Y)/F(X)*F(Y)   (公式1)
其中,F(X)是指该候选用户的粉丝的数量;F(Y)是指该领域的种子专家的优质粉丝的数量;F(X,Y)是指该候选用户的粉丝中属于该领域的种子专家的优质粉丝的数量。
S205:将计算出的每个候选用户与该领域的相关度进行降序排序,从中选取N个与该领域的相关度最大的用户作为该领域的其它专家。
例如,对于美食领域,根据美食领域的种子专家的优质粉丝得到的该领域的候选用户包括:“美食天下”、“吃货爱小吃”、“美食”、“学点私房菜”、“美食搜罗特工”、“一切与美食有关”、“999道私房菜”、“美食工场”、“中华美食频道”、“全球美食大搜捕”。对于每个候选用户,根据该候选用户的粉丝关系,计算出该候选用户与美食领域的相关度。由此得到按与美食领域的相关度降序排序的各候选用户,具体排序如下:“吃货爱小吃”、“美食搜罗特工”、“美食”、“学点私房菜”、“一切与美食有关”、“美食工场”、“中华美食频道”、“全球美食大搜捕”、“美食天下”、“999道私房菜”。当N取值为5时,则可以根据各候选用户与美食领域的相关度的排序,从中选取排序靠前的“吃货爱小吃”、“美食搜罗特工”、“美食”、“学点私房菜”、“一切与美食有关”作为美食领域的专家。
本发明实施例中,通过从优质粉丝所关注的用户与该领域的相关度的排序确定领域专家的方法比基于pagerank算法发现领域专家的方法更好之处在于,pagerank算法容易把一些与领域无关的但粉丝数量较多的大号用户排名靠前,而使用本发明的排序方法,虽然大号用户也有不少该领域的优质粉丝关注它,但由于大号用户本身的粉丝非常多,因此,计算出来的相关度的数值会非常小,导致大号用户在排名上也不会靠前,这样,就可以排除与领域无关的但粉丝数量较多的大号用户,提高发现领域专家的准确性。
作为一种更优的实施方式,本发明实施例提供的社交平台下的领域专家发现方法中,对于一个领域,在从查找出的优质粉丝所关注的用户中选取出该领域的专家后,还包括:将选取出的该领域的专家作为该领域的种子专家。这样,对于一个领域,在将每次发现的领域专家作为该领域的种子专家之后,可以通过本发明提供的社交平台下的领域专家发现方法,进行下一轮的发现过程得到新的领域专家,如此反复迭代,直至满足一定的迭代次数,或新获得的该领域的专家的数量满足一定的数量要求。
更优地,在从查找出的优质粉丝所关注的用户中选取出该领域的专家后,可以确定与该领域的相关度大于设定阈值的该领域的专家为该领域的种子专家,并应用到下一轮的该领域的领域专家发现过程。这样,可以保证该领域的种子专家的质量,进而提高发现领域专家的准确性。
基于上述社交平台下的领域专家发现方法,本发明实施例还提供了一种社交平台下的领域专家发现装置,如图3所示,包括:优质粉丝确定模块301和领域专家确定模块302。
其中,优质粉丝确定模块301用于对于一个领域,查找微博环境下该领域的种子专家的优质粉丝。具体地,优质粉丝确定模块301确定该领域的每个种子专家的粉丝;对于每个确定出的粉丝,计算该粉丝关注的该领域的种子专家的个数与该领域的种子专家的总数的比值;将比值高于设定阈值的粉丝作为该领域的种子专家的优质粉丝。
领域专家确定模块302用于从优质粉丝确定模块301查找出的优质粉丝所关注的用户中选取出该领域的其它专家。
具体地,领域专家确定模块302用于在接收由优质粉丝确定模块301查找出的优质粉丝后,对于查找出的优质粉丝所关注的每个用户,计算该用户与该领域的相关度;并选取N个与该领域的相关度最大的用户作为该领域的专家。
其中,领域专家确定模块302对于每个该领域的候选用户,该候选用户与该领域的相关度DC(Domain correlation,领域相关度),具体可根据上述公式1计算出。
进一步地,本发明实施例提供的一种社交平台的领域专家发现装置还包括:种子专家确定模块303。
种子专家确定模块303用于将至少一个UGC标签与预先设定的该领域的关键词标签相同的社交平台下的用户作为该领域的相关用户;确定该领域的各相关用户之间的关注关系;使用pagerank算法对该领域的各相关用户基于确定出的关注关系进行权威度排序;将权威度排序靠前的M个该领域的相关用户作为该领域的种子专家。
具体地,对于一个领域,种子专家确定模块可以根据预先设定的该领域的关键词标签,将至少一个UGC标签与该领域的关键词标签相同的社交平台下的用户确定为该领域的相关用户;在确定出的该领域的相关用户后,确定出该领域的各相关用户之间的关注关系;再根据该领域的各相关用户之间的关注关系,使用pagerank算法得到该领域的各相关用户的权威度,并将得到的权威度进行降序排序,从中选取权威度排序靠前的M个该领域的相关用户,并将选取的相关用户作为该领域的种子专家。
作为一种更优的实施方式,种子专家确定模块303还用于在从查找出的优质粉丝所关注的用户中选取出该领域的专家后,将选取出的该领域的专家作为该领域的种子专家。这样,对于一个领域,在将每次发现的领域专家作为该领域的种子专家之后,可以通过本发明提供的社交平台下的领域专家发现方法,进行下一轮的发现过程,如此反复迭代,直至满足一定的迭代次数,或新获得的该领域的专家的数量满足一定的数量要求。
本发明的技术方案中,对于一个领域,社交平台下的领域专家发现装置可以根据预先确定的该领域的种子专家,查找社交平台下该领域的种子专家的优质粉丝;根据查找出的优质粉丝所关注的每个用户与该领域的相关度,选取设定数量的与该领域的相关度最大的用户作为该领域的专家。避免了分析社交平台下各个用户的博文内容,简化了领域专家的发现过程;而且,通过针对某一领域的种子专家的优质粉丝所关注的用户与该领域的相关度得到的领域专家的方法,相比直接将种子专家的粉丝作为领域专家的方法更为准确。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读取存储介质中,如:ROM/RAM、磁碟、光盘等。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种社交平台下的领域专家发现方法,其特征在于,包括:
对于一个领域,查找所述社交平台下该领域的种子专家的优质粉丝;
从查找出的优质粉丝所关注的用户中选取出该领域的其它专家。
2.如权利要求1所述的方法,其特征在于,所述领域的种子专家是预先确定出的:
将至少一个UGC标签与预先设定的该领域的关键词标签相同的所述社交平台下的用户作为该领域的相关用户;
确定该领域的各相关用户之间的关注关系;
使用pagerank算法对该领域的各相关用户基于确定出的关注关系进行权威度排序;
将权威度排序靠前的M个该领域的相关用户作为该领域的种子专家。
3.如权利要求1所述的方法,其特征在于,所述查找所述社交平台下该领域的种子专家的优质粉丝,具体包括:
确定该领域的每个种子专家的粉丝;对于每个确定出的粉丝,计算该粉丝关注的该领域的种子专家的个数与该领域的种子专家的总数的比值;将比值高于设定阈值的粉丝作为所述优质粉丝。
4.如权利要求1所述的方法,其特征在于,所述从查找出的优质粉丝所关注的用户中选取出该领域的其它专家,具体包括:
对于查找出的优质粉丝所关注的每个用户,计算该用户与该领域的相关度;
选取N个与该领域的相关度最大的用户作为该领域的其它专家。
5.如权利要求4所述的方法,其特征在于,所述计算该用户与该领域的相关度,具体包括:
根据如下公式1计算出该用户与该领域的相关度DC:
DC=F(X,Y)/F(X)*F(Y)   (公式1)
其中,F(X)是指该用户的粉丝的数量;F(Y)是指该领域的种子专家的优质粉丝的数量;F(X,Y)是指该用户的粉丝中属于该领域的种子专家的优质粉丝的数量。
6.如权利要求1-5任一所述的方法,其特征在于,在所述选取出该领域的其它专家后,还包括:
将选取出的该领域的其它专家作为该领域的种子专家。
7.一种社交平台下的领域专家发现装置,其特征在于,包括:
优质粉丝确定模块,用于对于一个领域,查找所述社交平台下该领域的种子专家的优质粉丝;
领域专家确定模块,用于从所述优质粉丝确定模块查找出的优质粉丝所关注的用户中选取出该领域的其它专家。
8.如权利要求7所述的装置,其特征在于,还包括:
种子专家确定模块,用于将至少一个UGC标签与预先设定的该领域的关键词标签相同的所述社交平台的用户作为该领域的相关用户;确定该领域的各相关用户之间的关注关系;使用pagerank算法对该领域的各相关用户基于确定出的关注关系进行权威度排序;将权威度排序靠前的M个该领域的相关用户作为该领域的种子专家。
9.如权利要求7所述的装置,其特征在于,
所述优质粉丝确定模块具体用于确定该领域的每个种子专家的粉丝;对于每个确定出的粉丝,计算该粉丝关注的该领域的种子专家的个数与该领域的种子专家的总数的比值;将比值高于设定阈值的粉丝作为所述优质粉丝。
10.如权利要求7所述的装置,其特征在于,
所述领域专家确定模块具体用于对于查找出的优质粉丝所关注的每个用户,根据如下公式1计算该用户与该领域的相关度DC:
DC=F(X,Y)/F(X)*F(Y)   (公式1)
其中,F(X)是指该用户的粉丝的数量;F(Y)是指该领域的种子专家的优质粉丝的数量;F(X,Y)是指该用户的粉丝中属于该领域的种子专家的优质粉丝的数量;以及
所述领域专家确定模块选取N个与该领域的相关度最大的用户作为该领域的其它专家。
CN201310585627.3A 2013-11-19 2013-11-19 社交平台下的领域专家发现方法和装置 Pending CN103631896A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310585627.3A CN103631896A (zh) 2013-11-19 2013-11-19 社交平台下的领域专家发现方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310585627.3A CN103631896A (zh) 2013-11-19 2013-11-19 社交平台下的领域专家发现方法和装置

Publications (1)

Publication Number Publication Date
CN103631896A true CN103631896A (zh) 2014-03-12

Family

ID=50212938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310585627.3A Pending CN103631896A (zh) 2013-11-19 2013-11-19 社交平台下的领域专家发现方法和装置

Country Status (1)

Country Link
CN (1) CN103631896A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035967A (zh) * 2014-05-20 2014-09-10 微梦创科网络科技(中国)有限公司 社交网络中的领域专家发现方法和系统
CN106886921A (zh) * 2017-02-17 2017-06-23 正源信用(北京)科技有限公司 基于用户兴趣的个性化推荐方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101981590A (zh) * 2008-03-31 2011-02-23 雅虎公司 利用社交网络访问受信任的用户生成的内容
US20120158720A1 (en) * 2008-04-29 2012-06-21 Microsoft Corporation Social network powered search enhancements
CN102664828A (zh) * 2012-04-26 2012-09-12 复旦大学 一种在sns网络中好友推荐的系统和方法
CN102955781A (zh) * 2011-08-19 2013-03-06 腾讯科技(深圳)有限公司 一种人物搜索方法及装置
CN103108036A (zh) * 2013-01-22 2013-05-15 魏强 一种计算机网络人脉服务系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101981590A (zh) * 2008-03-31 2011-02-23 雅虎公司 利用社交网络访问受信任的用户生成的内容
US20120158720A1 (en) * 2008-04-29 2012-06-21 Microsoft Corporation Social network powered search enhancements
CN102955781A (zh) * 2011-08-19 2013-03-06 腾讯科技(深圳)有限公司 一种人物搜索方法及装置
CN102664828A (zh) * 2012-04-26 2012-09-12 复旦大学 一种在sns网络中好友推荐的系统和方法
CN103108036A (zh) * 2013-01-22 2013-05-15 魏强 一种计算机网络人脉服务系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035967A (zh) * 2014-05-20 2014-09-10 微梦创科网络科技(中国)有限公司 社交网络中的领域专家发现方法和系统
CN104035967B (zh) * 2014-05-20 2018-05-01 微梦创科网络科技(中国)有限公司 社交网络中的领域专家发现方法和系统
CN106886921A (zh) * 2017-02-17 2017-06-23 正源信用(北京)科技有限公司 基于用户兴趣的个性化推荐方法

Similar Documents

Publication Publication Date Title
Yin et al. Adapting to user interest drift for poi recommendation
CN107609152B (zh) 用于扩展查询式的方法和装置
US10572565B2 (en) User behavior models based on source domain
US10310834B2 (en) Searching and accessing application functionality
CN105556512B (zh) 用于分析关注实体特性的设备、系统以及方法
US10216851B1 (en) Selecting content using entity properties
US9626443B2 (en) Searching and accessing application functionality
CN104111941B (zh) 信息展示的方法及设备
WO2018121700A1 (zh) 基于已安装应用来推荐应用信息的方法、装置、终端设备及存储介质
CN105488068B (zh) 搜索音乐和建立索引的方法及装置、搜索结果判断方法
CN103838756A (zh) 一种确定推送信息的方法及装置
US9501530B1 (en) Systems and methods for selecting content
KR20180126577A (ko) 관련 엔티티 탐색
CN104516910A (zh) 在客户端服务器环境中推荐内容
CN104838376B (zh) 为显著用户生成用于信息取回查询的摘录
Gao et al. SeCo-LDA: Mining service co-occurrence topics for recommendation
CN109241403A (zh) 项目推荐方法、装置、机器设备和计算机可读存储介质
CN104077415A (zh) 搜索方法及装置
US20160188684A1 (en) Consolidating Search Results
WO2015185020A1 (en) Information category obtaining method and apparatus
CN103955480B (zh) 一种用于确定用户所对应的目标对象信息的方法与设备
CN112989169A (zh) 目标对象识别方法、信息推荐方法、装置、设备及介质
CN104992352A (zh) 一种个性化资源检索方法
Goarany et al. Mining social tags to predict mashup patterns
Magnani et al. Neural product retrieval at walmart. com

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140312

RJ01 Rejection of invention patent application after publication