CN103593342B - 基于单向用户关系的专家挖掘方法及挖掘系统 - Google Patents

基于单向用户关系的专家挖掘方法及挖掘系统 Download PDF

Info

Publication number
CN103593342B
CN103593342B CN201210286449.XA CN201210286449A CN103593342B CN 103593342 B CN103593342 B CN 103593342B CN 201210286449 A CN201210286449 A CN 201210286449A CN 103593342 B CN103593342 B CN 103593342B
Authority
CN
China
Prior art keywords
expert
user
seed set
seed
unidirectional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210286449.XA
Other languages
English (en)
Other versions
CN103593342A (zh
Inventor
文勖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210286449.XA priority Critical patent/CN103593342B/zh
Publication of CN103593342A publication Critical patent/CN103593342A/zh
Application granted granted Critical
Publication of CN103593342B publication Critical patent/CN103593342B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种基于单向用户关系的专家挖掘方法,包括:步骤S 1:设置第一专家种子集合,所述第一专家种子集合中包括多个专家用户;步骤S2:根据第一专家种子集合中的所有用户的单向用户关系获取用户集合;步骤S3:判断用户集合中的用户是否满足预定条件,并将满足预定条件的用户的集合设置为第二专家种子集合;步骤S4:判断第一专家种子集合与第二专家种子集合的并集中的用户的个数是否达到目标数量,如果判断结果为是,则将第一专家种子集合与第二专家种子集合的并集设置为目标专家种子集合;如果判断结果为否,则将第二专家种子集合去除其与第一专家种子集合的交集的部分设置为第一专家种子集合,重复步骤S2至S4。本发明还提出一种用于实现上述方法的挖掘系统。本发明的专家挖掘方法可以挖掘出其他更多的专家,包括草根专家。

Description

基于单向用户关系的专家挖掘方法及挖掘系统
技术领域
本发明涉及计算机网络信息技术,特别涉及一种基于单向用户关系的专家挖掘方法及系统。
背景技术
在微博等各种社交媒体中,除了像郎咸平这样的知名人士,还隐藏着很多草根专家,这些草根专家在某个领域有很强的影响力,在小范围内很有知名度,但不为广大用户所知。这些用户发表的微博或博文质量很高,识别这些草根专家有很多用途,比如改善搜索结果,或者把互动平台的问题推送给这些专家解答。
目前标注专家,主要采用人工对已知的专家打上标记,这种方法的缺点是会漏掉很多未知的草根专家,特别是对于小范围内某个类别的专家很难挖掘出来。
因此,如何在海量用户中挖掘草根专家,是我们亟待解决的问题。
发明内容
本发明的目的在于,克服现有人工标记专家所存在的缺陷,而提供一种基于单向用户关系的专家挖掘方法及系统,可以挖掘出其他更多的专家,包括草根专家,而且挖掘出的专家更加贴近实际情况。
本发明的目的及解决其技术问题是采用以下技术方案来实现的。
本发明提供一种基于单向用户关系的专家挖掘方法,所述是实现方法包括:步骤S1:设置第一专家种子集合,所述第一专家种子集合包括多个专家用户;步骤S2:根据所述第一专家种子集合中的所有用户的单向用户关系获取用户集合;步骤S3:判断所述用户集合中的用户是否满足预定条件,并将满足预定条件的用户的集合设置为第二专家种子集合;步骤S4:判断所述第一专家种子集合与所述第二专家种子集合的并集中的用户的个数是否达到目标数量,如果判断结果为是,则将所述第一专家种子集合与第二专家种子集合的并集设置为目标专家种子集合;如果判断结果为否,则将所述第二专家种子集合去除其与所述第一专家种子集合的交集的部分设置为所述第一专家种子集合,重复步骤S2至S4。
本发明提供一种专家挖掘系统。所述系统包括:预设置模块、获取模块、第一判断及设置模块以及第二判断及设置模块。预设置模块用于设置第一专家种子集合,所述第一专家种子集合包括多个专家用户。获取模块用于根据所述第一专家种子集合中的所有用户的单向用户关系获取用户集合。第一判断及设置模块用于判断所述用户集合中的用户是否满足预定条件,并将满足预定条件的用户的集合设置为第二专家种子集合。第二判断及设置模块用于判断所述第一专家种子集合与所述第二专家种子集合的并集中的用户的个数是否达到目标数量,如果判断结果为是,则将所述第一专家种子集合与第二专家种子集合的并集设置为目标专家种子集合;如果判断结果为否,则将所述第二专家种子集合去除其与所述第一专家种子集合的交集的部分设置为所述第一专家种子集合。
相对于现有技术中对人工标记专家的方法,本发明的专家挖掘系统根据一个专家种子集合中的用户的单向用户关系可以挖掘出其他更多的专家,包括草根专家,而且挖掘出的专家更加贴近实际情况。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1为本发明第一实施例所揭示的专家挖掘方法的主要步骤流程图。
图2为本发明第一实施例所揭示的专家挖掘方法的具体步骤流程图。
图3为本发明第二实施例所揭示的专家挖掘方法的具体步骤流程图。
图4为本发明第三实施例所揭示的专家挖掘方法的具体步骤流程图。
图5为本发明第四实施例所揭示的专家挖掘系统的结构图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于单向用户关系的专家挖掘方法及系统其具体实施方式、方法、步骤、结构、特征及其功效,详细说明如下。
有关本发明的前述及其他技术内容、特点及功效,在以下配合参考图式的较佳实施例的详细说明中将可清楚呈现。通过具体实施方式的说明,当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图式仅是提供参考与说明之用,并非用来对本发明加以限制。
在微博等各种社交网络工具中,SNS(全称SociA1l Networking Services,即社会性网络服务)用户关系包括收听(follow)关系、好友(friend)关系、关注关系或喜欢关系等。SNS关系可以是双向关系,也可以是单向关系,例如follow关系包括正向follow关系和反向follow关系,对于某用户如用户X,正向follow关系记录的是用户X收听的用户;反向follow关系记录的是收听用户X的用户,也就是用户X被哪些用户收听。如果某种SNS用户关系既包括正向关系又包括反向关系,就称为双向的SNS用户关系,如果仅包括正向关系或者仅包括反向关系那么就称为单向的SNS用户关系。本发明所提供的专家挖掘方法及系统,主要是基于单向的SNS用户关系,包括单向的收听(follow)关系、好友(friend)关系、关注关系或喜欢关系等。单向的收听关系指的是,某社交网络工具,如微博的用户通过点击与其他用户链接的“收听”按钮,即可收听到该其他用户所发表的微博。单向的好友关系指的是,某用户通过点击与其他用户链接的“好友”按钮,即将该其他用户设置为自己的好友,方便与对方交流。单向的关注关系指的是,某用户通过点击与其他用户链接的“关注”按钮,即可收听到该其他用户所发表的微博,与单向的收听关系类似。单向的喜欢关系指的是,某用户通过点击与其他用户链接的“喜欢”按钮,即可将该其他用户标记为自己喜欢的用户,方便以后查询或获取对方的信息,与单向的好友关系类似。这里所指的“专家”也可以理解为某特定类别中的知名人士。本发明基于以下思想:如果一个用户被某特定类别的知名人士收听、关注或添加为好友等,那么这个用户很可能也是这个类别的知名用户,也就是专家。比如某个用户被很多财经专家follow,那么这个用户是财经专家的可能性较大。通过挖掘这个知名用户,可以再挖掘出更多其它的知名用户,以此类推。
图1为本发明第一实施例所提供的专家挖掘方法的主要步骤流程图。请参照图1,于第一实施例中,专家挖掘方法包括:
步骤S1:设置第一专家种子集合A1,所述第一专家种子集合中包括多个专家用户。
于步骤S1中,在所有的用户中标示出一些专家用户,例如人工选出财经专家i个,将这些被标示出的专家用户的集合设置为第一专家种子集合A1。
步骤S2:根据第一专家种子集合A1中的所有专家用户的单向用户关系获取用户集合B。
于步骤S2中,根据第一专家种子集合A1中的i个专家用户的单向用户关系可以得到用户集合B,以follow关系为例,也就是将第一专家种子集合A1中的i个专家用户所follow的所有用户设置为用户集合B,假设共有j个不同的用户被第一专家种子集合A1中的专家用户所follow,那么此j个用户即构成用户集合B。可以理解,用户集合B中的用户是可以与第一专家种子集合A1中的用户重复的,但是用户集合B内部的用户彼此是没有重复的。
步骤S3:判断用户集合B中的用户是否满足预定条件,并将满足预定条件的用户的集合设置为第二专家种子集合A2。
步骤S4:判断第一专家种子集合A1与第二专家种子集合A2的并集中的用户的个数是否达到目标数量,如果判断结果为是,则将第一专家种子集合A1与第二专家种子集合A2的并集设置为目标专家种子集合C,如果判断结果为否,则将第二专家种子集合A2去除其与第一专家种子集合A1的交集的部分设置为第一专家种子集合A1,重复步骤S2至S4。
目标专家种子集合C也就是本发明根据第一专家种子集合中的专家用户的单向用户关系挖掘出的其他更多的专家。
也就是说,如果以A1∪A2表示第一专家种子集合A1与第二专家种子集合A2的并集,以A1∩A2表示第一专家种子集合A1与第二专家种子集合A2的交集,那么,目标专家种子集合C=A1∪A2,第一专家种子集合A1=A2-(A1∩A2)。在步骤S4中,如果A1∪A2中的用户的个数达到目标数量,也就是说当挖掘到足够数量的专家时,A1∪A2就是最终的目标专家种子集合,即可停止上述操作,但是如果A1∪A2中的用户的个数还未达到目标数量,也就是说没有挖掘到足够数量的专家时,就将集合A2-(A1∩A2)设置为第一专家种子集合A1,或者说将集合A2-(A1∩A2)赋值给A1,再重复步骤S2至S4,反复迭代,直到挖掘到足够数量的专家为止。由于在将集合A2-(A1∩A2)设置为第一专家种子集合A1之前,已经将第二专家种子集合A2中与第一专家种子集合A1重复的用户去除,因此可以保证将集合A2-(A1∩A2)设置为第一专家种子集合A1并重复操作步骤S2至S4时,不再对同样的用户进行重复的操作,可以避免系统陷入死循环。
请参照图2,优选的,在步骤S2之前还包括步骤S20:建立用户的单向用户关系数据库,并通过单向用户关系数据库记录所有用户的单向用户关系。每个单向用户关系包括发起关系的用户、所发起的关系以及对应的目标用户。以follow关系为例,假如第一专家种子集合A1中的某用户X有follow用户Y,就会被用户关系数据库记录为一个单向用户关系,此单向用户关系包括:发起关系的用户X、所发起的关系为follow,所follow的目标用户为Y,此关系可被记录为X-follow-Y,当然,用户X所follow的目标客户也可以为多个,例如,目标用户为Y1、Y2、Y3,则此关系可被记录为X-follow-(Y1、Y2、Y3)。
优选的,步骤S2包括步骤S21:查询单向用户关系数据库,将与第一专家种子集合A1中的所有用户对应的目标用户的集合设置为用户集合B。
优选的,于本实施例中,步骤S3可进一步包括:
步骤S31:查询单向用户关系数据库,并获取用户集合B中的每个用户作为第一专家种子集合A1中的用户的目标用户的次数f。以follow关系为例,例如用户集合B中的用户Y被第一专家种子集合中的3个用户所follow,那么用户Y被follow的次数为3,也就是用户Y作为第一专家种子集合A1中的用户的目标用户的次数为3,以此类推。
步骤S32a:判断用户集合B中的每个用户作为第一专家种子集合A1中的用户的目标用户的次数f是否大于或等于第一数值m,并将对应次数f大于或等于第一数值m的用户的集合设置为第二专家种子集合A2。其中,m≤f≤i,i为第一专家种子集合A1中的用户的个数。第一数值m可以根据具体的需求进行设定,但是m不会超过第一专家种子集合A1中的用户的个数i,假设i为1万,那么m例如可以设定为1000。以follow关系为例,判断用户集合B中的每个用户被第一专家种子集合A1中的用户follow的次数f是否大于1000次,并将次数f超过1000次的用户的集合设置为第二专家种子集合A2。假设次数f超过1000次的用户的个数为10万个,也就是第二专家种子集合A2中用户的个数为10万个,再假设第一专家种子集合A1中的用户的个数i为1万,那么,在步骤4中,第一专家种子集合A1与第二专家种子集合A2的并集中的用户的个数共为11万个。如果目标数量为10万,那么由于第一专家种子集合A1与第二专家种子集合A2的并集中的用户的个数达到目标数量,第一专家种子集合A1与第二专家种子集合A2的并集就被设置为目标专家种子集合;如果目标数量为15万,那么由于第一专家种子集合A1与第二专家种子集合A2的并集中的用户的个数未达到目标数量,那么第二专家种子集合A2去除其与第一专家种子集合A1的交集的部分就被设置为第一专家种子集合A1,重复步骤S2至S4,直到第一专家种子集合A1与第二专家种子集合A2的并集中的用户的个数达到目标数量为止。可以理解,目标数量可以根据实际需求进行设定,并不以上述举例为限。可以理解,用户作为目标用户的次数越多,则该用户为专家的可能性就越大,因此,相对于现有技术中对人工标记专家的方法,本发明的专家挖掘系统根据一个专家种子集合中的用户的单向用户关系可以挖掘出其他更多的专家,包括草根专家,而且挖掘出的专家更加贴近实际情况。
图3为本发明第二实施例所提供的专家挖掘方法的流程图。请参照图3,于第二实施例中,专家挖掘方法包括:
步骤S1:设置第一专家种子集合A1;
步骤S20:建立用户的单向用户关系数据库,并通过单向用户关系数据库记录所有用户的单向用户关系;
步骤S21:查询单向用户关系数据库,将与第一专家种子集合A1中的所有用户对应的目标用户的集合设置为用户集合B;
步骤S31:查询单向用户关系数据库,并获取用户集合B中的每个用户作为第一专家种子集合A1中的用户的目标用户的次数f;
步骤S32b:将用户集合B中的所有用户按照其各自对应的次数f由高到低进行排序并记录其次序号k,并将对应次序号k小于或等于第二数值n的用户的集合设置为第二专家种子集合A2,n≤j,j为用户集合B中的用户的个数;
步骤S4:判断第一专家种子集合A1与第二专家种子集合A2的并集中的用户的个数是否达到目标数量,如果判断结果为是,则将第一专家种子集合A1与第二专家种子集合A2的并集设置为目标专家种子集合C,如果判断结果为否,则将第二专家种子集合A2去除其与第一专家种子集合A1的交集的部分设置为第一专家种子集合A1,重复步骤S20至S4。
第二实施例与第一实施例的不同在于第二专家种子集合A2的设置条件与第一实施例不同,以follow关系为例,在第二实施例的步骤S32b中,是将对用户集合B中的所有用户按照被第一专家种子集合A1中的用户所follow的次数排序(于第二实施例中为由高到低进行排序),取次序号k小于或等于第二数值n的用户的集合设置为第二专家种子集合A2,也就是取前k个用户(例如10万个)作为第二专家种子集合A2。可以理解,用户作为目标用户的次数越多,则该用户为专家的可能性就越大,因此,相对于现有技术中对人工标记专家的方法,本发明的专家挖掘系统根据一个专家种子集合中的用户的单向用户关系可以挖掘出其他更多的专家,包括草根专家,而且挖掘出的专家更加贴近实际情况。
图4为本发明第三实施例所提供的专家挖掘方法的流程图。请参照图4,于第三实施例中,专家挖掘方法包括:
步骤S1:设置第一专家种子集合A1;
步骤S20:建立用户的单向用户关系数据库,并通过单向用户关系数据库记录所有用户的单向用户关系;
步骤S21:查询单向用户关系数据库,将与第一专家种子集合A1中的所有用户对应的目标用户的集合设置为用户集合B;
步骤S31:查询单向用户关系数据库,并获取用户集合B中的每个用户作为第一专家种子集合A1中的用户的目标用户的次数f;
步骤S32c:将用户集合B中的所有用户按照其各自对应的次数f由低到高进行排序并记录其次序号k,并将对应次序号k大于或等于第二数值n的用户的集合设置为第二专家种子集合A2,n≤j,j为用户集合B中的用户的个数;
步骤S4:判断第一专家种子集合A1与第二专家种子集合A2的并集中的用户的个数是否达到目标数量,如果判断结果为是,则将第一专家种子集合A1与第二专家种子集合A2的并集设置为目标专家种子集合C,如果判断结果为否,则将第二专家种子集合A2去除其与第一专家种子集合A1的交集的部分设置为第一专家种子集合A1,重复步骤S20至S4。
第三实施例与第二实施例的不同在于在第二实施例中,用户集合B中的所有用户按照其各自对应的次数f由高到低进行排序,取次序号k小于或等于第二数值n的用户的集合设置为第二专家种子集合A2,而于第三实施例中,用户集合B中的所有用户按照其各自对应的次数f由低到高进行排序,取次序号k大于或等于第二数值n的用户的集合设置为第二专家种子集合A2。可以理解,用户作为目标用户的次数越多,则该用户为专家的可能性就越大,因此,相对于现有技术中对人工标记专家的方法,本发明的专家挖掘系统根据一个专家种子集合中的用户的单向用户关系可以挖掘出其他更多的专家,包括草根专家,而且挖掘出的专家更加贴近实际情况。
图5为本发明第四实施例所提供的专家挖掘系统的结构图,该专家挖掘系统用于实现上述实施例中的专家挖掘方法。请参照图5,于第四实施例中,专家挖掘系统10包括:预设置模块11、获取模块12、第一判断及设置模块13及第二判断及设置模块14。
其中,预设置模块11用于设置第一专家种子集合A。获取模块12用于根据第一专家种子集合A1中的所有用户的单向用户关系获取用户集合B。第一判断及设置模块13用于判断用户集合B中的用户是否满足预定条件,并将满足预定条件的用户的集合设置为第二专家种子集合A2。第二判断及设置模块14用于判断第一专家种子集合A1与第二专家种子集合A2的并集中的用户的个数是否达到目标数量,如果判断结果为是,则将第一专家种子集合A1与第二专家种子集合A2的并集设置为目标专家种子集合C,如果判断结果为否,则将第二专家种子集合A2去除其与第一专家种子集合A1的交集的部分设置为第一专家种子集合A1。
优选的,专家挖掘系统10还包括建立模块15以及记录模块16。建立模块15用于建立用户的单向用户关系数据库20。记录模块16用于通过单向用户关系数据库20记录所有用户的单向用户关系,每个所述单向用户关系包括发起关系的用户、所发起的关系以及对应的目标用户。
优选的,专家挖掘系统10还包括查询模块17。查询模块17用于查询单向用户关系数据库20,获取模块12根据查询模块17的查询结果将与第一专家种子集合A1中的所有用户对应的目标用户的集合设置为用户集合B。第一判断及设置模块13根据查询模块17的查询结果获取用户集合B中的每个用户作为第一专家种子集合A1中的用户的目标用户的次数f。
进一步的,第一判断及设置模块13包括第一判断模块131及第一设置模块132。第一判断模块131用于判断用户集合B中的用户是否满足预定条件,第一设置模块132用于将满足预定条件的用户的集合设置为第二专家种子集合A2。
例如在上述第一实施例中,第一判断模块131用于判断用户集合B中的每个用户作为第一专家种子集合A1中的用户的目标用户的次数f是否大于或等于第一数值m。第一设置模块132用于将对应次数f大于或等于第一数值m的用户的集合设置为第二专家种子集合A2,m≤f≤i,i为第一专家种子集合A1中的用户的个数。
例如在上述第二实施例中,第一判断模块131用于将用户集合B中的所有用户按照其各自对应的次数f由高到低进行排序并记录其次序号k。第一设置模块132用于将对应次序号k小于或等于第二数值n的用户的集合设置为第二专家种子集合A2,n≤j,j为用户集合B中的用户的个数。
例如在上述第三实施例中,第一判断模块131用于将用户集合B中的所有用户按照其各自对应的次数f由低到高进行排序并记录其次序号k,第一设置模块132用于将对应次序号k大于或等于第二数值n的用户的集合设置为第二专家种子集合A2,n≤j。
第二判断及设置模块14包括第二判断模块141及第二设置模块142,第二判断模块141用于判断第一专家种子集合A1与第二专家种子集合A2的并集中的用户的个数是否达到目标数量,第二设置模块142用于将第一专家种子集合A1与第二专家种子集合A2的并集设置为目标专家种子集合或者将第二专家种子集合A2去除其与第一专家种子集合A1的交集的部分设置为第一专家种子集合A1。
综上所述,相对于现有技术中对人工标记专家的方法,本发明的专家挖掘系统根据一个专家种子集合中的用户的单向用户关系可以挖掘出其他更多的专家,包括草根专家,而且挖掘出的专家更加贴近实际情况。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (10)

1.一种基于单向用户关系的专家挖掘方法,其特征在于,所述方法包括:
步骤S1:设置第一专家种子集合,所述第一专家种子集合中包括多个专家用户;
步骤S2:根据所述第一专家种子集合中的所有专家用户的单向用户关系获取用户集合;所述单向用户关系为单向收听关系、单向好友关系、单向关注关系或单向喜欢关系;
步骤S3:判断所述用户集合中的用户是否满足预定条件,并将满足预定条件的用户的集合设置为第二专家种子集合;
步骤S4:判断所述第一专家种子集合与所述第二专家种子集合的并集中的用户的个数是否达到目标数量,如果判断结果为是,则将所述第一专家种子集合与第二专家种子集合的并集设置为目标专家种子集合;如果判断结果为否,则将所述第二专家种子集合去除其与所述第一专家种子集合的交集的部分设置为所述第一专家种子集合,重复步骤S2至S4;
所述步骤S3包括:
步骤S31:查询单向用户关系数据库,并获取所述用户集合中的每个用户作为所述第一专家种子集合中的用户的目标用户的次数f;
步骤S32a:判断所述用户集合中的每个用户作为所述第一专家种子集合中的用户的目标用户的次数f是否大于或等于第一数值m,并将对应次数f大于或等于所述第一数值m的用户的集合设置为所述第二专家种子集合,m≤f≤i,i为所述第一专家种子集合中的用户的个数。
2.根据权利要求1所述的专家挖掘方法,其特征在于,所述步骤S2之前包括:
步骤S20:建立用户的单向用户关系数据库,并通过所述单向用户关系数据库记录所有用户的单向用户关系,每个所述单向用户关系包括发起关系的用户、所发起的关系以及对应的目标用户。
3.根据权利要求2所述的专家挖掘方法,其特征在于,所述步骤S2包括:
步骤S21:查询所述单向用户关系数据库,将与所述第一专家种子集合中的所有用户对应的目标用户的集合设置为所述用户集合。
4.根据权利要求1所述的专家挖掘方法,其特征在于,所述步骤S3进一步包括:
步骤S32b:将所述用户集合中的所有用户按照其各自对应的次数f由高到低进行排序并记录其次序号k,并将对应次序号k小于或等于第二数值n的用户的集合设置为所述第二专家种子集合,n≤j,j为所述用户集合中的用户的个数。
5.根据权利要求1所述的专家挖掘方法,其特征在于,所述步骤S3进一步包括:
步骤S32c:将所述用户集合中的所有用户按照其各自对应的次数f由低到高进行排序并记录其次序号k,并将对应次序号k大于或等于第二数值n的用户的集合设置为所述第二专家种子集合,n≤j,j为所述用户集合中的用户的个数。
6.一种基于单向用户关系的专家挖掘系统,其特征在于,所述系统包括:
预设置模块,用于设置第一专家种子集合,所述第一专家种子集合中包括多个专家用户;
获取模块,用于根据所述第一专家种子集合中的所有专家用户的单向用户关系获取用户集合;所述单向用户关系为单向收听关系、单向好友关系、单向关注关系或单向喜欢关系;
第一判断及设置模块,用于判断所述用户集合中的用户是否满足预定条件,并将满足预定条件的用户的集合设置为第二专家种子集合;
第二判断及设置模块,用于判断所述第一专家种子集合与所述第二专家种子集合的并集中的用户的个数是否达到目标数量,如果判断结果为是,则将所述第一专家种子集合与第二专家种子集合的并集设置为目标专家种子集合;如果判断结果为否,则将所述第二专家种子集合去除其与所述第一专家种子集合的交集的部分设置为所述第一专家种子集合;
查询模块,用于查询所述单向用户关系数据库,所述获取模块根据所述查询模块的查询结果将与所述第一专家种子集合中的所有用户对应的目标用户的集合设置为所述用户集合,所述第一判断及设置模块根据所述查询模块的查询结果获取所述用户集合中的每个用户作为所述第一专家种子集合中的用户的目标用户的次数f;
所述第一判断及设置模块包括第一判断模块及第一设置模块,所述第一判断模块用于判断所述用户集合中的用户是否满足预定条件,所述第一设置模块用于将满足预定条件的用户的集合设置为所述第二专家种子集合;
所述第一判断及设置模块包括第一判断模块,所述第一判断模块用于判断所述用户集合中的每个用户作为所述第一专家种子集合中的用户的目标用户的次数f是否大于或等于第一数值m,所述第一设置模块用于将对应次数f大于或等于所述第一数值m的用户的集合设置为所述第二专家种子集合,m≤f≤i,i为所述第一专家种子集合中的用户的个数。
7.根据权利要求6所述的专家挖掘系统,进一步包括:
建立模块,用于建立用户的单向用户关系数据库;
记录模块,用于通过所述单向用户关系数据库记录所有用户的单向用户关系,每个所述单向用户关系包括发起关系的用户、所发起的关系以及对应的目标用户。
8.根据权利要求6所述的专家挖掘系统,其特征在于,所述第一判断模块用于将所述用户集合中的所有用户按照其各自对应的次数f由高到低进行排序并记录其次序号k,所述第一设置模块用于将对应次序号k小于或等于第二数值n的用户的集合设置为所述第二专家种子集合,n≤j,j为所述用户集合中的用户的个数。
9.根据权利要求6所述的专家挖掘系统,其特征在于,所述第一判断模块用于将所述用户集合中的所有用户按照其各自对应的次数f由低到高进行排序并记录其次序号k,所述第一设置模块用于将对应次序号k大于或等于第二数值n的用户的集合设置为所述第二专家种子集合,n≤j,j为所述用户集合中的用户的个数。
10.根据权利要求6所述的专家挖掘系统,其特征在于,所述第二判断及设置模块包括第二判断模块及第二设置模块,所述第二判断模块用于判断所述第一专家种子集合与所述第二专家种子集合的并集中的用户的个数是否达到目标数量,所述第二设置模块用于将所述第一专家种子集合与第二专家种子集合的并集设置为目标专家种子集合或者将所述第二专家种子集合去除其与所述第一专家种子集合的交集的部分设置为所述第一专家种子集合。
CN201210286449.XA 2012-08-13 2012-08-13 基于单向用户关系的专家挖掘方法及挖掘系统 Active CN103593342B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210286449.XA CN103593342B (zh) 2012-08-13 2012-08-13 基于单向用户关系的专家挖掘方法及挖掘系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210286449.XA CN103593342B (zh) 2012-08-13 2012-08-13 基于单向用户关系的专家挖掘方法及挖掘系统

Publications (2)

Publication Number Publication Date
CN103593342A CN103593342A (zh) 2014-02-19
CN103593342B true CN103593342B (zh) 2017-10-31

Family

ID=50083492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210286449.XA Active CN103593342B (zh) 2012-08-13 2012-08-13 基于单向用户关系的专家挖掘方法及挖掘系统

Country Status (1)

Country Link
CN (1) CN103593342B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611350B (zh) * 2015-10-26 2020-06-05 阿里巴巴集团控股有限公司 挖掘潜在用户源的方法和装置
CN116149516A (zh) * 2021-11-17 2023-05-23 北京字节跳动网络技术有限公司 数据处理方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101149756A (zh) * 2007-11-09 2008-03-26 清华大学 在大规模社会网络中基于路径评分的个人关系发现方法
CN101887441A (zh) * 2009-05-15 2010-11-17 华为技术有限公司 一种社会网络建立方法和系统及网络社区挖掘方法和系统
CN102200988A (zh) * 2010-03-01 2011-09-28 微软公司 具有推荐的社交网络系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100739348B1 (ko) * 2006-03-06 2007-07-16 엔에이치엔(주) 키워드 별로 사용자의 전문가 지수를 산정하는 방법 및상기 방법을 수행하는 시스템
US8195664B2 (en) * 2009-10-22 2012-06-05 Symantec Corporation Method and system for clustering transactions in a fraud detection system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101149756A (zh) * 2007-11-09 2008-03-26 清华大学 在大规模社会网络中基于路径评分的个人关系发现方法
CN101887441A (zh) * 2009-05-15 2010-11-17 华为技术有限公司 一种社会网络建立方法和系统及网络社区挖掘方法和系统
CN102200988A (zh) * 2010-03-01 2011-09-28 微软公司 具有推荐的社交网络系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种面向加权双向图的聚类发掘方法;邱德红 等;《小型微型计算机系统》;20120731;第33卷(第7期);1568-1571 *

Also Published As

Publication number Publication date
CN103593342A (zh) 2014-02-19

Similar Documents

Publication Publication Date Title
Wang et al. Knowledge networks, collaboration networks, and exploratory innovation
Irani et al. Enabling sustainable energy futures: factors influencing green supply chain collaboration
Trier Research note—towards dynamic visualization for understanding evolution of digital communication networks
CN103593393B (zh) 基于微博互动关系挖掘社交圈的方法及装置
O'Leary KPMG knowledge management and the next phase: Using enterprise social media
Repta et al. Towards the development of semantically enabled flexible process monitoring systems
CN104156388A (zh) 个性化搜索中基于信任的隐私保持的协同过滤推荐方法
CN106204297A (zh) 一种封闭社交传播意见领袖的识别方法及装置
CN108170842A (zh) 基于三部图模型的微博热点话题溯源方法
Goodall et al. VIAssist: Visual analytics for cyber defense
CN103593342B (zh) 基于单向用户关系的专家挖掘方法及挖掘系统
CA3017606A1 (en) Rule based hierarchical configuration
Reilly et al. Ranking users based on influence in a directional social network
Schuurman et al. Living labs as quasi-experiments: results from the Flemish LeYLab
CN104050291B (zh) 一种账户余额数据的并行处理方法和系统
US11061888B2 (en) Method for backfilling graph structure and articles comprising the same
CN104199964A (zh) 信息处理方法及装置
CN104885075B (zh) 一种利用关键链接执行反向搜索的方法及装置
CN107145508A (zh) 网站数据处理方法、装置及系统
CN103064830A (zh) 软件应用及网络应用高度综合桌面化的方法
WO2023286087A1 (en) Providing personalized recommendations based on users behavior over an e-commerce platform
CN109062945A (zh) 一种社交网络的信息推荐方法、装置及系统
Terevinto et al. A flexible workload model based on roles of interactive users in social networks
Javed et al. How do facebookers use friendlists
CN106204082A (zh) 一种基于会员行为大数据的会员匹配机制及其实现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant