CN107766515B - 社交圈关键用户提取方法及装置 - Google Patents
社交圈关键用户提取方法及装置 Download PDFInfo
- Publication number
- CN107766515B CN107766515B CN201710995536.5A CN201710995536A CN107766515B CN 107766515 B CN107766515 B CN 107766515B CN 201710995536 A CN201710995536 A CN 201710995536A CN 107766515 B CN107766515 B CN 107766515B
- Authority
- CN
- China
- Prior art keywords
- users
- attention
- rings
- user
- social circle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 35
- 230000003993 interaction Effects 0.000 claims abstract description 57
- 230000000694 effects Effects 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 14
- 230000002452 interceptive effect Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 101100042371 Caenorhabditis elegans set-3 gene Proteins 0.000 description 5
- 101150117538 Set2 gene Proteins 0.000 description 5
- 101150055297 SET1 gene Proteins 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 102100029768 Histone-lysine N-methyltransferase SETD1A Human genes 0.000 description 1
- 101000865038 Homo sapiens Histone-lysine N-methyltransferase SETD1A Proteins 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明提供一种社交圈关键用户提取方法及装置,其中,方法包括:获取设定区域内所有用户在社交平台上的社交数据,所述社交数据包括:用户之间的关注关系网和言论互动数据;在所述关注关系网中提取用户之间相互关注的最小关注环,最小关注环中的每个用户仅与最小关注环中的其中两个用户互相关注;当各所述最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈;根据所述重叠用户的数量、所述社交圈中用户的总数以及所述言论互动数据在所述社交圈中提取关键用户。本发明提供的社交圈关键用户提取方法及装置能够提高信息推送效果。
Description
技术领域
本发明涉及社交圈数据处理技术,尤其涉及一种社交圈关键用户提取方法及装置。
背景技术
自上世纪九十年代起,人们从电话、书信逐渐转变为通过互联网进行信息交流和推送。从最初只能通过聊天软件进行信息交流的方式,发展到目前集聊天、文章推送、图片浏览、文件传送等功能于一体的方式,例如:微博、微信、视频社交平台等。无论哪一个社交平台,用户都与其它用户建立联系,形成社交圈,例如:社交圈内可以包括:亲人、同学、朋友、同事、陌生人、以及关注的名人、企业或公众号等。
用户所形成的社交圈通常可以依靠拓扑结构来进行划分成多个,同一个社交圈中的用户可能具有较为相似的喜好。因此,目前的信息推广的方式通常是有针对性地向各社交圈来推送信息。但是,由于社交圈的规模不同,每个用户的影响力也不同,若接收到推送信息的用户的影响力较小,则不能够达到较好的信息推送效果。
发明内容
本发明提供一种社交圈关键用户提取方法及装置,能够提高信息推送效果。
本发明一方面提供一种社交圈关键用户提取方法,包括:
获取设定区域内所有用户在社交平台上的社交数据,所述社交数据包括:用户之间的关注关系网和言论互动数据;
在所述关注关系网中提取用户之间相互关注的最小关注环,所述最小关注环中的每个用户仅与所述最小关注环中的其中两个用户互相关注;
当各所述最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈;
根据所述重叠用户的数量、所述社交圈中用户的总数以及所述言论互动数据在所述社交圈中提取关键用户。
本发明另一方面提供一种社交圈关键用户提取装置,包括:
社交数据获取模块,用于获取设定区域内所有用户在社交平台上的社交数据,所述社交数据包括:用户之间的关注关系网和言论互动数据;
最小关注环提取模块,用于在所述关注关系网中提取用户之间相互关注的最小关注环,所述最小关注环中的每个用户仅与所述最小关注环中的其中两个用户互相关注;
关注环合并模块,用于当各所述最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈;
关键用户提取模块,用于根据所述重叠用户的数量、所述社交圈中用户的总数以及所述言论互动数据在所述社交圈中提取关键用户。
本发明所提供的技术方案,通过获取设定区域内所有用户在社交平台上的关注关系网和言论互动数据,然后在关注关系网中提取用户之间相互关注的最小关注环,当各最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈,最后根据重叠用户的数量、社交圈中用户的总数以及言论互动数据在社交圈中提取关键用户。由于关键用户在社交圈中的影响力较大,向关键用户推送信息,则与该关键用户有互相关注关系的用户、以及与该关键用户有言论互动的用户都能够知晓推送信息,进而扩大了影响力,提高了信息推送的效果。
附图说明
图1为本发明实施例一提供的社交圈关键用户提取方法的流程图;
图2为本发明实施例二提供的社交圈关键用户提取方法的流程图;
图3为本发明实施例二提供的关注关系网的无向图;
图4为本发明实施例二提供的关注关系网的矩阵结构;
图5为本发明实施例三提供的社交圈关键用户提取方法的流程图;
图6为本发明实施例七提供的社交圈关键用户提取装置的结构示意图;
图7为本发明实施例八提供的社交圈关键用户提取装置中最小关注环提取模块的结构示意图;
图8为本发明实施例八提供的社交圈关键用户提取装置中关注环合并模块的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1为本发明实施例一提供的社交圈关键用户提取方法的流程图。如图1所示,本实施例提供一种社交圈关键用户提取方法,包括:
步骤10、获取设定区域内所有用户在社交平台上的社交数据,社交数据包括:用户之间的关注关系网和言论互动数据。
社交平台可以为目前常见的一些聊天、交友软件,例如:微博、微信、QQ空间、视频分享平台等。由于社交平台中的用户数量非常庞大,收集全部用户的社交数据进行分析的工作量非常大,并且,通常某一区域内的用户具有较为相似的喜好,因此,本实施例仅获取设定区域内的所有用户的社交数据。例如:获取北京市西城区内所有用户的社交数据。
社交数据包括:用户之间的关注关系网和言论互动数据。以微博为例:各用户之间的互动关系可以为:单向关注、相互关注、在某一用户发表的微博下评论、转发某一条微博等。其中,用户之间的相互关注可以组成一个关注关系网。单向关注、在某一用户发表的微博下评论、转发某一条微博等可以作为言论互动数据。再以微信为例:各用户之间的互动关系可以为:互相加为好友、在某一用户的朋友圈中评论、转发某一链接等。其中,用户之间互相加为好友可以组成一个关注关系网,在某一用户的朋友圈中评论、转发某一链接等可以作为言论互动数据。另外,微信中还有一种情况,用户能够接收到某一公众号(用户并未与该公众号加为好友,也未关注该公众号)在朋友圈发表的内容,且能够对该内容进行评论,也属于言论互动数据。本实施例仅以微博为例,对技术方案进行详细的说明,但本领域技术人员可以将本实施例所提供的技术方案应用于微信、QQ空间、视频社交等平台中。
首先,获取设定区域内所有用户唯一的序列号,并将所有用户的序列号加入数据库,生成用户列表。然后,获取设定区域内所有用户在社交平台上的关注关系网,具体的,可以将设定区域内的每一个用户作为节点,采用深度遍历或广度遍历的方式,查找到与该用户为相互关注的其它用户,此处的其它用户并不限定在设定区域内。若相互关注的用户已经存在于用户列表中,则继续查找下一用户;若相互关注的用户不在用户列表中,则将该用户的序列号加入用户列表。
在用户列表中,根据用户的序列号构建索引,若系列号的首位字符为英文字母,则按照A-Z的顺序建立索引,以便于提高查找效率。各用户之间的相互关注关系可以一个拼接的关系字段来表示:例如:a用户,与其相互关注的用户为b、ce、dmo,则关系字段可以为:b00ce0dmo,以序列号长度最长3位的为基准,不足3位的补数字0。该关系字段能便于后续对用户进行查找和关系切割。
之后,通过自动化网页爬取脚本,收集用户列表中每个用户的社交言论数据。由于用户的社交言论数量较大,可以仅收集某一期间内的社交言论数据。以微博为例,收集每个用户在半年内发表的微博被评论或转发的用户的数目。例如:A用户发表了一条微博,这条微博被3个用户进行了评论,被6个用户进行了转发,则评论数目CommentCount为3,转发数目RepostCount为6。记录A用户半年内发表的每一条微博的评论数目和转发数目,并计算半年内的平均评论数目和平均转发数目。另外,还可以记录在A用户发表的微博下进行互动的用户及其互动的次数,该互动的用户若不在用户列表中,则无需记录。
步骤20、在关注关系网中提取用户之间相互关注的最小关注环。
经过步骤10,获取到的用户的关注关系网,在关注关系网中提取最小关注环。最小关注环中的每个用户仅与该关注环中的其中两个用户互相关注。
例如:A用户与B用户相互关注,B用户与C用户相互关注,C用户与D用户相互关注,D用户与E用户相互关注,E用户与A用户相互关注,则构成关注环A-B-C-D-E-A。另外,C用户除了与B和D相互关注之外,也与A用户相互关注,构成另一个关注环A-B-C-A。则与关注环A-B-C-D-E-A相比,关注环A-B-C-A为最小关注环。
可以理解的是,最小关注环的数量具体可以为多个。
步骤30、当各最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈。
上述步骤20得到的最小关注环之间存在有重叠用户,判断重叠用户的数量是否满足设定要求,若满足,则将重叠用户所在的最小关注环合并,形成大的社交圈。
具体的,可以两两进行合并,考察两个最小关注环之间是否存在重叠用户,若存在,则判断重叠用户的数量是否满足设定要求,若满足,则将两个最小关注环进行合并,形成社交圈。合并之后的社交圈还可以与其它最小关注环或其它社交圈进行合并,直至各社交圈之间或社交圈与最小关注环之间不存在重叠用户,或者重叠用户的数量不满足设定要求,则不再合并。
重叠用户的数量大于设定值,可以认为满足设定要求;小于或等于设定值,则认为不满足设定要求。
步骤40、根据重叠用户的数量、社交圈中用户的总数以及言论互动数据在社交圈中提取关键用户。
该步骤中,可综合重叠用户的数量、社交圈中用户的总数以及言论互动数据这三个参数,来确定社交圈中影响力最大的用户可作为关键用户。例如;某一个社交圈X由最小关注环S和最小关注环Q合并而来,最小关注环S和最小关注环Q之间的重叠用户有6个。社交圈X中有10个用户,考察这10个用户的言论互动数据,哪一个用户的言论互动数据较多,则在社交圈中的影响力最大,则可作为关键用户。
本实施例所提供的技术方案,通过获取设定区域内所有用户在社交平台上的关注关系网和言论互动数据,然后在关注关系网中提取用户之间相互关注的最小关注环,当各最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈,最后根据重叠用户的数量、社交圈中用户的总数以及言论互动数据在社交圈中提取关键用户。由于关键用户在社交圈中的影响力较大,向关键用户推送信息,则与该关键用户有互相关注关系的用户、以及与该关键用户有言论互动的用户都能够知晓推送信息,进而扩大了影响力,提高了信息推送的效果。
实施例二
本实施例是在上述实施例的基础上,对社交圈关键用户提取方法进行进一步的优化。
上述步骤20,在关注关系网中提取用户之间相互关注的最小关注环,除了可以采用上述实施例所提供的实现方式之外,还可以进一步采用下面的方式:
图2为本发明实施例二提供的社交圈关键用户提取方法的流程图,图3为本发明实施例二提供的关注关系网的无向图,图4为本发明实施例二提供的关注关系网的矩阵结构。如图2至图4所示,
步骤201、在关注关系网中提取用户之间相互关注的关注环。
用户之间的关注关系网是采用矩阵的形式进行存储的,由于用户之间的相互关注为没有方向的(可参照图3所示的无向图),则采用半角矩阵进行存储即可(可参照图4所示的半角矩阵),能够节省存储空间。
例如:A用户、B用户、C用户、D用户和N用户之间的关注关系可参照图3所示,这五个用户的关注关系通过图4所示的半角矩阵进行存储。矩阵中,元素的值为“1”表示二者之间相互关注,元素的值为“0”表示二者之间为单向关注或互不关注,斜对角线上的元素均为“1”默认为自己与自己相互关注。矩阵为M行*M列,M为用户列表中用户的总数。
在上述矩阵中,采用深度遍历或广度遍历的方式访问每一个用户,并查找与其相互关注的用户。
以深度遍历为例,以A用户为节点,沿着互相关注的每一条线路访问,直至遇到不再与其它用户具有互相关注关系为止;或者遇到返回A用户的情况,形成关注环。例如:用户A与B、C、D互相关注,B与N互相关注,C与M互相关注,M与Q互相关注,Q与A互相关注,则访问顺序首先为A-B-N,然后返回A用户,再按照A-C-M-Q-A的顺序进行访问,再返回A用户,按照A-D的顺序访问。上述访问顺序A-B-N和A-D为非关注环,A-C-M-Q-A为关注环。
步骤202、根据言论互动数据对关注环进行拆分,以得到最小关注环。
以微博平台为例,若A用户关注了M用户,但M用户未关注A用户,因此在关注关系网中,A用户与M用户并不是互相关注的关系,因此在矩阵中的对应元素的值为“0”。但是A用户在M用户发表的微博下进行了评论,M用户也有可能对A用户进行了回复,或者A用户对M用户发表的微博进行了转发,表明A用户与M用户之间存在言论互动。
因此,对于上述A-C-M-Q-A的关注环可以进行拆分,形成A-C-M-A。相比于关注环A-C-M-Q-A,关注环A-C-M-A即为最小关注环,且该最小关注环内的用户数量为三个。
除此之外,对于非关注环也可以进行拆分,形成最小关注环。例如:访问顺序为:A-C-E-S-L,其中,S用户关注了A用户,但A用户未关注S用户,S用户在A用户所发表的微博下进行了评论,则S用户与A用户之间存在社交言论,可形成A-C-E-S-A关注环,也可以作为最小关注环,其用户为四个。
本实施例所提供的技术方案,通过获取设定区域内所有用户在社交平台上的关注关系网和言论互动数据,然后在关注关系网中提取用户之间相互关注的最小关注环,当各最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈,最后根据重叠用户的数量、社交圈中用户的总数以及言论互动数据在社交圈中提取关键用户。由于关键用户在社交圈中的影响力较大,向关键用户推送信息,则与该关键用户有互相关注关系的用户、以及与该关键用户有言论互动的用户都能够知晓推送信息,进而扩大了影响力,提高了信息推送的效果。
另外,对于用户之间没有互相关注,但具有言论互动的情况,根据言论互动数据对关注环进行拆分,以得到最小关注环,能够进一步提高最小关注环的准确度,以进一步提高关键用户提取的准确度。
实施例三
本实施例是在上述实施例的基础上,对社交圈关键用户提取方法进行进一步的优化。
图5为本发明实施例三提供的社交圈关键用户提取方法的流程图,如图5所示,上述实施例中的步骤30还可以采用如下方式来实现:
步骤301、获取任意两个最小关注环之间重叠用户的数量。
在所有的最小关注环中任意获取两个最小关注环,并提取两个最小关注环中的重叠用户,计算重叠用户的数量。
步骤302、判断重叠用户的数量分别与重叠用户所在的两个最小关注环中用户总数的比值是否均大于设定值;若是,则将两个最小关注环进行合并,以得到社交圈。
步骤302具体可以用如下公式来表示:
其中,n为重叠用户的数量,m1和m2分别为两个最小关注环中用户的总数,k为设定值,当X为真时,将两个最小关注环进行合并,得到社交圈。若X不为真,则无需将两个最小关注环进行合并。
假设k为66%,重叠用户的数量与第一个最小关注环中用户总数的比值大于66%,且重叠用户的数量与第二个最小关注环中用户总数的比值也大于66%,则将两个最小关注环合并,形成一个中间社交圈。
在上述步骤301和302执行完毕之后,重新获取另外两个最小关注环,重复执行步骤301和步骤302,直至对所有的最小关注环都执行过步骤301和步骤302。
然后可执行下一轮合并,即:将两个中间社交圈进行合并,或将一个中间社交圈与一个最小关注环进行合并,形成更大的社交圈。直至任意两个中间社交圈或一个中间社交圈与一个最小关注环计算得到的X值均不为真,完成合并操作。
在上述每一次合并的过程中,需要记录重叠的用户,以便于后续对关键用户进行提取。
本实施例所提供的技术方案,通过获取设定区域内所有用户在社交平台上的关注关系网和言论互动数据,然后在关注关系网中提取用户之间相互关注的最小关注环,当各最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈,最后根据重叠用户的数量、社交圈中用户的总数以及言论互动数据在社交圈中提取关键用户。由于关键用户在社交圈中的影响力较大,向关键用户推送信息,则与该关键用户有互相关注关系的用户、以及与该关键用户有言论互动的用户都能够知晓推送信息,进而扩大了影响力,提高了信息推送的效果。
由于上述方案中,随机选择两个最小关注环进行合并,因此通过不同的合并方式可以得到不同的社交圈。本领域技术人员可以采用较为合理的合并方式,以达到社交圈中的人数越多越好,人数较少的社交圈的数目越少越好。例如:采用某种合并方式得到4个社交圈,每一个社交圈中的人数为3-6个,在这样的社交圈中提取关键用户的意义较小,因此可放弃这种合并方式。
因此在多次执行步骤301和302之后,得到最终的至少一个社交圈。计算社交圈中用户的总数,判断用户的总数是否小于设定用户数,若是,则放弃该社交圈。然后更换合并方式,以得到新的社交圈,直至社交圈中用户的总数大于或等于设定用户数,在这样的社交圈中提取关键用户才具有真实性。
实施例四
本实施例是在上述实施例的基础上,对社交圈关键用户提取方法进行进一步的优化。
上述步骤40具体可以采用如下方式来实现:
首先,采用如下公式对社交圈中的各用户的活跃值进行计算:
其中,Si为用户的活跃值,t1为第一权值,t2为第二权值,C1为重叠用户的数量,C2为社交圈中用户的总数,A1为言论互动数据。然后,提取活跃值最高的用户作为关键用户。
上述第一权值t1表示用户在社交圈的重复率的权重,第二权值t2表示社交圈言论互动用户的权重。第一权值t1和第二权值t2可以设置为0到1之内的任意数值,且t1与t2之和等于1。本实施例中,t1和t2均等于0.5。A1具体为与其发生言论互动用户的数量。社交圈由两个最小关注环合并而来,C1为两个最小关注环之间的重叠用户的数量。C2为社交圈中用户的总数。
例如:最小关注环1和最小关注环2合并为社交圈12,社交圈12的用户总数为20个。最小关注环1和最小关注环2之间的重叠用户为A、B、C三个用户,这三个用户半年内每条微博的平均互动用户数量为6、8、9个。
则对于A、B、C三个用户,活跃值分别为:
则用户C的活跃值较高,可以作为关键用户。
可以理解的是,关键用户分为两类:其一是各关注环之间的重叠用户,其二是社交言论互动率较高的用户,社交言论互动率较高的用户有可能也是重叠用户。可以采用上述公式对这两类用户的活跃值进行计算。
进一步的,对社交圈中的每一个用户进行判断,若用户为重叠用户,则采用上述公式计算活跃值;若用户不为重叠用户,则可采用下面的公式进行计算:
其中,Si为用户的活跃值,C2为社交圈中用户的总数,A1为言论互动数据。然后,提取活跃值最高的用户作为关键用户。相当于将上述公式中的t1/C1设定为零,即不考虑其作为重叠用户的分量。
采用上述方案提取到的关键用户,具有一定的核心聚集力,其发表的社交言论总会在社交圈内引起很多互动。
实施例五
本实施例是在上述实施例的基础上,对社交圈关键用户提取方法进行进一步的优化。
由于最终得到的社交圈是由多个小的关注环合并而成的,每次合并都是基于重叠用户进行的。小的关注环中的数量有多又少,重叠用户在各小关注环中所占的比重是不同的,因此,需要对实施例四中的公式进行进一步的优化。
例如:关注环A、关注环B、关注环C和关注环D合并得到社交圈E。
其中,关注环A和关注环B之间的重叠用户用集合表示:
Set1=A∩B={1,3,5,2,6},
关注环A与关注环B合并之后形成中间社交圈AB,中间社交圈AB与关注环C之间的重叠用户用集合表示:
Set2=AB∩C={1,3,7,9,10,32},
中间社交圈AB与关注环C合并之后形成中间社交圈ABC,中间社交圈ABC与关注环C之间的重叠用户用集合表示:
Set3=ABC∩D={1,3,5,2,6,32,55,23},
在计算活跃值的时候,需考虑每个用户是哪几个小的关注圈中的重叠用户。
例如:用户7存在于AB∩C中,则用户7的活跃值计算公式为:
其中,C(set2)为中间社交圈AB与关注环C之间的重叠用户的数量,C(set2)为6。C(set1∪set2∪set3)为set1、set2和set3三个集合合并的用户的数量,为11。
用户5存在于ABC∩D中,则用户5的活跃值计算公式为:
其中,C(set1∪set3)为set1和set3两个集合合并的用户的数量,为8。
实施例六
本实施例是在上述实施例的基础上,对社交圈关键用户提取方法进行进一步的优化。
在一些社交平台上,某一用户发表言论后,其它用户既可以对该言论进行评论,也可以对该言论进行转发。可以理解的是,用户将他人的言论转发到自己的社交网络中与仅在他人的言论中进行评论相比,转发是更加认同此言论的。因此,可以调整评论和转发两类言论互动所占的比重。即:对上述实施例四中的如下公式进行优化:
设定转发权值为t3,评论权值为t4,t3与t4之和为1,且t3大于t4。
上述公式中的(t2×A1)/C2可以优化为:
其中,A2为半年内每条微博被转发的用户数目,A3为半年内每条微博被评论的用户数目。
实施例七
图6为本发明实施例七提供的社交圈关键用户提取装置的结构示意图。如图6所示,本实施例提供一种社交圈关键用户提取装置,包括:社交数据获取模块61、最小关注环提取模块62、关注环合并模块63和关键用户提取模块64。
其中,社交数据获取模块61用于获取设定区域内所有用户在社交平台上的社交数据,社交数据包括:用户之间的关注关系网和言论互动数据。最小关注环提取模块62用于在关注关系网中提取用户之间相互关注的至少两个最小关注环,最小关注环中的每个用户仅与最小关注环中的其中两个用户互相关注。关注环合并模块63用于当各最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈。关键用户提取模块64用于根据重叠用户的数量、社交圈中用户的总数以及言论互动数据在社交圈中提取关键用户。
本实施例所提供的技术方案,通过获取设定区域内所有用户在社交平台上的关注关系网和言论互动数据,然后在关注关系网中提取用户之间相互关注的最小关注环,当各最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈,最后根据重叠用户的数量、社交圈中用户的总数以及言论互动数据在社交圈中提取关键用户。由于关键用户在社交圈中的影响力较大,向关键用户推送信息,则与该关键用户有互相关注关系的用户、以及与该关键用户有言论互动的用户都能够知晓推送信息,进而扩大了影响力,提高了信息推送的效果。
实施例八
图7为本发明实施例八提供的社交圈关键用户提取装置中最小关注环提取模块的结构示意图。如图7所示,上述最小关注环提取模块62包括:关注环提取单元621和关注环拆分单元622。
其中,关注环提取单元621用于在所述关注关系网中提取用户之间相互关注的关注环。关注环拆分单元622用于根据所述言论互动数据对所述关注环进行拆分,以得到最小关注环。
图8为本发明实施例八提供的社交圈关键用户提取装置中关注环合并模块的结构示意图。如图8所示,进一步的,上述关注环合并模块63具体包括:重叠用户数量获取单元631和重叠用户数量判断单元632。
其中,重叠用户数量获取单元631用于获取任意两个最小关注环之间重叠用户的数量。重叠用户数量判断单元632用于判断所述重叠用户的数量分别与所述重叠用户所在的两个最小关注环中用户总数的比值是否均大于设定值;若是,则将两个最小关注环进行合并,以得到社交圈。
本实施例所提供的技术方案,通过获取设定区域内所有用户在社交平台上的关注关系网和言论互动数据,然后在关注关系网中提取用户之间相互关注的最小关注环,当各最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈,最后根据重叠用户的数量、社交圈中用户的总数以及言论互动数据在社交圈中提取关键用户。由于关键用户在社交圈中的影响力较大,向关键用户推送信息,则与该关键用户有互相关注关系的用户、以及与该关键用户有言论互动的用户都能够知晓推送信息,进而扩大了影响力,提高了信息推送的效果。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (8)
1.一种社交圈关键用户提取方法,其特征在于,包括:
获取设定区域内所有用户在社交平台上的社交数据,所述社交数据包括:用户之间的关注关系网和言论互动数据;
在所述关注关系网中提取用户之间相互关注的最小关注环,所述最小关注环中的每个用户仅与所述最小关注环中的其中两个用户互相关注;
当各所述最小关注环之间重叠用户的数量满足设定要求时,对各最小关注环进行合并,以得到社交圈;
根据所述重叠用户的数量、所述社交圈中用户的总数以及所述言论互动数据在所述社交圈中提取关键用户;
所述当各所述最小关注环之间重叠用户的数量满足设定要求时,对各最小关注环进行合并,以得到社交圈,包括:
获取任意两个最小关注环之间重叠用户的数量;
判断所述重叠用户的数量分别与所述重叠用户所在的两个最小关注环中用户总数的比值是否均大于设定值;若是,则将两个最小关注环进行合并,以得到社交圈。
2.根据权利要求1所述的社交圈关键用户提取方法,其特征在于,在所述关注关系网中提取用户之间相互关注的最小关注环,包括:
在所述关注关系网中提取用户之间相互关注的关注环;
根据所述言论互动数据对所述关注环进行拆分,以得到最小关注环。
3.根据权利要求2所述的社交圈关键用户提取方法,其特征在于,在所述关注关系网中提取用户之间相互关注的关注环,包括:
采用深度遍历的方式,在所述关注关系网中提取用户之间相互关注的关注环。
5.根据权利要求4所述的社交圈关键用户提取方法,其特征在于,对社交圈中的各用户的活跃值进行计算之前,还包括:
判断社交圈中的各用户是否为重叠用户,若否,则设定t1/C1为零。
6.根据权利要求1所述的社交圈关键用户提取方法,其特征在于,还包括:
计算所述社交圈中用户的总数;
判断用户的总数是否小于设定用户数,若是,则放弃所述社交圈。
7.一种社交圈关键用户提取装置,其特征在于,包括:
社交数据获取模块,用于获取设定区域内所有用户在社交平台上的社交数据,所述社交数据包括:用户之间的关注关系网和言论互动数据;
最小关注环提取模块,用于在所述关注关系网中提取用户之间相互关注的最小关注环,所述最小关注环中的每个用户仅与所述最小关注环中的其中两个用户互相关注;
关注环合并模块,用于当各所述最小关注环之间重叠用户的数量满足设定要求时,对最小关注环进行合并,以得到社交圈;
关键用户提取模块,用于根据所述重叠用户的数量、所述社交圈中用户的总数以及所述言论互动数据在所述社交圈中提取关键用户;
所述关注环合并模块,包括:
重叠用户数量获取单元,用于获取任意两个最小关注环之间重叠用户的数量;
重叠用户数量判断单元,用于判断所述重叠用户的数量分别与所述重叠用户所在的两个最小关注环中用户总数的比值是否均大于设定值;若是,则将两个最小关注环进行合并,以得到社交圈。
8.根据权利要求7所述的社交圈关键用户提取装置,其特征在于,最小关注环提取模块包括:
关注环提取单元,用于在所述关注关系网中提取用户之间相互关注的关注环;
关注环拆分单元,用于根据所述言论互动数据对所述关注环进行拆分,以得到最小关注环。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710995536.5A CN107766515B (zh) | 2017-10-23 | 2017-10-23 | 社交圈关键用户提取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710995536.5A CN107766515B (zh) | 2017-10-23 | 2017-10-23 | 社交圈关键用户提取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107766515A CN107766515A (zh) | 2018-03-06 |
CN107766515B true CN107766515B (zh) | 2020-04-14 |
Family
ID=61268393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710995536.5A Active CN107766515B (zh) | 2017-10-23 | 2017-10-23 | 社交圈关键用户提取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107766515B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103024017A (zh) * | 2012-12-04 | 2013-04-03 | 武汉大学 | 一种社交网络重要目标及社区群体识别方法 |
CN105913322A (zh) * | 2016-04-07 | 2016-08-31 | 合肥学院 | 一种基于用户社交圈的信息传播评估方法及装置 |
CN106156117A (zh) * | 2015-04-07 | 2016-11-23 | 中国科学院信息工程研究所 | 面向特定主题的隐蔽社区核心交际圈检测发现方法和系统 |
CN106875277A (zh) * | 2017-01-16 | 2017-06-20 | 星云纵横(北京)大数据信息技术有限公司 | 一种社交媒体账号影响力的判断方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9311620B2 (en) * | 2010-10-21 | 2016-04-12 | Trustees Of Davidson College | System and process for ranking content on social networks such as twitter |
US20150134402A1 (en) * | 2013-11-11 | 2015-05-14 | Yahoo! Inc. | System and method for network-oblivious community detection |
-
2017
- 2017-10-23 CN CN201710995536.5A patent/CN107766515B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103024017A (zh) * | 2012-12-04 | 2013-04-03 | 武汉大学 | 一种社交网络重要目标及社区群体识别方法 |
CN106156117A (zh) * | 2015-04-07 | 2016-11-23 | 中国科学院信息工程研究所 | 面向特定主题的隐蔽社区核心交际圈检测发现方法和系统 |
CN105913322A (zh) * | 2016-04-07 | 2016-08-31 | 合肥学院 | 一种基于用户社交圈的信息传播评估方法及装置 |
CN106875277A (zh) * | 2017-01-16 | 2017-06-20 | 星云纵横(北京)大数据信息技术有限公司 | 一种社交媒体账号影响力的判断方法 |
Non-Patent Citations (1)
Title |
---|
一种移动通信网络的关键用户预测方法;张金龙;《移动通信》;20170530;第41卷(第10期);第11-14页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107766515A (zh) | 2018-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10360230B2 (en) | Method and device for social platform-based data mining | |
CN103678613B (zh) | 一种计算影响力数据的方法与装置 | |
US10296649B2 (en) | Mention suggestion, and information processing methods and systems | |
KR101568311B1 (ko) | 소셜 네트워크에서 친구를 추가하는 방법, 장치 및 저장 매체 | |
CN102651719B (zh) | 用于在消息交互环境中跟踪消息话题的方法和设备 | |
CN104202319A (zh) | 一种社交关系推荐方法及装置 | |
CN103916436B (zh) | 信息推送方法、装置、终端及服务器 | |
CN107729481B (zh) | 一种自定义规则的文本信息抽取结果筛选方法及装置 | |
US9892532B2 (en) | Apparatus and method for generating a shortest-path tree in a graph | |
CN106503230A (zh) | 一种基于复杂网络的微博传播溯源方法 | |
CN103425763A (zh) | 基于sns的用户推荐方法及装置 | |
CN102999577A (zh) | 信息合成方法及终端设备 | |
CN115438169A (zh) | 一种文本与视频的互检方法、装置、设备及存储介质 | |
CN110333990B (zh) | 数据处理方法以及装置 | |
CN107766515B (zh) | 社交圈关键用户提取方法及装置 | |
KR101509888B1 (ko) | 소셜 네트워크에서의 메시지 전파 방법 및 그 장치 | |
CN103810248A (zh) | 基于照片查找人际关系的方法和装置 | |
CN104111926A (zh) | 通讯录的关注推荐列表的生成方法及装置 | |
CN103051476B (zh) | 基于拓扑分析的网络社区发现方法 | |
CN105959205A (zh) | 聊天记录保存方法 | |
CN112416922B (zh) | 一种群体关联数据挖掘方法、装置、设备及存储介质 | |
US20180184351A1 (en) | Method, system, and program product for improving quality of electronic communications | |
CN111143701A (zh) | 一种基于多维度的社交网络用户推荐方法及系统 | |
CN105608116B (zh) | 基于交互历史数据的个性化推荐方法 | |
CN106656727B (zh) | 在社交网络中对用户信息处理的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |