CN102270239A - 论坛中关联网络的演化分析方法 - Google Patents

论坛中关联网络的演化分析方法 Download PDF

Info

Publication number
CN102270239A
CN102270239A CN2011102315591A CN201110231559A CN102270239A CN 102270239 A CN102270239 A CN 102270239A CN 2011102315591 A CN2011102315591 A CN 2011102315591A CN 201110231559 A CN201110231559 A CN 201110231559A CN 102270239 A CN102270239 A CN 102270239A
Authority
CN
China
Prior art keywords
community
degree
node
network
forum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102315591A
Other languages
English (en)
Inventor
张伟哲
张宏莉
何慧
曹博然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN2011102315591A priority Critical patent/CN102270239A/zh
Publication of CN102270239A publication Critical patent/CN102270239A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种论坛中关联网络的演化分析方法,1、合理的时间划分与片段提取;2、衡量社区演化的衡量参数;3、最长公共子序列算法求解团中的公共节点;4、基于DFS算法的社区网络图中割点的发现。本发明适用于不同应用、不同规模的网络、不同类型的网络。只要可以转换成无向图并遵循相同原则均可使用。不仅能够用于社区网络发现的可视化,并且可以分析提取出的网络随时间的变化。通过对多贴的分析得到:不同的帖子的演化过程也有差别,对于内容没有吸引力并且比较枯燥的帖子,它们仅仅在发帖的初期有一定的回复数量,生成的社区数量也相对较少,重要作用的节点也相对较少。而对于那些有吸引力的帖子,会持续很长时间,社区数量多。

Description

论坛中关联网络的演化分析方法
技术领域
本发明涉及一种论坛中关联网络的演化分析方法,属于网络的演化分析方法技术领域。
背景技术
在社区的演化过程中,社区层次会不断发生改变,单一层次的社区发现难以确保得到合理的社区结构,从而可能无法准确发现社区的演化过程。不仅如此,现有的社区演化类型判断标准很难满足社区变化的复杂性。在现有的社区发现方法中,存在一些问题如下:
(1)在分析不同时间的网络社区结构时,为了在同一条件下比较社区的变化过程,采用固定参数标准进行社区提取。然而,在社区的演化过程中,社区的内聚度和强度会不断发生改变,固定参数标准难以保证得到合理的社区结构,并准确发现社区的演化过程。
(2)社区的演化类型划分不够合理。很多时候社区变化是复合的,很难单用增大、缩小、合并、分解等方式进行准确描述。此外,社区的演化类型的界定过于绝对,没有充分考虑社区中变化部分和静止部分对社区变化类型的影响。
发明内容
本发明的目的是为解决发现社区的层次结构以及各个社区的变化过程,对于分析网络结构特性,理解节点在网络中的作用以及节点之间的关系的问题,进而提供一种论坛中关联网络的演化分析方法。
本发明的目的是通过以下技术方案实现的:
论坛中关联网络的演化分析方法,其具体步骤如下:
一、合理的时间划分与片段提取;
二、衡量社区演化的衡量参数;
(1)稳定度
稳定度是社区在变化过程中静态成员的比例;
R stability ( c i , c j ) = | c i ∩ c j | | c i | - - - ( 1 - 1 )
(2)消失度
消失度是消失的成员在社区中的比例;消失度与社区中消失的成员数量成正比,与社区本身的规模成反比;
R disappear ( c i , c j ) = | c i , c j | | c i | - - - ( 1 - 2 )
(3)增长度
增长度是社区中新增加成员的比例;增长度与社区中新增加的成员数量成正比,与社区的规模成反比;
R grow ( c i , c j ) = | c j - c i | | c i | - - - ( 1 - 3 )
(4)更新度
更新度反映了社区在演化过程中其成员发生变化的程度;在更新度与社区中消失和新增的成员数量成正比,与社区本身的规模成反比;
R alteration ( c i , c j ) = | c j ∩ c i | | c i | - - - ( 1 - 4 )
(5)社区相关度
社区相关度描述了两个社区的相关程度;社区Ci和Cj的相关度(Ci,Cj)定义为:
CR ( c i , c j ) = | c i ∩ c j | | c i ∪ c j | - - - ( 1 - 5 )
如果Ci、Cj为同一个社区结构在相邻时间的状态,那么社区Ci、Cj之间的相关度CR(ci,cj)称为自相关度(self-correlation),显然,社区相关度值的范围为[0,1];如果CR(ci,cj),那么Ci、Cj的成员完全相同;如果CR(ci,cj)=0,那么Ci、Cj没有共同成员;所以定义关联社区为两个社区的关联度不低于0.2。
三、最长公共子序列算法求解团中的公共节点;
最长公共子序列也称作最长公共子串,其定义是,一个序列S,如果分别是两个或多个已知序列的子序列,且是所有符合此条件序列中最长的,则S称为已知序列的最长公共子序列;它可以描述两段文字之间的“相似度”,对一段文字进行修改之后,计算改动前后文字的最长公共子序列,将除此子序列外的部分提取出来;
对于两个序列Xm=x1 x2 x3...xm和Yn=y1 y2 y3...yn,最长公共子序列(不必连续)算法如下:
(1)首先,定义dp(m,n)为Xm和Yn之间最长的子序列的长度;
(2)之后,初始化dp(m,0)=dp(0,m)=0;
(3)如果xm!=yn,则dp(m,n)=max{dp(m-1,n),dp(m,n-1)};
如果xm==yn,则dp(m,n)=dp(m-1,n-1)+1;
问题归结于求f(m,n),依照上述的判断和公式运用自顶向下的动态规划方法求解;
四、基于DFS算法的社区网络图中割点的发现;
求割点常见的算法就是DFS(Depth-First-Search),在DFS时记录每个节点的深度dep和它的子孙所能达到的最浅深度low,然后对于每一个节点:
(1)如果节点u是根节点并且有两个或者两个以上儿子,那么u是一个割点;
(2)如果u不是根节点并且存在它的一个儿子v,使得low[v]>=dep[u],那么u是割点。
由上述提供的技术方案可以看出,本发明发现社区的层次结构以及各个社区的变化过程,对于分析网络结构特性,理解节点在网络中的作用以及节点之间的关系,起着不可或缺的作用。
社区的分类:
一个社区层次,一般来说是由一个大社区和若干个小社区构成的。大社区的规模远远大于其他小社区的规模。定义一个社区是大社区如果社区的节点的个数大于等于4。小社区就是那些节点数量小于4的社区。在单帖数据中我们得出了大社区数量很少共有11个,而小社区的数量很多共有42个。
大社区:
(1)成员
从组成上看,大社区中的节点大多是与其他人联系比较紧密的人,并且其中很大一部分节点的度数较高,节点平均度数为10.08。
(2)演化
随着时间推移,大社区的成员在不断发生变化,随着时间的变化有新的节点加入,也有部分的节点消失。消失度很高在0.6-0.9之间。社区间的重叠度在0.2-0.3之间。然而,大社区中相当一部分节点是稳定的。在演化过利中,自相关度保持在一个小范围0.1-0.2之间波动。这反应了大社区的不断变化的特征,也说明了大社区成员的相对稳定性。对于一个大社区,总是可以找到它的前驱状态和后继状态。也就是说,大社区不会突然地形成,也不会顷刻消失。尽管大社区没有明显的涌现现象,但通过分析大社区中新增的节点和消失的节点,在某种程度上还是可以了解整个网络的变化。
小社区:
(1)成员
小社区的规模远远小于大社区。从成员集合上看,大部分小社区的含义比起大社区更加清晰。可能是在论坛中几个人之间关系密切所以他们之间经常发帖回帖,同时也可能是因为某种原因几个人发生纠纷产生口角进而之间小团体的发帖回帖。
(2)演化
和大社区的演化过程截然不同,很多小社区的变化呈现两级化。这些小社区可能完全静止,也可能突然涌现或是消失。因此,大社区很可能会比小社区有更长的平均生命周期。
适用情况:适用于不同应用、适用于不同规模的网络、适用于不同类型的网络。只要可以转换成无向图并遵循相同原则,均可使用本发明的方法。本发明的方法不仅能够用于社区网络发现的可视化,并且可以分析提取出的网络随时间的变化。
通过对多贴的分析得到:对于多贴,不同的帖子的演化过程也有差别,对于内容没有吸引力并且比较枯燥的帖子,如新闻类,它们仅仅在发帖的初期有一定的回复数量,生成的社区数量也相对较少,重要作用的节点也相对较少。而对于那些能引起人们共鸣并且比较新颖有吸引力的帖子,如生活情感类、娱乐类、政治类会持续很长时间,社区数量多。
附图说明
图1为节点数量分布图;
图2为边的数量分布图;
图3为节点平均度分布图;
图4为社区数量分布图;
图5为每个帖子生成社区的边的数量图;
图6为每个帖子生成社区的节点数量图;
图7为每个帖子生成社区的团的数量图。
具体实施方式
本具体实施方式提供了一种论坛中关联网络的演化分析方法,其具体步骤如下:
一、合理的时间划分与片段提取
时间段选择的合理性对社区发现的效果有较大的影响;时间段的确定需要考虑现实系统本身的特点。如果时间段选取过长,则难以发现网络中的涌现现象。如果时间段选取过短,网络中不稳定的节点和边的数量可能会大大增加,社区发现的结果较容易受到噪音的干扰,且加重了计算代价。时间段的确定需要考虑现实系统本身的特点。
二、衡量社区演化的衡量参数
(1)稳定度
稳定度是社区在变化过程中静态成员的比例。稳定度越高,社区内保持不变的节点数越大。如果稳定度为1,那么整个社区在这个时段保持静止。
R stability ( c i , c j ) = | c i ∩ c j | | c i | - - - ( 1 - 1 )
(2)消失度
消失度是消失的成员在社区中的比例。消失度与社区中消失的成员数量成正比,与社区本身的规模成反比。
R disappear ( c i , c j ) = | c i , c j | | c i | - - - ( 1 - 2 )
(3)增长度
增长度是社区中新增加成员的比例。增长度与社区中新增加的成员数量成正比,与社区的规模成反比。
R grow ( c i , c j ) = | c j - c i | | c i | - - - ( 1 - 3 )
(4)更新度
更新度反映了社区在演化过程中其成员发生变化的程度。在更新度与社区中消失和新增的成员数量成正比,与社区本身的规模成反比。
R alteration ( c i , c j ) = | c j ∩ c i | | c i | - - - ( 1 - 4 )
(5)社区相关度
社区相关度描述了两个社区的相关程度。社区Ci和Cj的相关度(Ci,Cj)定义为。。
CR ( c i , c j ) = | c i ∩ c j | | c i ∪ c j | - - - ( 1 - 5 )
如果Ci、Cj为同一个社区结构在相邻时间的状态,那么社区Ci、Cj之间的相关度CR(ci,cj)称为自相关度(self-correlation)。显然,社区相关度值的范围为[0,1]。如果CR(ci,cj),那么Ci、Cj的成员完全相同。如果CR(ci,cj)=0,那么Ci、Cj没有共同成员。我们定义关联社区为两个社区的关联度不低于0.2。
三、最长公共子序列算法求解团中的公共节点
最长公共子序列也称作最长公共子串(不要求连续),英文缩写为LCS(LongestCommon Subsequence)。其定义是,一个序列S,如果分别是两个或多个已知序列的子序列,且是所有符合此条件序列中最长的,则S称为已知序列的最长公共子序列。最长公共子序列是一个十分实用的问题,它可以描述两段文字之间的“相似度”,对一段文字进行修改之后,计算改动前后文字的最长公共子序列,将除此子序列外的部分提取出来。这种方法判断修改的部分,往往十分准确。
对于两个序列Xm=x1 x2 x3...xm和Yn=y1 y2 y3...yn,最长公共子序列(不必连续)算法大致如下:
(1)首先,定义dp(m,n)为Xm和Ym之间最长的子序列的长度;
(2)之后,初始化dp(m,0)=dp(0,m)=0;
(3)如果xm!=yn,则dp(m,n)=max{dp(m-1,n),dp(m,n-1)};
如果xm==yn,则dp(m,n)=dp(m-1,n-1)+1。
问题归结于求f(m,n)。依照上述的判断和公式我们可以运用自顶向下的动态规划方法求解。
四、基于DFS算法的社区网络图中割点的发现
如果一个连通的无向图的任意的一个顶点删除之后,剩下的图仍然是连通的,那么这样的无相连通图就称为双连通的。如果将一个双连通图中的节点比作是计算机,边是链路,那么,若有一台计算机出现了故障而不能运行,则网络邮件并不受影响,但是网络图不是双连通的那么去掉某个点之后就会使整个网络出现故障而不能正常运行。我们发现,去掉树中任一度大于1的顶点,便得到了由几棵树构成的森林。这个顶点就叫做割点。因此,我们需要找到关联网络中的割点或者桥。而去掉树的任一条边,就破坏了树的连通性。这种边就叫做桥。对于一个一般的图,有时也可以找到具有类似性质的顶点和边。对铁路、公路交通图,割点和桥有显然的军事意义和经济意义。
通俗来说,割点就是在一个无向图中,去掉这个点以及与它关联的边,原来连通的图变为了若干不连通的块的一个点。求割点常见的算法就是DFS(Depth-First-Search),在DFS时记录每个节点的深度dep和它的子孙所能达到的最浅深度low。然后对于每一个节点:
(1)如果节点u是根节点并且有两个或者两个以上儿子,那么u是一个割点;
(2)如果u不是根节点并且存在它的一个儿子v,使得low[v]>=dep[u],那么u是割点。
在分析社区网络中的节点特性和作用时,从功能结构观点来看,人之间联系紧密是在说话题中的同一个观点。蛋白质网络中,完成同一功能的蛋白质之间联系频繁,形成团(clique)。在以下的说明中将团称之为clique。
在分析的clique中,3-clique和4-clique、5-clique之间交集最多为1个点,不可能多于一条边。即同等大小的clique之间以及不同大小的clique之间的交集均是点。可以认为,clique之间的交集承担的功能更强,因为其连接了2个不同功能的clique。
如何评价点:形成clique的点,和非clique的点;
(1)对clique里的点,分clique间的交集和非交集。如果是clique之间的交集则重要性大。否则重要性次之;
(2)对于虽然没有连接clique,但和该点连接的点都形成了clique,则可以认为该节点同样重要。
对于第一种情况需要分析图中的边,即clique的演化。
分析clique的演化,是分析交互的人群是变多了,还是消失了。交互人群变多了说明是热点问题,交互人群少说明已经不是热点,或热点性在减小。
在分析clique间的交集时,clique间的交集是边,又因为clique是全连通图。故可形成一个点的序列并按点的标号进行排序,求clique间的最长公共子序列(长度最少为1)。因此,上面的求clique交集可以通过最长公共子序列方法实现。
对于第二种情况,需要在图中查找割点。其主要思想是运用深度优先搜索(DFS)方法进行求解。
论坛中单帖中的网络社区的演化比较:
对来自于天涯论坛娱乐八卦版块的一篇回复数较多和持续时间较长的帖子作为代表。数据日期:2010.08.17-2010.10.14。
由于该帖子的时间跨度为两个月,如果时间划分的方法以选取月份为时间段则只有两个月。无法得到理想的结果。如果一天为划分时间段,则我们分析的数据量多,结果比较杂乱并且难以清楚地反映社区的演化结果。
见表1,表示了对单贴的数据统计,包括新增的节点、消失的节点、公共的节点以及生成的社区中团的数量,节点和边的数量。见表2,表示了单帖中社区的总数量、大社区数量、小社区数量和团的数量。在这里,定义一个社区是大社区如果社区的节点的个数大于等于4。小社区就是那些节点数量小于4的社区。见表3,表示了衡量参数随每一周的变化量。
表1社区初始信息和节点的变化
Figure BSA00000556429600091
对帖子通过LCS算法并求解每周之间公共节点分析得出:在这八周之间,得到发言比较活跃的有81个人;或者可以说这81个点在社区结构中比较稳定,他们处于一个不变动的阶段。这些人在这八周当中是该帖中处于比较中心的位置。之后在这81个人当中,通过基于DFS方法求解社区网络中的割点的方法发现其中有40个点可以成为割点。并且得到了割点相对应的社区网络图的连通性。因此,可以说这40个人在之前找到的81个人中更为重要。因为,一旦忽略他们的存在,其他的人之间的联系关系就将不会存在。通过查看其帖子的具体内容可以验证该方法的正确性。
表2帖子中的社区数量和生成团的数量
Figure BSA00000556429600101
表3社区的衡量参数的变化
Figure BSA00000556429600102
为了得出帖子中节点数量随时间的变化,(见图3)为单帖中每周节点的数量分布。从图中可以看出节点的数量总体呈减少趋势。但是在第三周有小幅度的增加。
为了得出帖子中人们之间的回复数量(见图4)为单帖中每周边的数量分布。其变化趋势是在第三周达到最大的回复数量,之后回复数量呈每周递减的趋势。
图5为单帖中节点的平均度分布。曲线大致呈增长趋势。表示了随着时间的变化节点的联系边的更加紧密稳定。
为了发现帖子随时间生成的社区数量,分析帖子中人们之间形成的团多少,(见图6)为单帖中社区数量的分布曲线。总体上,曲线呈下降趋势,但是每周有一定小幅度的回升。这反证了帖子随着时间的推移虽然热度逐渐降低,但是参与其中的人数并不会很快减少,有一部分新增的人参与到了论坛的回复。
论坛中多帖中的网络社区的演化比较:
对于论坛中多帖的网络社区的演化分析,基本上与单帖的分析方法相似。主要过程为:首先,在同一个时间段下比较特性近似的每个帖子的节点数量、回复关系数量、生成的社区和团的数量。查找出每个帖子中处于比较重要位置的节点。分析不同特性的帖子演化的特征。
数据源:天涯杂谈中选择了七个时间跨度比较大并且回复数量比较多的帖子。帖子名称分别为:《赌场两年》、《监控》、《关于阴阳五行》、《海面以下》、《决不妥协》、《作为老共产党员》、《重庆人在东北》。为后面简化说明将这七个帖子对应为编号1-7,简称为帖子No1等等。他们的最长时间跨度从2008年6月至2010年12月。
图5为七个帖子在同一个时间段内,人们之间的回复的数量曲线图。在2008.6-2009.3中由该图可以看出对于生成社区的每个帖子中No2帖子在前两个月回复数量剧烈增加,但是,第二月之后就基本没有人进行回复。No1和No7帖子中的回复数量比较均衡,但持续时间不同,No7持续时间较长。No3帖子的持续时间最长并且呈现出先增加在减少的波浪型变化。原因是,开始时,人们回复逐渐增加,过了一段时间先前参与的人数开始减少,但是之后又会有新增的一部分人参与到帖子的讨论中。
在2010.1-2010.3之间,No4帖子和No5帖的回复数量均呈现为下降趋势但是No4中的回复数量减少的更快。然而,No6帖子中的回复数量从开始逐渐增加,最后减少。
图6为七个帖子在同一个时间段内,输入的节点的数量曲线图。由该图可以看出输入节点的数量曲线变化基本与回复数量的曲线图呈相似的变化。可以简单的认为输入节点的增多,回复的数量也会增多。
图7为七个帖子随时间的变化生成团个数的曲线图。由该图可以判断出每个帖子生成的团的数量与输入的节点和边的数量基本上成正比关系。输入的节点和边的数量越多生成的团的数量一般上来说也会越多。但是节点之间的关系紧密与否也在一定程度上决定了生成团的数量。
表4多帖中出现频率统计
在统计出的前12个出现频率较多的节点。占分析的所有节点的0.041%。另外出现频率为2的有182个节点,占所有节点的0.631%。由这两个数据可以说明:出现在不同帖子中的人数并不是很多。原因是,帖子的内容覆盖面比较广,并不是每个人都会感兴趣,每个人只可能喜欢其中的部分方面。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (1)

1.一种论坛中关联网络的演化分析方法,其特征在于,具体步骤如下:
一、合理的时间划分与片段提取;
二、衡量社区演化的衡量参数;
(1)稳定度
稳定度是社区在变化过程中静态成员的比例;
R stability ( c i , c j ) = | c i ∩ c j | | c i | - - - ( 1 - 1 )
(2)消失度
消失度是消失的成员在社区中的比例;消失度与社区中消失的成员数量成正比,与社区本身的规模成反比;
R disappear ( c i , c j ) = | c i , c j | | c i | - - - ( 1 - 2 )
(3)增长度
增长度是社区中新增加成员的比例;增长度与社区中新增加的成员数量成正比,与社区的规模成反比;
R grow ( c i , c j ) = | c j - c i | | c i | - - - ( 1 - 3 )
(4)更新度
更新度反映了社区在演化过程中其成员发生变化的程度;在更新度与社区中消失和新增的成员数量成正比,与社区本身的规模成反比;
R alteration ( c i , c j ) = | c j ∩ c i | | c i | - - - ( 1 - 4 )
(5)社区相关度
社区相关度描述了两个社区的相关程度;社区Ci和Cj的相关度(Ci,Cj)定义为:
CR ( c i , c j ) = | c i ∩ c j | | c i ∪ c j | - - - ( 1 - 5 )
如果Cj、Cj为同一个社区结构在相邻时间的状态,那么社区Ci、Cj之间的相关度CR(ci,cj)称为自相关度,显然,社区相关度值的范围为[0,1];如果CR(ci,cj),那么Ci、Cj的成员完全相同;如果CR(ci,cj)=0,那么Ci、Cj没有共同成员;所以定义关联社区为两个社区的关联度不低于0.2;
三、最长公共子序列算法求解团中的公共节点;
最长公共子序列也称作最长公共子串,其定义是,一个序列S,如果分别是两个或多个已知序列的子序列,且是所有符合此条件序列中最长的,则S称为已知序列的最长公共子序列;它可以描述两段文字之间的相似度,对一段文字进行修改之后,计算改动前后文字的最长公共子序列,将除此子序列外的部分提取出来;
对于两个序列Xm=x1 x2 x3...xm和Yn=y1 y2 y3...yn,最长公共子序列算法如下:
(1)首先,定义dp(m,n)为Xm和Yn之间最长的子序列的长度;
(2)之后,初始化dp(m,0)=dp(0,m)=0;
(3)如果xm!=yn,则dp(m,n)=max{dp(m-1,n),dp(m,n-1)};
如果xm==yn,则dp(m,n)=dp(m-1,n-1)+1;
问题归结于求f(m,n),依照上述的判断和公式运用自顶向下的动态规划方法求解;
四、基于DFS算法的社区网络图中割点的发现;
求割点常见的算法就是DFS,在DFS时记录每个节点的深度dep和它的子孙所能达到的最浅深度low,然后对于每一个节点:
(1)如果节点u是根节点并且有两个或者两个以上儿子,那么u是一个割点;
(2)如果u不是根节点并且存在它的一个儿子v,使得low[v]>=dep[u],那么u是割点。
CN2011102315591A 2011-08-15 2011-08-15 论坛中关联网络的演化分析方法 Pending CN102270239A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102315591A CN102270239A (zh) 2011-08-15 2011-08-15 论坛中关联网络的演化分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102315591A CN102270239A (zh) 2011-08-15 2011-08-15 论坛中关联网络的演化分析方法

Publications (1)

Publication Number Publication Date
CN102270239A true CN102270239A (zh) 2011-12-07

Family

ID=45052544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102315591A Pending CN102270239A (zh) 2011-08-15 2011-08-15 论坛中关联网络的演化分析方法

Country Status (1)

Country Link
CN (1) CN102270239A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567407A (zh) * 2010-12-22 2012-07-11 北大方正集团有限公司 一种论坛回帖增量采集方法及系统
CN103853739A (zh) * 2012-11-29 2014-06-11 中国移动通信集团公司 动态社会关系网络社区演化识别以及稳定社区提取方法
CN104809751A (zh) * 2015-04-30 2015-07-29 百度在线网络技术(北京)有限公司 生成事件组演化图的方法和装置
CN106484723A (zh) * 2015-08-28 2017-03-08 杭州华为数字技术有限公司 Egonet的信息处理方法和装置
CN107480213A (zh) * 2017-07-27 2017-12-15 上海交通大学 基于时序文本网络的社区检测与用户关系预测方法
CN110019845A (zh) * 2019-04-16 2019-07-16 济南大学 一种基于知识图谱的社区演化分析方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060080422A1 (en) * 2004-06-02 2006-04-13 Bernardo Huberman System and method for discovering communities in networks
CN101383748A (zh) * 2008-10-24 2009-03-11 北京航空航天大学 一种复杂网络中的社区划分方法
CN101388024A (zh) * 2008-10-09 2009-03-18 浙江大学 一种基于复杂网络的压缩空间高效搜索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060080422A1 (en) * 2004-06-02 2006-04-13 Bernardo Huberman System and method for discovering communities in networks
CN101388024A (zh) * 2008-10-09 2009-03-18 浙江大学 一种基于复杂网络的压缩空间高效搜索方法
CN101383748A (zh) * 2008-10-24 2009-03-11 北京航空航天大学 一种复杂网络中的社区划分方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
阎艳: "关联网络的社区发现研究", 《中国优秀硕士学位论文全文数据库》, 31 October 2009 (2009-10-31), pages 19 - 57 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567407A (zh) * 2010-12-22 2012-07-11 北大方正集团有限公司 一种论坛回帖增量采集方法及系统
CN102567407B (zh) * 2010-12-22 2014-07-16 北大方正集团有限公司 一种论坛回帖增量采集方法及系统
CN103853739A (zh) * 2012-11-29 2014-06-11 中国移动通信集团公司 动态社会关系网络社区演化识别以及稳定社区提取方法
CN104809751A (zh) * 2015-04-30 2015-07-29 百度在线网络技术(北京)有限公司 生成事件组演化图的方法和装置
CN104809751B (zh) * 2015-04-30 2017-11-24 百度在线网络技术(北京)有限公司 生成事件组演化图的方法和装置
CN106484723A (zh) * 2015-08-28 2017-03-08 杭州华为数字技术有限公司 Egonet的信息处理方法和装置
CN106484723B (zh) * 2015-08-28 2019-08-02 杭州华为数字技术有限公司 Egonet的信息处理方法和装置
CN107480213A (zh) * 2017-07-27 2017-12-15 上海交通大学 基于时序文本网络的社区检测与用户关系预测方法
CN107480213B (zh) * 2017-07-27 2021-12-24 上海交通大学 基于时序文本网络的社区检测与用户关系预测方法
CN110019845A (zh) * 2019-04-16 2019-07-16 济南大学 一种基于知识图谱的社区演化分析方法及装置

Similar Documents

Publication Publication Date Title
Huang et al. Shrink: a structural clustering algorithm for detecting hierarchical communities in networks
Laffan et al. Range‐weighted metrics of species and phylogenetic turnover can better resolve biogeographic transition zones
CN102663101B (zh) 一种基于新浪微博的用户等级排序算法
CN102270239A (zh) 论坛中关联网络的演化分析方法
Fluck et al. Climate and geographic distance are more influential than rivers on the beta diversity of passerine birds in Amazonia
Mo et al. A two-stage clustering approach for multi-region segmentation
Weber et al. Who's in the gang? Revealing coordinating communities in social media
Li et al. Dynamic changes of land use/cover and landscape pattern in a typical alpine river basin of the Qinghai‐Tibet Plateau, China
Bhatt et al. Illuminating an ecosystem of partisan websites
CN102456064B (zh) 在社会网络中实现社区发现的方法
CN103823890A (zh) 一种针对特定群体的微博热点话题检测方法及装置
Weinreb et al. Lineage reconstruction from clonal correlations
Fagroud et al. IOT search engines: exploratory data analysis
Ames et al. Keeping up with the souzas: Social influence and electoral change in a weak party system, Brazil 2002–2006
Bai et al. Evolution of transaction pattern in Ethereum: A temporal graph perspective
CN103366009A (zh) 一种基于自适应聚类的图书推荐方法
Pulick et al. Modeling interaction effects in polarization: Individual media influence and the impact of town meetings
Wang et al. Fundamental literature and hot topics on rural left‐behind children in China: A bibliometric analysis
Leroi et al. On revolutions
Cao et al. How do scientific papers from different journal tiers gain attention on social media?
Dassisti et al. A small-world methodology of analysis of interchange energy-networks: The European behaviour in the economical crisis
Xia et al. Trends and Future Directions in Research on the Protection of Traditional Village Cultural Heritage in Urban Renewal
Xiao Equilibrating ripple effect, disturbing information cascade effect and regional disparity–A perspective from China's tiered housing markets
Völz et al. Sea Level Rise Learning Scenarios for Adaptive Decision‐Making Based on IPCC AR6
CN109828995A (zh) 一种基于视觉特征的图数据检测方法、系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20111207