CN105677648A - 一种基于标签传播算法的社团发现方法及系统 - Google Patents

一种基于标签传播算法的社团发现方法及系统 Download PDF

Info

Publication number
CN105677648A
CN105677648A CN201410657458.4A CN201410657458A CN105677648A CN 105677648 A CN105677648 A CN 105677648A CN 201410657458 A CN201410657458 A CN 201410657458A CN 105677648 A CN105677648 A CN 105677648A
Authority
CN
China
Prior art keywords
node
label
network
maximum
adjacent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410657458.4A
Other languages
English (en)
Other versions
CN105677648B (zh
Inventor
吴海贵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
4399 NETWORK Co Ltd
Original Assignee
4399 NETWORK Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 4399 NETWORK Co Ltd filed Critical 4399 NETWORK Co Ltd
Priority to CN201410657458.4A priority Critical patent/CN105677648B/zh
Publication of CN105677648A publication Critical patent/CN105677648A/zh
Application granted granted Critical
Publication of CN105677648B publication Critical patent/CN105677648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种基于标签传播算法的社团发现方法及系统,方法包括:获得源数据,初始化初始的关系网络图;以随机顺序排列关系网络图中的各个节点,按所排列的顺序遍历更新关系网络图中的所有节点的标签;其中,节点m更新方法为:判断节点m的所有邻接节点中出现次数最多的标签是否为一个,如果不是,则将出现次数最多的标签所对应的邻接节点组成邻接节点集M,从邻接节点集M中选取与节点m连接的向量的权重值最大的邻接节点作为选定节点,将选定节点的标签更新为节点m的新标签;当满足终止条件时,网络论坛的社团划分过程结束,具有相同标签的节点所对应的用户ID属于同一个社团。能够更准确的实现社团的划分,得到网络论坛的社团分布情况。

Description

一种基于标签传播算法的社团发现方法及系统
技术领域
本发明属于计算机应用技术领域,具体涉及一种基于标签传播算法的社团发现方法及系统。
背景技术
随着对社会网络的深入研究,可以发现在一个复杂网络的用户之间还存在一些潜在的社区结构,即社团,社团是由一组组相似的结点互相连接而成的,同一个社团内部之间连接稠密,不同社团之间的连接较为稀疏。例如,在游戏论坛中,所有喜欢射击类游戏的用户可以划分为一个社团,在这个社团中,所有玩家关注共同兴趣的话题。通过社团划分,可以揭示某个具体节点在复杂网络中的作用。
比较经典的社团发现算法包括GN算法、LPA算法等。其中,对于GN算法,其复杂度较高,而社会网络的数据信息往往是海量的,所以要求社团发现方法应具有尽可能低的时间复杂度,因此,GN算法不适用于复杂社会网络的社团发现。而对于LPA(NearLinearTimeAlgorithmtoDetectCommunityStructuresinLarge-scaleNetworks)算法,与集中式社团发现算法不同,LPA是一种分布式的社团发现算法,不需要预先给定划分社团的数量和规模等先验信息,对社团的大小也没有限制,其核心思想是:LPA算法首先为每个节点指派唯一标签,在每一步迭代中,每个节点将自身标签更新为其邻接节点出现次数最多的标签,如果邻接节点中出现次数最多的标签同时有多个,则随机选择其中一个作为该节点的新标签,遍历所有节点后,判断是否达到终止条件,终止条件为所有节点的标签均为其邻接节点标签中出现次数最多的标签,如果没有达到,则进行下一步迭代;若干次迭代后,当达到终止条件时,即具有相同标签的节点归为一个社团,则标签收敛,社团划分完成。
LPA社团发现算法可以实现复杂网络中社团的发现,但在分配标签的时候,当邻接节点中出现次数最多的标签同时有多个时,采用的策略为:随机选择其中一个作为该节点的新标签,从而降低了社团划分的准确率。
发明内容
针对现有技术存在的缺陷,本发明提供一种基于标签传播算法的社团发现方法及系统,用以解决LPA算法进行复杂网络社团划分时,由于忽略复杂网络中节点间连接边的权重等特点,使得其社团发现的准确率降低的技术问题。
本发明采用的技术方案如下:
本发明提供一种基于标签传播算法的社团发现方法,包括以下步骤:
S1,获得源数据:即,对于被分析的网络论坛,通过读取数据库,获得所述网络论坛中某一历史时刻T1至当前时刻T2之间的所有单向互动记录,其中,所述单向互动记录包括发起方的用户ID以及接收方的用户ID;
S2,将所述网络论坛中某一历史时刻T1至当前时刻T2之间的参与单向互动的所有用户ID分别映射为关系拓扑网络图的节点;将单向互动关系映射为关系拓扑网络图中节点之间相互连接的向量,其中,向量的方向为:由代表单向互动发起方的节点指向代表单向互动接收方的节点;将在某一历史时刻T1至当前时刻T2之间通过向量连接的两个节点之间的单向互动次数作为连接所述两个节点的向量的权重值,由此得到初始的关系网络图;
S3,初始化所述初始的关系网络图,即:为所述初始的关系网络图中的每个节点均赋予唯一的标签;
S4,令迭代计数器t=1;
S5,以随机顺序排列S3得到的关系网络图中的各个节点,按所排列的顺序遍历更新所述关系网络图中的所有节点的标签;其中,对于任意一个节点m,对所述节点m进行更新的方法为:
首先获取节点m的所有邻接节点;其中,所述邻接节点指:与节点m发生互动,并且,相对于节点m,作为单向互动接收方的所有节点;然后,判断节点m的所有邻接节点中出现次数最多的标签是否为一个,如果是,则将所有邻接节点中出现次数最多的标签更新为节点m的新标签;如果不是,则将出现次数最多的标签所对应的邻接节点组成邻接节点集M,然后,从所述邻接节点集M中选取与所述节点m连接的向量的权重值最大的邻接节点作为选定节点,将所述选定节点的标签更新为节点m的新标签;
S6,判断是否满足预设置的迭代终止条件,其中,所述迭代终止条件指:所述关系网络图中的任意节点m’的标签满足以下条件:如果节点m’的所有邻接节点中出现次数最多的标签为一个,则节点m’的标签等于其所有邻接节点中出现次数最多的标签;如果节点m’的所有邻接节点中出现次数最多的标签为两个以上,将出现次数最多的标签所对应的邻接节点组成邻接节点集M’,则节点m’的标签等于邻接节点集M’中与节点m’连接的向量的权重值最大的邻接节点的标签;
如果未满足,则令t=t+1,反复迭代执行S5,直至满足预设置的终止条件;如果满足,则对所述网络论坛的社团划分过程结束,具有相同标签的节点所对应的用户ID属于同一个社团。
优选的,S3中,为每个节点所赋予的唯一的标签即为用户ID。
优选的,S5中,通过以下方法获取节点m的所有邻接节点:
建立邻接节点映射表;所述邻接节点映射表存储所述关系网络图中每一个用户ID与其所有邻接节点对应的用户ID的对应关系;
通过查找所述邻接节点映射表,获得节点m的所有邻接节点。
优选的,S6之后,还包括:
通过簇结构的方式显示所述关系网络图的所有节点,其中,具有相同标签的节点属于同一个簇。
本发明还提供一种基于标签传播算法的社团发现系统,包括:
源数据获取模块,对于被分析的网络论坛,获得所述网络论坛中的源数据;其中,所述源数据指所述网络论坛中某一历史时刻T1至当前时刻T2之间的所有单向互动记录,其中,所述单向互动记录包括发起方的用户ID以及接收方的用户ID;
关系网络图创建模块,用于读取所述源数据获取模块,将所述网络论坛中某一历史时刻T1至当前时刻T2之间的参与单向互动的所有用户ID分别映射为关系拓扑网络图的节点,将单向互动关系映射为关系拓扑网络图中节点之间相互连接的向量,将在某一历史时刻T1至当前时刻T2之间相互连接的两个节点之间的单向互动次数作为连接所述两个节点的向量的权重值,由此得到初始的关系网络图;
关系网络图初始化模块,用于初始化所述关系网络图创建模块所创建的初始的关系网络图,即:为所述初始的关系网络图中的每个节点均赋予唯一的标签;
迭代终止条件设置模块,用于设置迭代终止条件,所述迭代终止条件指:所述关系网络图中的任意节点m’的标签满足以下条件:如果节点m’的所有邻接节点中出现次数最多的标签为一个,则节点m’的标签等于其所有邻接节点中出现次数最多的标签;如果节点m’的所有邻接节点中出现次数最多的标签为两个以上,将出现次数最多的标签所对应的邻接节点组成邻接节点集M’,则节点m’的标签等于邻接节点集M’中与节点m’连接的向量的权重值最大的邻接节点的标签;其中,节点m’的邻接节点指:与节点m’发生互动,并且,相对于节点m’,作为单向互动接收方的所有节点;
迭代处理模块,用于在每次迭代中,以随机顺序排列关系网络图中的各个节点,按所排列的顺序遍历更新所述关系网络图中的所有节点的标签;其中,对于任意一个节点m,对所述节点m进行更新的方法为:首先获取节点m的所有邻接节点;然后,判断节点m的所有邻接节点中出现次数最多的标签是否为一个,如果是,则将所有邻接节点中出现次数最多的标签更新为节点m的新标签;如果不是,则将出现次数最多的标签所对应的邻接节点组成邻接节点集M,然后,从所述邻接节点集M中选取与所述节点m连接的向量的权重值最大的邻接节点作为选定节点,将所述选定节点的标签更新为节点m的新标签;
迭代终止判断模块,用于当所述迭代处理模块运行完一次迭代后,判断是否满足所述迭代终止条件设置模块所设置的迭代终止条件,如果未满足,则循环执行所述迭代处理模块,反复进行迭代处理;如果满足,则对所述网络论坛的社团划分过程结束,具有相同标签的节点所对应的用户ID属于同一个社团。
本发明提供一种基于标签传播算法的社团发现方法,包括以下步骤:
本发明提供的基于标签传播算法的社团发现方法及系统,具有以下优点:
当邻接节点中出现次数最多的标签有两个以上时,通过判断节点间连接向量的权重而决定需要选取的标签,能够更准确的实现社团的划分,得到网络论坛的社团分布情况,从而更有效的帮助运营决策者获知论坛用户的兴趣点,帮助运营决策者进行运营决策。
附图说明
图1为本发明提供的基于标签传播算法的社团发现方法的流程示意图;
图2为本发明对节点m进行更新的方法流程示意图;
图3为本发明提供的基于标签传播算法的社团发现系统的流程示意图;
图4为关系拓扑网络图的一种简化具体示例图。
具体实施方式
以下结合附图对本发明进行详细说明:
如图1所示,本发明提供一种基于标签传播算法的社团发现方法,可应用于游戏论坛进行舆情分析,具体包括以下步骤:
S1,获得源数据:即,对于被分析的网络论坛,通过读取数据库,获得所述网络论坛中某一历史时刻T1至当前时刻T2之间的所有单向互动记录,其中,所述单向互动记录包括发起方的用户ID以及接收方的用户ID;例如,获取某一游戏论坛近一周内的所有单向互动记录。此处,以用户ID-1为例,与用户ID-1相关的所有单向互动记录是指:用户ID-1作为单向互动发起方而得到的所有互动记录,如,在此期间,用户ID-1向用户ID-2共传输3条消息,则用户ID-1具有与用户ID-2相关的3条单向互动记录。而在此期间,如果用户ID-2向用户ID-1共传输5条消息,则用户ID-2具有与用户ID-1相关的5条单向互动记录。
可见,每一条单向互动记录均至少具有三个条件:发起方的用户ID、接收方的用户ID以及发起方发送消息的时间;通过对发起方发送消息的时间进行筛选,即可获得某一指定时间长度内的所有单向互动记录。
S2,将所述网络论坛中某一历史时刻T1至当前时刻T2之间的参与单向互动的所有用户ID分别映射为关系拓扑网络图的节点;将单向互动关系映射为关系拓扑网络图中节点之间相互连接的向量,其中,向量的方向为:由代表单向互动发起方的节点指向代表单向互动接收方的节点;将在某一历史时刻T1至当前时刻T2之间通过向量连接的两个节点之间的单向互动次数作为连接所述两个节点的向量的权重值,由此得到初始的关系网络图;;
具体的,在T1到T2时间段内参与单向互动的所有用户ID是指:在T1到T2时间段内发起消息的所有用户ID以及接收消息的所有用户ID。
将单向互动关系映射为关系拓扑网络图中节点之间相互连接的向量,是指:为简化说明,参考图4,为关系拓扑网络图的一种简化具体示例,在图4中,共有三个节点,分别为P1、P2和P3;对于P1向P2发送消息的单向互动关系,映射为图4中的向量L1,对于P2向P1发送消息的单向互动关系,映射为图4中的向量L2;也就是说,向量的方向为:由单向互动发起方指向单向互动接收方。
向量的权重值是指:参考图4,如果在统计时间范围内,P1向P2共发送10条消息,则向量L1的权重即为10;而如果在统计时间范围内,P2向P1共发送5条消息,则向量L2的权重即为5。
实际应用中,对于获得的作为源数据的所有单向互动记录,可以首先利用脚本对所有单向互动记录进行处理,将所有单向互动记录处理成LPA社团划分脚本需要的数据源格式,再通过LPA社团划分脚本执行后续步骤。
S3,初始化所述初始的关系网络图,即:为所述初始的关系网络图中的每个节点均赋予唯一的标签;
初始时,赋予每个节点的标签,只要能够达到将各个节点进行区分的目的即可,可以为数字、字母或数字与字母的组合均可,当然,由于各个节点所对应的用户ID是唯一的,因此,为简化计算,也可以将用户ID作为对应节点的标签,例如,对于用户ID为12345的节点,该节点的标签可以为12345。因此,本发明并不对各个节点所赋予的标签值进行限制。
S4-S6为标签更新、传播的过程,即:
S4,令迭代计数器t=1;
S5,以随机顺序排列S3得到的关系网络图中的各个节点,按所排列的顺序遍历更新所述关系网络图中的所有节点的标签;其中,对于任意一个节点m,如图2所示,对所述节点m进行更新的方法为:
S51,首先获取节点m的所有邻接节点;其中,所述邻接节点指:与节点m发生互动,并且,相对于节点m,作为单向互动接收方的所有节点;仍然以图4为例,对于节点P1,其邻接节点包括节点P2和节点P3;而对于节点P4,由于P1仅作为互动的接收方,与节点P4发生了通信,但并未作为互动的发起方,主动向节点P4发起互动,因此,节点P4不属于节点P1的邻接节点。
S52,然后,判断节点m的所有邻接节点中出现次数最多的标签是否为一个,如果是,则执行S53;如果不是,则执行S54;
S53,将所有邻接节点中出现次数最多的标签更新为节点m的新标签;
S54,将出现次数最多的标签所对应的邻接节点组成邻接节点集M,然后,从所述邻接节点集M中选取与所述节点m连接的向量的权重值最大的邻接节点作为选定节点,将所述选定节点的标签更新为节点m的新标签;
本步骤中,由于需要进行多次迭代,而每次迭代过程中,对于每个节点,均需要获取其所有邻接节点,因此,当关系网络图中包括的节点数量众多时,例如,当关系网络图中包括1万个节点时,当于任何一个节点,需要遍历其他9999个节点,才能得出该节点的邻接节点,因此,计算非常复杂,还具有计算时间长的问题。因此,本发明中,可以预先建立邻接节点映射表,例如,对于由100个节点组成的关系网络图,节点1的邻接节点为节点2、节点5、节点10…;因此,在每次需要获得某一节点的所有邻接节点时,只需要查找邻接节点映射表,即可迅速获得该节点的所有邻接节点,从而简化了运算,提高了社团发现的速度。
S6,判断是否满足预设置的迭代终止条件,其中,所述迭代终止条件指:所述关系网络图中的任意节点m’的标签满足以下条件:如果节点m’的所有邻接节点中出现次数最多的标签为一个,则节点m’的标签等于其所有邻接节点中出现次数最多的标签;如果节点m’的所有邻接节点中出现次数最多的标签为两个以上,将出现次数最多的标签所对应的邻接节点组成邻接节点集M’,则节点m’的标签等于邻接节点集M’中与节点m’连接的向量的权重值最大的邻接节点的标签;即:即,每个节点的邻接节点中,和本节点处于同一个社团的邻接节点数量一定大于等于处于其他社团的数量。
如果未满足,则令t=t+1,反复迭代执行S5,直至满足预设置的终止条件;如果满足,则对所述网络论坛的社团划分过程结束,具有相同标签的节点所对应的用户ID属于同一个社团。然后,还可以通过簇结构的方式显示所述关系网络图的所有节点,其中,具有相同标签的节点属于同一个簇,从而方便用户直观获得该网络论坛的社团分类。具体的,可以将含有用户社团信息的数据存入mysql数据库中。通过php程序从数据库读取用户社团信息,在后台通过图像显示。
如图3所示,本发明还提供一种基于标签传播算法的社团发现系统,包括:
源数据获取模块,对于被分析的网络论坛,获得所述网络论坛中的源数据;其中,所述源数据指所述网络论坛中某一历史时刻T1至当前时刻T2之间的所有单向互动记录,其中,所述单向互动记录包括发起方的用户ID以及接收方的用户ID;
关系网络图创建模块,用于读取所述源数据获取模块,将所述网络论坛中某一历史时刻T1至当前时刻T2之间的参与单向互动的所有用户ID分别映射为关系拓扑网络图的节点,将单向互动关系映射为关系拓扑网络图中节点之间相互连接的向量,将在某一历史时刻T1至当前时刻T2之间相互连接的两个节点之间的单向互动次数作为连接所述两个节点的向量的权重值,由此得到初始的关系网络图;
关系网络图初始化模块,用于初始化所述关系网络图创建模块所创建的初始的关系网络图,即:为所述初始的关系网络图中的每个节点均赋予唯一的标签;
迭代终止条件设置模块,用于设置迭代终止条件,所述迭代终止条件指:所述关系网络图中的任意节点m’的标签满足以下条件:如果节点m’的所有邻接节点中出现次数最多的标签为一个,则节点m’的标签等于其所有邻接节点中出现次数最多的标签;如果节点m’的所有邻接节点中出现次数最多的标签为两个以上,将出现次数最多的标签所对应的邻接节点组成邻接节点集M’,则节点m’的标签等于邻接节点集M’中与节点m’连接的向量的权重值最大的邻接节点的标签;其中,节点m’的邻接节点指:与节点m’发生互动,并且,相对于节点m’,作为单向互动接收方的所有节点;
迭代处理模块,用于在每次迭代中,以随机顺序排列关系网络图中的各个节点,按所排列的顺序遍历更新所述关系网络图中的所有节点的标签;其中,对于任意一个节点m,对所述节点m进行更新的方法为:首先获取节点m的所有邻接节点;然后,判断节点m的所有邻接节点中出现次数最多的标签是否为一个,如果是,则将所有邻接节点中出现次数最多的标签更新为节点m的新标签;如果不是,则将出现次数最多的标签所对应的邻接节点组成邻接节点集M,然后,从所述邻接节点集M中选取与所述节点m连接的向量的权重值最大的邻接节点作为选定节点,将所述选定节点的标签更新为节点m的新标签;
迭代终止判断模块,用于当所述迭代处理模块运行完一次迭代后,判断是否满足所述迭代终止条件设置模块所设置的迭代终止条件,如果未满足,则循环执行所述迭代处理模块,反复进行迭代处理;如果满足,则对所述网络论坛的社团划分过程结束,具有相同标签的节点所对应的用户ID属于同一个社团。
综上所述,本发明提供的基于标签传播算法的社团发现方法及系统,可应用于舆情分析后台中,对社团进行划分和展示,具有以下优点:
当邻接节点中出现次数最多的标签有两个以上时,跟现有技术中忽略向量权重而随机选择一个出现次数最多的标签作为本节点的标签的方式不同,本发明通过判断节点间向量的权重而决定需要选取的标签,能够更准确的实现社团的划分,得到网络论坛的社团分布情况,从而更有效的帮助运营决策者获知论坛用户的兴趣点,例如,论坛中用户感兴趣的话题或游戏等,进而帮助运营决策者进行运营决策,同时也能够帮助运营决策者获知某个用户在关系网络中的地位和作用。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (5)

1.一种基于标签传播算法的社团发现方法,其特征在于,包括以下步骤:
S1,获得源数据:即,对于被分析的网络论坛,通过读取数据库,获得所述网络论坛中某一历史时刻T1至当前时刻T2之间的所有单向互动记录,其中,所述单向互动记录包括发起方的用户ID以及接收方的用户ID;
S2,将所述网络论坛中某一历史时刻T1至当前时刻T2之间的参与单向互动的所有用户ID分别映射为关系拓扑网络图的节点;将单向互动关系映射为关系拓扑网络图中节点之间相互连接的向量,其中,向量的方向为:由代表单向互动发起方的节点指向代表单向互动接收方的节点;将在某一历史时刻T1至当前时刻T2之间通过向量连接的两个节点之间的单向互动次数作为连接所述两个节点的向量的权重值,由此得到初始的关系网络图;
S3,初始化所述初始的关系网络图,即:为所述初始的关系网络图中的每个节点均赋予唯一的标签;
S4,令迭代计数器t=1;
S5,以随机顺序排列S3得到的关系网络图中的各个节点,按所排列的顺序遍历更新所述关系网络图中的所有节点的标签;其中,对于任意一个节点m,对所述节点m进行更新的方法为:
首先获取节点m的所有邻接节点;其中,所述邻接节点指:与节点m发生互动,并且,相对于节点m,作为单向互动接收方的所有节点;然后,判断节点m的所有邻接节点中出现次数最多的标签是否为一个,如果是,则将所有邻接节点中出现次数最多的标签更新为节点m的新标签;如果不是,则将出现次数最多的标签所对应的邻接节点组成邻接节点集M,然后,从所述邻接节点集M中选取与所述节点m连接的向量的权重值最大的邻接节点作为选定节点,将所述选定节点的标签更新为节点m的新标签;
S6,判断是否满足预设置的迭代终止条件,其中,所述迭代终止条件指:所述关系网络图中的任意节点m’的标签满足以下条件:如果节点m’的所有邻接节点中出现次数最多的标签为一个,则节点m’的标签等于其所有邻接节点中出现次数最多的标签;如果节点m’的所有邻接节点中出现次数最多的标签为两个以上,将出现次数最多的标签所对应的邻接节点组成邻接节点集M’,则节点m’的标签等于邻接节点集M’中与节点m’连接的向量的权重值最大的邻接节点的标签;
如果未满足,则令t=t+1,反复迭代执行S5,直至满足预设置的终止条件;如果满足,则对所述网络论坛的社团划分过程结束,具有相同标签的节点所对应的用户ID属于同一个社团。
2.根据权利要求1所述的基于标签传播算法的社团发现方法,其特征在于,S3中,为每个节点所赋予的唯一的标签即为用户ID。
3.根据权利要求1所述的基于标签传播算法的社团发现方法,其特征在于,S5中,通过以下方法获取节点m的所有邻接节点:
建立邻接节点映射表;所述邻接节点映射表存储所述关系网络图中每一个用户ID与其所有邻接节点对应的用户ID的对应关系;
通过查找所述邻接节点映射表,获得节点m的所有邻接节点。
4.根据权利要求1所述的基于标签传播算法的社团发现方法,其特征在于,S6之后,还包括:
通过簇结构的方式显示所述关系网络图的所有节点,其中,具有相同标签的节点属于同一个簇。
5.一种基于标签传播算法的社团发现系统,其特征在于,包括:
源数据获取模块,对于被分析的网络论坛,获得所述网络论坛中的源数据;其中,所述源数据指所述网络论坛中某一历史时刻T1至当前时刻T2之间的所有单向互动记录,其中,所述单向互动记录包括发起方的用户ID以及接收方的用户ID;
关系网络图创建模块,用于读取所述源数据获取模块,将所述网络论坛中某一历史时刻T1至当前时刻T2之间的参与单向互动的所有用户ID分别映射为关系拓扑网络图的节点,将单向互动关系映射为关系拓扑网络图中节点之间相互连接的向量,将在某一历史时刻T1至当前时刻T2之间相互连接的两个节点之间的单向互动次数作为连接所述两个节点的向量的权重值,由此得到初始的关系网络图;
关系网络图初始化模块,用于初始化所述关系网络图创建模块所创建的初始的关系网络图,即:为所述初始的关系网络图中的每个节点均赋予唯一的标签;
迭代终止条件设置模块,用于设置迭代终止条件,所述迭代终止条件指:所述关系网络图中的任意节点m’的标签满足以下条件:如果节点m’的所有邻接节点中出现次数最多的标签为一个,则节点m’的标签等于其所有邻接节点中出现次数最多的标签;如果节点m’的所有邻接节点中出现次数最多的标签为两个以上,将出现次数最多的标签所对应的邻接节点组成邻接节点集M’,则节点m’的标签等于邻接节点集M’中与节点m’连接的向量的权重值最大的邻接节点的标签;其中,节点m’的邻接节点指:与节点m’发生互动,并且,相对于节点m’,作为单向互动接收方的所有节点;
迭代处理模块,用于在每次迭代中,以随机顺序排列关系网络图中的各个节点,按所排列的顺序遍历更新所述关系网络图中的所有节点的标签;其中,对于任意一个节点m,对所述节点m进行更新的方法为:首先获取节点m的所有邻接节点;然后,判断节点m的所有邻接节点中出现次数最多的标签是否为一个,如果是,则将所有邻接节点中出现次数最多的标签更新为节点m的新标签;如果不是,则将出现次数最多的标签所对应的邻接节点组成邻接节点集M,然后,从所述邻接节点集M中选取与所述节点m连接的向量的权重值最大的邻接节点作为选定节点,将所述选定节点的标签更新为节点m的新标签;
迭代终止判断模块,用于当所述迭代处理模块运行完一次迭代后,判断是否满足所述迭代终止条件设置模块所设置的迭代终止条件,如果未满足,则循环执行所述迭代处理模块,反复进行迭代处理;如果满足,则对所述网络论坛的社团划分过程结束,具有相同标签的节点所对应的用户ID属于同一个社团。
CN201410657458.4A 2014-11-18 2014-11-18 一种基于标签传播算法的社团发现方法及系统 Active CN105677648B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410657458.4A CN105677648B (zh) 2014-11-18 2014-11-18 一种基于标签传播算法的社团发现方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410657458.4A CN105677648B (zh) 2014-11-18 2014-11-18 一种基于标签传播算法的社团发现方法及系统

Publications (2)

Publication Number Publication Date
CN105677648A true CN105677648A (zh) 2016-06-15
CN105677648B CN105677648B (zh) 2018-08-28

Family

ID=56945320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410657458.4A Active CN105677648B (zh) 2014-11-18 2014-11-18 一种基于标签传播算法的社团发现方法及系统

Country Status (1)

Country Link
CN (1) CN105677648B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295681A (zh) * 2016-08-02 2017-01-04 西南石油大学 一种基于复杂网络标签传播算法的事件分类方法和系统
CN106548302A (zh) * 2016-12-01 2017-03-29 携程旅游信息技术(上海)有限公司 互联网交易的风险识别方法及系统
CN107248929A (zh) * 2017-05-27 2017-10-13 北京知道未来信息技术有限公司 一种多维关联数据的强关联数据生成方法
WO2018077039A1 (zh) * 2016-10-27 2018-05-03 腾讯科技(深圳)有限公司 社区发现方法、装置、服务器及计算机存储介质
US20180241638A1 (en) * 2015-08-24 2018-08-23 Shanghai Netis Technologies Co., Ltd. Method and system for discovering and presenting access information of network applications
CN109145462A (zh) * 2018-08-28 2019-01-04 电子科技大学 一种基于力导引的异形区域拓扑布局算法
CN109345158A (zh) * 2018-12-19 2019-02-15 重庆百行智能数据科技研究院有限公司 企业风险识别方法、装置和计算机可读存储介质
CN109543108A (zh) * 2018-11-26 2019-03-29 中国人民解放军陆军工程大学 面向网络多域信息的用户角色挖掘系统
CN110213070A (zh) * 2018-04-04 2019-09-06 腾讯科技(深圳)有限公司 团网络识别方法、装置、服务器及计算机可读存储介质
CN110489598A (zh) * 2019-07-05 2019-11-22 中国联合网络通信集团有限公司 一种用户社团划分方法及装置
CN110895604A (zh) * 2018-09-12 2020-03-20 国际关系学院 一种虚拟身份信息的关联融合方法
CN111182522A (zh) * 2019-11-28 2020-05-19 北京明略软件系统有限公司 一种团伙确定方法、装置、电子设备及计算机存储介质
CN111190966A (zh) * 2019-12-07 2020-05-22 北京海致星图科技有限公司 一种基于lpa算法的大规模知识图谱可视化方法及系统
CN112199450A (zh) * 2020-09-30 2021-01-08 支付宝(杭州)信息技术有限公司 一种关系图谱构建方法、装置及电子设备
CN113704371A (zh) * 2021-07-16 2021-11-26 重庆工商大学 一种地理信息网络中自适应检测划分子区域的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663108A (zh) * 2012-04-16 2012-09-12 南京大学 基于复杂网络模型并行化标签传播算法的药物社团发现方法
CN102768670A (zh) * 2012-05-31 2012-11-07 哈尔滨工程大学 基于节点属性标签传播的网页聚类方法
US20130046797A1 (en) * 2005-05-10 2013-02-21 Netseer, Inc. Methods and apparatus for distributed community finding
CN103327075A (zh) * 2013-05-27 2013-09-25 电子科技大学 基于标签交互的分布式社团发现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130046797A1 (en) * 2005-05-10 2013-02-21 Netseer, Inc. Methods and apparatus for distributed community finding
CN102663108A (zh) * 2012-04-16 2012-09-12 南京大学 基于复杂网络模型并行化标签传播算法的药物社团发现方法
CN102768670A (zh) * 2012-05-31 2012-11-07 哈尔滨工程大学 基于节点属性标签传播的网页聚类方法
CN103327075A (zh) * 2013-05-27 2013-09-25 电子科技大学 基于标签交互的分布式社团发现方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
康旭彬 等: "一种改进的标签传播快速社区发现方法", 《合肥工业大学学报(自然科学版)》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10644964B2 (en) * 2015-08-24 2020-05-05 Shanghai Netis Technologies Co., Ltd. Method and system for discovering and presenting access information of network applications
US20180241638A1 (en) * 2015-08-24 2018-08-23 Shanghai Netis Technologies Co., Ltd. Method and system for discovering and presenting access information of network applications
CN106295681A (zh) * 2016-08-02 2017-01-04 西南石油大学 一种基于复杂网络标签传播算法的事件分类方法和系统
WO2018077039A1 (zh) * 2016-10-27 2018-05-03 腾讯科技(深圳)有限公司 社区发现方法、装置、服务器及计算机存储介质
US10846052B2 (en) 2016-10-27 2020-11-24 Tencent Technology (Shenzhen) Company Limited Community discovery method, device, server and computer storage medium
CN106548302A (zh) * 2016-12-01 2017-03-29 携程旅游信息技术(上海)有限公司 互联网交易的风险识别方法及系统
CN107248929A (zh) * 2017-05-27 2017-10-13 北京知道未来信息技术有限公司 一种多维关联数据的强关联数据生成方法
CN107248929B (zh) * 2017-05-27 2020-08-11 北京知道未来信息技术有限公司 一种多维关联数据的强关联数据生成方法
CN110213070B (zh) * 2018-04-04 2021-08-17 腾讯科技(深圳)有限公司 团网络识别方法、装置、服务器及计算机可读存储介质
CN110213070A (zh) * 2018-04-04 2019-09-06 腾讯科技(深圳)有限公司 团网络识别方法、装置、服务器及计算机可读存储介质
CN109145462A (zh) * 2018-08-28 2019-01-04 电子科技大学 一种基于力导引的异形区域拓扑布局算法
CN110895604A (zh) * 2018-09-12 2020-03-20 国际关系学院 一种虚拟身份信息的关联融合方法
CN110895604B (zh) * 2018-09-12 2022-03-11 国际关系学院 一种虚拟身份信息的关联融合方法
CN109543108A (zh) * 2018-11-26 2019-03-29 中国人民解放军陆军工程大学 面向网络多域信息的用户角色挖掘系统
CN109345158A (zh) * 2018-12-19 2019-02-15 重庆百行智能数据科技研究院有限公司 企业风险识别方法、装置和计算机可读存储介质
CN110489598A (zh) * 2019-07-05 2019-11-22 中国联合网络通信集团有限公司 一种用户社团划分方法及装置
CN110489598B (zh) * 2019-07-05 2021-12-07 中国联合网络通信集团有限公司 一种用户社团划分方法及装置
CN111182522A (zh) * 2019-11-28 2020-05-19 北京明略软件系统有限公司 一种团伙确定方法、装置、电子设备及计算机存储介质
CN111182522B (zh) * 2019-11-28 2022-10-25 北京明智和术科技有限公司 一种团伙确定方法、装置、电子设备及计算机存储介质
CN111190966A (zh) * 2019-12-07 2020-05-22 北京海致星图科技有限公司 一种基于lpa算法的大规模知识图谱可视化方法及系统
CN112199450A (zh) * 2020-09-30 2021-01-08 支付宝(杭州)信息技术有限公司 一种关系图谱构建方法、装置及电子设备
CN113704371A (zh) * 2021-07-16 2021-11-26 重庆工商大学 一种地理信息网络中自适应检测划分子区域的方法

Also Published As

Publication number Publication date
CN105677648B (zh) 2018-08-28

Similar Documents

Publication Publication Date Title
CN105677648A (zh) 一种基于标签传播算法的社团发现方法及系统
CN103902538B (zh) 基于决策树的信息推荐装置及方法
CN111160954B (zh) 基于图卷积网络模型的面向群组对象的推荐方法
CN111125453B (zh) 基于子图同构的社交网络中意见领袖角色识别方法及存储介质
CN110377804A (zh) 培训课程数据的推送方法、装置、系统及存储介质
CN103379158A (zh) 一种社交网络中推荐好友信息的方法及系统
CN109741060A (zh) 信息查询系统、方法、装置、电子设备及存储介质
CN104915354A (zh) 多媒体文件推送方法及装置
WO2016045567A1 (zh) 网页数据分析方法及装置
CN106951471A (zh) 一种基于svm的标签发展趋势预测模型的构建方法
CN110334264A (zh) 一种针对异构动态信息网络的社区检测方法及装置
CN103440199B (zh) 测试引导方法和装置
CN106453096A (zh) 一种动态网络社区发现方法及装置
CN109242552A (zh) 一种基于大数据的商铺定位方法
CN108305181A (zh) 社交影响力确定、信息投放方法及装置、设备及存储介质
CN103281211A (zh) 大规模网络节点分组管理系统及管理方法
CN104965846B (zh) MapReduce平台上的虚拟人建立方法
He et al. Evolutionary community detection in social networks
CN107133339A (zh) 线路查询方法和装置以及存储介质、处理器
CN110442800A (zh) 一种融合节点属性和图结构的半监督社区发现方法
CN110413722A (zh) 地址选择方法、装置以及非瞬时性存储介质
CN109218184B (zh) 基于端口和结构信息的路由器归属as识别方法
CN107545453A (zh) 一种信息投放方法及装置
CN105653533B (zh) 一种更新分类关联词集合的方法和装置
CN109255433B (zh) 一种基于相似性的社区检测的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant