CN110162716A - 一种基于社区检索的影响力社区搜索方法和系统 - Google Patents
一种基于社区检索的影响力社区搜索方法和系统 Download PDFInfo
- Publication number
- CN110162716A CN110162716A CN201910421573.4A CN201910421573A CN110162716A CN 110162716 A CN110162716 A CN 110162716A CN 201910421573 A CN201910421573 A CN 201910421573A CN 110162716 A CN110162716 A CN 110162716A
- Authority
- CN
- China
- Prior art keywords
- node
- community
- social networks
- topological diagram
- key node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000010586 diagram Methods 0.000 claims description 76
- 230000008569 process Effects 0.000 claims description 9
- 230000000750 progressive effect Effects 0.000 abstract description 5
- 238000012216 screening Methods 0.000 abstract description 4
- 230000008901 benefit Effects 0.000 abstract description 3
- 230000009467 reduction Effects 0.000 abstract description 3
- 230000007812 deficiency Effects 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于社区检索的影响力社区搜索方法,通过启发式方法设置权重的初始阈值对网络进行筛选生成子图从而减小其规模达到减少计算成本的目的;在子图的基础上通过生成树判断关键节点的连通性,从而统计社区数量;对于不满足查询条件的阈值,对其进行增量迭代直至其满足查询条件;最后根据查询条件渐进的输出影响力最大社区,避免了重复的枚举社区数目。本发明弥补了现有社区检索技术方面的不足,但保留了其优势,使得社区检索技术变得完美:第一,通过渐进的输出结果有效地减少了重复计算,节省了计算成本;第二,充分考虑了相同权重节点对社区检索的影响,在不影响其检索性能的同时打破了权重的限制条件,扩大了其使用范围。
Description
技术领域
本发明属于社交网络技术领域,更具体地,涉及一种基于社区检索的影响力社区搜索方法和系统。
背景技术
在当今的社交网络中,常常需要使用社区搜索从社交网络的海量数据中搜索具有影响力的社区,通过影响力社区搜索的过程,能够发现社交网络中具有重要影响力的核心节点和核心社区,用于企业商业营销、广告定向投放、言论渠道推荐、舆情监控等诸多领域。
目前主流的影响力社区搜索方法有两种,第一种是基于索引的影响力社区搜索方法,其通过基于深度优先搜索方法预先计算所有的k-影响力社区,并将所有的社区组织成树形的索引结构,最终对索引进行查询得到输出结果;但是,这种方法也存在一些问题:首先,虽然该方法的搜索效率较高,但该方法是将所有社区都一一计算出来之后再查找前r个社区,从而浪费了部分计算资源;其次,维护索引需要一定的空间资源,从而导致该方法并不适合较大规模的社交网络;第二种是渐进式影响力社区优化方法,其根据网络中节点的权值大小对网络进行筛选,通过对得到的子图进行计算并根据查询条件渐进地输出结果,并通过筛选减小网络的规模,从而提高其搜索效率;但这种方法的缺陷在于,其正常工作的约束条件是网络中每个节点的影响力都是不相等的,而现实世界中节点影响力相等的情况是不可避免的,因此,这一约束条件限制了该方法的应用。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于社区检索的影响力社区搜索方法和系统,其目的在于,解决现有基于索引的社区搜索方法中存在的浪费计算资源、并不适合大规模社交网络的技术问题,以及现有渐进式影响力社区优化方法中由于存在约束条件所导致的应用性差的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于社区检索的影响力社区搜索方法,包括以下步骤:
(1)获取社交网络拓扑图、需要搜索的社区数量r、以及社区中节点邻居个数的约束值k,该社交网络拓扑图中的每个节点代表一个用户实体,每条边代表两个用户实体之间的社交关系;
(2)从步骤(1)获取的社交网络拓扑图中确定每个节点的邻居个数和影响力值,从社区网络拓扑图中将邻居个数小于k的节点、以及与该节点相连的所有边删除,并将剩余的所有节点按照影响力值从大到小的顺序进行排列;
(3)根据步骤(2)的排列结果从社交网络拓扑图中删除影响力值小于阈值t的节点,从而形成更新后的社交网络拓扑图,其中阈值t的大小等于步骤(2)的排列结果中排在第(k+r)位的影响力值;
(4)针对步骤(3)更新后的社交网络拓扑图,根据其中各个节点的邻居个数和影响力值确定关键节点,选择其中影响力值相同的关键节点,并根据更新后的社交网络拓扑图对选择的关键节点进行更新;
(5)针对步骤(4)中更新后的关键节点,所有关键节点构成关键节点集合,根据集合中的每一个关键节点和步骤(3)更新后的社交网络拓扑图中剩余节点的邻居个数确定该关键节点对应的候选节点,每一个关键节点对应的所有候选节点构成该关键节点对应的候选节点集合;
(6)获取步骤(5)中得到的关键节点集合以及该关键节点集合中关键节点的数量m,判断步骤(5)获取的更新后的关键节点集合中关键节点的数量m是否大于或等于需要搜索的社区数量r,如果是则进入步骤(8),否则进入步骤(7);
(7)将阈值t的值更新为其当前值的2/3,并返回步骤(3);
(8)对步骤(5)更新后的关键节点集合中所有关键节点对应的候选节点集合进行处理,从而得到步骤(1)中社交网络拓扑图中的前r个影响力社区,过程结束。
优选地,步骤(2)步骤中第i个节点Pi的影响力值PageRank(Pi)是采用以下公式获得:
其中,N表示社交网络拓扑图中节点的总数,d表示阻尼系数,其取值为0.85,M(Pi)表示第i个节点pi的所有邻居节点的集合,L(Pj)表示第i个节点Pj的邻居个数。
优选地,步骤(4)包括以下子步骤:
(4-1)根据步骤(3)更新后的社交网络拓扑图中各个节点的影响力值,获取最小影响力值对应的节点作为关键节点;
(4-2)针对步骤(4-1)中得到的关键节点,判断其数量是否为1,若为1,则过程结束,否则根据步骤(3)更新后的社交网络拓扑图判断这些节点之间的连通性,将彼此连通的节点合并为一个节点,从而完成对关键节点的更新;
优选地,步骤(5)包括以下子步骤:
(5-1)获取步骤(4)更新后的关键节点,并将其放入关键节点集合;
(5-2)在步骤(3)更新后的社交网络拓扑图中将该关键节点以及和它相连的边删除,从而得到二次更新后的社交网络拓扑图;
(5-3)从二次更新后的社交网络拓扑图中选择节点,获取其邻居个数,并判断其邻居的数量是否小于k,如果是则进入步骤(5-4),否则转入步骤(5-5);
(5-4)将该节点放入关键节点对应的候选节点集合,并从二次更新后的社交网络拓扑图中将该节点以及和它相连的边删除;
(5-5)重复上述步骤(5-1)至(5-4),直到二次更新后的社交网络拓扑图中的所有节点均被处理完毕为止。
优选地,步骤(8)包括以下子步骤:
(8-1)获取步骤(5)中得到的关键节点集合和关键节点集合中每个关键节点对应的候选点集合;
(8-2)选取关键节点集合中的一个节点和该节点对应的候选点集合,将这些节点在步骤(1)的社交网络拓扑图中对应的诱导子图作为影响力社区;
(8-3)从关键节点集合中删除该节点并删除该节点对应的候选节点集合;
(8-4)针对关键节点集合和对应候选集合中的剩余节点重复上述(8-1)至(8-3),直到两个集合都为空为止。
按照本发明的另一方面,提供了一种基于社区检索的影响力社区搜索系统,包括:
第一模块,用于获取社交网络拓扑图、需要搜索的社区数量r、以及社区中节点邻居个数的约束值k,该社交网络拓扑图中的每个节点代表一个用户实体,每条边代表两个用户实体之间的社交关系;
第二模块,用于从第一模块获取的社交网络拓扑图中确定每个节点的邻居个数和影响力值,从社区网络拓扑图中将邻居个数小于k的节点、以及与该节点相连的所有边删除,并将剩余的所有节点按照影响力值从大到小的顺序进行排列;
第三模块,用于根据第二模块的排列结果从社交网络拓扑图中删除影响力值小于阈值t的节点,从而形成更新后的社交网络拓扑图,其中阈值t的大小等于第二模块的排列结果中排在第(k+r)位的影响力值;
第四模块,用于针对第三模块更新后的社交网络拓扑图,根据其中各个节点的邻居个数和影响力值确定关键节点,选择其中影响力值相同的关键节点,并根据更新后的社交网络拓扑图对选择的关键节点进行更新;
第五模块,用于针对第四模块更新后的关键节点,所有关键节点构成关键节点集合,根据集合中的每一个关键节点和第三模块更新后的社交网络拓扑图中剩余节点的邻居个数确定该关键节点对应的候选节点,每一个关键节点对应的所有候选节点构成该关键节点对应的候选节点集合;
第六模块,用于获取第五模块得到的关键节点集合以及该关键节点集合中关键节点的数量m,判断m是否大于或等于需要搜索的社区数量r,如果是则进入第八模块,否则进入第七模块;
第七模块,用于将阈值t的值更新为其当前值的2/3,并返回第三模块;
第八模块,用于对第五模块更新后的关键节点集合中所有关键节点对应的候选节点集合进行处理,从而得到第一模块中社交网络拓扑图中的前r个影响力社区,过程结束。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
(1)本发明能够解决传统影响力社区方法计算规模大,重复计算多而导致的检索效率问题:由于本发明采用了步骤(1)到步骤(3)对网络中的节点进行筛选,生成规模小的自网络从而减小了网络的规模,达到减少计算成本的目的;在步骤(6)到步骤(8)对于不满足查询条件的子网络,对其规模增量迭代直至其满足查询条件,并根据查询条件渐进的输出影响力最大社区,避免了重复的获取社区数目,因此本方法在检索时能保证更高的效率。
(2)本发明能够解决传统方法不能够有效处理影响力相同的节点,进而不能准确地获得影响力社区的问题:由于本发明采用了步骤(5)到步骤(6)来判断影响力相同节点的连通性,并合并相同的节点,每当网络中包含影响力相同的节点的时候,本发明都能准确的计算关键节点的数目。因此在不影响其检索性能的同时解除了对影响力的限制,扩大了其使用范围。
(3)本发明能够适应多种社交网络的社区模型,适应性强。当社区模型发生变化的时候,只需对网络中节点的约束方式进行相应的调整,便能够搜索对应模型的影响力社区。
附图说明
图1是本发明基于社区检索的影响力社区搜索方法的流程图
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,本发明基于社区检索的影响力社区搜索方法包括以下步骤:
(1)获取社交网络拓扑图、需要搜索的社区数量r、以及社区中节点邻居个数的约束值k,该社交网络拓扑图中的每个节点代表一个用户实体,每条边代表两个用户实体之间的社交关系;
(2)从步骤(1)获取的社交网络拓扑图中确定每个节点的邻居个数和影响力值,从社区网络拓扑图中将邻居个数小于k的节点、以及与该节点相连的所有边删除,并将剩余的所有节点按照影响力值从大到小的顺序进行排列;
本步骤中第i个节点Pi的影响力值PageRank(Pi)是采用以下公式获得:
其中,N表示社交网络拓扑图中节点的总数,d表示阻尼系数,其取值为0.85,M(Pi)表示第i个节点pi的所有邻居节点的集合,L(Pj)表示第i个节点Pj的邻居个数。
(3)根据步骤(2)的排列结果从社交网络拓扑图中删除影响力值小于阈值t的节点,从而形成更新后的社交网络拓扑图,其中阈值t的大小等于步骤(2)的排列结果中排在第(k+r)位的影响力值;
(4)针对步骤(3)更新后的社交网络拓扑图,根据其中各个节点的邻居个数和影响力值确定关键节点,选择其中影响力值相同的关键节点,并根据更新后的社交网络拓扑图对选择的关键节点进行更新;
具体而言,本步骤包括以下子步骤:
(4-1)根据步骤(3)更新后的社交网络拓扑图中各个节点的影响力值,获取最小影响力值对应的节点作为关键节点;
(4-2)针对步骤(4-1)中得到的关键节点,判断其数量是否为1,若为1,则过程结束,否则根据步骤(3)更新后的社交网络拓扑图判断这些节点之间的连通性,将彼此连通的节点合并为一个节点,从而完成对关键节点的更新;
(5)针对步骤(4)中更新后的关键节点,所有关键节点构成关键节点集合,根据集合中的每一个关键节点和步骤(3)更新后的社交网络拓扑图中剩余节点的邻居个数确定该关键节点对应的候选节点,每一个关键节点对应的所有候选节点构成该关键节点对应的候选节点集合;
具体而言,本步骤包括以下子步骤:
(5-1)获取步骤(4)更新后的关键节点,并将其放入关键节点集合;
(5-2)在步骤(3)更新后的社交网络拓扑图中将该关键节点以及和它相连的边删除,从而得到二次更新后的社交网络拓扑图;
(5-3)从二次更新后的社交网络拓扑图中选择节点,获取其邻居个数,并判断其邻居的数量是否小于k,如果是则进入步骤(5-4),否则转入步骤(5-5);
(5-4)将该节点放入关键节点对应的候选节点集合,并从二次更新后的社交网络拓扑图中将该节点以及和它相连的边删除;
(5-5)重复上述步骤(5-1)至(5-4),直到二次更新后的社交网络拓扑图中的所有节点均被处理完毕为止。
(6)获取步骤(5)中得到的关键节点集合以及该关键节点集合中关键节点的数量m,判断步骤(5)获取的更新后的关键节点集合中关键节点的数量m是否大于或等于需要搜索的社区数量r,如果是则进入步骤(8),否则进入步骤(7);
(7)将阈值t的值更新为其当前值的2/3,并返回步骤(3);
(8)对步骤(5)更新后的关键节点集合中所有关键节点对应的候选节点集合进行处理,从而得到步骤(1)中社交网络拓扑图中的前r个影响力社区,过程结束。
具体而言,本步骤包括以下子步骤:
(8-1)获取步骤(5)中得到的关键节点集合和关键节点集合中每个关键节点对应的候选点集合;
(8-2)选取关键节点集合中的一个节点和该节点对应的候选点集合,将这些节点在步骤(1)的社交网络拓扑图中对应的诱导子图作为影响力社区;
(8-3)从关键节点集合中删除该节点并删除该节点对应的候选节点集合;
(8-4)针对关键节点集合和对应候选集合中的剩余节点重复上述(8-1)至(8-3),直到两个集合都为空为止。
举例而言,对于一个社交网络G,本发明首先根据查询参数k和r选取将影响力的阈值τ选为第(k+r)大的影响力,其中k为每个节点的最小度,r为查询的最大影响力社区的数目。遍历网络中的所有节点,每个节点不仅要满足影响力的要求,同时也需要满足度不小于k,因此将其中影响力小于τ以及度小于k的节点删去得到一个子网络,通过计数模块统计子网络中的社区数目,如果社区的数目不小于r,则将子网络中的社区作为查询结果并返回;若子网络中包含的影响力社区数目小于r,则扩大子网络的规模,减小τ的值,重复步骤3~7,直至网络中包含的社区数量不小于r。最终通过枚举模块输出每个具体的社区。通过筛选之后,子网络和原网络规模的比值为:其中τ为最终输出结果时的取值,通过仿真实验发现,在k=10,r=10的情况下,子网络与原网络的规模比值要小于0.073%,子网络规模的减小极大地提升了计算效率,缩短了计算时间。
总而言之,本发明提供了一种基于社区检索的top-r影响力社区计算方法,其通过启发式方法设置影响力的初始阈值对网络进行筛选生成子网络从而减小其规模达到减少计算成本的目的;在子网络的基础上通过生成树判断关键节点的连通性,从而统计社区数量;对于不满足查询条件的阈值,对其进行增量迭代直至其满足查询条件;最后根据查询条件渐进的输出影响力最大社区,避免了重复的枚举社区数目。
本发明弥补了现有社区检索技术方面的不足,但保留了其优势,使得社区检索技术变得完美:第一,通过渐进的输出结果有效地减少了重复计算,节省了计算成本;第二,充分考虑了相同影响力节点对社区检索的影响,在不影响其检索性能的同时打破了影响力的限制条件,扩大了其使用范围。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于社区检索的影响力社区搜索方法,其特征在于,包括以下步骤:
(1)获取社交网络拓扑图、需要搜索的社区数量r、以及社区中节点邻居个数的约束值k,该社交网络拓扑图中的每个节点代表一个用户实体,每条边代表两个用户实体之间的社交关系;
(2)从步骤(1)获取的社交网络拓扑图中确定每个节点的邻居个数和影响力值,从社区网络拓扑图中将邻居个数小于k的节点、以及与该节点相连的所有边删除,并将剩余的所有节点按照影响力值从大到小的顺序进行排列;
(3)根据步骤(2)的排列结果从社交网络拓扑图中删除影响力值小于阈值t的节点,从而形成更新后的社交网络拓扑图,其中阈值t的大小等于步骤(2)的排列结果中排在第(k+r)位的影响力值;
(4)针对步骤(3)更新后的社交网络拓扑图,根据其中各个节点的邻居个数和影响力值确定关键节点,选择其中影响力值相同的关键节点,并根据更新后的社交网络拓扑图对选择的关键节点进行更新;
(5)针对步骤(4)中更新后的关键节点,所有关键节点构成关键节点集合,根据集合中的每一个关键节点和步骤(3)更新后的社交网络拓扑图中剩余节点的邻居个数确定该关键节点对应的候选节点,每一个关键节点对应的所有候选节点构成该关键节点对应的候选节点集合;
(6)获取步骤(5)中得到的关键节点集合以及该关键节点集合中关键节点的数量m,判断步骤(5)获取的更新后的关键节点集合中关键节点的数量m是否大于或等于需要搜索的社区数量r,如果是则进入步骤(8),否则进入步骤(7);
(7)将阈值t的值更新为其当前值的2/3,并返回步骤(3);
(8)对步骤(5)更新后的关键节点集合中所有关键节点对应的候选节点集合进行处理,从而得到步骤(1)中社交网络拓扑图中的前r个影响力社区,过程结束。
2.根据权利要求1所述的影响力社区搜索方法,其特征在于,步骤(2)步骤中第i个节点Pi的影响力值PageRank(Pi)是采用以下公式获得:
其中,N表示社交网络拓扑图中节点的总数,d表示阻尼系数,其取值为0.85,M(Pi)表示第i个节点pi的所有邻居节点的集合,L(Pj)表示第i个节点Pj的邻居个数。
3.根据权利要求1所述的影响力社区搜索方法,其特征在于,步骤(4)包括以下子步骤:
(4-1)根据步骤(3)更新后的社交网络拓扑图中各个节点的影响力值,获取最小影响力值对应的节点作为关键节点;
(4-2)针对步骤(4-1)中得到的关键节点,判断其数量是否为1,若为1,则过程结束,否则根据步骤(3)更新后的社交网络拓扑图判断这些节点之间的连通性,将彼此连通的节点合并为一个节点,从而完成对关键节点的更新;
4.根据权利要求1所述的影响力社区搜索方法,其特征在于,步骤(5)包括以下子步骤:
(5-1)获取步骤(4)更新后的关键节点,并将其放入关键节点集合;
(5-2)在步骤(3)更新后的社交网络拓扑图中将该关键节点以及和它相连的边删除,从而得到二次更新后的社交网络拓扑图;
(5-3)从二次更新后的社交网络拓扑图中选择节点,获取其邻居个数,并判断其邻居的数量是否小于k,如果是则进入步骤(5-4),否则转入步骤(5-5);
(5-4)将该节点放入关键节点对应的候选节点集合,并从二次更新后的社交网络拓扑图中将该节点以及和它相连的边删除;
(5-5)重复上述步骤(5-1)至(5-4),直到二次更新后的社交网络拓扑图中的所有节点均被处理完毕为止。
5.根据权利要求1所述的影响力社区搜索方法,其特征在于,步骤(8)包括以下子步骤:
(8-1)获取步骤(5)中得到的关键节点集合和关键节点集合中每个关键节点对应的候选点集合;
(8-2)选取关键节点集合中的一个节点和该节点对应的候选点集合,将这些节点在步骤(1)的社交网络拓扑图中对应的诱导子图作为影响力社区;
(8-3)从关键节点集合中删除该节点并删除该节点对应的候选节点集合;
(8-4)针对关键节点集合和对应候选集合中的剩余节点重复上述(8-1)至(8-3),直到两个集合都为空为止。
6.一种基于社区检索的影响力社区搜索系统,其特征在于,包括:
第一模块,用于获取社交网络拓扑图、需要搜索的社区数量r、以及社区中节点邻居个数的约束值k,该社交网络拓扑图中的每个节点代表一个用户实体,每条边代表两个用户实体之间的社交关系;
第二模块,用于从第一模块获取的社交网络拓扑图中确定每个节点的邻居个数和影响力值,从社区网络拓扑图中将邻居个数小于k的节点、以及与该节点相连的所有边删除,并将剩余的所有节点按照影响力值从大到小的顺序进行排列;
第三模块,用于根据第二模块的排列结果从社交网络拓扑图中删除影响力值小于阈值t的节点,从而形成更新后的社交网络拓扑图,其中阈值t的大小等于第二模块的排列结果中排在第(k+r)位的影响力值;
第四模块,用于针对第三模块更新后的社交网络拓扑图,根据其中各个节点的邻居个数和影响力值确定关键节点,选择其中影响力值相同的关键节点,并根据更新后的社交网络拓扑图对选择的关键节点进行更新;
第五模块,用于针对第四模块更新后的关键节点,所有关键节点构成关键节点集合,根据集合中的每一个关键节点和第三模块更新后的社交网络拓扑图中剩余节点的邻居个数确定该关键节点对应的候选节点,每一个关键节点对应的所有候选节点构成该关键节点对应的候选节点集合;
第六模块,用于获取第五模块得到的关键节点集合以及该关键节点集合中关键节点的数量m,判断m是否大于或等于需要搜索的社区数量r,如果是则进入第八模块,否则进入第七模块;
第七模块,用于将阈值t的值更新为其当前值的2/3,并返回第三模块;
第八模块,用于对第五模块更新后的关键节点集合中所有关键节点对应的候选节点集合进行处理,从而得到第一模块中社交网络拓扑图中的前r个影响力社区,过程结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910421573.4A CN110162716B (zh) | 2019-05-21 | 2019-05-21 | 一种基于社区检索的影响力社区搜索方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910421573.4A CN110162716B (zh) | 2019-05-21 | 2019-05-21 | 一种基于社区检索的影响力社区搜索方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110162716A true CN110162716A (zh) | 2019-08-23 |
CN110162716B CN110162716B (zh) | 2020-12-25 |
Family
ID=67631527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910421573.4A Active CN110162716B (zh) | 2019-05-21 | 2019-05-21 | 一种基于社区检索的影响力社区搜索方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110162716B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111506751A (zh) * | 2020-04-20 | 2020-08-07 | 创景未来(北京)科技有限公司 | 一种搜索机械制图的方法及装置 |
CN113424180A (zh) * | 2021-05-13 | 2021-09-21 | 清华大学 | 基于时间跨度优化的短时社区搜索方法 |
CN113536052A (zh) * | 2021-07-08 | 2021-10-22 | 浙江工商大学 | 一种基于k边连通分量在大型网络中搜索个性化影响力社区的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150120782A1 (en) * | 2013-10-25 | 2015-04-30 | Marketwire L.P. | Systems and Methods for Identifying Influencers and Their Communities in a Social Data Network |
US20170301050A1 (en) * | 2016-04-14 | 2017-10-19 | Medical Knowledge Group Llc | System and method of analyzing health care provider networks |
CN108364234A (zh) * | 2018-03-08 | 2018-08-03 | 重庆邮电大学 | 一种基于节点影响力标签传播的微博社区发现方法 |
CN108492201A (zh) * | 2018-03-29 | 2018-09-04 | 山东科技大学 | 一种基于社区结构的社交网络影响力最大化方法 |
CN109033159A (zh) * | 2018-06-15 | 2018-12-18 | 华中科技大学 | 一种基于顶点影响力的图数据布局方法 |
-
2019
- 2019-05-21 CN CN201910421573.4A patent/CN110162716B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150120782A1 (en) * | 2013-10-25 | 2015-04-30 | Marketwire L.P. | Systems and Methods for Identifying Influencers and Their Communities in a Social Data Network |
US20170301050A1 (en) * | 2016-04-14 | 2017-10-19 | Medical Knowledge Group Llc | System and method of analyzing health care provider networks |
CN108364234A (zh) * | 2018-03-08 | 2018-08-03 | 重庆邮电大学 | 一种基于节点影响力标签传播的微博社区发现方法 |
CN108492201A (zh) * | 2018-03-29 | 2018-09-04 | 山东科技大学 | 一种基于社区结构的社交网络影响力最大化方法 |
CN109033159A (zh) * | 2018-06-15 | 2018-12-18 | 华中科技大学 | 一种基于顶点影响力的图数据布局方法 |
Non-Patent Citations (1)
Title |
---|
罗宇敏等: "一种评估社会网络中重叠社区影响力的方法", 《小型微型计算机系统》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111506751A (zh) * | 2020-04-20 | 2020-08-07 | 创景未来(北京)科技有限公司 | 一种搜索机械制图的方法及装置 |
CN113424180A (zh) * | 2021-05-13 | 2021-09-21 | 清华大学 | 基于时间跨度优化的短时社区搜索方法 |
CN113536052A (zh) * | 2021-07-08 | 2021-10-22 | 浙江工商大学 | 一种基于k边连通分量在大型网络中搜索个性化影响力社区的方法 |
CN113536052B (zh) * | 2021-07-08 | 2023-11-07 | 浙江工商大学 | 一种基于k边连通分量在大型网络中搜索个性化影响力社区的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110162716B (zh) | 2020-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8125922B2 (en) | Method and apparatus for generating a ranked index of web pages | |
CN110162716A (zh) | 一种基于社区检索的影响力社区搜索方法和系统 | |
JP5092165B2 (ja) | データ構築方法とシステム | |
CN106951524A (zh) | 基于节点影响力的重叠社区发现方法 | |
CN107317704A (zh) | 一种基于紧密度和结构洞的复杂网络重要节点排序方法 | |
CN107274669B (zh) | 一种基于最短路径的城市道路交通网络熵计算方法及系统 | |
CN109921939A (zh) | 一种通信网络中关键节点的选取方法及系统 | |
CN113190939B (zh) | 基于多边形系数的大型稀疏复杂网络拓扑分析和简化方法 | |
CN105976048A (zh) | 一种基于改进人工蜂群算法的输电网扩展规划方法 | |
CN108809697B (zh) | 基于影响力最大化的社交网络关键节点识别方法及系统 | |
CN106685745B (zh) | 一种网络拓扑构建方法及装置 | |
CN113422695B (zh) | 一种提高物联网拓扑结构鲁棒性能的优化方法 | |
CN109063759A (zh) | 一种应用于图片多属性预测的神经网络结构搜索方法 | |
CN106326610A (zh) | 一种基于设计网络的设计变更传播预测方法及系统 | |
US6766504B1 (en) | Interconnect routing using logic levels | |
CN104821086B (zh) | 一种定位大规模交通网络中低效路段组合的方法 | |
CN102063497B (zh) | 一种开放式知识共享平台及其词条处理方法 | |
CN115277115A (zh) | 一种用于解决网络上鲁棒信息传播问题的方法及系统 | |
CN107133274A (zh) | 一种基于图知识库的分布式信息检索集合选择方法 | |
CN104125146B (zh) | 一种业务处理方法及装置 | |
CN109086302A (zh) | 时序图下基于Skyline的多约束路径查询方法 | |
CN103413027B (zh) | 一种社会网络重叠社区发现方法的评价方法 | |
CN115827996B (zh) | 一种具有共享约束的社区查询方法及系统 | |
CN108833461A (zh) | 基于网络分解的社交网络关键节点发现方法及系统 | |
CN102750288B (zh) | 一种互联网内容推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |