CN110347881A - 一种基于路径回溯图嵌入的群体发现方法 - Google Patents

一种基于路径回溯图嵌入的群体发现方法 Download PDF

Info

Publication number
CN110347881A
CN110347881A CN201910533270.1A CN201910533270A CN110347881A CN 110347881 A CN110347881 A CN 110347881A CN 201910533270 A CN201910533270 A CN 201910533270A CN 110347881 A CN110347881 A CN 110347881A
Authority
CN
China
Prior art keywords
node
vector
topological diagram
traverse
recalling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910533270.1A
Other languages
English (en)
Inventor
沈超
李其睿
刘晓明
刘笑子
管晓宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201910533270.1A priority Critical patent/CN110347881A/zh
Publication of CN110347881A publication Critical patent/CN110347881A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于路径回溯图嵌入的群体发现方法,包括建立用于表示网络的拓扑图,从拓扑图中选取一个节点作为初始节点,进行随机游走,得到遍历节点序列,将遍历节点序列按序截断为预设长度的多个遍历节点子序列;根据每个遍历节点子序列中的节点,统计回溯得到节点之间每条边出现的次数作为边的权重值,得到边权重矩阵,将节点采用随机构造的图嵌入向量表示,通过边权重矩阵优化图嵌入向量,得到图嵌入表示向量并降维、聚类,聚类形成的每个类别里所包含的节点即为同一群体。具有计算复杂度低,要求数据源简单的特点,可以有效减少群体发现中的计算资源开销;无需任何先验知识,完全依靠网络拓扑结构实现,对于真实的复杂网络适用性强。

Description

一种基于路径回溯图嵌入的群体发现方法
技术领域
本发明属于数据挖掘领域,涉及一种基于路径回溯图嵌入的群体发现方法。
背景技术
在数据挖掘领域中,拓扑图网络是一类非常重要的处理对象,这种网络是由大量的节点以及节点之间的连接关系共同构成的。现实生活中,有许多领域的数据是以这样的图网络结构进行存储的,例如社交网络(文字社交网络及图片社交网络等)、工业网络(电力及工业互联设备等)、生物网络(蛋白质结构等)。拓扑图由于其非欧几里得结构使得其包含的信息非常丰富,同时也使得对该类对象进行信息提出等操作较为复杂。拓扑图网络的一个重要特征就是网络中所呈现出的群体结构。大量实证研究表明,许多网络是异构的,即网络不是大批性质相同节点的随机连接,而是许多类型的节点的组合,其中相同类型的节点存在较多的连接,而不同类型节点的连接则相对较少。我们把同一类型节点以及这些节点之间的边所构成的子图称为网络中的群体。
对网络中的群体进行挖掘发现是一个拥有较长历史,也一直吸引研究者的方向。这是由于一方面网络群体具有非常高的实用价值,可以在各个领域中起到重要的作用;另一方面是由于群体发现是处理拓扑图方法的一个缩影,如何更有效的对图网络进行更有效的分析始终吸引研究者。目前,通常采用图神经网络算法的方法实现对网络中的群体进行挖掘发现。
但是,通过图神经网络方法对网络中的群体进行挖掘发现时,不仅计算时间复杂度高,而且需要除图拓扑信息外的知识,例如节点名称,性别等属性,导致该方法难以在实际情况中应用。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供一种基于路径回溯图嵌入的群体发现方法。
为达到上述目的,本发明采用以下技术方案予以实现:
一种基于路径回溯图嵌入的群体发现方法,包括以下步骤:
S1:建立用于表示网络的拓扑图G=(V,E);其中:V={v1,v2,…,vN}为拓扑图G中节点的集合,v1,v2,…,vN为拓扑图G中的节点;E为拓扑图G中的边的集合;
S2:从拓扑图G中选取一个节点作为初始节点,从初始节点出发进行L步随机游走,记录初始节点和每次随机游走的目标节点,得到遍历节点序列;
S3:将遍历节点序列按序划分为H个遍历节点子序列,对每个遍历节点子序列内的节点进行边权重统计,得到边权重矩阵A*;
S4:将节点采用随机构造的图嵌入向量表示,构造目标函数,通过边权重矩阵A*和目标函数优化各节点的图嵌入向量,至节点之间的边权重越大,对应的图嵌入向量之间的距离越小,得到各节点的图嵌入表示向量,将各节点的图嵌入表示向量降维得到各节点的图嵌入表示结果;
S5:将各节点的图嵌入表示结果进行聚类,聚类形成的每个类别里所包含的节点为同一群体。
本发明进一步的改进在于:
S1的具体方法为:
将网络中的成员采用拓扑图中的节点表示,将成员与成员之间的关系采用拓扑图中的节点与节点之间的边表示,建立用于表示网络的拓扑图G=(V,E);其中,V={v1,v2,…,vN}为拓扑图G中节点的集合,v1,v2,…,vN为拓扑图中的节点;E为拓扑图G中的边的集合。
S2的具体方法为:
从拓扑图G中节点的集合V中等概率选取一个节点作为初始节点,从初始节点出发进行L步随机游走,每次随机游走的目标节点均为当前节点的邻居节点中等概率选取的一个节点,记录初始节点和每次游走的目标节点,得到遍历节点序列。
随机游走的步数L=N2,N为拓扑图G中的节点个数。
S3的具体方法为:
构建N阶方阵A,方阵A中的元素Aij表示对应的节点i和节点j之间的边的权重值,初始时Aij为0;将遍历节点序列划分为H个遍历节点子序列,对每个遍历节点子序列进行边权重统计,当遍历节点子序列中的节点i和节点j在拓扑图G中有边时,Aij加1,至所有遍历节点子序列均进行边权重统计后得到边权重矩阵A*。
当L/K为非整数时,所述遍历节点子序列的个数H=L/K;当L/K为非整数时,H为L/K向上取整的整数值;其中,K为遍历节点子序列的预设长度。
遍历节点子序列的预设长度K=3~10。
S4的具体方法为:
D1:随机构造图嵌入向量Pi=(Pi1,Pi2,…,Pik),i=1,2,3,…,N;采用图嵌入向量Pi表示节点i;
D2:构造目标函数其中,Aij为权重矩阵A*中的元素值,Pi表示节点i的图嵌入向量,Pj表示节点j的图嵌入向量,λ为做正则化时使用的参数;
D3:利用梯度下降法,将每个节点对(i,j)分别代入目标函数进行优化,并采用优化后的图嵌入向量更新当前的图嵌入向量,重复优化至当前目标函数值与上一次优化的目标函数值的差值在预设阈值内,停止优化,当前各节点的图嵌入向量即为各节点的图嵌入表示向量;
D4:通过降维算法将各节点的图嵌入表示向量降至二维或三维,得到各节点的图嵌入表示结果。
S5的具体方法为:
采用密度聚类算法将各节点的图嵌入表示结果进行聚类,聚类形成的每个类别里所包含的节点为同一群体。
采用密度聚类算法将各节点的图嵌入表示结果进行聚类的具体方法为:
T1:预设密度大小EPS和最小邻居对象数MinPts;
T2:统计以每个节点为圆心,EPS为半径的圆周内包含的节点的个数;
T3:当节点的个数大于MinPts时,该节点为圆心节点;否则,该节点为边界节点;
T4:将彼此包含的圆心节点分为一个类别,将边界节点分为距离最近的圆心节点所处的类别,完成聚类。
与现有技术相比,本发明具有以下有益效果:
通过使用随机游走、路径回溯等方法,无需进行复杂的计算,本质上是对数据的搜索查找过程,这样的特性决定了本发明方法的实现简单,复杂度低,可以有效减少群体发现中的计算资源开销。在群体发现的过程中,对数据源要求简单,无需事先得知节点的真实群体划分,仅需要节点之间的拓扑信息进行边权重的统计即可,无需其他任何信息,相对于目前使用的类似于图神经网络算法需要节点属性信息而言,对数据的要求更符合实际使用情况,使用的为完全无监督方法,符合实际网络数据情况,对于真实的复杂网络适用性强,具有极强的普适性。同时,图嵌入生成的节点表征方式是向量形式,由于通常的机器学习算法的输入输出均为向量形式,图嵌入生成的节点表征方式也是向量形式,使得机器学习算法的应用成为了可能,给当前大量的机器学习算法的应用提供了可能,目前有许多效果很好的机器学习聚类算法,这对于群体发现是非常有益的。
进一步的,拓扑图的构造方法简单,现实中数据基本皆满足构造拓扑图的需求,另外如果节点间有方向关系,拓扑图可以很方便得转换为有向图,仅需明确每条边的指向即可。
进一步的,在随机游走的过程中,初始节点和每一步选择的目标节点均是随机的,可以有效的避免人为因素的影响。
进一步的,随机游走的步数L=N2,该步数长度可以有效的获取拓扑图的结构信息,且不过分冗余。
进一步的,通过构造边权重矩阵A*,可以有效的表征网络拓扑图中节点的连接紧密程度,又不同于传统的邻接矩阵只能反映直接相邻点之间的连接关系。
进一步的,遍历节点子序列的预设长度K=3~10,该长度可以尽可能集中得保留联系紧密节点间的信息。
进一步的,目标函数的构建综合了权重矩阵以及图嵌入向量,利用梯度下降法修改每个节点对应的图嵌入向量,使得连接紧密的节点所对应的图嵌入向量距离接近,目标函数构造合理,迭代时计算简单,结果有效。
进一步的,采用密度聚类算法将图嵌入表示结果进行聚类不需要获得群体数这一先验知识,对于真实的复杂网络适用性强。
附图说明
图1为本发明的方法流程框图;
图2为本发明的实施例1的人工生成网络示意图;
图3为本发明的实施例1的人工生成网络的图嵌入结果示意图;
图4为本发明的实施例2的karate网络结构示意图;
图5为本发明的实施例2的karate网络图嵌入结果意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面结合附图对本发明做进一步详细描述:
图嵌入是近年来随着机器学习算法的流行而产生的一类将拓扑图的节点用向量表示的方法,有效的图嵌入算法不仅可以将拓扑图中的重要信息进行最大程度的保留,又由于其输出的向量模式使得大量的机器学习算法得以应用。本发明基于路径回溯图嵌入的群体发现方法,通过一段长度的随机游走获得一段较长的图网络节点序列,将该节点序列通过按序截断为预设长度的多个子序列;根据每个子序列中的节点,在原始图中寻找包含这些节点的子图,统计回溯得到的每个子图中节点连接情况,每条边出现的次数作为边的权重值并得到权重矩阵;以权重矩阵为依据,以最小化特定损失函数为目标,将随机初始化的节点向量进行优化,从而使两节点之间的边的边权重越大,节点向量距离越近;对优化完成的节点向量利用机器学习聚类算法,达到群体发现的目的,无须先验知识,复杂度低,可视化强,能对复杂拓扑图网络进行群体发现的方法。
参见图1,本发明基于路径回溯图嵌入的群体发现方法,包括以下步骤:
S1:建立用于表示网络的拓扑图G=(V,E);其中:V={v1,v2,…,vN}为拓扑图G中节点的集合,v1,v2,…,vN为拓扑图G中的节点;E为拓扑图G中的边的集合;具体方法为:
将网络中的成员采用拓扑图中的节点表示,将成员与成员之间的关系采用拓扑图中的节点与节点之间的边表示,建立用于表示网络的拓扑图G=(V,E);其中,V={v1,v2,…,vN}为拓扑图G中节点的集合,v1,v2,…,vN为拓扑图中的节点;E为拓扑图G中的边的集合。
S2:从拓扑图G中选取一个节点作为初始节点,从初始节点出发进行L步随机游走,记录初始节点和每次随机游走的目标节点,得到遍历节点序列;具体方法为:
从拓扑图G中节点的集合V中等概率选取一个节点作为初始节点,从初始节点出发进行L步随机游走,每次随机游走的目标节点均为当前节点的邻居节点中等概率选取的一个节点,记录初始节点和每次游走的目标节点,得到遍历节点序列。其中,随机游走的步数L=N2,N为拓扑图G中的节点个数。邻居节点为该节点相连的节点。
S3:将遍历节点序列划分为H个遍历节点子序列,对每个遍历节点子序列内的节点进行边权重统计,得到边权重矩阵A*;具体方法为:
构建N阶方阵A,方阵A中的元素Aij表示对应的节点i和节点j之间的边的权重值,初始时Aij为0;将遍历节点序列划分为H个遍历节点子序列,对每个遍历节点子序列进行边权重统计,当遍历节点子序列中的节点i和节点j在拓扑图G中有边时,Aij加1,至所有遍历节点子序列均进行边权重统计后得到边权重矩阵A*。当L/K为非整数时,所述遍历节点子序列的个数H=L/K;当L/K为非整数时,H为L/K向上取整的整数值;其中,K为遍历节点子序列的预设长度,按照复杂网络的规模大小,遍历节点子序列的预设长度K一般取3~10。
S4:将节点采用随机构造的图嵌入向量表示,通过边权重矩阵A*优化图嵌入向量,至节点之间的边权重越大,对应的图嵌入向量之间的距离越小,得到图嵌入表示向量,将图嵌入表示向量降维得到图嵌入表示结果;具体方法为:
D1:随机构造图嵌入向量Pi=(Pi1,Pi2,…,Pik),i=1,2,3,…,N;采用图嵌入向量Pi表示节点i;
D2:构造目标函数其中,Aij为权重矩阵A*中的元素值,Pi表示节点i的图嵌入向量,Pj表示节点j的图嵌入向量,λ为做正则化时使用的参数;
D3:利用梯度下降法,将每个节点对(i,j)分别代入目标函数进行优化,并采用优化后的图嵌入向量更新当前的图嵌入向量,重复优化至当前F值与上一次优化的F值之间的差值在预设阈值内,停止优化,当前的图嵌入向量即为图嵌入表示向量;
D4:通过降维算法将图嵌入表示向量降至二维或三维,得到图嵌入表示结果。
S5:将图嵌入表示结果进行聚类,聚类形成的每个类别里所包含的节点为同一群体;具体方法为:采用密度聚类算法将图嵌入表示结果进行聚类,聚类形成的每个类别里所包含的节点为同一群体。或针对数据集选定的特定聚类算法,如明确知道群体数目时选用基于划分的聚类算法,如具有层级关系的数据选用基于层次的聚类算法。其中,采用密度聚类算法将图嵌入表示结果进行聚类的具体方法为:
T1:预设密度大小EPS和最小邻居对象数MinPts;
T2:统计以每个节点为圆心,EPS为半径的圆周内包含的节点的个数;
T3:当节点的个数大于MinPts时,该节点为圆心节点;否则,该节点为边界节点;
T4:将彼此包含的圆心节点分为一个类别,将边界节点分为距离最近的圆心节点所处的类别,完成聚类。
实施例1
参见图2,一个人工构造的复杂网络,用一个拓扑图G=(V,E)来表示,其中V代表拓扑图的节点集,E代表拓扑图边的集合。该人工构造的复杂网络具有7个节点,8条边,该网络图具有大小为7×7的邻接矩阵。在该拓扑图上进行长度为49步随机游走,过程如下:
步骤1-1:开始在拓扑图G的所有节点{1,2,3,4,5,6,7}中以等概率的可能性选择一个节点作为随机游走的起始点,其中每个点被选中的概率为1/7,经过随机选择获得随机游走的起始节点为1,遍历节点序列VS={1};
步骤1-2:以1为起始节点,在其邻居节点[2,3]中等概率选择目的节点,每个邻居节点被选中的概率为1/2,经过随机选择,目标节点为2,遍历节点序列VS={1,2};
步骤1-3:对于随机游走的每一步,目标节点都是从当前节点的邻居节点中等概率随机选择的一个点,同时将目标节点加入遍历节点序列;
步骤1-4:重复步骤1-3,当随机游走的步数达到49的时候,停止。
在复杂网络中,一些节点内部连接非常紧密,但和其他节点连接稀疏,通常将这种结构称为群体。由于有些节点连接紧密,导致在随机游走采样的过程中,在一个阶段游走得到的序列中,相邻的几个节点通常很大几率来自同一个群体。所以,边权重越大,则其所连接的两个节点联系越紧密,即越可能属于同一个群体。路径回溯进行图嵌入过程:
步骤2-1:将随机游走得到的遍历节点序列{1,3,4,5,4,…,6,6,5}划分为长度为3的遍历节点子序列{1,3,4},…,{6,5,6};
步骤2-2:对每一个遍历节点子序列,进行路径回溯,即对于每个遍历节点子序列中所有的相邻节点,返回原始网络寻找任意两点之间是否存在边连接,如果存在的话便将6×6的矩阵A中对应的边的统计量加1;以子序列{1,3,4}为例,在这个三节点组合中,对于任意两两组合,返回原图进行路径回溯,发现存在边的节点对有{1,3},{3,4},不存在边的节点对有{1,4},因此在矩阵中存在边的节点对所对应的元素A13,A14两个统计量加1;
步骤2-3:重复步骤2-2中的过程将所有的遍历节点子序列处理完毕,得到最终的紧密程度矩阵A*;
步骤2-4:构造目标函数:
其中,Aij为矩阵A*的元素值,Zi,Zj分别表示节点i与j的图嵌入向量,λ为做正则化时使用的参数,利用梯度下降法,将矩阵A*中每个元素分别代入目标函数进行下降优化;
步骤2-5:重复步骤2-4中的过程,并计算两次优化后向量之间差值的总和∈,其中,n表示节点数量,t表示迭代的次数。
步骤2-6:重复步骤2-5,直至两次优化后向量差值总和小于预设的阈值,停止,得到图嵌入表示向量。
以图2中所示的群体为例,获得路径回溯获得图嵌入过程中获得的图嵌入表示向量,利用降维算法将高维的图嵌入表示向量转化为低维向量,本实施例中降维至二维向量,并将其进行可视化,得到图嵌入表示结果,参见图3。
当获得了二维图嵌入表示向量,使用DBSCAN聚类算法,根据图嵌入表示向量之间距离的密度区别进行聚类。
步骤3-1:设定密度大小EPS,最小邻居对象数MinPts;
步骤3-2:检查以每个节点为圆心,EPS大小为半径的圆周内所包含的邻居节点的个数;
步骤3-3:若数量大于MinPts,则将圆心移动转移为邻居节点中的任意一个,重复步骤3-2;若邻居节点数量小于MinPts,则将该节点认定为边界节点;
步骤3-4:将互相重叠,切不包含边界点的节点划分为一个类别,将边界节点划分至最近的邻居节点的类别,完成聚类。
再次参见图2和3,聚类后节点1、2、3为一类,4、5、6为另一类,这与实际情况是一致的。
实施例2
参见图4,Zachary Karate俱乐部真实成员关系图,采用本发明方法对于Zacharykarate俱乐部关系图进行处理,处理结果参见图5,图中三角形状代表图4中的浅灰色节点,圆形节点代表图4中的深灰色节点。两种形状的节点通过聚类可以划分为两类,其分界面如图5中直线所示,群体发现结果与真实情况完全吻合。
本发明在整个群体发现的过程中,只需要知道网络拓扑信息,无需其他任何信息,使得该算法具有极强的普适性;使用的随机游走,路径回溯等方法的本身特性决定了本发明方法的实现简单,复杂度低,无需极大的计算开销;图嵌入生成的节点表征方式是向量形式,这给当前大量的机器学习算法的应用提供了可能。在群体发现的过程中,使用的为完全无监督方法,符合实际网络数据情况,具有很强的实用性。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

Claims (10)

1.一种基于路径回溯图嵌入的群体发现方法,其特征在于,包括以下步骤:
S1:建立用于表示网络的拓扑图G=(V,E);其中:V={v1,v2,…,vN}为拓扑图G中节点的集合,v1,v2,…,vN为拓扑图G中的节点;E为拓扑图G中的边的集合;
S2:从拓扑图G中选取一个节点作为初始节点,从初始节点出发进行L步随机游走,记录初始节点和每次随机游走的目标节点,得到遍历节点序列;
S3:将遍历节点序列按序划分为H个遍历节点子序列,对每个遍历节点子序列内的节点进行边权重统计,得到边权重矩阵A*;
S4:将节点采用随机构造的图嵌入向量表示,构造目标函数,通过边权重矩阵A*和目标函数优化各节点的图嵌入向量,至节点之间的边权重越大,对应的图嵌入向量之间的距离越小,得到各节点的图嵌入表示向量,将各节点的图嵌入表示向量降维得到各节点的图嵌入表示结果;
S5:将各节点的图嵌入表示结果进行聚类,聚类形成的每个类别里所包含的节点为同一群体。
2.根据权利要求1所述的基于路径回溯图嵌入的群体发现方法,其特征在于,所述S1的具体方法为:
将网络中的成员采用拓扑图中的节点表示,将成员与成员之间的关系采用拓扑图中的节点与节点之间的边表示,建立用于表示网络的拓扑图G=(V,E);其中,V={v1,v2,…,vN}为拓扑图G中节点的集合,v1,v2,…,vN为拓扑图中的节点;E为拓扑图G中的边的集合。
3.根据权利要求1所述的基于路径回溯图嵌入的群体发现方法,其特征在于,所述S2的具体方法为:
从拓扑图G中节点的集合V中等概率选取一个节点作为初始节点,从初始节点出发进行L步随机游走,每次随机游走的目标节点均为当前节点的邻居节点中等概率选取的一个节点,记录初始节点和每次游走的目标节点,得到遍历节点序列。
4.根据权利要求1所述的基于路径回溯图嵌入的群体发现方法,其特征在于,所述随机游走的步数L=N2,N为拓扑图G中的节点个数。
5.根据权利要求1所述的基于路径回溯图嵌入的群体发现方法,其特征在于,所述S3的具体方法为:
构建N阶方阵A,方阵A中的元素Aij表示对应的节点i和节点j之间的边的权重值,初始时Aij为0;将遍历节点序列划分为H个遍历节点子序列,对每个遍历节点子序列进行边权重统计,当遍历节点子序列中的节点i和节点j在拓扑图G中有边时,Aij加1,至所有遍历节点子序列均进行边权重统计后得到边权重矩阵A*。
6.根据权利要求1所述的基于路径回溯图嵌入的群体发现方法,其特征在于,当L/K为非整数时,所述遍历节点子序列的个数H=L/K;当L/K为非整数时,H为L/K向上取整的整数值;其中,K为遍历节点子序列的预设长度。
7.根据权利要求6所述的基于路径回溯图嵌入的群体发现方法,其特征在于,所述遍历节点子序列的预设长度K=3~10。
8.根据权利要求1所述的基于路径回溯图嵌入的群体发现方法,其特征在于,所述S4的具体方法为:
D1:随机构造图嵌入向量Pi=(Pi1,Pi2,…,Pik),i=1,2,3,…,N;采用图嵌入向量Pi表示节点i;
D2:构造目标函数其中,Aij为权重矩阵A*中的元素值,Pi表示节点i的图嵌入向量,Pj表示节点j的图嵌入向量,λ为做正则化时使用的参数;
D3:利用梯度下降法,将每个节点对(i,j)分别代入目标函数进行优化,并采用优化后的图嵌入向量更新当前的图嵌入向量,重复优化至当前目标函数值与上一次优化的目标函数值的差值在预设阈值内,停止优化,当前各节点的图嵌入向量即为各节点的图嵌入表示向量;
D4:通过降维算法将各节点的图嵌入表示向量降至二维或三维,得到各节点的图嵌入表示结果。
9.根据权利要求1所述的基于路径回溯图嵌入的群体发现方法,其特征在于,所述S5的具体方法为:
采用密度聚类算法将各节点的图嵌入表示结果进行聚类,聚类形成的每个类别里所包含的节点为同一群体。
10.根据权利要求1所述的基于路径回溯图嵌入的群体发现方法,其特征在于,所述采用密度聚类算法将各节点的图嵌入表示结果进行聚类的具体方法为:
T1:预设密度大小EPS和最小邻居对象数MinPts;
T2:统计以每个节点为圆心,EPS为半径的圆周内包含的节点的个数;
T3:当节点的个数大于MinPts时,该节点为圆心节点;否则,该节点为边界节点;
T4:将彼此包含的圆心节点分为一个类别,将边界节点分为距离最近的圆心节点所处的类别,完成聚类。
CN201910533270.1A 2019-06-19 2019-06-19 一种基于路径回溯图嵌入的群体发现方法 Pending CN110347881A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910533270.1A CN110347881A (zh) 2019-06-19 2019-06-19 一种基于路径回溯图嵌入的群体发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910533270.1A CN110347881A (zh) 2019-06-19 2019-06-19 一种基于路径回溯图嵌入的群体发现方法

Publications (1)

Publication Number Publication Date
CN110347881A true CN110347881A (zh) 2019-10-18

Family

ID=68182437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910533270.1A Pending CN110347881A (zh) 2019-06-19 2019-06-19 一种基于路径回溯图嵌入的群体发现方法

Country Status (1)

Country Link
CN (1) CN110347881A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611531A (zh) * 2020-05-20 2020-09-01 杭州中奥科技有限公司 人员关系分析方法、装置及电子设备
CN112084419A (zh) * 2020-07-29 2020-12-15 浙江工业大学 一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社团发现方法
CN112132326A (zh) * 2020-08-31 2020-12-25 浙江工业大学 一种基于随机游走度惩罚机制的社交网络好友预测方法
CN112417224A (zh) * 2020-11-27 2021-02-26 华中科技大学 一种基于熵驱动的随机游走的图嵌入方法及系统
CN112651487A (zh) * 2020-12-21 2021-04-13 广东交通职业技术学院 基于图坍缩卷积神经网络的数据推荐方法、系统及介质
CN112768081A (zh) * 2021-01-27 2021-05-07 湖南大学 一种基于子图抽样及节点属性的共调控生物网络模体发现方法及装置
CN113254580A (zh) * 2021-05-24 2021-08-13 厦门大学 一种特殊群体搜索方法及系统
CN113657915A (zh) * 2020-05-12 2021-11-16 杭州海康威视数字技术股份有限公司 一种潜在用户推荐方法、装置、电子设备及可读存储介质
CN114580061A (zh) * 2022-03-06 2022-06-03 江苏天利电梯有限公司 基于计算机辅助设计电梯安装指导设计优化方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657915B (zh) * 2020-05-12 2024-04-05 杭州海康威视数字技术股份有限公司 一种潜在用户推荐方法、装置、电子设备及可读存储介质
CN113657915A (zh) * 2020-05-12 2021-11-16 杭州海康威视数字技术股份有限公司 一种潜在用户推荐方法、装置、电子设备及可读存储介质
CN111611531A (zh) * 2020-05-20 2020-09-01 杭州中奥科技有限公司 人员关系分析方法、装置及电子设备
CN111611531B (zh) * 2020-05-20 2023-11-21 杭州中奥科技有限公司 人员关系分析方法、装置及电子设备
CN112084419B (zh) * 2020-07-29 2023-07-28 浙江工业大学 一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社团发现方法
CN112084419A (zh) * 2020-07-29 2020-12-15 浙江工业大学 一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社团发现方法
CN112132326A (zh) * 2020-08-31 2020-12-25 浙江工业大学 一种基于随机游走度惩罚机制的社交网络好友预测方法
CN112132326B (zh) * 2020-08-31 2023-12-01 浙江工业大学 一种基于随机游走度惩罚机制的社交网络好友预测方法
CN112417224A (zh) * 2020-11-27 2021-02-26 华中科技大学 一种基于熵驱动的随机游走的图嵌入方法及系统
CN112651487A (zh) * 2020-12-21 2021-04-13 广东交通职业技术学院 基于图坍缩卷积神经网络的数据推荐方法、系统及介质
CN112651487B (zh) * 2020-12-21 2021-07-27 广东交通职业技术学院 基于图坍缩卷积神经网络的数据推荐方法、系统及介质
CN112768081B (zh) * 2021-01-27 2024-02-13 湖南大学 基于子图及节点的共调控生物网络模体发现方法及装置
CN112768081A (zh) * 2021-01-27 2021-05-07 湖南大学 一种基于子图抽样及节点属性的共调控生物网络模体发现方法及装置
CN113254580B (zh) * 2021-05-24 2023-10-03 厦门大学 一种特殊群体搜索方法及系统
CN113254580A (zh) * 2021-05-24 2021-08-13 厦门大学 一种特殊群体搜索方法及系统
CN114580061B (zh) * 2022-03-06 2022-12-13 江苏天利电梯有限公司 基于计算机辅助设计电梯安装指导设计优化方法
CN114580061A (zh) * 2022-03-06 2022-06-03 江苏天利电梯有限公司 基于计算机辅助设计电梯安装指导设计优化方法

Similar Documents

Publication Publication Date Title
CN110347881A (zh) 一种基于路径回溯图嵌入的群体发现方法
Yan et al. Link prediction with persistent homology: An interactive view
CN112382082A (zh) 一种拥堵区域交通运行状态预测方法及系统
CN112700056A (zh) 复杂网络链路预测方法、装置、电子设备及介质
CN113761221B (zh) 基于图神经网络的知识图谱实体对齐方法
CN113190939B (zh) 基于多边形系数的大型稀疏复杂网络拓扑分析和简化方法
Ahmad et al. Image classification based on automatic neural architecture search using binary crow search algorithm
CN104268629A (zh) 一种基于先验信息和网络固有信息的复杂网络社区检测方法
CN113297429B (zh) 一种基于神经网络架构搜索的社交网络链路预测方法
Deac et al. Xlvin: executed latent value iteration nets
Zheng et al. Multi-relational graph neural architecture search with fine-grained message passing
CN110473195A (zh) 一种可自动定制的医学病灶检测架构及方法
CN109740722A (zh) 一种基于Memetic算法的网络表示学习方法
CN112860977A (zh) 一种基于卷积神经网络的链路预测方法
Rabani et al. An optimized firefly algorithm based on cellular learning automata for community detection in social networks
CN109871469B (zh) 基于动态图元的小簇人群识别方法
Pan et al. Overlapping community detection via leader-based local expansion in social networks
Domingues et al. City motifs as revealed by similarity between hierarchical features
CN115294402B (zh) 一种基于去冗余多阶混合训练的半监督车辆分类方法
CN109697511B (zh) 数据推理方法、装置及计算机设备
CN103051476B (zh) 基于拓扑分析的网络社区发现方法
CN109033746A (zh) 一种基于节点向量的蛋白质复合物识别方法
CN109508831A (zh) 基于自适应马尔科夫聚类的城市交通流网络结构识别方法
Alahakoon et al. Mining a growing feature map by data skeleton modelling
Long et al. A unified community detection algorithm in large-scale complex networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191018

RJ01 Rejection of invention patent application after publication