CN116304773A - 基于图神经网络的社区发现方法 - Google Patents

基于图神经网络的社区发现方法 Download PDF

Info

Publication number
CN116304773A
CN116304773A CN202310043047.5A CN202310043047A CN116304773A CN 116304773 A CN116304773 A CN 116304773A CN 202310043047 A CN202310043047 A CN 202310043047A CN 116304773 A CN116304773 A CN 116304773A
Authority
CN
China
Prior art keywords
node
meta
path
nodes
target node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310043047.5A
Other languages
English (en)
Inventor
施振佺
王博文
施佺
罗奇才
张翁坚
黄子玲
冯季
孙凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN202310043047.5A priority Critical patent/CN116304773A/zh
Publication of CN116304773A publication Critical patent/CN116304773A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开一种基于图神经网络的社区发现方法,包括:将节点信息转换成one‑hot向量作为初始特征值;对one‑hot向量进行PCA降维,计算降维后目标节点与其他节点的特征相似度,学习到目标节点在特征视图下的节点表征;在元路径内和元路径间使用注意力机制,学习到目标节点在元路径视图下的节点表征;分层聚合邻居节点的信息,学习到目标节点在结构视图下的节点表征;拼接三种节点表征,学习到目标节点最终的节点表征;通过最小化交叉熵损失函数来优化模型;通过对生成的节点表征进行k‑means划分成不同的社区。本发明考虑了节点元路径视图下的信息以及特征视图和结构视图下的信息,提高了学习到的节点信息的丰富性与完整性,提高了表征的质量,使发现的社区更为精准。

Description

基于图神经网络的社区发现方法
技术领域
本发明属于社区发现技术领域,涉及一种基于图神经网络的社区发现方法。
背景技术
社区发现用来发现网络中的社区结构,也可以视为一种广义的聚类算法。我们的世界可以说是由一系列社区组成的庞大网络。例如,在社交网络中,平台能够通过社区发现更好的向检测到的社区中的目标用户推广产品。交通网络中能够更好的进行交通流的预测。引文网络中的社区检测确定研究主题的重要性、相互关联性、演变并确定研究趋势。大脑网络中的社区检测反映了大脑区域的功能和解剖分离。
一些基于图神经网络的社区发现方法主要是针对同构图来进行实现的,包括GCN、GraghSAGE、GAT等,但他们大多针对的是同构图,在异构图上的表现并不理想。当前对异构图上的研究大多基于元路径来实现,通过定义一条连接两个相同类型节点之前的元路径来实现异构图中相同类型节点之间的聚合,例如IDMB中的M-A-M(电影-演员-电影)和M-D-M(电影-导演-电影)就是两条元路径,M-A-M元路径描述了同一个演员扮演的两部电影之间的关系,M-D-M描述的是同一个导演执导的两部电影之间的关系,具有不同的语义关系。具有代表性的一些方法比如HAN,使用注意力机制通过一次元路径内的聚合以及一次元路径间的聚合将邻居节点的信息聚合到节点自身,从而实现异构图上的节点聚合,生成最终的节点嵌入以供社区发现。MAGNN作为最近较为火的一种生成异构图的嵌入的方法通过封装输入节点的属性嵌入,然后合并元路径间的语义信息,然后聚合多个元路径之间的信息,赋予一定的权重得到最终的节点嵌入。以上两种方法都是基于元路径已经给出的情况,但是现实生活中的很多元路径都是无法有效的给出,针对这种情况,GTN通过学习一种新的图形结构来自动识别作用更大的元路径,并取得了良好的效果。CP-GNN引入上下文路径概率来对学习目标函数进行建模,从而捕获高阶信息,通过另一种方式来自动生成元路径,解决了元路径需要专家进行定义的问题,另一方面,它提出根据不同元路径长度的注意力机制,并取得了一定的效果。以上一些方法都是通过有监督的方式进行的,但是现实世界中很多数据都是无标签的,针对这个问题,DGI通过最大化相似节点互信息的方式来设计目标函数,与大多数先前使用GCN进行无监督学习的方法相比,DGI不依赖于随机游走目标,并且很容易适用于转导和归纳学习设置。之后在DGI的基础上,又有人提出了HDMI,它通过将二阶互信息扩散到高阶互信息从而获取高阶节点的特征从而更好的学习节点嵌入,并且它将视图扩散到多路上,运用一次注意力机制整合不同视图下的节点嵌入。但是特征空间下的节点特征并没有被考虑,并且还没有学者将特征视图、元路径视图以及结构视图下的节点表征进行结合考虑,从而学习到更为完善的节点表征进行社区发现。
发明内容
发明目的:为克服现有技术中存在的不足,本发明在与提供一种基于图神经网络的社区发现方法,解决以前模型没有考虑特征空间下的节点特征的问题,通过余弦相似度求取与目标节点相似度较高的节点并进行加权聚合,同时考虑特征视图下、元路径视图下以及结构视图下学习到的节点特征进行一次线性变换从而学习到最终的节点表征,更好的进行社区发现。
技术法案:基于图神经网络的社区发现方法,包括如下步骤:
1.对初始数据进行预处理,将图中的节点信息转换成one-hot向量作为初始特征值,并拆分数据集;
2.对one-hot向量进行PCA降维,利用余弦相似度计算降维后目标节点与其他各节点的特征的相似度,选取相似度最高的k个节点进行加权求和,学习到目标节点在特征视图下的节点表征;
3.利用元路径信息,分别在元路径内和元路径间使用注意力机制,学习到目标节点在元路径视图下的节点表征;
4.根据目标节点的邻居信息和元路径信息,分层聚合邻居节点的信息,学习到目标节点在结构视图下的节点表征;
5.将上述三个视图下学习到的表征拼接,通过一次线性变换,学习到目标节点最终的节点表征;
6.通过最小化交叉熵损失函数来优化模型;
7.需要通过对生成的节点表征进行一次k-means划分成不同的社区。
进一步,所述步骤1中,需要对初始数据进行预处理,将图中的节点信息转换成one-hot向量作为初始特征值,并拆分数据集。具体步骤如下:
步骤1-1:将用于社区发现的异构网络定义为G=(V,E,X),其中V表示节点集合,E表示边的集合,X∈Rn*m代表图中节点的属性矩阵,n为图中节点的个数,m为每个节点特征的维度,属性矩阵X通过提取节点的语义信息生成one-hot向量得到;
步骤1-2:确定超参数,将数据集划分成训练集、验证集和测试集进行训练。
进一步,所述步骤2中,需要对one-hot向量进行PCA降维,利用余弦相似度计算降维后节点与其他各节点的特征的相似度,选取相似度最高的k个节点进行加权求和,学习到目标节点在特征视图下的节点表征,具体步骤如下:
步骤2-1:对节点的one-hot向量进行PCA降维。先对属性矩阵X的每一行进行零均值化,求出协方差矩阵
Figure BDA0004051225070000031
并求出协方差矩阵的特征值与特征向量,将特征向量按对应特征值大小从上到下按行排列成矩阵,取前c行组成矩阵P,Y=PX即为降维到c维后的矩阵;
步骤2-2:利用余弦相似度计算降维后目标节点与其他各节点的特征的相似度:
Figure BDA0004051225070000032
其中,Sv,u表示两个节点之间的相似性,xv表示目标节点的属性表征,xu表示其他节点的属性表征;
步骤2-3:选取相似度最高的k个节点特征进行加权求和,学习到目标节点在特征视图下的节点表征:
Figure BDA0004051225070000033
其中,
Figure BDA0004051225070000034
表示特征视图下学习到的节点v的特征,Nk表示与目标节点相似度最高的k个节点集合,w表示可学习的参数,xu表示与目标节点相似度最高的k个节点的特征。
进一步,所述步骤3中,需要利用元路径信息,分别在元路径内和元路径间使用注意力机制,学习到目标节点在元路径视图下的节点表征,具体步骤如下:
步骤3-1:将不同类型的节点映射到相同的嵌入层维度:
Figure BDA0004051225070000035
其中,hv表示映射后的隐藏层特征向量,wA表示可学习的权重矩阵,
Figure BDA0004051225070000041
表示不同类型节点的原始特征向量;
步骤3-2:对元路径内部采用特殊的元路径实例编码器将元路径间的节点特征转换为hp(v,u),使用多头注意力机制对目标节点针对该条元路径的多个元路径实例进行加权聚合:
Figure BDA0004051225070000042
Figure BDA0004051225070000043
Figure BDA0004051225070000044
其中,p(v,u)表示连接目标节点v和基于元路径的邻居u的元路径实例,mp(v,u)表示p(v,u)的中间节点,
Figure BDA0004051225070000045
是元路径p的可学习参数,/>
Figure BDA0004051225070000046
表示元路径实例hp(v,u)对hv的重要性,||表示向量连接运算符;
步骤3-3:对于所有类型为A的节点在特定元路径下的学习到的节点特征进行一次线性变换后平均,使用注意力机制对不同元路径下学习到的节点特征进行加权聚合,从而学习到元路径视图下目标节点的特征:
Figure BDA0004051225070000047
Figure BDA0004051225070000048
其中,
Figure BDA0004051225070000049
表示节点类型A的可学习参数化注意向量,MA和bA为可学习的参数,/>
Figure BDA00040512250700000410
为元路径pi对类型A节点的注意力系数。
进一步,所述步骤4中,需要根据目标节点的邻居信息和元路径信息,分层聚合邻居节点的信息,学习到目标节点在结构视图下的节点表征,具体步骤如下:
步骤4-1:将不同类型的节点映射到相同的嵌入层维度:
Figure BDA00040512250700000411
其中,hv表示映射后的隐藏层特征向量,wA表示可学习的权重矩阵,
Figure BDA00040512250700000412
表示不同类型节点的原始特征向量;
步骤4-2:通过余弦相似度计算元路径中间节点与前一类节点之间的注意力系数,然后加权聚合到中间节点上,层层递进,最终通过相同的方式将中间节点的信息加权聚合到目标节点身上,从而学习到目标节点在该元路径下的特征。在元路径的帮助下,学习到目标节点在结构视图下的节点特征:
Figure BDA0004051225070000051
Figure BDA0004051225070000052
其中,节点u为目标节点v在元路径pi下的邻居节点,
Figure BDA0004051225070000053
表示节点u对目标节点v的注意力系数;
步骤4-3:对于所有类型为A的节点在特定元路径下的学习到的节点特征进行一次线性变换后平均,使用注意力机制对不同元路径下学习到的节点特征进行加权聚合,从而学习到元路径视图下目标节点的特征:
Figure BDA0004051225070000054
Figure BDA0004051225070000055
其中,
Figure BDA0004051225070000056
表示节点类型A的可学习参数化注意向量,MA和bA为可学习的参数,/>
Figure BDA0004051225070000057
为元路径pi对类型A节点的注意力系数。
进一步,所述步骤5中,需要将上述三个视图下学习到的表征拼接,通过一次线性变换,学习到目标节点最终的节点表征,具体步骤如下:
步骤5-1:将上述三个视图下学习到的节点特征进行拼接:
Figure BDA0004051225070000058
其中,
Figure BDA0004051225070000059
分别为特征视图、元路径视图和结构视图下学习到的节点表征;
步骤5-2:通过一次MLP线性变换,学习到目标节点最终的节点表征:
h=MLP(hv) (10)
其中,hv为拼接后的节点特征,h为最终的目标节点表征。
进一步,所述步骤6中,需要通过最小化交叉熵损失函数来优化模型,具体步骤如下:
Figure BDA0004051225070000061
其中,VL是带标签的节点集,C是类型的个数,yv是标签向量,hv是预测的向量。
进一步,所述步骤7中,需要通过对生成的节点表征进行一次k-means划分成不同的社区,具体步骤如下:
步骤7-1:首先随机选取样本中的K个点作为聚类中心;
步骤7-2:分别算出样本中其他样本距离这K个聚类中心的距离,并把这些样本分别作为自己最近的那个聚类中心的类别;
步骤7-3:对上述分类完的样本再进行每个类别求平均值,求解出新的聚类质心;
步骤7-4:与前一次计算得到的K个聚类质心比较,如果聚类质心发生变化,转步骤7-2,否则,停止并输出聚类结果。
有益效果:本发明在元路径视图下引入了结构视图和特征视图来更好的学习节点表征,从而更好的应用于社区发现;使用余弦相似度来计算与目标节点最相似的k个节点,并将它们进行加权求和,从而使学习到的节点表征能够获得节点特征视图下的信息,并且能够在一定程度上学习与目标节点相似的高阶信息;使用基于元路径的层次聚合方式,层层递进,然后将中间节点的信息加权聚合到目标节点身上,最后用注意力机制聚合不同元路径下学习到的节点表征,通过这样的方式能够让节点表征学习到结构视图的节点表征信息。
附图说明
图1是本发明的步骤示意图。
图2是本发明的总体模型框架图。
图3是本发明特征视图下的流程图。
图4是本发明元路径视图下的流程图。
图5是本发明结构视图下的流程图。
具体实施方式
下面结合附图对本发明进一步说明。
整体流程如图2所示,一种基于图神经网络的社区发现方法,该方法包括如下步骤:
步骤1:对初始数据进行预处理,将图中的节点信息转换成one-hot向量作为初始特征值,并拆分数据集。具体步骤如下:
步骤1-1:将用于社区发现的异构网络定义为G=(V,E,X),其中V表示节点集合,E表示边的集合,X∈Rn*m代表图中节点的属性矩阵,n为图中节点的个数,m为每个节点特征的维度,属性矩阵X通过提取节点的语义信息生成one-hot向量得到;
步骤1-2:确定超参数,将数据集划分成训练集、验证集和测试集进行训练。
步骤2:该部分流程如图3所示,对one-hot向量进行PCA降维,利用余弦相似度计算降维后节点与其他各节点的特征的相似度,选取相似度最高的k个节点进行加权求和,学习到目标节点在特征视图下的节点表征,具体步骤如下:
步骤2-1:对节点的one-hot向量进行PCA降维。先对属性矩阵X的每一行进行零均值化,求出协方差矩阵
Figure BDA0004051225070000071
并求出协方差矩阵的特征值与特征向量,将特征向量按对应特征值大小从上到下按行排列成矩阵,取前c行组成矩阵P,Y=PX即为降维到c维后的矩阵;
步骤2-2:利用余弦相似度计算降维后目标节点与其他各节点的特征的相似度:
Figure BDA0004051225070000072
其中,Sv,u表示两个节点之间的相似性,xv表示目标节点的属性表征,xu表示其他节点的属性表征;
步骤2-3:选取相似度最高的k个节点特征进行加权求和,学习到目标节点在特征视图下的节点表征:
Figure BDA0004051225070000073
其中,
Figure BDA0004051225070000074
表示特征视图下学习到的节点v的特征,Nk表示与目标节点相似度最高的k个节点集合,w表示可学习的参数,xu表示与目标节点相似度最高的k个节点的特征。
步骤3:该部分流程如图4所示,利用元路径信息,分别在元路径内和元路径间使用注意力机制,学习到目标节点在元路径视图下的节点表征,具体步骤如下:
步骤3-1:将不同类型的节点映射到相同的嵌入层维度:
Figure BDA0004051225070000081
其中,hv表示映射后的隐藏层特征向量,wA表示可学习的权重矩阵,
Figure BDA0004051225070000082
表示不同类型节点的原始特征向量;
步骤3-2:对元路径内部采用特殊的元路径实例编码器将元路径间的节点特征转换为hp(v,u),使用多头注意力机制对目标节点针对该条元路径的多个元路径实例进行加权聚合:
Figure BDA0004051225070000083
Figure BDA0004051225070000084
Figure BDA0004051225070000085
其中,p(v,u)表示连接目标节点v和基于元路径的邻居u的元路径实例,mp(v,u)表示p(v,u)的中间节点,
Figure BDA0004051225070000086
是元路径p的可学习参数,/>
Figure BDA0004051225070000087
表示元路径实例hp(v,u)对hv的重要性,||表示向量连接运算符;
步骤3-3:对于所有类型为A的节点在特定元路径下的学习到的节点特征进行一次线性变换后平均,使用注意力机制对不同元路径下学习到的节点特征进行加权聚合,从而学习到元路径视图下目标节点的特征:
Figure BDA0004051225070000088
Figure BDA0004051225070000089
其中,
Figure BDA00040512250700000810
表示节点类型A的可学习参数化注意向量,MA和bA为可学习的参数,βpi为元路径pi对类型A节点的注意力系数。
步骤4:该部分流程如图5所示,根据目标节点的邻居信息和元路径信息,分层聚合邻居节点的信息,学习到目标节点在结构视图下的节点表征,具体步骤如下:
步骤4-1:将不同类型的节点映射到相同的嵌入层维度:
Figure BDA00040512250700000811
其中,hv表示映射后的隐藏层特征向量,wA表示可学习的权重矩阵,
Figure BDA0004051225070000091
表示不同类型节点的原始特征向量;
步骤4-2:通过余弦相似度计算元路径中间节点与前一类节点之间的注意力系数,然后加权聚合到中间节点上,层层递进,最终通过相同的方式将中间节点的信息加权聚合到目标节点身上,从而学习到目标节点在该元路径下的特征。在元路径的帮助下,学习到目标节点在结构视图下的节点特征:
Figure BDA0004051225070000092
Figure BDA0004051225070000093
其中,节点u为目标节点v在元路径pi下的邻居节点,
Figure BDA0004051225070000094
表示节点u对目标节点v的注意力系数;
步骤4-3:对于所有类型为A的节点在特定元路径下的学习到的节点特征进行一次线性变换后平均,使用注意力机制对不同元路径下学习到的节点特征进行加权聚合,从而学习到元路径视图下目标节点的特征:
Figure BDA0004051225070000095
Figure BDA0004051225070000096
其中,
Figure BDA0004051225070000097
表示节点类型A的可学习参数化注意向量,MA和bA为可学习的参数,βpi为元路径pi对类型A节点的注意力系数。
步骤5:将上述三个视图下学习到的表征拼接,通过一次线性变换,学习到目标节点最终的节点表征,具体步骤如下:
步骤5-1:将上述三个视图下学习到的节点特征进行拼接:
Figure BDA0004051225070000098
其中,
Figure BDA0004051225070000099
分别为特征视图、元路径视图和结构视图下学习到的节点表征;
步骤5-2:通过一次MLP线性变换,学习到目标节点最终的节点表征:
h=MLP(hv) (10)
其中,hv为拼接后的节点特征,h为最终的目标节点表征。
步骤6:通过最小化交叉熵损失函数来优化模型,具体步骤如下:
Figure BDA0004051225070000101
其中,VL是带标签的节点集,C是类型的个数,yv是标签向量,hv是预测的向量。
步骤7:通过对生成的节点表征进行一次k-means划分成不同的社区,具体步骤如下:
步骤7-1:首先随机选取样本中的K个点作为聚类中心;
步骤7-2:分别算出样本中其他样本距离这K个聚类中心的距离,并把这些样本分别作为自己最近的那个聚类中心的类别;
步骤7-3:对上述分类完的样本再进行每个类别求平均值,求解出新的聚类质心;
步骤7-4:与前一次计算得到的K个聚类质心比较,如果聚类质心发生变化,转步骤7-2,否则,停止并输出聚类结果。

Claims (8)

1.一种基于图神经网络的社区发现方法,其特征在于,所述方法包括如下步骤:
步骤1:对初始数据进行预处理,将图中的节点信息转换成one-hot向量作为初始特征值,并拆分数据集;
步骤2:对one-hot向量进行PCA降维,利用余弦相似度计算降维后目标节点与其他各节点的特征的相似度,选取相似度最高的k个节点进行加权求和,学习到目标节点在特征视图下的节点表征;
步骤3:利用元路径信息,分别在元路径内和元路径间使用注意力机制,学习到目标节点在元路径视图下的节点表征;
步骤4:根据目标节点的邻居信息和元路径信息,分层聚合邻居节点的信息,学习到目标节点在结构视图下的节点表征;
步骤5:将上述三个视图下学习到的表征拼接,通过一次线性变换,学习到目标节点最终的节点表征;
步骤6:通过最小化交叉熵损失函数来优化模型;
步骤7:通过对生成的节点表征进行一次k-means划分成不同的社区。
2.根据权利要求1所述的基于图神经网络的社区发现方法,其特征在于:所述步骤1的具体步骤如下:
步骤1-1:将用于表征学习的异构网络定义为G=(V,E,X),其中V表示节点集合,E表示边的集合,X∈Rn*m代表图中节点的属性矩阵,n为图中节点的个数,m为每个节点特征的维度,属性矩阵X通过提取节点的语义信息生成one-hot向量得到;
步骤1-2:确定超参数,将数据集划分成训练集、验证集和测试集进行训练。
3.根据权利要求2所述的基于图神经网络的社区发现方法,其特征在于:所述步骤2的具体步骤如下:
步骤2-1:对节点的one-hot向量进行PCA降维;先对属性矩阵X的每一行进行零均值化,求出协方差矩阵
Figure FDA0004051225060000011
并求出协方差矩阵的特征值与特征向量,将特征向量按对应特征值大小从上到下按行排列成矩阵,取前c行组成矩阵P,Y=PX即为降维到c维后的矩阵;
步骤2-2:利用余弦相似度计算降维后目标节点与其他各节点的特征的相似度:
Figure FDA0004051225060000021
其中,Sv,u表示两个节点之间的相似性,xv表示目标节点的属性表征,xu表示其他节点的属性表征;
步骤2-3:选取相似度最高的k个节点特征进行加权求和,学习到目标节点在特征视图下的节点表征:
Figure FDA0004051225060000022
其中,
Figure FDA0004051225060000023
表示特征视图下学习到的节点v的特征,Nk表示与目标节点相似度最高的k个节点集合,w表示可学习的参数,xu表示与目标节点相似度最高的k个节点的特征。
4.根据权利要求3所述的基于图神经网络的社区发现方法,其特征在于:所述步骤3的具体步骤如下:
步骤3-1:将不同类型的节点映射到相同的嵌入层维度:
Figure FDA0004051225060000024
其中,hv表示映射后的隐藏层特征向量,wA表示可学习的权重矩阵,
Figure FDA0004051225060000025
表示不同类型节点的原始特征向量;
步骤3-2:对元路径内部采用特殊的元路径实例编码器将元路径间的节点特征转换为hp(v,u),使用多头注意力机制对目标节点针对该条元路径的多个元路径实例进行加权聚合:
Figure FDA0004051225060000026
Figure FDA0004051225060000027
Figure FDA0004051225060000028
其中,p(v,u)表示连接目标节点v和基于元路径的邻居u的元路径实例,mp(v,u)表示p(v,u)的中间节点,
Figure FDA0004051225060000029
是元路径p的可学习参数,/>
Figure FDA00040512250600000210
表示元路径实例hp(v,u)对hv的重要性,||表示向量连接运算符;
步骤3-3:对于所有类型为A的节点在特定元路径下的学习到的节点特征进行一次线性变换后平均,使用注意力机制对不同元路径下学习到的节点特征进行加权聚合,从而学习到元路径视图下目标节点的特征:
Figure FDA0004051225060000031
Figure FDA0004051225060000032
其中,
Figure FDA0004051225060000033
表示节点类型A的可学习参数化注意向量,MA和bA为可学习的参数,βpi为元路径pi对类型A节点的注意力系数。
5.根据权利要求4所述的基于图神经网络的社区发现方法,其特征在于:所述步骤4中,需要根据目标节点的邻居信息和元路径信息,分层聚合邻居节点的信息,学习到目标节点在结构视图下的节点表征,具体步骤如下:
步骤4-1:将不同类型的节点映射到相同的嵌入层维度:
Figure FDA0004051225060000034
其中,hv表示映射后的隐藏层特征向量,wA表示可学习的权重矩阵,
Figure FDA0004051225060000035
表示不同类型节点的原始特征向量;
步骤4-2:通过余弦相似度计算元路径中间节点与前一类节点之间的注意力系数,然后加权聚合到中间节点上,层层递进,最终通过相同的方式将中间节点的信息加权聚合到目标节点身上,从而学习到目标节点在该元路径下的特征。在元路径的帮助下,学习到目标节点在结构视图下的节点特征:
Figure FDA0004051225060000036
Figure FDA0004051225060000037
其中,节点u为目标节点v在元路径pi下的邻居节点,
Figure FDA0004051225060000038
表示节点u对目标节点v的注意力系数;
步骤4-3:对于所有类型为A的节点在特定元路径下的学习到的节点特征进行一次线性变换后平均,使用注意力机制对不同元路径下学习到的节点特征进行加权聚合,从而学习到元路径视图下目标节点的特征:
Figure FDA0004051225060000039
Figure FDA0004051225060000041
其中,
Figure FDA0004051225060000042
表示节点类型A的可学习参数化注意向量,MA和bA为可学习的参数,βpi为元路径pi对类型A节点的注意力系数。
6.根据权利要求5所述的基于图神经网络的社区发现方法,其特征在于:所述步骤5的具体步骤如下:
步骤5-1:将上述三个视图下学习到的节点特征进行拼接:
Figure FDA0004051225060000043
其中,
Figure FDA0004051225060000044
分别为特征视图、元路径视图和结构视图下学习到的节点表征;
步骤5-2:通过一次MLP线性变换,学习到目标节点最终的节点表征:
h=MLP(hv) (10)
其中,hv为拼接后的节点特征,h为最终的目标节点表征。
7.根据权利要求6所述的基于图神经网络的社区发现方法,其特征在于:所述步骤6中,需要通过最小化交叉熵损失函数来优化模型,具体步骤如下:
Figure FDA0004051225060000045
其中,VL是带标签的节点集,C是类型的个数,yv是标签向量,hv是预测的向量。
8.根据权利要求7所述的基于图神经网络的社区发现方法,其特征在于:所述步骤7中,需要通过对生成的节点表征进行一次k-means划分成不同的社区,具体步骤如下:
步骤7-1:首先随机选取样本中的K个点作为聚类中心;
步骤7-2:分别算出样本中其他样本距离这K个聚类中心的距离,并把这些样本分别作为自己最近的那个聚类中心的类别;
步骤7-3:对上述分类完的样本再进行每个类别求平均值,求解出新的聚类质心;
步骤7-4:与前一次计算得到的K个聚类质心比较,如果聚类质心发生变化,转步骤7-2,否则,停止并输出聚类结果。
CN202310043047.5A 2023-01-29 2023-01-29 基于图神经网络的社区发现方法 Pending CN116304773A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310043047.5A CN116304773A (zh) 2023-01-29 2023-01-29 基于图神经网络的社区发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310043047.5A CN116304773A (zh) 2023-01-29 2023-01-29 基于图神经网络的社区发现方法

Publications (1)

Publication Number Publication Date
CN116304773A true CN116304773A (zh) 2023-06-23

Family

ID=86833140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310043047.5A Pending CN116304773A (zh) 2023-01-29 2023-01-29 基于图神经网络的社区发现方法

Country Status (1)

Country Link
CN (1) CN116304773A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117763485A (zh) * 2024-02-22 2024-03-26 福建理工大学 一种基于谱图分解的社交网络异常检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117763485A (zh) * 2024-02-22 2024-03-26 福建理工大学 一种基于谱图分解的社交网络异常检测方法

Similar Documents

Publication Publication Date Title
Cui et al. A new hyperparameters optimization method for convolutional neural networks
CN109492748B (zh) 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法
CN113516379B (zh) 一种智能质检的工单评分方法
CN112381179A (zh) 一种基于双层注意力机制的异质图分类方法
CN114817663A (zh) 一种基于类别感知图神经网络的服务建模与推荐方法
CN106951471A (zh) 一种基于svm的标签发展趋势预测模型的构建方法
Gu et al. [Retracted] Application of Fuzzy Decision Tree Algorithm Based on Mobile Computing in Sports Fitness Member Management
CN112507224B (zh) 基于异质网络表示学习的人机物融合系统服务推荐方法
CN114818703B (zh) 基于BERT语言模型和TextCNN模型的多意图识别方法及系统
CN112529638B (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN105844334B (zh) 一种基于径向基神经网络的温度插值方法
CN115270004B (zh) 一种基于场因子分解的教育资源推荐方法
CN116304773A (zh) 基于图神经网络的社区发现方法
CN113657678A (zh) 一种基于信息新鲜度的电网电力数据预测方法
CN117237559A (zh) 面向数字孪生城市的三维模型数据智能分析方法及系统
CN114880538A (zh) 基于自监督的属性图社团检测方法
CN114679372A (zh) 一种基于节点相似性的图注意力网络的链路预测方法
Lu et al. Feature pyramid-based graph convolutional neural network for graph classification
CN117635238A (zh) 一种商品推荐方法、装置、设备及存储介质
CN112950414A (zh) 一种基于解耦法律要素的法律文本表示方法
Wang et al. Research on integrating different methods of neural networks with case-based reasoning and rule-based system to infer causes of notebook computer breakdown
CN114818681B (zh) 一种实体识别方法及系统、计算机可读存储介质及终端
CN114880754B (zh) 基于bim的建筑能耗管理方法及系统
CN116485021A (zh) 一种煤炭企业技术技能人才人岗匹配预测方法与系统
CN113159976B (zh) 一种微博网络重要用户的识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination