CN116304773A

CN116304773A - 基于图神经网络的社区发现方法

Info

Publication number: CN116304773A
Application number: CN202310043047.5A
Authority: CN
Inventors: 施振佺; 王博文; 施佺; 罗奇才; 张翁坚; 黄子玲; 冯季; 孙凡
Original assignee: Nantong University
Current assignee: Nantong University
Priority date: 2023-01-29
Filing date: 2023-01-29
Publication date: 2023-06-23

Abstract

本发明公开一种基于图神经网络的社区发现方法，包括：将节点信息转换成one‑hot向量作为初始特征值；对one‑hot向量进行PCA降维，计算降维后目标节点与其他节点的特征相似度，学习到目标节点在特征视图下的节点表征；在元路径内和元路径间使用注意力机制，学习到目标节点在元路径视图下的节点表征；分层聚合邻居节点的信息，学习到目标节点在结构视图下的节点表征；拼接三种节点表征，学习到目标节点最终的节点表征；通过最小化交叉熵损失函数来优化模型；通过对生成的节点表征进行k‑means划分成不同的社区。本发明考虑了节点元路径视图下的信息以及特征视图和结构视图下的信息，提高了学习到的节点信息的丰富性与完整性，提高了表征的质量，使发现的社区更为精准。

Description

基于图神经网络的社区发现方法

技术领域

本发明属于社区发现技术领域，涉及一种基于图神经网络的社区发现方法。

背景技术

社区发现用来发现网络中的社区结构，也可以视为一种广义的聚类算法。我们的世界可以说是由一系列社区组成的庞大网络。例如，在社交网络中，平台能够通过社区发现更好的向检测到的社区中的目标用户推广产品。交通网络中能够更好的进行交通流的预测。引文网络中的社区检测确定研究主题的重要性、相互关联性、演变并确定研究趋势。大脑网络中的社区检测反映了大脑区域的功能和解剖分离。

一些基于图神经网络的社区发现方法主要是针对同构图来进行实现的，包括GCN、GraghSAGE、GAT等，但他们大多针对的是同构图，在异构图上的表现并不理想。当前对异构图上的研究大多基于元路径来实现，通过定义一条连接两个相同类型节点之前的元路径来实现异构图中相同类型节点之间的聚合，例如IDMB中的M-A-M(电影-演员-电影)和M-D-M(电影-导演-电影)就是两条元路径，M-A-M元路径描述了同一个演员扮演的两部电影之间的关系，M-D-M描述的是同一个导演执导的两部电影之间的关系，具有不同的语义关系。具有代表性的一些方法比如HAN，使用注意力机制通过一次元路径内的聚合以及一次元路径间的聚合将邻居节点的信息聚合到节点自身，从而实现异构图上的节点聚合，生成最终的节点嵌入以供社区发现。MAGNN作为最近较为火的一种生成异构图的嵌入的方法通过封装输入节点的属性嵌入，然后合并元路径间的语义信息，然后聚合多个元路径之间的信息，赋予一定的权重得到最终的节点嵌入。以上两种方法都是基于元路径已经给出的情况，但是现实生活中的很多元路径都是无法有效的给出，针对这种情况，GTN通过学习一种新的图形结构来自动识别作用更大的元路径，并取得了良好的效果。CP-GNN引入上下文路径概率来对学习目标函数进行建模，从而捕获高阶信息，通过另一种方式来自动生成元路径，解决了元路径需要专家进行定义的问题，另一方面，它提出根据不同元路径长度的注意力机制，并取得了一定的效果。以上一些方法都是通过有监督的方式进行的，但是现实世界中很多数据都是无标签的，针对这个问题，DGI通过最大化相似节点互信息的方式来设计目标函数，与大多数先前使用GCN进行无监督学习的方法相比，DGI不依赖于随机游走目标，并且很容易适用于转导和归纳学习设置。之后在DGI的基础上，又有人提出了HDMI，它通过将二阶互信息扩散到高阶互信息从而获取高阶节点的特征从而更好的学习节点嵌入，并且它将视图扩散到多路上，运用一次注意力机制整合不同视图下的节点嵌入。但是特征空间下的节点特征并没有被考虑，并且还没有学者将特征视图、元路径视图以及结构视图下的节点表征进行结合考虑，从而学习到更为完善的节点表征进行社区发现。

发明内容

发明目的：为克服现有技术中存在的不足，本发明在与提供一种基于图神经网络的社区发现方法，解决以前模型没有考虑特征空间下的节点特征的问题，通过余弦相似度求取与目标节点相似度较高的节点并进行加权聚合，同时考虑特征视图下、元路径视图下以及结构视图下学习到的节点特征进行一次线性变换从而学习到最终的节点表征，更好的进行社区发现。

技术法案：基于图神经网络的社区发现方法，包括如下步骤：

1.对初始数据进行预处理，将图中的节点信息转换成one-hot向量作为初始特征值，并拆分数据集；

2.对one-hot向量进行PCA降维，利用余弦相似度计算降维后目标节点与其他各节点的特征的相似度，选取相似度最高的k个节点进行加权求和，学习到目标节点在特征视图下的节点表征；

3.利用元路径信息，分别在元路径内和元路径间使用注意力机制，学习到目标节点在元路径视图下的节点表征；

4.根据目标节点的邻居信息和元路径信息，分层聚合邻居节点的信息，学习到目标节点在结构视图下的节点表征；

5.将上述三个视图下学习到的表征拼接，通过一次线性变换，学习到目标节点最终的节点表征；

6.通过最小化交叉熵损失函数来优化模型；

7.需要通过对生成的节点表征进行一次k-means划分成不同的社区。

进一步，所述步骤1中，需要对初始数据进行预处理，将图中的节点信息转换成one-hot向量作为初始特征值，并拆分数据集。具体步骤如下：

步骤1-1：将用于社区发现的异构网络定义为G＝(V,E,X)，其中V表示节点集合，E表示边的集合，X∈R^n*m代表图中节点的属性矩阵，n为图中节点的个数，m为每个节点特征的维度，属性矩阵X通过提取节点的语义信息生成one-hot向量得到；

步骤1-2：确定超参数，将数据集划分成训练集、验证集和测试集进行训练。

进一步，所述步骤2中，需要对one-hot向量进行PCA降维，利用余弦相似度计算降维后节点与其他各节点的特征的相似度，选取相似度最高的k个节点进行加权求和，学习到目标节点在特征视图下的节点表征，具体步骤如下：

步骤2-1：对节点的one-hot向量进行PCA降维。先对属性矩阵X的每一行进行零均值化，求出协方差矩阵

并求出协方差矩阵的特征值与特征向量，将特征向量按对应特征值大小从上到下按行排列成矩阵，取前c行组成矩阵P，Y＝PX即为降维到c维后的矩阵；

步骤2-2：利用余弦相似度计算降维后目标节点与其他各节点的特征的相似度：

其中，S_v,u表示两个节点之间的相似性，x_v表示目标节点的属性表征，x_u表示其他节点的属性表征；

步骤2-3：选取相似度最高的k个节点特征进行加权求和，学习到目标节点在特征视图下的节点表征：

其中，

表示特征视图下学习到的节点v的特征，N_k表示与目标节点相似度最高的k个节点集合，w表示可学习的参数，x_u表示与目标节点相似度最高的k个节点的特征。

进一步，所述步骤3中，需要利用元路径信息，分别在元路径内和元路径间使用注意力机制，学习到目标节点在元路径视图下的节点表征，具体步骤如下：

步骤3-1：将不同类型的节点映射到相同的嵌入层维度：

其中，h_v表示映射后的隐藏层特征向量，w_A表示可学习的权重矩阵，

表示不同类型节点的原始特征向量；

步骤3-2：对元路径内部采用特殊的元路径实例编码器将元路径间的节点特征转换为h_p(v,u),使用多头注意力机制对目标节点针对该条元路径的多个元路径实例进行加权聚合：

其中，p_(v,u)表示连接目标节点v和基于元路径的邻居u的元路径实例，m^p(v,u)表示p_(v,u)的中间节点，

是元路径p的可学习参数，/>

表示元路径实例h_p(v,u)对h_v的重要性，||表示向量连接运算符；

步骤3-3：对于所有类型为A的节点在特定元路径下的学习到的节点特征进行一次线性变换后平均，使用注意力机制对不同元路径下学习到的节点特征进行加权聚合，从而学习到元路径视图下目标节点的特征：

其中，

表示节点类型A的可学习参数化注意向量，M_A和b_A为可学习的参数，/>

为元路径p_i对类型A节点的注意力系数。

进一步，所述步骤4中，需要根据目标节点的邻居信息和元路径信息，分层聚合邻居节点的信息，学习到目标节点在结构视图下的节点表征，具体步骤如下：

步骤4-1：将不同类型的节点映射到相同的嵌入层维度：

表示不同类型节点的原始特征向量；

步骤4-2：通过余弦相似度计算元路径中间节点与前一类节点之间的注意力系数，然后加权聚合到中间节点上，层层递进，最终通过相同的方式将中间节点的信息加权聚合到目标节点身上，从而学习到目标节点在该元路径下的特征。在元路径的帮助下，学习到目标节点在结构视图下的节点特征：

其中，节点u为目标节点v在元路径p_i下的邻居节点，

表示节点u对目标节点v的注意力系数；

步骤4-3：对于所有类型为A的节点在特定元路径下的学习到的节点特征进行一次线性变换后平均，使用注意力机制对不同元路径下学习到的节点特征进行加权聚合，从而学习到元路径视图下目标节点的特征：

其中，

为元路径p_i对类型A节点的注意力系数。

进一步，所述步骤5中，需要将上述三个视图下学习到的表征拼接，通过一次线性变换，学习到目标节点最终的节点表征，具体步骤如下：

步骤5-1：将上述三个视图下学习到的节点特征进行拼接：

其中，

分别为特征视图、元路径视图和结构视图下学习到的节点表征；

步骤5-2：通过一次MLP线性变换，学习到目标节点最终的节点表征：

h＝MLP(h_v) (10)

其中，h_v为拼接后的节点特征，h为最终的目标节点表征。

进一步，所述步骤6中，需要通过最小化交叉熵损失函数来优化模型，具体步骤如下：

其中，V_L是带标签的节点集，C是类型的个数，y_v是标签向量，h_v是预测的向量。

进一步，所述步骤7中，需要通过对生成的节点表征进行一次k-means划分成不同的社区，具体步骤如下：

步骤7-1：首先随机选取样本中的K个点作为聚类中心；

步骤7-2：分别算出样本中其他样本距离这K个聚类中心的距离，并把这些样本分别作为自己最近的那个聚类中心的类别；

步骤7-3：对上述分类完的样本再进行每个类别求平均值，求解出新的聚类质心；

步骤7-4：与前一次计算得到的K个聚类质心比较，如果聚类质心发生变化，转步骤7-2，否则，停止并输出聚类结果。

有益效果：本发明在元路径视图下引入了结构视图和特征视图来更好的学习节点表征，从而更好的应用于社区发现；使用余弦相似度来计算与目标节点最相似的k个节点，并将它们进行加权求和，从而使学习到的节点表征能够获得节点特征视图下的信息，并且能够在一定程度上学习与目标节点相似的高阶信息；使用基于元路径的层次聚合方式，层层递进，然后将中间节点的信息加权聚合到目标节点身上，最后用注意力机制聚合不同元路径下学习到的节点表征，通过这样的方式能够让节点表征学习到结构视图的节点表征信息。

附图说明

图1是本发明的步骤示意图。

图2是本发明的总体模型框架图。

图3是本发明特征视图下的流程图。

图4是本发明元路径视图下的流程图。

图5是本发明结构视图下的流程图。

具体实施方式

下面结合附图对本发明进一步说明。

整体流程如图2所示，一种基于图神经网络的社区发现方法，该方法包括如下步骤：

步骤1：对初始数据进行预处理，将图中的节点信息转换成one-hot向量作为初始特征值，并拆分数据集。具体步骤如下：

步骤2：该部分流程如图3所示，对one-hot向量进行PCA降维，利用余弦相似度计算降维后节点与其他各节点的特征的相似度，选取相似度最高的k个节点进行加权求和，学习到目标节点在特征视图下的节点表征，具体步骤如下：

其中，

步骤3：该部分流程如图4所示，利用元路径信息，分别在元路径内和元路径间使用注意力机制，学习到目标节点在元路径视图下的节点表征，具体步骤如下：

步骤3-1：将不同类型的节点映射到相同的嵌入层维度：

表示不同类型节点的原始特征向量；

是元路径p的可学习参数，/>

其中，

表示节点类型A的可学习参数化注意向量，M_A和b_A为可学习的参数，β_pi为元路径p_i对类型A节点的注意力系数。

步骤4：该部分流程如图5所示，根据目标节点的邻居信息和元路径信息，分层聚合邻居节点的信息，学习到目标节点在结构视图下的节点表征，具体步骤如下：

步骤4-1：将不同类型的节点映射到相同的嵌入层维度：

表示不同类型节点的原始特征向量；

其中，节点u为目标节点v在元路径p_i下的邻居节点，

表示节点u对目标节点v的注意力系数；

其中，

步骤5：将上述三个视图下学习到的表征拼接，通过一次线性变换，学习到目标节点最终的节点表征，具体步骤如下：

步骤5-1：将上述三个视图下学习到的节点特征进行拼接：

其中，

h＝MLP(h_v) (10)

其中，h_v为拼接后的节点特征，h为最终的目标节点表征。

步骤6：通过最小化交叉熵损失函数来优化模型，具体步骤如下：

步骤7：通过对生成的节点表征进行一次k-means划分成不同的社区，具体步骤如下：

步骤7-1：首先随机选取样本中的K个点作为聚类中心；

Claims

1.一种基于图神经网络的社区发现方法，其特征在于，所述方法包括如下步骤：

步骤1：对初始数据进行预处理，将图中的节点信息转换成one-hot向量作为初始特征值，并拆分数据集；

步骤2：对one-hot向量进行PCA降维，利用余弦相似度计算降维后目标节点与其他各节点的特征的相似度，选取相似度最高的k个节点进行加权求和，学习到目标节点在特征视图下的节点表征；

步骤3：利用元路径信息，分别在元路径内和元路径间使用注意力机制，学习到目标节点在元路径视图下的节点表征；

步骤4：根据目标节点的邻居信息和元路径信息，分层聚合邻居节点的信息，学习到目标节点在结构视图下的节点表征；

步骤5：将上述三个视图下学习到的表征拼接，通过一次线性变换，学习到目标节点最终的节点表征；

步骤6：通过最小化交叉熵损失函数来优化模型；

步骤7：通过对生成的节点表征进行一次k-means划分成不同的社区。

2.根据权利要求1所述的基于图神经网络的社区发现方法，其特征在于：所述步骤1的具体步骤如下：

步骤1-1：将用于表征学习的异构网络定义为G＝(V,E,X)，其中V表示节点集合，E表示边的集合，X∈R^n*m代表图中节点的属性矩阵，n为图中节点的个数，m为每个节点特征的维度，属性矩阵X通过提取节点的语义信息生成one-hot向量得到；

3.根据权利要求2所述的基于图神经网络的社区发现方法，其特征在于：所述步骤2的具体步骤如下：

步骤2-1：对节点的one-hot向量进行PCA降维；先对属性矩阵X的每一行进行零均值化，求出协方差矩阵

其中，

4.根据权利要求3所述的基于图神经网络的社区发现方法，其特征在于：所述步骤3的具体步骤如下：

步骤3-1：将不同类型的节点映射到相同的嵌入层维度：

表示不同类型节点的原始特征向量；

步骤3-2：对元路径内部采用特殊的元路径实例编码器将元路径间的节点特征转换为h_p(v,u)，使用多头注意力机制对目标节点针对该条元路径的多个元路径实例进行加权聚合：

是元路径p的可学习参数，/>

其中，

5.根据权利要求4所述的基于图神经网络的社区发现方法，其特征在于：所述步骤4中，需要根据目标节点的邻居信息和元路径信息，分层聚合邻居节点的信息，学习到目标节点在结构视图下的节点表征，具体步骤如下：

步骤4-1：将不同类型的节点映射到相同的嵌入层维度：

表示不同类型节点的原始特征向量；

其中，节点u为目标节点v在元路径p_i下的邻居节点，

表示节点u对目标节点v的注意力系数；

其中，

6.根据权利要求5所述的基于图神经网络的社区发现方法，其特征在于：所述步骤5的具体步骤如下：

步骤5-1：将上述三个视图下学习到的节点特征进行拼接：

其中，

h＝MLP(h_v) (10)

其中，h_v为拼接后的节点特征，h为最终的目标节点表征。

7.根据权利要求6所述的基于图神经网络的社区发现方法，其特征在于：所述步骤6中，需要通过最小化交叉熵损失函数来优化模型，具体步骤如下：

8.根据权利要求7所述的基于图神经网络的社区发现方法，其特征在于：所述步骤7中，需要通过对生成的节点表征进行一次k-means划分成不同的社区，具体步骤如下：

步骤7-1：首先随机选取样本中的K个点作为聚类中心；