CN116226467A - 基于节点结构特征的图卷积神经网络的社区发现方法 - Google Patents

基于节点结构特征的图卷积神经网络的社区发现方法 Download PDF

Info

Publication number
CN116226467A
CN116226467A CN202310297088.7A CN202310297088A CN116226467A CN 116226467 A CN116226467 A CN 116226467A CN 202310297088 A CN202310297088 A CN 202310297088A CN 116226467 A CN116226467 A CN 116226467A
Authority
CN
China
Prior art keywords
node
nodes
matrix
graph
community
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310297088.7A
Other languages
English (en)
Inventor
施振佺
孙凡
施佺
罗奇才
张翁坚
黄子玲
冯季
王博文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN202310297088.7A priority Critical patent/CN116226467A/zh
Publication of CN116226467A publication Critical patent/CN116226467A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于节点结构特征的图卷积神经网络的社区发现方法。首先,将不同类型的节点映射至同一空间,使用GCN模型求得节点特征。然后,从异构性和重叠性两个方面考虑节点的结构特征。接着,对三个角度下的目标节点表征进行堆叠,使用MLP生成最终的目标节点表征。最后,使用k‑means聚类算法,对节点进行社区划分。本发明从异构性和重叠性两个角度,考虑节点结构特征,从节点特征和节点结构特征两个方面,考虑节点表征,为学习节点表征提供了新的角度,提高了节点表征的质量,保证了社区发现的精确性,对个性化推荐、社区欺诈检测等多种领域有着重要意义。

Description

基于节点结构特征的图卷积神经网络的社区发现方法
技术领域
本发明属于数据挖掘技术领域,涉及一种基于节点结构特征的图卷积神经网络的社区发现方法。
背景技术
社区网络、生物网络等在现实世界等往往被建模为图,这使得图结构广泛存在于众多领域,同时也促进了图数据挖掘技术的出现。社区发现是一个常见且热门的研究方向,它旨在发现具有高内聚性的节点簇,即同一簇中的节点应该比不同簇中的节点更密集地连接,也可称之为节点聚类。社区检测不仅可以帮助揭示图的结构特征,而且在欺诈检测、社交网络和个性化推荐等方面具有重要的现实意义和应用价值。
在现实生活中,社区网络可看做一个具有异构性和重叠性的图。在过去的几十年里,许多社区发现方法被提出并展示了不同程度的性能。新兴的图深度学习领域在设计更准确、更可扩展的算法方面表现出了巨大的前景。大多学者使用GNN来学习节点的低维表示,近年来,GNN不断演变,出现了四种类型:图递归神经网络(GRNN)、图注意力网络(GAT)、图卷积网络(GCN)和图自动编码器(GAE),尽管他们是不同的模型框架,但是他们基本都是通过两个操作来实现节点表示。相较于传统方法,GNN在节点分类,节点聚类,图分类等任务中表现出良好的性能,然而,这些解决方案在许多具有多个节点类型和边类型的现实世界图上可能不太好地工作,学习节点在低维空间中的表示以及同时为下游任务保留异构结构和语义已引起广泛关注,因此在异构图节点学习方面还有很大提升空间。现有的几种社区发现方法都有一个共同的缺点:它们只研究非重叠社区的特殊情况,GNN严重依赖于平滑节点特征而不是图结构,其中结构信息,例如,重叠邻域、度和最短路径是至关重要的。为了解决这一局限性,本发明考虑它的重叠性,并从邻接矩阵中学习有用的结构特征以形成更好的节点表征。
发明内容
发明目的:为弥补现有方法中存在的不足,本发明的目的在于提供一种基于节点结构特征的图卷积神经网络的社区发现方法,从异构性和重叠性两个方面,求得节点结构特征,使用GCN模型直接求得节点特征,最终结合节点特征和节点结构特征两个方面,求出更精准的节点特征向量,提高社区检测的精确度。
技术方案:
基于节点结构特征的图卷积神经网络的社区发现方法,包括如下步骤:
1.对图进行预处理,将图中不同类型的节点映射到同一个潜在向空间中;
2.使用GCN模型,学习目标节点的第一节点特征;
3.根据图的边关系类型,将图分为M个关系子图;针对每个关系子图,分别使用GCN模型,求得目标节点在不同关系下的特征向量;使用多头注意力机制聚合多关系下的节点特征,形成第二节点特征;
4.考虑节点之间重叠邻居的特征,根据邻接矩阵求得节点的结构表示,形成节点的结构特征矩阵;考虑多阶邻居关系,形成多阶的邻接矩阵,根据结构特征矩阵和邻接矩阵,形成在每阶层情况下的节点表征矩阵,最后使用多层感知机连接,形成第三节点特征;
5.堆叠第一节点特征、第二节点特征、第三节点特征,通过多层感知机输出最终的节点表征模型;
6.使用交叉熵损失函数训练所提出的节点表征模型;
7.使用k-means聚类方法,将各个节点聚入各个社区,实现社区检测。
进一步,所述步骤1中,将图中的每个节点映射到一个相同的潜在向量空间中,再对数据进行预处理,将数据拆分成训练集、测试集和验证集。具体步骤如下:
步骤1-1:将用于社区网络的图定义为G=(V,E,Tv,Te),它包含了具有多种节点类型Tv的多个节点V和具有多种边类型Te的边E,该图有多种边类型|Te|>1,边类型映射函数:
Figure BDA0004143500710000021
节点个数为N,节点v的邻居表示为N(v),euv表示从节点u到v的连接边;任何节点v,其邻居节点集表示为/>
Figure BDA0004143500710000022
Figure BDA0004143500710000023
用/>
Figure BDA0004143500710000024
表示初始节点特征矩阵,节点v的初始特征向量为/>
Figure BDA0004143500710000025
对不同类型的节点应用特定类型的线性变换,将其映射到同一潜在空间中,形成映射后矩阵H。
对于t∈Tv型的节点v∈Vt有:
Figure BDA0004143500710000026
其中Wt是t关系下的可训练权重矩阵,
Figure BDA0004143500710000031
是在t关系下节点v的初始特征向量。
对于同时具有多种类型的节点v有:
Figure BDA0004143500710000032
步骤1-2:将数据集划分成训练集、验证集和测试集以进行实验。
进一步,所述步骤2,首先求得节点特征,直接使用两层GCN模型对节点进行处理,具体方法如下:
Figure BDA0004143500710000033
其中,w0、w1、w2和w3是可训练权重矩阵,σ是RELU激活函数,
Figure BDA0004143500710000034
经过两层GCN后,节点v表示为bv
进一步,所述步骤3,根据图的边关系类型,将图分为M个关系子图;针对每个关系子图,分别使用GCN模型,求得目标节点在不同关系下的特征向量;使用多头注意力机制聚合多关系下的节点特征,形成第二节点特征。具体步骤如下:
步骤3-1:根据图中节点间边关系的不同种类,划分出M个子图,使用GCN模型,求得每个子图中的目标节点表征。
对于在根据关系I∈Te划分的子图中节点v表示为:
Figure BDA0004143500710000035
/>
其中,w4、w5、w6和w7是可训练权重矩阵,
Figure BDA0004143500710000036
经过两层GCN后,节点v表示为/>
Figure BDA0004143500710000037
步骤3-2:使用注意力机制,为不同关系下的目标节点分配不同的权重,融合在不同关系下目标节点v的表征。假设关系集合为Pv,注意力机制公式如下:
Figure BDA0004143500710000038
其中,qT是查询向量,
Figure BDA0004143500710000041
是在关系p下节点v的重要性分数,/>
Figure BDA0004143500710000042
是在关系I下节点v的注意力系数。
步骤3-3:使用一个附加的线性变换和一个非线性函数将节点嵌入映射到具有期望输出维数的向量空间:
Figure BDA0004143500710000043
其中,w8是可训练权重矩阵,
Figure BDA0004143500710000044
是在映射空间中节点v聚合多关系的特征,dv是第二节点特征。
进一步,所述步骤4,考虑节点之间重叠邻居的特征,根据邻接矩阵求得节点的结构表示,形成节点的结构特征矩阵;考虑多阶邻居关系,形成多阶的邻接矩阵,根据结构特征矩阵和邻接矩阵,形成在每阶层情况下的节点表征矩阵,最后使用多层感知机连接,形成第三节点特征。具体步骤如下:
步骤4-1:结合节点特征和边特征,得出节点结构特征:
Figure BDA0004143500710000045
其中,Aij是邻接矩阵,Ni是节点i的邻居节点集合,函数
Figure BDA0004143500710000046
Figure BDA0004143500710000047
步骤4-2:使用结构特征向量qv生成对角矩阵Qv
Q=diag(q)#(10)
步骤4-3:通过未归一化的邻接矩阵A来聚合邻居的特征:
r=AQ#(11)
根据多阶邻接矩阵公式(12),考虑多跳重叠邻居,可得出聚合多阶邻居后的特征:
A(m)=A(m-1)A(1)#(12)
r(m)=A(m)Q#(13)
步骤4-4:使用注意力机制,为不同关系下的目标节点分配不同的权重,融合在不同关系下节点表征:
Figure BDA0004143500710000048
/>
Figure BDA0004143500710000051
其中,
Figure BDA0004143500710000052
是查询向量,/>
Figure BDA0004143500710000053
是在n阶下节点v的重要性分数,/>
Figure BDA0004143500710000054
是在n阶下节点v的注意力系数。
步骤4-5:使用一个附加的线性变换和一个非线性函数将节点嵌入映射到具有期望输出维数的向量空间:
R=σ(w9·Rr)#(17)
其中,w9是可训练权重矩阵,R的第i行,ri表示节点i的结构特征向量,则节点v的结构特征向量表示为rv
进一步,所述步骤5,堆叠第一节点特征、第二节点特征、第三节点特征,通过多层感知机输出最终的节点表征模型。具体步骤如下:
步骤5-1:堆叠第一节点特征、第二节点特征、第三节点特征,形成多层感知机的输入:
hv=concat(bv,dv,rv)#(18)
步骤5-2:使用多层感知机,形成最终的目标节点表示:
Figure BDA0004143500710000055
Figure BDA0004143500710000056
表示目标节点v的最终嵌入表示/>
Figure BDA0004143500710000057
进一步,所述步骤6,使用交叉熵损失函数训练所提出的节点表征模型。具体步骤如下:
使用半监督学习,在一小部分标记节点的指导下,通过反向传播和梯度下降最小化交叉熵来优化模型权重,从而学习有意义的节点嵌入。损失函数定义为:
Figure BDA0004143500710000058
其中,C是社区集合,yv[c]为节点v的真实所属社区,
Figure BDA0004143500710000059
节点v的预测的社区,VL是具有标签的节点集合。
进一步,所述步骤7,使用k-means聚类方法,将各个节点聚入各个社区,实现社区检测。具体步骤如下:
步骤7-1:从数据中选择k个对象作为初始的聚类中心;
步骤7-2:分别计算每个聚类对象到每个聚类中心的距离,将聚类对象划分到距离最近的聚类中心的类中,分成k个簇;
步骤7-3:计算K个簇样本的平均值作新的质心;
步骤7-4:循环执行步骤7-2和7-3,直到质心位置不变,则算法停止。
有益效果:本发明从节点特征和节点结构特征两个方面入手,学习更好的节点表征,从而提高社区检测的准确性;首先,将不同类型的节点映射至同一空间,然后,直接使用GCN模型求得节点特征。然后,从异构性和重叠性两个方面考虑节点的结构特征。在异构性方面:首先,根据节点间边关系划分多个子图。然后,使用多个GCN模型求得在不同边关系情况下的目标节点表征。接着,使用注意力机制,聚合目标节点的多个表征。最后,映射到期望的维度空间,形成该视图下的目标节点表征。在重叠性方面:首先,根据启发式算法求得节点结构特征。然后,在不同阶的情况下,使用邻接矩阵A来聚合邻居的特征。接着,使用注意力机制,聚合多阶邻居特征。最后,映射到期望的维度空间,生成该视图下的目标节点表征。最后,对三个角度下的目标节点表征进行堆叠,使用MLP生成最终的目标节点表征。
附图说明
图1是本发明的步骤示意图。
图2是本发明的总体模型框架图。
图3是本发明计算节点特征的流程图。
图4是本发明根据异构性计算节点结构特征的流程图。
图5是本发明根据重叠性计算节点结构特征的流程图。
具体实施方式
下面结合附图对本发明做进一步的说明。基于节点结构特征的图卷积神经网络的社区发现方法,包括如下步骤:
整体流程如图2所示,
步骤1:将图中的每个节点映射到一个相同的潜在向量空间中,再对数据进行预处理,将数据拆分成训练集、测试集和验证集。具体步骤如下:
步骤1-1:将用于社区网络的图定义为G=(V,E,Tv,Te),它包含了具有多种节点类型Tv的多个节点V和具有多种边类型Te的边E,该图有多种边类型|Te|>1,边类型映射函数:
Figure BDA0004143500710000061
节点个数为N,节点v的邻居表示为N(v),euv表示从节点u到v的连接边。任何节点v,其邻居节点集可以表示为/>
Figure BDA0004143500710000071
Figure BDA0004143500710000072
用/>
Figure BDA0004143500710000073
表示初始节点特征矩阵,节点v的初始特征向量为/>
Figure BDA0004143500710000074
对不同类型的节点应用特定类型的线性变换,将其映射到同一潜在空间中,形成映射后矩阵H。
对于t∈Tv型的节点v∈Vt有:
Figure BDA0004143500710000075
其中Wt是t关系下的可训练权重矩阵,
Figure BDA0004143500710000076
是在t关系下节点v的初始特征向量。
对于同时具有多种类型的节点v有:
Figure BDA0004143500710000077
步骤1-2:将数据集划分成训练集、验证集和测试集以进行实验。
步骤2:该步骤框图如图3所示,首先求得节点特征,直接使用两层GCN模型对节点进行处理,具体方法如下:
Figure BDA0004143500710000078
其中,其中,w0、w1、w2和w3是可训练权重矩阵,σ是RELU激活函数,
Figure BDA0004143500710000079
经过两层GCN后,节点v表示为bv。/>
步骤3:该步骤框图如图4所示,根据图的边关系类型,将图分为M个关系子图;针对每个关系子图,分别使用GCN模型,求得目标节点在不同关系下的特征向量;使用多头注意力机制聚合多关系下的节点特征,形成第二节点特征。具体步骤如下:
步骤3-1:根据图中节点间边关系的不同种类,划分出M个子图,使用GCN模型,求得每个子图中的目标节点表征。
对于在根据关系I∈Te划分的子图中节点v表示为:
Figure BDA00041435007100000710
其中,w4、w5、w6和w7是可训练权重矩阵,
Figure BDA00041435007100000711
经过两层GCN后,节点v表示为/>
Figure BDA0004143500710000081
步骤3-2:使用注意力机制,为不同关系下的目标节点分配不同的权重,融合在不同关系下目标节点v的表征。假设关系集合为Pv,注意力机制公式如下:
Figure BDA0004143500710000082
其中,qT是查询向量,
Figure BDA0004143500710000083
是在关系p下节点v的重要性分数,/>
Figure BDA0004143500710000084
是在关系I下节点v的注意力系数。
步骤3-3:使用一个附加的线性变换和一个非线性函数将节点嵌入映射到具有期望输出维数的向量空间:
Figure BDA0004143500710000085
其中,w8是可训练权重矩阵,
Figure BDA0004143500710000086
是在映射空间中节点v聚合多关系的特征,dv是第二节点特征。
步骤4:该步骤框图如图5所示,考虑节点之间重叠邻居的特征,根据邻接矩阵求得节点的结构表示,形成节点的结构特征矩阵;考虑多阶邻居关系,形成多阶的邻接矩阵,根据结构特征矩阵和邻接矩阵,形成在每阶层情况下的节点表征矩阵,最后使用多层感知机连接,形成第三节点特征。具体步骤如下:
步骤4-1:结合节点特征和边特征,得出节点结构特征:
Figure BDA0004143500710000087
其中,Aij是邻接矩阵,Ni是节点i的邻居节点集合,函数
Figure BDA0004143500710000088
Figure BDA0004143500710000089
步骤4-2:使用结构特征向量qv生成对角矩阵Qv
Q=diag(q)#(10)
步骤4-3:通过未归一化的邻接矩阵A来聚合邻居的特征:
r=AQ#(11)
根据多阶邻接矩阵公式(12),考虑多跳重叠邻居,可得出聚合多阶邻居后的特征:
A(m)=A(m-1)A(1)#(12)
r(m)=A(m)Q#(13)
步骤4-4:使用注意力机制,为不同关系下的目标节点分配不同的权重,融合在不同关系下节点表征:
Figure BDA0004143500710000091
其中,
Figure BDA0004143500710000092
是查询向量,/>
Figure BDA0004143500710000093
是在n阶下节点v的重要性分数,/>
Figure BDA0004143500710000094
是在n阶下节点v的注意力系数。
步骤4-5:使用一个附加的线性变换和一个非线性函数将节点嵌入映射到具有期望输出维数的向量空间:
R=σ(w9·Rr)#(17)
其中,w9是可训练权重矩阵,R的第i行,ri表示节点i的结构特征向量,则节点v的结构特征向量表示为rv
步骤5:堆叠第一节点特征、第二节点特征、第三节点特征,通过多层感知机输出最终的节点表征模型。具体步骤如下:
步骤5-1:堆叠第一节点特征、第二节点特征、第三节点特征,形成多层感知机的输入:
hv=concat(bv,dv,rv)#(18)
步骤5-2:使用多层感知机,形成最终的目标节点表示:
Figure BDA0004143500710000095
Figure BDA0004143500710000096
表示目标节点v的最终嵌入表示/>
Figure BDA0004143500710000097
步骤6:使用交叉熵损失函数训练所提出节点表征的模型。具体步骤如下:
使用半监督学习,在一小部分标记节点的指导下,通过反向传播和梯度下降最小化交叉熵来优化模型权重,从而学习有意义的节点嵌入。损失函数定义为:
Figure BDA0004143500710000101
其中,C是社区集合,yv[c]为节点v的真实所属社区,
Figure BDA0004143500710000102
节点v的预测的社区,VL是具有标签的节点集合。
步骤7:使用k-means聚类方法,将各个节点聚入各个社区,实现社区检测。
具体步骤如下:
步骤7-1:从数据中选择k个对象作为初始的聚类中心;
步骤7-2:分别计算每个聚类对象到每个聚类中心的距离,将聚类对象划分到距离最近的聚类中心的类中,分成k个簇;
步骤7-3:计算K个簇样本的平均值作新的质心;
步骤7-4:循环执行步骤7-2和7-3,直到质心位置不变,则算法停止。

Claims (8)

1.一种基于节点结构特征的图卷积神经网络的社区发现方法,其特征在于,所述方法包括如下步骤:
步骤1:对图进行预处理,将图中不同类型的节点映射到同一个潜在向空间中;
步骤2:使用GCN模型,学习目标节点的第一节点特征;
步骤3:根据图的边关系类型,将图分为M个关系子图;针对每个关系子图,分别使用GCN模型,求得目标节点在不同关系下的特征向量;使用多头注意力机制聚合多关系下的节点特征,形成第二节点特征;
步骤4:考虑节点之间重叠邻居的特征,根据邻接矩阵求得节点的结构表示,形成节点的结构特征矩阵;考虑多阶邻居关系,形成多阶的邻接矩阵,根据结构特征矩阵和邻接矩阵,形成在每阶层情况下的节点表征矩阵,最后使用多层感知机连接,形成第三节点特征;
步骤5:堆叠第一节点特征、第二节点特征、第三节点特征,通过多层感知机输出最终的节点表征模型;
步骤6:使用交叉熵损失函数训练所述节点表征模型;
步骤7:使用k-means聚类方法,将各个节点聚入各个社区,实现社区检测。
2.根据权利要求1所述的基于节点结构特征的图卷积神经网络的社区发现方法,其特征在于:所述步骤1的具体步骤如下:
步骤1-1:将用于社区网络的图定义为G=(V,E,Tv,Te),它包含了具有多种节点类型Tv的多个节点V和具有多种边类型Te的边E,该图有多种边类型|Te|>1,边类型映射函数:
Figure FDA0004143500700000011
节点个数为N,节点v的邻居表示为N(v),euv表示从节点u到v的连接边;任何节点v,其邻居节点集表示为/>
Figure FDA0004143500700000012
Figure FDA0004143500700000013
用/>
Figure FDA0004143500700000014
表示初始节点特征矩阵,节点v的初始特征向量为/>
Figure FDA0004143500700000015
对不同类型的节点应用特定类型的线性变换,将其映射到同一潜在空间中,形成映射后矩阵H;
对于t∈Tv型的节点v∈Vt有:
Figure FDA0004143500700000016
其中Wt是t关系下的可训练权重矩阵,
Figure FDA0004143500700000017
是在t关系下节点v的初始特征向量;
对于同时具有多种类型的节点v有:
Figure FDA0004143500700000021
步骤1-2:将数据集划分成训练集、验证集和测试集以进行实验。
3.根据权利要求2所述的基于节点结构特征的图卷积神经网络的社区发现方法,其特征在于:所述步骤2的具体步骤如下:
使用两层GCN模型对节点进行处理:
Figure FDA0004143500700000022
其中,w0、w1、w2和w3是可训练权重矩阵,σ是RELU激活函数,
Figure FDA0004143500700000023
经过两层GCN后,节点v表示为bv。/>
4.根据权利要求3所述的基于节点结构特征的图卷积神经网络的社区发现方法,其特征在于:所述步骤3的具体步骤如下:
步骤3-1:根据图中节点间边关系的不同种类,划分出M个子图,使用GCN模型,求得每个子图中的目标节点表征;
对于在根据关系I∈Te划分的子图中节点v表示为:
Figure FDA0004143500700000024
其中,w4、w5、w6和w7是可训练权重矩阵,
Figure FDA0004143500700000025
经过两层GCN后,节点v表示为/>
Figure FDA0004143500700000026
步骤3-2:使用注意力机制,为不同关系下的目标节点分配不同的权重,融合在不同关系下目标节点v的表征;假设关系集合为Pv,注意力机制公式如下:
Figure FDA0004143500700000027
Figure FDA0004143500700000028
Figure FDA0004143500700000029
其中,qT是查询向量,
Figure FDA00041435007000000210
是在关系p下节点v的重要性分数,/>
Figure FDA00041435007000000211
是在关系I下节点v的注意力系数;
步骤3-3:使用一个附加的线性变换和一个非线性函数将节点嵌入映射到具有期望输出维数的向量空间:
Figure FDA0004143500700000031
其中,w8是可训练权重矩阵,
Figure FDA0004143500700000032
是在映射空间中节点v聚合多关系的特征,dv是第二节点特征。
5.根据权利要求4所述的基于节点结构特征的图卷积神经网络的社区发现方法,其特征在于:所述步骤4的具体步骤如下:
步骤4-1:结合节点特征和边特征,得出节点结构特征:
Figure FDA0004143500700000033
其中,Aij是邻接矩阵,Ni是节点i的邻居节点集合,函数
Figure FDA0004143500700000034
Figure FDA00041435007000000311
步骤4-2:使用结构特征向量qv生成对角矩阵Qv
Q=diag(q)#(10)
步骤4-3:通过未归一化的邻接矩阵A来聚合邻居的特征:
r=AQ#(11)
根据多阶邻接矩阵公式(12),考虑多跳重叠邻居,得出聚合多阶邻居后的特征:
A(m)=A(m-1)A(1)#(12)
r(m)=A(m)Q#(13)
步骤4-4:使用注意力机制,为不同关系下的目标节点分配不同的权重,融合在不同关系下节点表征:
Figure FDA0004143500700000035
Figure FDA0004143500700000036
Figure FDA0004143500700000037
其中,
Figure FDA0004143500700000038
是查询向量,/>
Figure FDA0004143500700000039
是在n阶下节点v的重要性分数,/>
Figure FDA00041435007000000310
是在n阶下节点v的注意力系数;
步骤4-5:使用一个附加的线性变换和一个非线性函数将节点嵌入映射到具有期望输出维数的向量空间:
R=σ(w9·Rr)#(17)
其中,w9是可训练权重矩阵R的第i行,ri表示节点i的结构特征向量,则节点v的结构特征向量表示为rv
6.根据权利要求5所述的基于节点结构特征的图卷积神经网络的社区发现方法,其特征在于:所述步骤5的具体步骤如下:
步骤5-1:堆叠第一节点特征、第二节点特征、第三节点特征,形成多层感知机的输入:
hv=concat(bv,dv,rv)#(18)
步骤5-2:使用多层感知机,形成最终的目标节点表示:
Figure FDA0004143500700000041
Figure FDA0004143500700000042
表示目标节点v的最终嵌入表示/>
Figure FDA0004143500700000043
7.根据权利要求6所述的基于节点结构特征的图卷积神经网络的社区发现方法,其特征在于:所述步骤6的具体步骤如下:
使用半监督学习,通过反向传播和梯度下降最小化交叉熵来优化模型权重,损失函数定义为:
Figure FDA0004143500700000044
其中,C是社区集合,yv,c-为节点v的真实所属社区,
Figure FDA0004143500700000045
节点v的预测的社区,VL是具有标签的节点集合。
8.根据权利要求1所述的基于节点结构特征的图卷积神经网络的社区发现方法,其特征在于:所述步骤7的具体步骤如下:
步骤7-1:从数据中选择k个对象作为初始的聚类中心;
步骤7-2:分别计算每个聚类对象到每个聚类中心的距离,将聚类对象划分到距离最近的聚类中心的类中,分成k个簇;
步骤7-3:计算K个簇样本的平均值作新的质心;
步骤7-4:循环执行步骤7-2和7-3,直到质心位置不变,则算法停止。
CN202310297088.7A 2023-03-24 2023-03-24 基于节点结构特征的图卷积神经网络的社区发现方法 Pending CN116226467A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310297088.7A CN116226467A (zh) 2023-03-24 2023-03-24 基于节点结构特征的图卷积神经网络的社区发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310297088.7A CN116226467A (zh) 2023-03-24 2023-03-24 基于节点结构特征的图卷积神经网络的社区发现方法

Publications (1)

Publication Number Publication Date
CN116226467A true CN116226467A (zh) 2023-06-06

Family

ID=86580606

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310297088.7A Pending CN116226467A (zh) 2023-03-24 2023-03-24 基于节点结构特征的图卷积神经网络的社区发现方法

Country Status (1)

Country Link
CN (1) CN116226467A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117237141A (zh) * 2023-11-16 2023-12-15 长春大学 一种基于自适应曲率的双曲图卷积网络的社区检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117237141A (zh) * 2023-11-16 2023-12-15 长春大学 一种基于自适应曲率的双曲图卷积网络的社区检测方法

Similar Documents

Publication Publication Date Title
CN111489358B (zh) 一种基于深度学习的三维点云语义分割方法
Rhee et al. Active and semi-supervised learning for object detection with imperfect data
CN109800692B (zh) 一种基于预训练卷积神经网络的视觉slam回环检测方法
CN107229942A (zh) 一种基于多个分类器的卷积神经网络快速分类方法
CN106021990B (zh) 一种将生物基因以特定的性状进行分类与自我识别的方法
CN111931505A (zh) 一种基于子图嵌入的跨语言实体对齐方法
CN108304380A (zh) 一种融合学术影响力的学者人名消除歧义的方法
Pan et al. Clustering of designers based on building information modeling event logs
CN113157957A (zh) 一种基于图卷积神经网络的属性图文献聚类方法
CN112199532A (zh) 一种基于哈希编码和图注意力机制的零样本图像检索方法及装置
CN113505239B (zh) 一种结合图注意力和属性聚类的实体对齐方法
CN115270007B (zh) 一种基于混合图神经网络的poi推荐方法及系统
CN116226467A (zh) 基于节点结构特征的图卷积神经网络的社区发现方法
CN114299362A (zh) 一种基于k-means聚类的小样本图像分类方法
CN114254093A (zh) 多空间知识增强的知识图谱问答方法及系统
CN109376790A (zh) 一种基于渗流分析的二元分类方法
CN114969367A (zh) 基于多方面子任务交互的跨语言实体对齐方法
CN113516019A (zh) 高光谱图像解混方法、装置及电子设备
CN115601745A (zh) 一种面向应用端的多视图三维物体识别方法
CN115828988A (zh) 一种基于自监督的异构图表示学习方法
CN114298854A (zh) 一种联合学习表示和对齐的弱监督用户身份链接方法
CN114254738A (zh) 双层演化的动态图卷积神经网络模型构建方法及应用
CN114758172A (zh) 一种基于安全对比自集成框架的半监督医学图像分类方法
CN112465066A (zh) 一种基于clique匹配和分层池化的图分类方法
Wen et al. Discriminative graph representation learning with distributed sampling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination