CN117421671A

CN117421671A - 面向引文网络的频率自适应静态异质图节点分类方法

Info

Publication number: CN117421671A
Application number: CN202311732766.4A
Authority: CN
Inventors: 宋春瑶; 廉亚红; 李玉奇; 袁晓洁
Original assignee: Nankai University
Current assignee: Nankai University
Priority date: 2023-12-18
Filing date: 2023-12-18
Publication date: 2024-01-19
Anticipated expiration: 2043-12-18
Also published as: CN117421671B

Abstract

本发明公开了一种面向引文网络的频率自适应静态异质图节点分类方法，首先从引文网络数据中提取出特征，构建静态异质图；再忽略静态异质图的顶点类型和边类型，通过受约束的马尔可夫过程得到转移状态矩阵收敛时图的稳定的转移状态，再将随机游走概率大于给定阈值的顶点对作为新的类型的边加入到静态异质图中；再通过空间线性映射将不同的顶点类型从原始空间映射到同一向量空间中，再对每个顶点来自一阶邻居的信号分离高频和低频信号，并通过个性化注意力机制为每个顶点聚合高低频信号；最后，通过空间线性映射将顶点的表示向量映射回原始空间，通过加权交叉熵和受约束的注意力机制训练模型，再通过分类器将引文网络数据的顶点进行分类。

Description

面向引文网络的频率自适应静态异质图节点分类方法

技术领域

本发明属于大数据下的图数据处理领域，具体是一种面向引文网络的频率自适应静态异质图节点分类方法。

背景技术

随着大数据时代的到来，静态异质图（heterogeneous graph）上的顶点分类问题已成为热门研究领域。静态异质图包含多种类型的顶点，每个顶点均携带着特征，并且顶点之间存在各种复杂关系，可以被用来建模各种复杂的交互场景。分类问题作为一个基本方法，在各种场景下都有着广泛的应用，例如：社交网络中的用户分类、学术网络中的顶点分类、化学分子分类、推荐系统中的商品分类以及异常检测等实际问题。

大多数静态异质图顶点分类的图神经网络框架都是继承自静态同质图神经网络的基本框架，基于邻居采样、消息传递和消息聚合这一范式。然而，该框架在处理静态异质图时存在一些局限性，如该框架本质上是根据相似度传递邻居的特征，本质上是一个低频滤波器（只利用相似的特征），不能利用顶点之间的差异特征；此外，该框架在捕获高阶邻居的信息时会存在过拟合的现象。为了克服这些困难，一些研究提出了很多改进的静态异质图顶点分类方法，如异质图注意力网络（HAN）和异质图卷积注意力网络（HAGCN）等都是从注意力机制的角度从邻居顶点获得信息。

基于上述描述，设计一种频率自适应的异质图神经网络，并为每个顶点个性化地选择自身所需的高、低频信号并完成顶点分类任务，具有重要的研究意义和应用价值。

发明内容

针对现有技术的不足，本发明拟解决的技术问题是，提供一种面向引文网络的频率自适应静态异质图节点分类方法。

本发明解决所述技术问题的技术方案是，提供一种面向引文网络的频率自适应静态异质图节点分类方法，其特征在于，该方法包括以下步骤：

步骤1、从引文网络数据中提取出每个顶点的特征向量X，第c种顶点类型的顶点特征向量记为X_c；同时建立静态异质图；再将静态异质图中所有的顶点划分为训练集、验证集和测试集；

步骤2、利用受约束的马尔可夫过程对静态异质图进行处理，得到稳定的转移状态；

步骤3、结合步骤2得到稳定的转移状态，过滤出指定顶点类型的顶点集合，并且选择该顶点集合内的随机游走概率大于给定阈值θ的顶点对，θ为超参数；再将这些顶点对作为新的类型的边加入到步骤1得到的静态异质图中，得到含稳态边的静态异质图；

步骤4、空间线性映射：对含稳态边的静态异质图中的每种顶点类型分别各自学习一个线性函数，将不同的顶点类型从原始空间映射到同一向量空间中，如式（3）所示：

（3）

式（3）中，第c种顶点类型的顶点特征向量X_c通过式（3）映射到同一向量空间中，记为H_c；W_c和B_c分别表示第c种顶点类型的权重矩阵和偏移矩阵，它们是可学习的参数；σ是sigmoid激活函数；

步骤5、在线性映射后的同一向量空间内对每个顶点来自一阶邻居的信号依次进行高低频信号分离和个性化注意力机制聚合，得到每个顶点在线性映射后的空间中的向量表示；

步骤6、通过线性变换将任意一个顶点i在线性映射后的空间中的向量表示映射回同一向量空间中，再引入残差连接，得到顶点i的新向量表示/>；

步骤7、在受约束的注意力机制下进行分类：

S7.1、经过步骤6映射回同一向量空间后，根据每个顶点i的新向量表示进行分类，得到顶点i的新向量表示/>的预测顶点类别/>；

S7.2、通过受约束的注意力机制增强注意机制中高频信号和低频信号之间的差异，受约束的注意力机制的损失函数L_α如式（12）所示：

（12）

式（12）中，c_u和c_v表示顶点u和顶点v的标签；N(v)表示与顶点v具有相同顶点类型的邻居，表示异或操作；γ_v表示与顶点v的标签不同的邻居的比例；/>和/>是超参数；V是所有顶点个数，/>是顶点v的低频注意力分数；/>是顶点v的高频注意力分数；

S7.3、结合加权交叉熵损失函数和受约束的注意力机制L_α得到在进行分类时的损失函数L，如式（13）所示：

（13）

式（13）中，为加权交叉熵损失函数，w_i是顶点i在损失函数L中的权重，y_i顶点i的真实顶点类别；β是用来平衡损失函数L_α的超参数；

S7.4、利用损失函数L在训练集上对模型进行一次迭代训练，当在验证集上预测类别的准确率超过M次都没有提升时，M为超参数，返回步骤4；直至模型收敛，然后对于测试集中的第m个顶点，利用步骤6得到它的新向量表示，再通过步骤S7.1来预测测试集中顶点的顶点类别。

与现有技术相比，本发明的有益效果在于：

（1）本发明首次提出了在静态异质图上使用马尔可夫过程来发现拓扑连接紧密的高阶邻居并加以应用，在避免过平滑的情况下来捕获高阶的邻居；并且首次提出了在静态异质图上使用高频信号的思路，通过共享注意力机制的方式为每个顶点分离来自它邻居的高低频信号，之后再为每个顶点个性化地聚合高低频信号。

（2）本发明首先从输入的数据集中，提取出实体的特征、类型以及实体之间复杂的关系，构建一个静态异质图；再忽略静态异质图的顶点类型和边类型，通过受约束的马尔可夫过程得到转移状态矩阵收敛时图的稳定的转移状态，再将随机游走概率大于给定阈值θ的顶点对作为新的类型的边加入到静态异质图中，得到含稳态边的静态异质图；再通过空间线性映射将不同的顶点类型从原始空间映射到同一向量空间中，再对每个顶点来自一阶邻居的信号分离高频和低频信号，并通过个性化注意力机制为每个顶点聚合高低频信号；最后，通过空间线性映射将顶点的表示向量映射回原始空间，通过加权交叉熵和受约束的注意力机制训练模型，再通过分类器将顶点进行分类。

（3）本发明不仅可以自适应地利用高频和低频信号，从而可以更准确地分类具有更灵活拓扑结构的顶点，而且在静态异质图中捕获高阶邻居信息时不会发生过平滑现象。

（4）本发明解决了静态异质图上的顶点分类任务，是一种半监督学习算法，即利用已知的部分顶点的标签，通过训练模型来预测剩余顶点的类别。

（5）本发明提可以避免在对高频信号的需求较少时退化为低频信号，以提高分类准确性和泛化能力。

（6）在引文网络的两个真实数据集中，本发明在顶点分类的各项指标上明显优于现有的方法。

附图说明

图1为本发明的整体分类流程图；

图2为本发明实施例2中的受约束的马尔可夫过程和现有技术中的元路径处理静态异质图的效果对比图。

具体实施方式

下面给出本发明的具体实施例。具体实施例仅用于进一步详细说明本发明，不限制本发明权利要求的保护范围。

本发明提供了一种面向引文网络的频率自适应静态异质图节点分类方法（简称方法，如图1所示），其特征在于，该方法用于引文网络的顶点分类，包括以下步骤：

步骤1、对输入数据进行预处理：从引文网络数据中提取出每个顶点的特征向量X，第c种顶点类型的顶点特征向量记为X_c；同时建立静态异质图；再将静态异质图中所有的顶点划分为训练集、验证集和测试集；

优选地，步骤1具体是：将引文网络数据中的实体携带的多模态信息进行统计分析，提取出每个顶点的特征向量X；引文网络数据的顶点类型为作者、论文、术语和会场这四种类型，其中第c种类型的顶点的特征向量记为X_c；同时利用引文网络数据中的顶点类型和交互关系（即顶点之间不同的边类型）建立一个静态异质图；再将静态异质图中所有的顶点按照比例随机划分为训练集、验证集和测试集。

优选地，步骤1中，引文网络数据采用DBLP数据集或ACM数据集。当采用DBLP数据集时，边类型为作者（源顶点）-论文（目标顶点）、论文-术语、论文-会场、论文-作者、术语-论文、会场-论文这六种边类型；当采用ACM数据集时，边类型为作者-论文、论文-主题、论文-术语、论文-会场、论文-作者、术语-论文、会场-论文、主题-论文这八种边类型。边类型的形式为源顶点-目标顶点，例如作者-论文，即作者为源顶点、论文为目标顶点。

优选地，步骤1中，当采用DBLP数据集时对作者顶点进行分类，将作者顶点划分为数据库、数据挖掘、人工智能和信息检索四种标签；当采用ACM数据集时对论文顶点进行分类，将论文顶点划分为数据库、无线通讯和数据挖掘三种标签。

优选地，步骤1中，所述多模态信息包括学术论文的文本及照片、论文作者的照片及视频、术语和会场的相关描述信息。

优选地，步骤1中，为了便于计算，通过作者-论文-作者的桥接模式下采样得到引文网络的子静态异质图。

步骤2、利用受约束的马尔可夫过程对静态异质图进行处理，得到转移状态矩阵收敛时的图的稳定的转移状态：

S2.1、忽略静态异质图的顶点类型和边类型，得到一个加权邻接矩阵A，加权邻接矩阵A中的每一个元素表示顶点i和顶点j之间的边数；再根据加权邻接矩阵A，得到度矩阵D，度矩阵D中的每一个元素/>；

S2.2、根据加权邻接矩阵A和度矩阵D，得到状态转移矩阵M（即顶点之间的随机游走概率）的初始状态转移矩阵，M₀中的每一个元素M₀[i,j]表示从顶点i到顶点j的随机游走概率；

S2.3、根据初始状态转移矩阵M₀利用广义图扩散获得每一次迭代后的顶点之间的随机游走概率M_k，k=1,2,3…N，k表示迭代次数；同时对每一次迭代后得到的M_k依次进行扩张操作和修剪操作来控制随机游走过程，以发现紧密连接的社区，直至M_k不再发生变化，保留此时的M_k作为稳定的转移状态；

优选地，步骤S2.3中，广义图扩散的计算公式为；；/>表示前一次迭代的随机游走概率；

优选地，步骤S2.3中，扩张操作通过矩阵的Hadamard幂来优化拓扑结构，如式（1）所示；扩张操作增大了较大的随机游走概率，减少了较小的随机游走概率，有助于发现拓扑结构上紧密相关的顶点：

（1）

式（1）中，r是扩张因子，它是一个非线性操作。

优选地，步骤S2.3中，修剪操作是移除随机游走概率≤给定阈值θ的边，使静态异质图变得稀疏，有助于发现紧密相关的高阶邻居，如式（2）所示：

（2）

式（2）中，θ为超参数，尝试不同的值后，选择效果最好的结果作为该参数的取值。

步骤3、静态异质图中稳态边的构建：结合步骤2得到稳定的转移状态（即S2.3得到的不再变化的M_k），过滤出指定顶点类型的顶点集合，并且选择该顶点集合内的随机游走概率大于给定阈值θ的顶点对；再将这些顶点对作为新的类型的边加入到步骤1得到的静态异质图中，得到含稳态边的静态异质图；

步骤4、空间线性映射：对含稳态边的静态异质图中的每种顶点类型分别各自学习一个线性函数，将不同的顶点类型从原始空间映射到同一向量空间中（即将引文网络中的作者、论文、术语和会场四种顶点类型从原始空间映射到同一向量空间中），如式（3）所示：

（3）

S5.1、首先通过注意力机制计算一个顶点（即源顶点s）与它的一阶邻居（即目标顶点t）之间的权重系数ω_st；再将权重系数ω_st利用Softmax进行归一化，得到源顶点s和目标顶点t之间注意力权重α_st；

优选地，步骤S5.1中，权重系数ω_st的计算公式如式（4）所示：

（4）

式（4）中，ω_st为源顶点s和目标顶点t之间的权重系数；K(s)表示源顶点s的关键词向量，Q(t)表示目标顶点t的查询向量，本质上是一个可学习向量；是用于区分每个边类型的不同矩阵，每个边类型/>都有一个可学习的矩阵/>；μ是一个先验张量，用于自适应缩放注意力；τ(s)为源顶点s的顶点类型；/>为源顶点s和目标顶点t之间的边e的边类型；τ(t)为目标顶点t的顶点类型；d是当前顶点向量表示的维数；N(s)表示源顶点s的一阶邻居集合，目标顶点t应该属于该集合，即/>；

优选地，步骤S5.1中，注意力权重α_st的计算公式如式（5）所示：

（5）

S5.2、高低频信号分离：经过步骤S5.1的注意力机制使得特征相似的顶点之间权重大，不相似的顶点之间权重小，本质上是聚合相似信息（即低频信号）得到特征，但是忽略了不相似的信息（高频信号），因此本发明通过共享的注意力机制分离来自一阶邻居的高低频信号；

优选地，步骤S5.2具体是：先计算获取源顶点s和目标顶点t之间的低频信号的注意力权重和高频信号的注意力权重/>，其中/>等于源顶点s和目标顶点t之间的注意力权重α_st，/>等于权重系数ω_st依次进行取倒数和Softmax归一化；然后通过源顶点s的向量表示h_s加上源顶点s的一阶邻居集合N(s)中的向量表示的加权平均值，得到源顶点s的低频信号的向量表示/>；同时通过源顶点s的向量表示h_s减去源顶点s的一阶邻居集合N(s)中的所有向量表示的加权平均值，得到源顶点s的高频信号的向量表示/>。

优选地，步骤S5.2中，注意力权重和/>的计算公式如式（6）所示：

（6）

优选地，步骤S5.2中，源顶点s的低频信号的向量表示以及源顶点s的高频信号的向量表示/>的计算公式如式（7）所示：

（7）

式（7）中，h_s为源顶点s的向量表示，已知其顶点类型c，进而从步骤4得到的H_c中得到源顶点s的向量表示h_s；h_t为目标顶点t的向量表示，已知其顶点类型c，进而从步骤4得到的H_c中得到目标顶点t的向量表示h_t；

S5.3、个性化注意力机制聚合：由于每个顶点对高频信号和低频信号的需求是不同的，因此需要为每个顶点将步骤S5.2的从一阶邻居中分离的高频信号和低频信号进行个性化聚合，得到该顶点在线性映射后的空间中的向量表示；

优选地，步骤S5.3具体是：先对于任一顶点i，已知其顶点类型c，进而从步骤4得到的H_c中得到顶点i的向量表示h_i；再分别计算出顶点i在低频信号时的注意力权重以及在高频信号时的注意力权重，然后利用Softmax进行归一化，分别得到顶点i在低频信号上的注意力系数以及顶点i在高频信号上的注意力系数/>；再通过式（9）对顶点i从邻居中分离的低频信号和高频信号进行加权聚合，得到顶点i在线性映射后的空间中的向量表示/>。

优选地，步骤S5.3中，顶点i在低频信号上的注意力系数以及顶点i在高频信号上的注意力系数/>的计算公式如式（8）所示：

（8）

式（8）中，是一个共享的注意力向量，/>和表示权重矩阵，/>为顶点i的低频信号，/>为顶点i的高频信号，Softmax为归一化函数；

优选地，步骤S5.3中，加权聚合的计算公式如式（9）所示：

（9）

步骤6、映射回同一向量空间：通过线性变换将任意一个顶点i在线性映射后的空间中的向量表示映射回同一向量空间中，再引入残差连接，得到顶点i的新向量表示/>；

优选地，步骤6的具体过程如式（10）所示：

（10）

式（10）中，是每个顶点类型的线性变换，σ是sigmoid激活函数，res是残差连接。

步骤7、在受约束的注意力机制下进行分类：

S7.1、经过步骤6映射回同一向量空间后，根据每个顶点i的新向量表示利用线性分类器进行分类，得到顶点i的新向量表示/>的预测顶点类别/>；

优选地，步骤S7.1中，顶点i的新向量表示的预测顶点类别/>的计算公式如式（11）所示：

（11）

式（11）中，MLP是进行分类的线性分类器，是顶点i的新向量表示/>的预测顶点类别。

S7.2、由于在静态异质图数据集中，需要高频信号的顶点通常很少，而注意力机制可能会过度拟合低频信号，因此本发明通过受约束的注意力机制增强注意机制中高频信号和低频信号之间的差异，受约束的注意力机制的损失函数L_α如式（12）所示：

（12）

式（12）中，c_u和c_v表示顶点u和顶点v的标签；N(v)表示与顶点v具有相同顶点类型的邻居，表示异或操作，如果顶点u和顶点v的标签不同，则/>，否则/>；γ_v表示与顶点v的标签不同的邻居的比例；/>和/>是超参数；V是所有顶点个数，/>是顶点v的低频注意力分数；/>是顶点v的高频注意力分数；

（13）

S7.4、利用损失函数L在训练集上对模型进行一次迭代训练，当线性分类器在验证集上预测类别的准确率超过M次都没有提升时，M为超参数（根据数据集的大小与特点进行调整），返回步骤4；直至模型收敛（即达到指定的迭代次数或者损失函数L变为最小），然后对于测试集中的第m个顶点，利用步骤6得到它的新向量表示，再通过步骤S7.1来预测测试集中顶点的顶点类别。

实施例1：本实施例中，首先对本发明的方法进行有效性验证：分别在DBLP和ACM两个公开的引文网络数据集上进行顶点分类任务；所使用的数据集的基本统计属性和同质化的宏观评价指标（H.R.Macro）的描述信息如表1所示：

由表1可以看出，所使用的2个数据集包含多种顶点类型，以及不同的同质化的宏观评价指标可以从不同维度验证静态异质图顶点分类模型的表现。

然后，采用两个常用的评价指标F1-Macro（宏平均F1，每个类别下顶点F1的平均值）和F1-Micro（微平均F1，也等于准确率），每组实验均重复5次，表2是本发明的方法和其他方法在DBLP和ACM两个数据集上的引文网络的静态异质图顶点分类实验结果。

由表2可以看出，本发明方法相比于以往效果最好的方法，不同实验设置下，在性能上有不同程度的提升，对比结果充分说明了本发明提出的方法在静态异质图上的顶点分类任务上取得了优秀的效果。

实施例2：本实施例中，以DBLP引文网络中作者分类为例，引文网络是一种典型的异质图网络，有作者Au、论文P、术语T以及会场Ven四种顶点类型，有作者-论文、论文-术语、论文-会场、论文-作者、术语-论文、会场-论文六种边类型，每种顶点类型包含多个顶点，也就是每个Au中包含多个作者名，任务是对作者Au类型顶点进行分类，共有四个标签分别是数据库L₁、数据挖掘L₂、人工智能L₃、信息检索L₄；基于此设定，对比本发明的受约束的马尔可夫过程和现有技术中的元路径处理静态异质图的区别：由图2可以看出，引文网络的静态异质图中共有16个顶点，其中Au₁、Au₂是标签为L₁的作者顶点，Au₃、Au₄、Au₅、Au₆、Au₇是标签为L₂的作者顶点，标签相同为同质顶点，标签不同为异质顶点。P₁、P₂、P₃、P₄是论文顶点。Ven₁、Ven₂是会场顶点，T₁、T₂、T₃、T₄是术语顶点。通过多种边类型连接得到引文网络的静态异质图。以作者-论文-作者的桥接模式为例分离出引文网络的子静态异质图，得到多个异质作者顶点Au之间更简洁的关联关系。在引文网络的子静态异质图中，顶点Au₃和Au₄的拓扑关联并不紧密，而顶点Au₄和Au₇的拓扑关联很紧密。

使用元路径连接，会导致Au₃和Au₄两个顶点直接连接，但是Au₄和Au₇没有直接连接。利用受约束的马尔可夫过程得到的连接拓扑结构关联紧密的顶点（Au₄和Au₇），并且删除事实上关联不紧密的顶点（Au₃和Au₄）。本发明还可以应用于社交网络群组分类、多模态图片分类、推荐系统中的商品分类任务。

实施例3：本实施例中，以ACM引文网络为例，有作者Au、论文P、术语T以及会场Ven四种顶点类型，有作者-论文、论文-主题、论文-术语、论文-会场、论文-作者、术语-论文、会场-论文、主题-论文八种边类型，每种顶点类型包含多个顶点，也就是每个P中包含多个论文名，任务是对论文P类型顶点进行分类，共有三个标签分别是数据库、无线通讯、数据挖掘。

本发明未述及之处适用于现有技术。

Claims

1.一种面向引文网络的频率自适应静态异质图节点分类方法，其特征在于，该方法包括以下步骤：

（3）

步骤7、在受约束的注意力机制下进行分类：

（12）

（13）

2.根据权利要求1所述的面向引文网络的频率自适应静态异质图节点分类方法，其特征在于，步骤1具体是：将引文网络数据中的实体携带的多模态信息进行统计分析，提取出每个顶点的特征向量X；引文网络数据的顶点类型为作者、论文、术语和会场，其中第c种类型的顶点的特征向量记为X_c；同时利用引文网络数据中的顶点类型和顶点之间不同的边类型建立一个静态异质图；再将静态异质图中所有的顶点按照比例随机划分为训练集、验证集和测试集；

引文网络数据采用DBLP数据集或ACM数据集；当采用DBLP数据集时，边类型为作者-论文、论文-术语、论文-会场、论文-作者、术语-论文以及会场-论文；当采用ACM数据集时，边类型为作者-论文、论文-主题、论文-术语、论文-会场、论文-作者、术语-论文、会场-论文以及主题-论文。

3.根据权利要求1所述的面向引文网络的频率自适应静态异质图节点分类方法，其特征在于，步骤2具体是：

S2.2、根据加权邻接矩阵A和度矩阵D，得到状态转移矩阵M的初始状态转移矩阵，M₀中的每一个元素M₀[i,j]表示从顶点i到顶点j的随机游走概率；

S2.3、根据初始状态转移矩阵M₀利用广义图扩散获得每一次迭代后的顶点之间的随机游走概率M_k，k表示迭代次数；再对每一次迭代后得到的M_k依次进行扩张操作和修剪操作，直至M_k不再发生变化，保留此时的M_k作为稳定的转移状态。

4.根据权利要求3所述的面向引文网络的频率自适应静态异质图节点分类方法，其特征在于，步骤S2.3中，广义图扩散的计算公式为；/>表示前一次迭代的随机游走概率；

步骤S2.3中，扩张操作通过矩阵的Hadamard幂来优化拓扑结构，如式（1）所示：

（1）

式（1）中，r是扩张因子，它是一个非线性操作；

步骤S2.3中，修剪操作是移除随机游走概率≤给定阈值θ的边，如式（2）所示：

（2）

式（2）中，θ为超参数。

5.根据权利要求1所述的面向引文网络的频率自适应静态异质图节点分类方法，其特征在于，步骤5具体是：

S5.1、首先通过注意力机制计算源顶点s与它的一阶邻居即目标顶点t之间的权重系数ω_st；再将权重系数ω_st利用Softmax进行归一化，得到源顶点s和目标顶点t之间注意力权重α_st；

S5.2、通过共享的注意力机制分离来自一阶邻居的高低频信号；

S5.3、个性化注意力机制聚合：为每个顶点将步骤S5.2的从一阶邻居中分离的高频信号和低频信号进行个性化聚合，得到该顶点在线性映射后的空间中的向量表示。

6.根据权利要求5所述的面向引文网络的频率自适应静态异质图节点分类方法，其特征在于，步骤S5.1中，权重系数ω_st的计算公式如式（4）所示：

（4）

式（4）中，ω_st为源顶点s和目标顶点t之间的权重系数；K(s)表示源顶点s的关键词向量，Q(t)表示目标顶点t的查询向量，是一个可学习向量；是用于区分每个边类型的不同矩阵；μ是一个先验张量，用于自适应缩放注意力；τ(s)为源顶点s的顶点类型；/>为源顶点s和目标顶点t之间的边e的边类型；τ(t)为目标顶点t的顶点类型；d是当前顶点向量表示的维数；N(s)表示源顶点s的一阶邻居集合，目标顶点t应该属于该集合，即/>；

步骤S5.1中，注意力权重α_st的计算公式如式（5）所示：

（5）。

7.根据权利要求5所述的面向引文网络的频率自适应静态异质图节点分类方法，其特征在于，步骤S5.2具体是：先计算获取源顶点s和目标顶点t之间的低频信号的注意力权重和高频信号的注意力权重/>，其中/>等于源顶点s和目标顶点t之间的注意力权重α_st，/>等于权重系数ω_st依次进行取倒数和Softmax归一化；然后通过源顶点s的向量表示h_s加上源顶点s的一阶邻居集合N(s)中的向量表示的加权平均值，得到源顶点s的低频信号的向量表示/>；同时通过源顶点s的向量表示h_s减去源顶点s的一阶邻居集合N(s)中的所有向量表示的加权平均值，得到源顶点s的高频信号的向量表示/>；

步骤S5.3具体是：先对于任一顶点i，已知其顶点类型c，进而从步骤4得到的H_c中得到顶点i的向量表示h_i；再分别计算出顶点i在低频信号时的注意力权重以及在高频信号时的注意力权重，然后利用Softmax进行归一化，分别得到顶点i在低频信号上的注意力系数以及顶点i在高频信号上的注意力系数/>；再对顶点i从邻居中分离的低频信号和高频信号进行加权聚合，得到顶点i在线性映射后的空间中的向量表示/>。

8.根据权利要求7所述的面向引文网络的频率自适应静态异质图节点分类方法，其特征在于，步骤S5.2中，注意力权重和/>的计算公式如式（6）所示：

（6）

步骤S5.2中，源顶点s的低频信号的向量表示以及源顶点s的高频信号的向量表示/>的计算公式如式（7）所示：

（7）

步骤S5.3中，顶点i在低频信号上的注意力系数以及顶点i在高频信号上的注意力系数/>的计算公式如式（8）所示：

（8）

式（8）中，是一个共享的注意力向量，/>和/>表示权重矩阵，/>为顶点i的低频信号，/>为顶点i的高频信号，Softmax为归一化函数；

步骤S5.3中，加权聚合的计算公式如式（9）所示：

（9）。

9.根据权利要求1所述的面向引文网络的频率自适应静态异质图节点分类方法，其特征在于，步骤6的具体过程如式（10）所示：

（10）

10.根据权利要求1所述的面向引文网络的频率自适应静态异质图节点分类方法，其特征在于，步骤S7.1中，顶点i的新向量表示的预测顶点类别/>的计算公式如式（11）所示：

（11）