CN116628597B

CN116628597B - 一种基于关系路径注意力的异质图节点分类方法

Info

Publication number: CN116628597B
Application number: CN202310896610.3A
Authority: CN
Inventors: 王翔; 邓维康
Original assignee: Fujian University Of Science And Technology
Current assignee: Fujian University Of Science And Technology
Priority date: 2023-07-21
Filing date: 2023-07-21
Publication date: 2023-10-20
Anticipated expiration: 2043-07-21
Also published as: CN116628597A

Abstract

本发明提供了金融风险预测技术领域的一种基于关系路径注意力的异质图节点分类方法，包括如下步骤：步骤S1、获取异质图的数据集，将所述数据集划分为训练集、验证集和测试集，分别提取所述训练集、验证集以及测试集的节点特征矩阵和邻接矩阵集合；步骤S2、基于关系路径注意力模块、节点路径注意力模块以及输出模块构建一节点分类模型；步骤S3、利用所述训练集对节点分类模型进行训练，利用所述验证集对训练后的节点分类模型进行验证；步骤S4、利用所述测试集对验证后的节点分类模型进行测试，并不断优化所述节点分类模型的超参数；步骤S5、利用测试后的所述节点分类模型进行异质图节点分类。本发明的优点在于：极大的提升了金融风险预测精度。

Description

一种基于关系路径注意力的异质图节点分类方法

技术领域

本发明涉及金融风险预测技术领域，特别指一种基于关系路径注意力的异质图节点分类方法。

背景技术

图神经网络(Graph Neural Networks，简称GNN)是一种用于处理图数据的深度学习方法，已经在许多领域取得了成功，如节点分类、链接预测、社区发现等。图数据可以分为同质图和异质图，其中的异质图指由不同类型的节点和边组成的图，在许多现实世界的场景中广泛存在，如社交网络中的用户和用户间的联系，生物学中的分子结构等。异质图的节点分类是GNN的一项重要任务，其目标是将每个节点分类到相应的类别中，以便更好地理解和分析异质图的结构和特征。

异质图的节点分类在各个领域都具有较为广泛的应用，如推荐系统、金融风险评估、医疗诊断等。在推荐系统中，可以使用异质图来表示用户、商品和交互等信息，并通过节点分类来预测用户的兴趣和行为；在金融风险评估中，可以使用异质图来表示客户、资产和交易等信息，并通过节点分类来预测客户的信用等级和风险水平；在医疗诊断中，可以使用异质图来表示疾病、症状、药物等信息，并通过节点分类来预测疾病的类型和严重程度。总之，异质图的节点分类在实际生活中具有重要应用，可以帮助我们更好地理解和分析复杂的图数据，并在多个领域中实现更准确的预测和决策。

由于异质图具有多种类型的节点和边，相比于同质图具有更加复杂的结构，同时蕴含着更加丰富的结构信息和高阶的语义信息。在异质图上进行节点分类通常采用元路径法，即使用异质图上的元路径来定义不同类型节点之间的关系，并利用元路径推导出节点之间的相似性，然后使用GNN对节点进行编码和分类。然而，元路径法无法捕捉到异质图中节点的高阶语义信息，同时也无法学习到元路径以外的一些特征表示信息，导致异质图节点分类应用于金融风险预测的精度欠佳。

因此，如何提供一种基于关系路径注意力的异质图节点分类方法，实现提升金融风险预测精度，成为一个亟待解决的技术问题。

发明内容

本发明要解决的技术问题，在于提供一种基于关系路径注意力的异质图节点分类方法，实现提升金融风险预测精度。

本发明是这样实现的：一种基于关系路径注意力的异质图节点分类方法，包括如下步骤：

步骤S1、获取基于金融数据构建的异质图的数据集，将所述数据集划分为训练集、验证集和测试集，分别提取所述训练集、验证集以及测试集的节点特征矩阵和邻接矩阵集合；

步骤S2、基于关系路径注意力模块、节点路径注意力模块以及输出模块构建一节点分类模型；

步骤S3、利用所述训练集对节点分类模型进行训练，利用所述验证集对训练后的节点分类模型进行验证；

步骤S4、利用所述测试集对验证后的节点分类模型进行测试，并不断优化所述节点分类模型的超参数；

步骤S5、利用测试后的所述节点分类模型进行异质图节点分类，以进行金融风险预测。

进一步的，所述步骤S1具体为：

获取基于金融数据构建的异质图包括ACM、DBLP以及IMDB的数据集，将所述数据集按设定比例划分为训练集、验证集和测试集，分别提取所述训练集、验证集以及测试集的异质图的节点特征矩阵和不同类型边的邻接矩阵集合；

所述节点特征矩阵的公式为：

所述邻接矩阵集合的公式为：

其中，X表示节点特征；表示实数；N表示节点数量；d表示节点特征的输入维度；A表示邻接矩阵；K表示异质图的边的类型数；k表示邻接矩阵编号。

进一步的，所述设定比例为2：1：7。

进一步的，所述步骤S2中，所述关系路径注意力模块由大小为1×1的一层卷积层和两层余弦注意力层组成；

所述卷积层用于学习异质图中不同类型边的重要性，并把不同类型边所构成的邻接矩阵集合聚合到一起，形成一个新的邻接矩阵A'；所述余弦注意力层用于在邻接矩阵A'的基础上，使用余弦注意力学习异质图节点的特征相似性。

进一步的，所述邻接矩阵A'的公式为：

其中，A'和A均表示邻接矩阵，表示实数,N表示节点数量；/>表示可学习的参数矩阵，并使用softmax函数进行归一化，且/>K表示异质图的边的类型数；Conv()表示向量卷积运算函数；

所述特征相似性的计算过程为：

A1：计算节点x_j到节点x_i的注意力系数：

e_ij＝βcos(x_i,x_j)；

其中，e_ij表示注意力系数；β表示每一层传播层可学习的注意力参数，为标量；为节点x_j的输入表示；/>为节点x_i的输入表示；/>||x_i||表示对x_i进行L₂正则化，||x_j||表示对x_j进行L₂正则化；

B1：使用softmax函数对所述注意力系数e_ij进行归一化，得到归一化注意力系数α_ij；

C1：基于所述归一化注意力系数α_ij计算邻居节点特征的线性组合，从而得到每个节点的输出特征嵌入，即特征相似性表示：

其中，r_i表示节点的特征相似性表示；σ₁表示Relu激活函数；N_i表示节点x_i基于邻接矩阵A'的一阶邻居节点集合；A_i'_j表示节点x_i和节点x_j的邻接矩阵。

进一步的，所述步骤S2中，所述节点路径注意力模块由一层变换层和两层节点注意力层组成；

所述变换层用于把不同类型边所组成的邻接矩阵变换到同一维度，把异质图的网络结构转换为同质图的网络结构，以形成一个新的邻接矩阵；所述节点注意力层用于在变换层输出的邻接矩阵的基础上，学习异质图节点的特征表示。

进一步的，所述把异质图的网络结构转换为同质图的网络结构的转换过程为：

H'＝AM_I+I；

其中，H'表示转换后的邻接矩阵，且I表示单位矩阵；M_I表示元素都为1的矩阵，且/>

所述节点注意力层的学习过程为：

A2：计算节点x_j到节点x_i的注意力系数：

其中，表示注意力系数，且/>att_node()表示节点注意力学习函数，att_node：/>||表示拼接操作，d'表示节点特征的输出维度，/>和/>分别代表节点x_i和节点x_j的特征表示；W表示可学习的权重矩阵，/>W对于所有节点都是共享的；

B2：使用softmax函数对所述注意力系数进行归一化，得到归一化注意力系数

C2：基于所述归一化注意力系数与邻居节点的特征线性组合计算节点x_i的嵌入值：

其中，表示嵌入值；σ₂表示非线性激活函数；N_i表示节点x_i基于邻接矩阵H'的一阶邻居节点集合；

D2：引入多头注意力，基于所述嵌入值训练Q个独立的注意力层，将各注意力层的输出相加取平均值，得到节点最终的特征表示：

其中，z_i表示多头注意力的节点特征嵌入；Q表示多头注意力的机制头的数量；q表示计算第q个注意力；表示由第q个注意力机制计算得到的归一化注意力系数；W^q表示相应的输入线性变换的可学习权重矩阵。

进一步的，所述步骤S2中，所述输出模块由两层全连接层以及softmax函数组成，用于对所述关系路径注意力模块以及节点路径注意力模块的输出特征进行融合以得到融合特征。

进一步的，所述步骤S2中，所述输出模块的公式为：

Z＝r_i||z_i；

P＝softmax(Linear(Linear(Z)))；

其中，P表示节点预测类别；Z表示融合特征；r_i表示节点的相似性特征嵌入，即关系路径注意力模块学习得到的节点特征表示；z_i表示节点的重要性特征嵌入，即节点路径注意力模块学习得到的节点特征表示；softmax()表示归一化指数函数；Linear()表示线性函数。

进一步的，所述步骤S4中，所述超参数至少包括随机失活率、权值衰减率以及学习率。

本发明的优点在于：

通过将获取的数据集划分为训练集、验证集和测试集，分别提取训练集、验证集以及测试集的节点特征矩阵和邻接矩阵集合，基于关系路径注意力模块、节点路径注意力模块以及输出模块构建一节点分类模型，利用训练集、验证集以及测试集分别对节点分类模型进行训练、验证和测试，并不断优化节点分类模型的超参数，最后利用测试后的节点分类模型进行金融风险预测；由于节点分类模型的关系路径注意力模块用于学习异质图中蕴含的丰富的语义信息，节点路径注意力模块用于学习节点间特征的重要性，相对于传统的元路径法，能更好的学习到异质图中节点的特征，可以捕捉到异质图中节点的高阶语义信息，最终极大的提升了金融风险预测精度。

附图说明

下面参照附图结合实施例对本发明作进一步的说明。

图1是本发明一种基于关系路径注意力的异质图节点分类方法的流程图。

图2是本发明节点分类模型的示意图。

图3是本发明卷积层的示意图。

图4是本发明余弦注意力层的示意图。

图5是本发明变换层的示意图。

图6是本发明节点注意力层的示意图。

具体实施方式

本申请实施例中的技术方案，总体思路如下：设置异质图的节点分类模型由关系路径注意力模块、节点路径注意力模块以及输出模块构建，关系路径注意力模块用于学习异质图中蕴含的丰富的语义信息，节点路径注意力模块用于学习节点间特征的重要性，能更好的学习到异质图中节点的特征，可以捕捉到异质图中节点的高阶语义信息，进而提升异质图节点分类精度，即本发明能够学习到异质图网络的复杂的语义信息，更好地生成节点的特征表示，进而提升金融风险预测精度。

请参照图1至图6所示，本发明一种基于关系路径注意力的异质图节点分类方法的较佳实施例，包括如下步骤：

步骤S2、基于关系路径注意力模块、节点路径注意力模块以及输出模块构建一节点分类模型；所述关系路径注意力模块用于学习异质图中蕴含的丰富的语义信息；所述节点路径注意力模块用于学习节点间特征的重要性；所述输出模块用于预测输出结果；

在训练过程中，使用交叉熵损失作为损失函数来衡量所述节点分类模型的性能。

步骤S4、利用所述测试集对验证后的节点分类模型进行测试，并不断优化所述节点分类模型的超参数，以得到表现性能最佳的所述超参数的组合；

步骤S5、利用测试后的所述节点分类模型进行异质图节点分类，，以进行金融风险预测，即对异质图数据G＝{V,E}提取所述节点特征矩阵和邻接矩阵集合输入节点分类模型，得到节点预测类别P，P∈R^1×n。

具体实施时，可使用图节点分类任务指标F1-macro和F1-micro，对所述节点分类模型的特征学习能力进行评测。

所述步骤S1具体为：

所述节点特征矩阵的公式为：

所述邻接矩阵集合的公式为：可以简写为张量/>

所述设定比例为2：1：7。

所述ACM、DBLP以及IMDB均为异构图的公共基准数据集。

所述步骤S2中，所述关系路径注意力模块由大小为1×1的一层卷积层和两层余弦注意力层组成；

所述邻接矩阵A'的公式为：

其中，A'和A均表示邻接矩阵，表示实数,N表示节点数量；/>表示可学习的参数矩阵，并使用softmax函数进行归一化，且/>K表示异质图的边的类型数；为了学习到节点自身的特征，在每种类型边的邻接矩阵上添加自连接的边，即每一个不同类型边的邻接矩阵A_k加上单位矩阵；Conv()表示向量卷积运算函数；

所述特征相似性的计算过程为：

A1：计算节点x_j到节点x_i的注意力系数：

e_ij＝βcos(x_i,x_j)；

其中，e_ij表示注意力系数；β表示每一层传播层可学习的注意力参数，为标量；为节点x_j的输入表示；/>为节点x_i的输入表示；/>||x_i||表示对x_i进行L₂正则化，||x_j||表示对x_j进行L₂正则化；本发明只计算与节点x_i存在一阶连接的节点x_j之间的注意力系数，即只计算j∈N_i的e_ij；

B1：使用softmax函数对所述注意力系数e_ij进行归一化，得到归一化注意力系数α_ij：

其中，r_i表示节点的特征相似性表示；σ₁表示Relu激活函数；N_i表示节点x_i基于邻接矩阵A'的一阶邻居节点集合，包括自身；A_i'_j表示节点x_i和节点x_j的邻接矩阵。

所述步骤S2中，所述节点路径注意力模块由一层变换层和两层节点注意力层组成；

所述把异质图的网络结构转换为同质图的网络结构的转换过程为：

H'＝AM_I+I；

所述节点注意力层的学习过程为：

A2：计算节点x_j到节点x_i的注意力系数：

其中，表示注意力系数；att_node()表示节点注意力学习函数，att_node：||表示拼接操作，d'表示节点特征的输出维度，/>和/>分别代表节点x_i和节点x_j的特征表示；W表示可学习的权重矩阵，/>W对于所有节点都是共享的；给定邻接矩阵H'，节点对(i,j)的注意力系数取决于它们的特征；

注意力系数是不对称的，即节点x_i对节点x_j的重要性和节点x_j对节点x_i的重要性是不一定相同的，本发明只计算与节点x_i存在一阶连接的节点x_j之间的注意力系数，这表示只计算j∈N_i的/>

其中，a表示可学习的权重向量，且T表示转置；

D2：为了稳定注意力机制学习的过程，引入多头注意力，基于所述嵌入值训练Q个独立的注意力层，将各注意力层的输出相加取平均值，得到节点最终的特征表示：

所述步骤S2中，所述输出模块由两层全连接层以及softmax函数组成，用于对所述关系路径注意力模块以及节点路径注意力模块的输出特征进行融合以得到融合特征。

所述步骤S2中，所述输出模块的公式为：

Z＝r_i||z_i；

P＝softmax(Linear(Linear(Z)))；

其中，P表示节点预测类别；Z表示融合特征；r_i表示节点的相似性特征嵌入，即关系路径注意力模块学习得到的节点特征表示；z_i表示节点的重要性特征嵌入，即节点路径注意力模块学习得到的节点特征表示；||表示拼接操作；softmax()表示归一化指数函数；Linear()表示线性函数。

所述步骤S4中，所述超参数至少包括随机失活率(droput)、权值衰减率(weight-decay)以及学习率；具体实施时，训练总迭代次数为40次，优化器使用Adam，余弦注意力学习率设置为0.02，节点注意力学习率设置为0.05，dropout设置为0.3。

节点分类任务中不同方法在Macro-F1和Micro-F1值上的实验结果对比如下表所示：

综上所述，本发明的优点在于：

虽然以上描述了本发明的具体实施方式，但是熟悉本技术领域的技术人员应当理解，我们所描述的具体的实施例只是说明性的，而不是用于对本发明的范围的限定，熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化，都应当涵盖在本发明的权利要求所保护的范围内。

Claims

1.一种基于关系路径注意力的异质图节点分类方法，其特征在于：包括如下步骤：

步骤S5、利用测试后的所述节点分类模型进行异质图节点分类，以进行金融风险预测；

所述卷积层用于学习异质图中不同类型边的重要性，并把不同类型边所构成的邻接矩阵集合聚合到一起，形成一个新的邻接矩阵A′；所述余弦注意力层用于在邻接矩阵A'的基础上，使用余弦注意力学习异质图节点的特征相似性；

所述节点路径注意力模块由一层变换层和两层节点注意力层组成；

所述变换层用于把不同类型边所组成的邻接矩阵变换到同一维度，把异质图的网络结构转换为同质图的网络结构，以形成一个新的邻接矩阵H'；所述节点注意力层用于在变换层输出的邻接矩阵H'的基础上，学习异质图节点的特征表示；

所述输出模块由两层全连接层以及softmax函数组成，用于对所述关系路径注意力模块以及节点路径注意力模块的输出特征进行融合以得到融合特征；

所述邻接矩阵A'的公式为：

所述特征相似性的计算过程为：

A1：计算节点x_j到节点x_i的注意力系数：

e_ij＝βcos(x_i,x_j)；

其中，r_i表示节点的特征相似性表示；σ₁表示Relu激活函数；N_i表示节点x_i基于邻接矩阵A'的一阶邻居节点集合；A′_ij表示节点x_i和节点x_j的邻接矩阵；

H'＝AM_I+I；

其中，H'表示转换后的邻接矩阵，且I表示单位矩阵；M_I表示元素都为1的矩阵，且/>A表示邻接矩阵；/>表示实数；

所述节点注意力层的学习过程为：

A2：计算节点x_j到节点x_i的注意力系数：

其中，表示注意力系数，且/>att_node()表示节点注意力学习函数，att_node：表示拼接操作，d'表示节点特征的输出维度，/>和/>分别代表节点x_i和节点x_j的特征表示；W表示可学习的权重矩阵，/>W对于所有节点都是共享的；d表示节点特征的输入维度；

B2：使用softmax函数对所述注意力系数进行归一化，得到归一化注意力系数/>

其中，z_i表示多头注意力的节点特征嵌入；Q表示多头注意力的机制头的数量；q表示计算第q个注意力；表示由第q个注意力机制计算得到的归一化注意力系数；W^q表示相应的输入线性变换的可学习权重矩阵；

所述步骤S2中，所述输出模块的公式为：

Z＝r_i||z_i；

P＝softmax(Linear(Linear(Z)))；

2.如权利要求1所述的一种基于关系路径注意力的异质图节点分类方法，其特征在于：所述步骤S1具体为：

所述节点特征矩阵的公式为：

所述邻接矩阵集合的公式为：

3.如权利要求2所述的一种基于关系路径注意力的异质图节点分类方法，其特征在于：所述设定比例为2：1：7。

4.如权利要求1所述的一种基于关系路径注意力的异质图节点分类方法，其特征在于：所述步骤S4中，所述超参数至少包括随机失活率、权值衰减率以及学习率。