CN114118416A

CN114118416A - 一种基于多任务学习的变分图自动编码器方法

Info

Publication number: CN114118416A
Application number: CN202111502928.6A
Authority: CN
Inventors: 李晶慈; 陆广泉
Original assignee: Guangxi Normal University
Current assignee: Guangxi Normal University
Priority date: 2021-12-09
Filing date: 2021-12-09
Publication date: 2022-03-01

Abstract

本发明公开了一种基于多任务学习的变分图自动编码器方法，包括如下步骤：S1：对源数据进行预处理；S2：划分图数据集；S3：将S22获得的训练集输入浅层图卷积层获得浅层共享嵌入表示H；S4：将S3获得的浅层共享嵌入表示H分别输入两个不同的下游网络框架，获得各自的嵌入表示；S5：将S4获得的两个不同的嵌入表示分别进行链路预测任务和半监督节点分类任务。这种方法能使嵌入表示跟样本空间的真实分布更相近，在链路预测任务上具有很强的竞争力，鲁棒性强。

Description

一种基于多任务学习的变分图自动编码器方法

技术领域

本发明涉及计算机数据分析领域，具体是一种基于多任务学习的变分图自动编码器方法。

背景技术

随着深度学习技术的不断发展，越来越多复杂的应用场景不能使用简单的欧几里得数据进行表示，例如分子结构、推荐系统、引文网络和社交网络等。这些应用数据，即非欧几里得数据，可以使用图来表示。图数据中包括节点和边，节点具有自己的属性特征，且不同的节点具有不同数量的邻居节点。传统的卷积神经网络或者循环神经网络不能够用于表示图数据。近年来，图神经网络吸引了研究者们极大的注意力，相对于卷积神经网络和循环神经网络，图神经网络可以通过保留拓扑结构信息和节点特征信息，将节点特征嵌入到低维空间，具有很强的性能。其中，图自动编码器和变分图自动编码器是进行图无监督学习(链路预测、节点聚类、图生成)的有效框架。

然而，图数据的多任务学习并没有引起研究者们太多的关注。实际上，将多个相关任务放在一起学习可以提高任务的整体泛化能力。目前已有的基于多任务学习的图神经网络框架都是直接将学习到的共享表示作为下游任务的输入，这意味着不同的下游任务使用共同的嵌入表示来进行学习，并没有着重去学习单个任务特定的嵌入信息。实际上，不同任务使用共同的嵌入表示可能不利于各自任务的学习，因为这样学习到的共享嵌入表示可能也学习到了其他任务的噪声。

发明内容

本发明的目的是针对现有技术的不足，而提供一种基于多任务学习的变分图自动编码器方法。这种方法能使嵌入表示跟样本空间的真实分布更相近，在链路预测任务上具有很强的竞争力，鲁棒性强。

实现本发明目的的技术方案是：

一种基于多任务学习的变分图自动编码器方法，包括如下步骤：

S1：对源数据进行预处理，具体过程为：

S11：将引文网络中的源数据处理成图数据G＝(V,E)，V为节点集，E为边集，假设引文网络中的一篇论文视为图中的一个节点，论文的作者、研究方向视为节点的特征，论文与被引用论文之间建立一条连接的无向边，论文所属的类别视为标签，由此一个引文网络构成一个图数据集；

S12：利用S11中获得的图数据集，得到图对应的度矩阵和邻接矩阵、特征矩阵；

S2：划分图数据集，具体过程为：

S21：将图数据集中部分数据进行掩码设置来进行半监督学习；

S22：将S12获得的矩阵中的数据划分为训练集、验证集和测试集；

S3：将S22获得的训练集输入浅层图卷积层获得浅层共享嵌入表示H，即将邻接矩阵和特征矩阵输入浅层图卷积层，通过消息传播机制H＝σ(AXW)，其中A是邻接矩阵，X是节点特征矩阵，W是可学习的参数矩阵，σ是激活函数，以聚合当前邻居节点的特征信息和拓扑结构信息来更新当前节点的特征信息，从而获得浅层共享嵌入表示H；

S4：将S3获得的浅层共享嵌入表示H分别输入两个不同的下游网络框架，获得各自的嵌入表示，具体过程为：

S41：将S3获得的浅层共享嵌入表示H输入用于链路预测的图卷积网络中，获得嵌入表示Z_mean和Z_log；

S42：将Z_mean和Z_log利用高斯分布进行相加，获得符合高斯分布的嵌入表示Z；

S43：将Z作为判别器的假样本输入，基于生成对抗机制，使得嵌入表示Z能够更接近原始的样本分布；

S44：将S3获得的浅层表示H输入用于节点分类的图卷积网络中，获得嵌入表示Z_nc；

S5：将S4获得的两个不同的嵌入表示分别进行链路预测任务和半监督节点分类任务，具体过程为：

S51：将S4获得的嵌入表示Z输入内积层进行邻接矩阵重构，用于链路预测任务；

S52：将S4获得的嵌入表示Z输入图卷积层进行特征矩阵重构，作为链路预测的辅助任务；

S53：将S4获得嵌入表示Z_nc输入用于节点分类的图卷积网络中；

S54：计算损失函数，利用梯度下降算法来更新迭代参数，经过多次迭代之后使得损失函数可以收敛，其中，最终的损失函数公式为：

其中，C是一组节点标签，如果节点i属于c类，y是节点所属的类别标签，

是节点i属于类c的softmax概率，当节点i在有标签时MASK_i＝1，否则MASK_i＝0，E_q(Z|X，A)[logp(A|Z)]-KL[q(Z|X,A)||p(Z)]为邻接矩阵的重构损失，其中KL[q(·)||p(·)]是生成样本与原始样本的相对熵，

为半监督节点分类的交叉熵损失，

为特征矩阵的重构损失。

本技术方案的有益效果是：

本技术方案基于多任务联合学习无监督链路预测任务和半监督节点分类任务，不同于其他的基于多任务的图神经网络框架，直接使用共享表示作为不同预测或分类任务的输入，本技术方案仅在浅层获得共享表示，将共享表示分别输入到不同下游任务设计的专属网络框架，此外，为了使链路预测任务的嵌入表示更具鲁棒性，本技术方案加入了对抗生成网络框架，通过生成器-判别器的博弈机制使嵌入表示跟样本空间的真实分布更相近，在三个真实的引文网络数据集上的实验结果表明，本技术方案提出的框架在链路预测任务上具有很强的竞争力，甚至在其中一个数据集上优于最先进的方法。

这种方法能使嵌入表示跟样本空间的真实分布更相近，在链路预测任务上具有很强的竞争力，鲁棒性强。

附图说明

图1为实施例的流程示意图。

具体实施方式

下面结合附图及具体实施例对本发明作进一步的详细描述，但不是对本发明的限定。

实施例：

本例适用于非欧式空间的数据，例如：社交网络、引文网络和分子结构。

参照图1，一种基于多任务学习的变分图自动编码器方法，包括如下步骤：

S1：对源数据进行预处理，具体过程为：

S11：本例在引文网络中收集图数据集，每一个图数据集的类别数量不同，数据集中的每一篇论文都有自己的标签，将引文网络中的图数据集处理成图数据G＝(V，E)，V为节点集，E为边集，假设一篇论文视为图中的一个节点，论文的作者、研究方向视为节点的特征，论文与被引用论文之间建立一条连接的无向边，论文所属的类别视为标签，一个引文网络构成一个图数据集，三个引文网络图数据集详细情况如表1所示：

表1数据集

数据集	节点数量	边数量	特征维度	类别数
					Cora	2708	5429	1433	7
Citeseer	3327	4732	3703	6
					Pubmed	19717	44338	500	3

；

S2：划分图数据集，具体过程为：

S3：将S22获得的训练集输入浅层图卷积层获得浅层共享嵌入表示H，即将Cora＝(A，X)输入浅层图卷积层，利用消息传播机制H＝σ(AXW)，其中A是邻接矩阵，X是节点特征矩阵，W是可学习的参数矩阵，σ是激活函数，以聚合当前邻居节点的特征信息和拓扑结构信息来更新当前节点的特征信息，来获得浅层共享嵌入表示H，图卷积网络的公式为：

其中，激活函数σ(·)＝ReLU(·)，W为权重矩阵，D是邻接矩阵的度矩阵；

S51：将S4获得的嵌入表示Z输入内积层进行邻接矩阵重构，用于链路预测任务，得到重构的邻接矩阵：

重构邻接矩阵的损失函数为：

L_re＝E_q(Z|X,A)[logp(A|Z)]-KL[q(Z|X,A)||p(Z)]；

S52：将S4获得的嵌入表示Z输入图卷积层进行特征矩阵重构，作为链路预测的辅助任务，获得重构的特征矩阵：

重构特征矩阵的损失函数为：

S53：将S4获得嵌入表示Z_nc输入用于节点分类的图卷积网络中，点分类任务的损失函数为：

为半监督节点分类的交叉熵损失，

为特征矩阵的重构损失。

在迭代50次之后，损失函数已经趋于收敛，停止训练。

三个图数据集的实验结果如表2、表3所示：

表2链路预测：AUC和AP评分

表3节点分类：准确率

Methods	Cora	Pubmed	Citeseer
				GCN	0.815	0.790	0.703
Planetoid	0.757	0.772	0.947
				DeepWalk	0.972	0.653	0.432
MTGAE	0.790	0.804	0.718
				本例	0.809	0.861	0.666

。

Claims

1.一种基于多任务学习的变分图自动编码器方法，其特征在于，包括如下步骤：

S1：对源数据进行预处理，具体过程为：

S2：划分图数据集，具体过程为：

S3：将S22获得的训练集输入浅层图卷积层获得浅层共享嵌入表示H，即将邻接矩阵和特征矩阵输入浅层图卷积层，通过消息传播机制H=σ(AXW)，其中A是邻接矩阵，X是节点特征矩阵，W是可学习的参数矩阵，σ是激活函数，以聚合当前邻居节点的特征信息和拓扑结构信息来更新当前节点的特征信息，从而获得浅层共享嵌入表示H；

S44：将S3获得的浅层表示H输入用于节点分类的图卷积网络中，获得嵌入表示Z_nc；S5：将S4获得的两个不同的嵌入表示分别进行链路预测任务和半监督节点分类任务，具体过程为：

是节点i属于类c的softmax概率，当节点i在有标签时MASK_i＝1，否则MASK_i＝0，E_q(Z|X,A)[logp(A|Z)]-KL[q(Z|X,A)||p(Z)]为邻接矩阵的重构损失，其中KL[q(·)||p(·)]是生成样本与原始样本的相对熵，

为半监督节点分类的交叉熵损失，

为特征矩阵的重构损失。