WO2024037354A1

WO2024037354A1 - 一种基于图神经网络的模型训练方法及装置

Info

Publication number: WO2024037354A1
Application number: PCT/CN2023/111176
Authority: WO
Inventors: 朱亦博; 陈扬锐; 何骏; 林苑; 彭杨华
Original assignee: 抖音视界有限公司; 脸萌有限公司
Priority date: 2022-08-18
Filing date: 2023-08-04
Publication date: 2024-02-22
Also published as: CN115221976B; CN115221976A

Abstract

本申请公开了一种基于GNN的模型训练方法，该包括：获取第一训练图和第一训练图对应的标签，第一训练图为与训练多媒体内容对应的关系图，或者，所述第一训练图为与训练物品对应的关系图。获得所述第一训练图之后，可以基于所述第一训练图得到所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征，并对所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征进行融合，得到所述第一训练图的融合特征。进一步地，基于所述第一训练图的融合特征和所述第一训练图的标签，训练基于GNN的目标模型。利用本方案所训练得到的目标模型在对数据进行处理时，所得到的处理结果也会更加准确。

Description

一种基于图神经网络的模型训练方法及装置

本申请要求于2022年8月18日提交中国国家知识产权局、申请号为202210994004.0、申请名称为“一种基于图神经网络的模型训练方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及数据处理领域，特别是涉及一种基于图神经网络的模型训练方法及装置。

背景技术

可以训练基于图神经网络(graph neural network，GNN)的模型来对数据进行处理，得到对应的处理结果。例如，可以利用基于GNN的模型对多媒体内容进行处理，从而预测多媒体内容的标签。

但是，目前所训练得到的基于GNN的模型在对数据进行处理时，所得到的处理结果往往不是特别准确，因此，急需一种方案，能够解决上述问题。

发明内容

为了解决或者部分解决上述技术问题，本申请实施例提供了一种基于GNN的模型训练方法及装置。

第一方面，本申请实施例提供了一种基于图神经网络GNN的模型训练方法，其特征在于，所述方法包括：

获取第一训练图和所述第一训练图对应的标签，所述第一训练图为与训练多媒体内容对应的关系图，或者，所述第一训练图为与训练物品对应的关系图；

基于所述第一训练图得到所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征；

对所述位置特征、所述结构特征以及所述节点特征进行融合，得到融合特征；

根据所述融合特征和所述标签，训练基于GNN的目标模型。

可选的，所述方法还包括：

确定所述位置特征的第一重要程度，以及确定所述结构特征的第二重要程度；

对所述位置特征、所述结构特征以及所述节点特征进行融合，得到融合特征，包括：

基于所述第一重要程度和所述第二重要程度，对所述位置特征、所述结构特征以及所述节点特征进行融合，得到所述融合特征。

可选的，所述基于所述第一训练图得到所述第一训练图的位置特征，包括：

将所述第一训练图输入位置特征提取模块，得到在目标特征空间对应的所述位置特征，所述目标特征空间的维度低于所述第一训练图对应的图像空间的维度。

可选的，所述位置特征提取模块，通过如下方式训练得到：

获取第二训练图；

获取所述第二训练图的各个节点对应所述目标特征空间的位置特征；

基于所述第二训练图的各个节点对应所述目标特征空间的位置特征、以及所述第二训练图，确定损失函数；

基于所述损失函数，调整所述位置特征提取模块的参数。

可选的，所述基于所述第二训练图的各个节点对应所述目标特征空间的位置特征、以及所述第二训练图，确定损失函数，包括：

基于所述各个节点分别对应的损失项，得到所述损失函数；其中：

第一节点为所述各个节点中的任意一个节点，所述第一节点对应的损失项，通过如下方式确定：

基于所述第一节点对应所述目标特征空间的位置特征、第二节点对应所述目标特征空间的位置特征、以及所述第一节点和所述第二节点在所述第二训练图中的距离，得到所述第一节点对应的损失项，所述第二节点为所述第一节点的K阶邻居节点，所述K为大于1或者等于1的整数。

可选的，所述确定所述位置特征的第一重要程度，包括：

将所述位置特征输入第一模型，得到所述第一重要程度，所述第一模型用于基于输入的位置特征，得到对应的重要程度；其中：

所述第一模型是基于第三训练图对应的位置特征和所述第三训练图对应的标签训练得到的。

可选的，所述确定所述第一训练图的结构特征，包括：

基于所述第一训练图，得到所述第一训练图的多阶邻居数量序列，所述多阶邻居数据序列用于指示所述第一训练图中各个节点分别包括的各阶邻居节点的数量，所述结构特征包括所述多阶邻居数量序列。

可选的，所述基于所述第一训练图得到所述第一训练图的结构特征，包括：

基于所述第一训练图，得到所述第一训练图的多阶邻居数量序列以及所述第一训练图的聚类特征，所述多阶邻居数据序列用于指示所述第一训练图中各个节点分别包括的各阶邻居节点的数量；

对所述多阶邻居数量序列和所述聚类特征进行融合，得到所述第一训练图的结构特征。

可选的，所述基于所述结构特征得到所述结构特征的第二重要程度，包括：

将所述结构特征输入第二模型，得到所述第二重要程度，所述第二模型用于基于输入的结构特征，得到对应的重要程度；其中：

所述第二模型，是基于第四训练图对应的结构特征和所述第四训练图对应的标签训练得到的。

可选的，所述方法还包括：

获取待处理图，所述待处理图为与待处理多媒体内容对应的关系图，或者，所述待处理图为与待处理物品对应的关系图；

基于所述待处理图得到所述待处理图的位置特征、所述待处理图的结构特征以及所述待处理图的节点特征；

对所述待处理图的位置特征、所述待处理图的结构特征以及所述待处理图的节点特征进行融合，得到所述待处理图的融合特征；

将所述待处理图的融合特征输入所述目标模型，得到所述待处理图的标签。

第二方面，本申请实施例提供了一种基于图神经网络GNN的模型训练装置，所述装置包括：

第一获取单元，用于获取第一训练图和所述第一训练图对应的标签，所述第一训练图为与训练多媒体内容对应的关系图，或者，所述第一训练图为与训练物品对应的关系图；

第一确定单元，用于基于所述第一训练图得到所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征；

第一融合单元，用于对所述位置特征、所述结构特征以及所述节点特征进行融合，得到融合特征；

训练单元，用于根据所述融合特征和所述标签，训练基于GNN的目标模型。

可选的，所述装置还包括：

第二确定单元，用于确定所述位置特征的第一重要程度，以及确定所述结构特征的第二重要程度；

所述第一融合单元，用于：

可选的，所述位置特征提取模块，通过如下方式训练得到：

获取第二训练图；

基于所述损失函数，调整所述位置特征提取模块的参数。

可选的，所述确定所述位置特征的第一重要程度，包括：

可选的，所述确定所述第一训练图的结构特征，包括：

可选的，所述装置还包括：

第二获取单元，用于获取待处理图，所述待处理图为与待处理多媒体内容对应的关系图，或者，所述待处理图为与待处理物品对应的关系图；

第三确定单元，用于基于所述待处理图得到所述待处理图的位置特征、所述待处理图的结构特征以及所述待处理图的节点特征；

第二融合单元，用于对所述待处理图的位置特征、所述待处理图的结构特征以及所述待处理图的节点特征进行融合，得到所述待处理图的融合特征；

第四确定单元，用于将所述待处理图的融合特征输入所述目标模型，得到所述待处理图的标签。

第三方面，本申请实施例提供了一种设备，所述设备包括处理器和存储器；

所述处理器用于执行所述存储器中存储的指令，以使得所述设备执行以上第一方面任一项所述的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，包括指令，所述指令指示设备执行以上第一方面任一项所述的方法。

第五方面，本申请实施例提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得计算机执行以上第一方面任一项所述的方法。

与现有技术相比，本申请实施例具有以下优点：

本申请实施例提供了一种基于GNN的模型训练方法，该包括：获取第一训练图和所述第一训练图对应的标签，所述第一训练图为与训练多媒体内容对应的关系图，或者，所述第一训练图为与训练物品对应的关系图。获得所述第一训练图之后，可以基于所述第一训练图得到所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征，并对所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征进行融合，得到所述第一训练图的融合特征。进一步地，基于所述第一训练图的融合特征和所述第一训练图的标签，训练基于GNN的目标模型。在本申请实施例中，在训练所述目标模型时，除了考虑了第一训练图的节点特征之外，还考虑了第一训练图的位置特征和所述第一训练图的结构特征，因此，训练所述目标模型所使用的有效信息更多，相应的，所训练得到的目标模型在对数据进行处理时，所得到的处理结果也会更加准确。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种基于GNN的模型训练方法的流程示意图；

图2为本申请实施例提供的一种训练位置特征提取模块的方法的流程示意图；

图3本申请实施例提供的一种训练目标模型的过程示意图；

图4为本申请实施例提供的一种基于GNN的模型训练装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的发明人经过研究发现，目前，在训练基于GNN的模型时，可以基于训练图的节点特征和训练图的标签来进行模型训练。但是，采用这种方式，往往会丢失训练图中的部分信息。在一个示例中，采用当前的训练方式，会丢失训练图中的部分位置信息，例如，当前的训练方式，无法区分在训练图中位置较远但具有相同邻域结构的两个节点。在又一个示例中，采用当前的训练方式，会丢失训练图中的部分结构信息，例如，当前的训练方式，无法区分具有相同计算子图但有不同邻域结构的两个节点。

为了解决上述问题，本申请实施例提供了一种基于GNN的模型训练方法及装置。

下面结合附图，详细说明本申请的各种非限制性实施方式。

示例性方法

参见图1，该图为本申请实施例提供的一种基于GNN的模型训练方法的流程示意图。在本实施例中，所述方法可以由终端设备执行，也可以由服务器执行，本申请实施例不做具体限定。

在一个示例中，所述方法例如可以包括以下步骤：S101-S104。

需要说明的是，模型训练的过程是一个多次迭代计算的过程，每一次迭代都可以对模型的参数进行调整，调整后的参数参与下一轮迭代计算。

图1以第一训练图为例，对训练基于GNN的目标模型中的某一轮迭代过程进行介绍。可以理解的是，训练所述目标模型所使用的训练图有很多，在训练所述目标模型时，每个训练图的处理方式类似。在经过多个训练图训练之后，即可得到准确度符合要求的目标模型。

S101：获取第一训练图和所述第一训练图对应的标签，所述第一训练图为与训练多媒体内容对应的关系图，或者，所述第一训练图为与训练物品对应的关系图。

在本申请实施例中，所述第一训练图可以包括多个节点，该第一训练图可以体现所述多个节点之间的关联关系，例如，第一训练图中的节点1和节点2之间具备一条边，则说明节点1和节点2具备关联关系。

本申请实施例不具体限定所述第一训练图对应的标签，所述第一训练图对应的标签，与所述目标模型的数据处理任务相关。例如，所述目标模型用于识别多媒体内容的类别，则所述第一训练图可以用于指示训练多媒体内容的类别。

本申请实施例提及的多媒体内容(例如此处提及的训练多媒体内容以及下文提及的待处理多媒体内容)，包括但不限于文本和/或图像。

在一个示例中，本申请实施例中提及的物品(例如此处提及的训练物品以及下文提及的待处理物品)，例如可以是商品。

S102：基于所述第一训练图得到所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征。

在一个示例中，可以采用图像分析方法，对所述第一训练图进行分析，从而得到所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征。

在一个示例中，“基于所述第一训练图得到所述第一训练图的位置特征”在具体实现时，可以通过位置特征提取模块来实现。具体地，可以将所述第一训练图输入位置特征提取模块，从而得到所述第一训练图对应的位置特征。其中，所述位置特征提取模块，用于提取图的位置特征。因此，将所述第一训练图输入所述位置特征提取模块之后，所述位置特征提取模块可以输出所述第一训练图的位置特征。本申请实施例中提及的第一训练图的位置特征，可以是能够体现所述第一训练图中的节点的位置的特征。

在一个示例中，考虑到对于第一训练图而言，第一训练图对应的图像空间的维度，与第一训练图的大小相关，或者说，与第一训练图包括的节点数量相关。所述第一训练图包括的节点数量越多，则所述图像空间的维度越高。因此，若所述第一训练图的位置特征为在所述图像空间的特征，则当所述第一训练图的节点数量较多时，确定所述第一训练图的位置特征所消耗的计算量较大，甚至，无法计算出所述第一训练图在所述图像空间的位置特征。鉴于此，在一个示例中，该位置特征提取模块，可以用于提取图在目标特征空间的位置特征，换言之，将所述第一训练图输入位置特征提取模块之后，所述位置特征提取模块可以输出第一训练图在目标特征空间对应的位置特征。

其中，所述目标特征空间的维度低于所述第一训练图对应的图像空间的维度。换言之，在一个示例中，所述目标特征空间，可以是一个低维空间，对于这种情况，可以减小计算得到所述第一训练图的位置特征的计算量，并且，即使所述第一训练图所包括的节点数量较多，所述位置特征提取模块，也能够得到所述第一训练图的位置特征。

在一个示例中，所述位置特征提取模块，可以是预先训练得到的，关于所述位置特征提取模块的训练方式，可以参考下文对于图2的描述部分，此处不做详细描述。

在一个示例中，考虑到对于第一训练图而言，其各个节点包括的各阶邻居节点的数量，是所述第一训练图的一种结构信息。因此，作为一个示例，“基于所述第一训练图得到所述第一训练图的结构特征”在具体实现时，可以基于所述第一训练图，得到所述第一训练图的多阶邻居数量序列，对于这种情况，所述结构特征包括所述多阶邻居数量序列。其中：所述多阶邻居数据序列用于指示所述第一训练图中各个节点分别包括的各阶邻居节点的数量。

关于节点的各阶邻居节点，现以节点1为例进行说明。

节点1的1阶邻居节点，指的是与节点1直连的节点；

节点1的2阶邻居节点，指的是与节点1通过一个中间节点相连的节点，或者说，是与节点1之间相隔1个中间节点的节点；

以此类推，节点1的k阶邻居节点，指的是与节点1通过(k-1)个中间节点相连的节点，或者说，是与节点1之间相隔(k-1)个中间节点的节点。

在一个示例中，可以遍历所述第一训练图，从而得到所述第一训练图的所述多阶邻居数量序列。

在一个示例中，所述第一训练图的聚类特征，也是所述第一训练图的一种结构信息。因此，在另一个示例中，“基于所述第一训练图得到所述第一训练图的结构特征”在具体实现时，可以基于所述第一训练图，得到所述第一训练图的多阶邻居数量序列以及所述第一训练图的聚类特征，并对所述多阶邻居数量序列和所述聚类特征进行融合，得到所述第一训练图的结构特征。

关于所述第一训练图的聚类特征，需要说明的是，在一个示例中，所述第一训练图的聚类特征，例如可以包括所述第一训练图中所包括的各个节点分别对应的各阶节点环的数量。

关于节点的各阶节点换，现以节点2为例进行说明。

节点2的k阶节点环，指的是所述第一训练图中、由节点2和节点2的k阶节点所构成的环的数量。

本申请实施例不具体限定对所述多阶邻居数量序列和所述聚类特征进行融合的具体实现方式，在一个示例中，例如可以对所述多阶邻居数量序列和所述聚类特征进行叠加(例如在特征维度上进行叠加)。

在一个示例中，前述“基于所述第一训练图得到所述第一训练图的结构特征”，可以由结构特征提取模块执行。

在一个示例中，“基于所述第一训练图得到所述第一训练图的节点特征”在具体实现时，例如可以利用节点特征提取模块对所述第一训练图进行处理，得到所述第一训练图的节点特征。此处提及的节点特征提取模块，例如可以是传统的节点特征提取模块，其可以按照传统的节点特征确定方式，确定所述第一训练图的节点特征。

S103：对所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征进行融合，得到所述第一训练图的融合特征。

得到所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征之后，可以对所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征进行融合，得到所述第一训练图的融合特征。

在一个示例中，可以按照预设的特征融合方式，对所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征进行融合，得到所述第一训练图的融合特征。

在又一个示例中，在所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征进行融合时，还可以考虑所述第一训练图的位置特征的第一重要程度以及所述第一训练图的结构特征的第二重要程度，来对所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征进行融合，从而使得所得到的融合特征，能够结合所述第一训练图的结构特征的和所述第一训练图的位置特征的重要程度，相应的，使得重要程度高的特征在训练目标模型时，贡献更多的特征信息，相应的，能够使得训练得到的目标模型在对数据进行处理时，所得到的的处理结果的准确度更高。

在一个示例中，前述第一重要程度和所述第二重要程度可以是基于目标模型的数据处理任务确定的，例如，可以预先确定各种数据处理任务分别对应的位置特征的重要程度和结构特征的重要程度，相应的，可以将所述目标模型对应的数据处理任务与前述“各种数据处理任务分别对应的位置特征的重要程度和结构特征的重要程度”进行匹配，从而得到所述第一重要程度和所述第二重要程度。

在又一个示例中，可以基于所述第一训练图的位置特征确定所述第一重要程度。作为一个示例，可以预先训练第一模型，所述第一模型用于基于输入的位置特征，得到对应的重要程度。对于这种情况，可以将所述第一训练图的位置特征输入所述第一模型，从而得到所述第一重要程度。

本申请实施例不具体限定所述第一模型，作为一个示例，所述第一模型例如可以是多层感知机(multilayer perceptron，MLP)。

在一个示例中，所述第一模型，例如可以是基于第三训练图对应的位置特征和所述第三训练图对应的标签训练得到的。

关于所述第三训练图，可以参考上文对于第一训练图的描述部分，此处不做详述。

关于所述第三训练图的位置特征，其确定方式可以参考第一训练图的位置特征的确定方式，具体可参考上文对于第一训练图的位置特征的描述部分，此处不做重复描述。

关于所述第三训练图的标签，可以参考上文对于第一训练图的标签的描述部分，此处不做详述。

在另一个示例中，可以基于所述第一训练图的结构特征确定所述第二重要程度。作为一个示例，可以预先训练第二模型，所述第二模型用于基于输入的结构特征，得到对应的重要程度。对于这种情况，可以将所述第一训练图的结构特征输入所述第二模型，从而得到所述第二重要程度。

本申请实施例不具体限定所述第二模型，作为一个示例，所述第二模型例如可以是MLP。

在一个示例中，所述第二模型，例如可以是基于第四训练图对应的结构特征和所述第四训练图对应的标签训练得到的。

关于所述第四训练图，可以参考上文对于第一训练图的描述部分，此处不做详述。

关于所述第四训练图的结构特征，其确定方式可以参考第一训练图的结构特征的确定方式，具体可参考上文对于第一训练图的结构特征的描述部分，此处不做重复描述。

关于所述第四训练图的标签，可以参考上文对于第一训练图的标签的描述部分，此处不做详述。

S104：根据所述第一训练图的融合特征和所述第一训练图的标签，训练基于GNN的目标模型。

得到所述第一训练图的融合特征之后，可以基于所述第一训练图的融合特征和所述第一训练图的标签，训练基于GNN的目标模型。例如，可以基于所述第一训练图的融合特征，得到模型预测结果，而后，基于所述模型预测结果和所述第一训练图对应的标签，调整所述目标模块的参数。

通过以上描述可知，在本申请实施例中，在训练所述目标模型时，除了考虑了第一训练图的节点特征之外，还考虑了第一训练图的位置特征和所述第一训练图的结构特征，因此，训练所述目标模型所使用的有效信息更多，相应的，所训练得到的目标模型在对数据进行处理时，所得到的处理结果也会更加准确。

接下来，结合图2，对前述位置特征提取模块的训练方法进行介绍。参见图2，该图为本申请实施例提供的一种训练位置特征提取模块的方法的流程示意图。

图2所示的方法，例如可以包括如下S201-S204。

S201：获取第二训练图。

关于所述第二训练图，可以参考上文对于第一训练图的描述部分，此处不做重复描述。

S202：获取所述第二训练图的各个节点对应所述目标特征空间的位置特征。

获取所述第二训练图之后，可以将所述第二训练图输入正在训练的所述位置特征提取模块中，从而得到所述位置特征提取模块所输出的所述第二训练图的各个节点对应所述目标特征空间的位置特征。

S203：基于所述第二训练图的各个节点对应所述目标特征空间的位置特征、以及所述第二训练图，确定损失函数。

S204：基于所述损失函数，调整所述位置特征提取模块的参数。

S203在具体实现时，例如可以基于所述第二训练图的各个节点对应所述目标特征空间的位置特征，确定所述第二训练图在任意两个节点在所述目标特征空间中的距离，并根据所述第二训练图，确定任意两个节点在所述第二训练图中的距离，而后，基于任意两个节点在所述目标特征空间中的距离和该任意两个节点在所述第二训练图中的距离，确定损失函数。

在一个示例中，考虑到对于第二训练图而言，若所述第二训练图包括的节点数量众多，则对于任意两个节点，均计算该两个节点在所述第二训练图中的距离以及在目标特征空间中的距离，则确定所述损失函数的计算量则比较大。为了减少确定所述损失函数的计算量，S203在具体实现时，例如可以根据第二训练图中各个节点分别对应的损失项，得到所述损失函数。例如，可以对所述各个节点分别对应的损失项进行求和，从而得到所述损失函数。

其中：

第一节点为所述各个节点中的任意一个节点，则可以基于所述第一节点对应所述目标特征空间的位置特征、第二节点对应所述目标特征空间的位置特征、以及所述第一节点和所述第二节点在所述第二训练图中的距离，得到所述第一节点对应的损失项，所述第二节点为所述第一节点的K阶邻居节点，所述K为大于1或者等于1的整数。

采用这种情况，对于第一节点而言，无需计算第一节点和所述第二训练图中各个节点分别在第二训练图以及在所述目标特征空间中的距离。由于第二节点是第一节点的K阶邻居节点，因此，第一节点和第二节点在第二训练图中的距离为K。因此，采用本方案，计算第一节点和第一节点的K阶邻居节点在所述目标特征空间的距离即可，有效减少了确定所述损失函数的计算量。

在一个示例中，“基于所述第一节点对应所述目标特征空间的位置特征、第二节点对应所述目标特征空间的位置特征、以及所述第一节点和所述第二节点在所述第二训练图中的距离，得到所述第一节点对应的损失项”在具体实现时，例如可以基于所述第一节点对应所述目标特征空间的位置特征和第二节点对应所述目标特征空间的位置特征，确定所述第一节点和所述第二节点在所述目标特征空间的距离，进一步地，基于所述第一节点和所述第二节点在所述目标特征空间的距离和所述第一节点和所述第二节点在所述第二训练图中的距离，得到所述第一节点对应的损失项。

本申请实施例不具体限定所述K的具体取值，所述K的具体取值例如可以根据实际情况确定。

在一个示例中，第一节点对应的损失项可以通过如下公式(1)计算得到。
L_los＝[(1-d_cos(f_pos(v_i),f_pos(v_j))/2-(1-1/d_spd(v_i,v_j))]² 公式(1)

在公式(1)中：

L_los为第一节点的损失项；

f_pos(v_i)为节点i在目标特征空间的位置特征，节点i为第一节点；

f_pos(v_j)为节点j在目标特征空间的位置特征，节点j为第二节点；

d_cos(f_pos(v_i),f_pos(v_j)为节点i和所述节点j在目标特征空间的距离；

d_spd(v_i,v_j)为节点i和节点j在第二训练图中的距离，d_spd(v_i,v_j)的值为k。

接下来，结合图3，对所述目标模型的训练过程进行介绍。

参见图3，该图为本申请实施例提供的一种训练目标模型的过程示意图。

如图3所示：

可以由位置特征提取模块对第一训练图进行处理，得到第一训练图的位置特征，并由第一模型对所述第一训练图的位置特征进行处理，得到第一重要程度。

另外，可以由节点特征提取模块对所述第一训练图进行处理，得到第一训练图的节点特征。

另外，可以由结构特征提取模块对第一训练图进行处理，得到第一训练图的结构特征，并由第二模型对所述第一训练图的结构特征进行处理，得到第二重要程度。

而后，基于所述第一重要程度和所述第二重要程度，对所述第一训练图的位置特征、所述第一训练图的结构特征、以及所述第一训练图的节点特征进行融合，得到所述第一训练图的融合特征。

进一步地，基于所述第一训练图的融合特征和所述第一训练图的标签，训练基于GNN的目标模型。

在一个示例中，训练得到所述目标模型之后，可以基于所述目标模型对待处理图进行处理，得到所述待处理图的标签。在一个示例中，可以执行如下步骤A1-A4，从而得到待处理图对应的标签。

步骤A1：获取待处理图，所述待处理图为与待处理多媒体内容对应的关系图，或者，所述待处理图为与待处理物品对应的关系图。

步骤A2：基于所述待处理图得到所述待处理图的位置特征、所述待处理图的结构特征以及所述待处理图的节点特征。

步骤A3：对所述待处理图的位置特征、所述待处理图的结构特征以及所述待处理图的节点特征进行融合，得到所述待处理图的融合特征。

需要说明的是，对待处理图的处理方式，与在训练目标模型时对第一训练图的处理方式是类似的，因此，关于步骤A1-A3，其具体实现方式可以参考步骤S101-S103，此处不做详细描述。

步骤A4：将所述待处理图的融合特征输入所述目标模型，得到所述待处理图的标签。

得到待处理图的融合特征之后，可以将所述待处理图的融合特征输入所述目标模型，从而得到所述目标模型输出的所述待处理图的标签。

正是由于在训练所述目标模型时，除了考虑了第一训练图的节点特征之外，还考虑了第一训练图的位置特征和所述第一训练图的结构特征，因此，训练所述目标模型所使用的有效信息更多，相应的，所训练得到的目标模型在对待处理图进行处理时，所得到的待处理图的标签也会更加准确。

示例性设备

基于以上实施例提供的方法，本申请实施例还提供了一种装置，以下结合附图介绍该装置。

参见图4，该图为本申请实施例提供的一种基于GNN的模型训练装置的结构示意图。所述装置400例如可以具体包括：第一获取单元401、第一确定单元402、第一融合单元403以及训练单元404。

第一获取单元401，用于获取第一训练图和所述第一训练图对应的标签，所述第一训练图为与训练多媒体内容对应的关系图，或者，所述第一训练图为与训练物品对应的关系图；

第一确定单元402，用于基于所述第一训练图得到所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征；

第一融合单元403，用于对所述位置特征、所述结构特征以及所述节点特征进行融合，得到融合特征；

训练单元404，用于根据所述融合特征和所述标签，训练基于GNN的目标模型。

可选的，所述装置还包括：

所述第一融合单元403，用于：

可选的，所述位置特征提取模块，通过如下方式训练得到：

获取第二训练图；

基于所述损失函数，调整所述位置特征提取模块的参数。

可选的，所述确定所述位置特征的第一重要程度，包括：

可选的，所述确定所述第一训练图的结构特征，包括：

可选的，所述装置还包括：

由于所述装置400是与以上方法实施例提供的方法对应的装置，所述装置400的各个单元的具体实现，均与以上方法实施例为同一构思，因此，关于所述装置400的各个单元的具体实现，可以参考以上方法实施例的描述部分，此处不再赘述。

本申请实施例还提供了一种设备，所述设备包括处理器和存储器；

所述处理器用于执行所述存储器中存储的指令，以使得所述设备执行以上方法实施例任一项所述的基于GNN的模型训练方法。

本申请实施例提供了一种计算机可读存储介质，包括指令，所述指令指示设备执行以上方法实施例任一项所述的基于GNN的模型训练方法。

本申请实施例提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得计算机执行以上方法实施例任一项所述的基于GNN的模型训练方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种基于图神经网络GNN的模型训练方法，其特征在于，所述方法包括：

获取第一训练图和所述第一训练图对应的标签，所述第一训练图为与训练多媒体内容对应的关系图，或者，所述第一训练图为与训练物品对应的关系图；

基于所述第一训练图得到所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征；

对所述位置特征、所述结构特征以及所述节点特征进行融合，得到融合特征；

根据所述融合特征和所述标签，训练基于GNN的目标模型。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

确定所述位置特征的第一重要程度，以及确定所述结构特征的第二重要程度；

对所述位置特征、所述结构特征以及所述节点特征进行融合，得到融合特征，包括：

基于所述第一重要程度和所述第二重要程度，对所述位置特征、所述结构特征以及所述节点特征进行融合，得到所述融合特征。
根据权利要求1所述的方法，其特征在于，所述基于所述第一训练图得到所述第一训练图的位置特征，包括：

将所述第一训练图输入位置特征提取模块，得到在目标特征空间对应的所述位置特征，所述目标特征空间的维度低于所述第一训练图对应的图像空间的维度。
根据权利要求3所述的方法，其特征在于，所述位置特征提取模块，通过如下方式训练得到：

获取第二训练图；

获取所述第二训练图的各个节点对应所述目标特征空间的位置特征；

基于所述第二训练图的各个节点对应所述目标特征空间的位置特征、以及所述第二训练图，确定损失函数；

基于所述损失函数，调整所述位置特征提取模块的参数。
根据权利要求4所述的方法，其特征在于，所述基于所述第二训练图的各个节点对应所述目标特征空间的位置特征、以及所述第二训练图，确定损失函数，包括：

基于所述各个节点分别对应的损失项，得到所述损失函数；其中：

第一节点为所述各个节点中的任意一个节点，所述第一节点对应的损失项，通过如下方式确定：

基于所述第一节点对应所述目标特征空间的位置特征、第二节点对应所述目标特征空间的位置特征、以及所述第一节点和所述第二节点在所述第二训练图中的距离，得到所述第一节点对应的损失项，所述第二节点为所述第一节点的K阶邻居节点，所述K为大于1或者等于1的整数。
根据权利要求2所述的方法，其特征在于，所述确定所述位置特征的第一重要程度，包括：

将所述位置特征输入第一模型，得到所述第一重要程度，所述第一模型用于基于输入的位置特征，得到对应的重要程度；其中：

所述第一模型是基于第三训练图对应的位置特征和所述第三训练图对应的标签训练得到的。
根据权利要求1所述的方法，其特征在于，所述确定所述第一训练图的结构特征，包括：

基于所述第一训练图，得到所述第一训练图的多阶邻居数量序列，所述多阶邻居数据序列用于指示所述第一训练图中各个节点分别包括的各阶邻居节点的数量，所述结构特征包括所述多阶邻居数量序列。
根据权利要求1所述的方法，其特征在于，所述基于所述第一训练图得到所述第一训练图的结构特征，包括：

基于所述第一训练图，得到所述第一训练图的多阶邻居数量序列以及所述第一训练图的聚类特征，所述多阶邻居数据序列用于指示所述第一训练图中各个节点分别包括的各阶邻居节点的数量；

对所述多阶邻居数量序列和所述聚类特征进行融合，得到所述第一训练图的结构特征。
根据权利要求2所述的方法，其特征在于，所述基于所述结构特征得到所述结构特征的第二重要程度，包括：

将所述结构特征输入第二模型，得到所述第二重要程度，所述第二模型用于基于输入的结构特征，得到对应的重要程度；其中：

所述第二模型，是基于第四训练图对应的结构特征和所述第四训练图对应的标签训练得到的。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取待处理图，所述待处理图为与待处理多媒体内容对应的关系图，或者，所述待处理图为与待处理物品对应的关系图；

基于所述待处理图得到所述待处理图的位置特征、所述待处理图的结构特征以及所述待处理图的节点特征；

对所述待处理图的位置特征、所述待处理图的结构特征以及所述待处理图的节点特征进行融合，得到所述待处理图的融合特征；

将所述待处理图的融合特征输入所述目标模型，得到所述待处理图的标签。
一种基于图神经网络GNN的模型训练装置，其特征在于，所述装置包括：

第一获取单元，用于获取第一训练图和所述第一训练图对应的标签，所述第一训练图为与训练多媒体内容对应的关系图，或者，所述第一训练图为与训练物品对应的关系图；

第一确定单元，用于基于所述第一训练图得到所述第一训练图的位置特征、所述第一训练图的结构特征以及所述第一训练图的节点特征；

第一融合单元，用于对所述位置特征、所述结构特征以及所述节点特征进行融合，得到融合特征；

训练单元，用于根据所述融合特征和所述标签，训练基于GNN的目标模型。
一种设备，其特征在于，所述设备包括处理器和存储器；

所述处理器用于执行所述存储器中存储的指令，以使得所述设备执行如权利要求1至10中任一项所述的方法。
一种计算机可读存储介质，其特征在于，包括指令，所述指令指示设备执行如权利要求1至10中任一项所述的方法。
一种计算机程序产品，其特征在于，当所述计算机程序产品在计算机上运行时，使得计算机执行如权利要求1至10中任一项所述的方法。