WO2021089013A1

WO2021089013A1 - 空间图卷积网络的训练方法、电子设备及存储介质

Info

Publication number: WO2021089013A1
Application number: PCT/CN2020/127254
Authority: WO
Inventors: 纪超杰; 吴红艳; 李烨; 蔡云鹏
Original assignee: 中国科学院深圳先进技术研究院
Priority date: 2019-11-06
Filing date: 2020-11-06
Publication date: 2021-05-14
Also published as: CN111079780A; CN111079780B

Abstract

一种空间图卷积网络的训练方法，包括：获取训练数据（S110）；其中，所述训练数据包多个对象的网络结构特征、每个对象的对象属性特征、以及所述多个对象中部分对象的标记类别；每个对象的所述网络结构特征为该对象与其他对象间的关联关系；所述多个对象中具有标记类别的对象为第二对象，不具有标记类别的对象为第一对象；以及，根据所述训练数据对待训练的图卷积网络进行训练，得到用于对象分类和对象网络结构属性预测的图卷积网络（S120）。从而实现了可以同时处理对象关系网络的对象分类和对象的网络结构特征预测任务，节省了计算设备的算力，提高了效率。

Description

空间图卷积网络的训练方法、电子设备及存储介质

技术领域

本申请属于模式识别技术领域，尤其涉及空间图卷积网络的训练方法、电子设备及存储介质。

背景技术

在关于图网络数据处理的相关应用场景中，对象关系网络中的节点对应的对象分类，和节点间连接对应的对象的网络结构特征预测是两个较为常见的任务。例如，通过论文间的引用关系进行论文所属学科的预测，和论文间缺失的引用关系的补全。又例如，通过蛋白质间在组织内的共表达预测蛋白质的细胞内功能和蛋白质间缺失的共表达关系的补全。但是目前缺乏一种方法可以同时处理对象关系网络对应的图网络数据中的对象分类和对象网络结构特征预测任务。

发明内容

本申请实施例提供了空间图卷积网络的训练方法、对象分类和对象的网络结构特征的预测方法、电子设备及存储介质，可以解决上述技术问题。

第一方面，本申请实施例提供了一种空间图卷积网络的训练方法，包括：

获取训练数据；其中，所述训练数据包多个对象的网络结构特征、每个对象的对象属性特征、以及所述多个对象中部分对象的标记类别；每个对象的所述网络结构特征为该对象与其他对象间的关联关系；所述多个对象中具有标记类别的对象为第二对象，不具有标记类别的对象为第一对象；

根据所述训练数据对待训练的图卷积网络进行训练，得到用于对象分类和对象网络结构属性预测的图卷积网络。

从而实现了可以同时处理对象关系网络的对象分类和对象网络结构属性预测任务，节省了计算设备的算力，提高了效率。

第二方面，本申请实施例提供了一种对象分类和对象的网络结构特征的预测方法，包括：

获取待预测对象的测试数据；

采用空间域图卷积网络对所述测试数据进行处理，获得所述待预测对象的分类结果和对象的网络结构属性预测结果，所述空间域图卷积网络为经由上述第一方面所述的方法训练的到的图卷积网络。

第三方面，本申请实施例提供了一种空间域图卷积网络的训练装置，包括：

数据获取模块，用于获取训练数据；其中，所述训练数据包多个对象的网络结构特征、每个对象的对象属性特征、以及所述多个对象中部分对象的标记类别；每个对象的所述网络结构特征为该对象与其他对象间的关联关系；所述多个对象中具有标记类别的对象为第二对象，不具有标记类别的对象为第一对象；

训练模块，用于根据所述训练数据对待训练的图卷积网络进行训练，得到用于对象分类和对象网络结构属性预测的图卷积网络。

第四方面，本申请实施例提供了一种对象分类和对象间连接关系的预测装置，包括：

测试数据获取模块，用于获取待预测对象的测试数据；

预测模块，采用空间域图卷积网络对所述测试数据进行处理，获得所述待预测对象的分类结果和对象间的网络结构属性预测结果，所述空间域图卷积网络为经由上述第一方面所述的方法训练的到的图卷积网络。

第五方面，本申请实施例提供了一种电子设备，包括：

存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面和/或第二方面所述的方法步骤。

第六方面，本申请实施例提供了一种计算机可读存储介质，包括：所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面和/或第二方面所述的方法步骤。

第七方面本申请实施例提供了一种计算机程序产品，当计算机程序产品在电子设备上运行时，使得电子设备执行上述第一方面所述的方法步骤。

可以理解的是，上述第二方面至第六方面的有益效果可以参见上述第一方面中的相关描述，在此不再赘述。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的电子设备的结构示意图；

图2是本申请一实施例提供的对象关系网络结构示意图；

图3是本申请一实施例提供的空间域图卷积网络训练方法流程示意图；

图4是本申请另一实施例提供的空间域图卷积网络训练方法流程示意图；

图5是本申请一实施例提供的对象分类和对象的网络结构特征的预测方法的流程示意图；

图6是本申请实施例提供的空间域图卷积网络训练装置示意图；

图7是本申请实施例提供的对象分类和对象的网络结构特征的预测装置示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

在关于图网络数据处理的相关应用场景中，对象关系网络中的节点对应的对象分类，和节点间连接对应的对象的网络结构特征预测是两个较为常见的任务。例如，通过论文间的引用关系进行论文所属学科的预测，和论文间缺失的引用关系的补全。又例如，通过蛋白质间在组织内的共表达预测蛋白质的细胞内功能和蛋白质间缺失的共表达关系。但是，目前的方法均将节点分类和节点间连接关系预测这两个任务孤立看待，没有方法能够同时训练学习和完成这两个任务。而且，也没有现有方法可以通过参数的设定，使得同一个模型可以根据参数的不同设定来切换侧重进行不同的任务。但是，往往这样的多任务同时学习可以大大减少计算机的计算成本，尤其对于深度学习网络这种复杂模型。

在图网络数据的节点分类任务中，输入数据必须包含网络拓扑结构信息，也就是节点之间的连接关系，但是节点分类模型并不直接对连接关系进行学习建模，而是通过间接观察已有的连接关系给分类结果带来的准确率收益来进行模型学习。这样单一的观察模式，并没有最大化的利用输入信息。同样，在连接预测任务中，现有方法又完全不考虑节点的类别归属。

图网络结构数据中，新的节点间的连接的引入能为节点分类和连接预测任务引入更多信息。而这个信息是能在多任务共同学习的过程中学习得到的，而目前方法都没有考虑到这点。

为解决同时处理节点分类任务和连接预测任务，以及通过连接预测任务提高节点分类任务的准确性，本申请提供了一种空间图卷积网络的训练方法、对象分类和对象的网络结构特征的预测方法电子设备及存储介质。

以下结合附图对本申请的实施例加以说明。

图1示出的是本申请实施例提供的一种电子设备D10，包括：至少一个处理器D100、存储器D101以及存储在存储器D101中并可在所述至少一个处理器D100上运行的计算机程序D102，所述处理器D100执行所述计算机程序D102时实现本申请实施例提供的空间图卷积网络的训练方法、对象分类和对象的网络结构特征的预测方法至少之一。

可以理解的是，上述电子设备，可以是桌上型计算机、笔记本、掌上电脑服务器、服务器集群、分布式服务器及云端服务器等计算设备。该电子设备D10可包括，但不仅限于，处理器D100、存储器D101。本领域技术人员可以理解，图1仅仅是电子设备D10的举例，并不构成对电子设备D10的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如还可以包括输入输出设备、网络接入设备等。

所称处理器D100可以是中央处理单元(Central Processing Unit，CPU)，该处理器D100还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器D101在一些实施例中可以是所述电子设备D10的内部存储单元，例如电子设备D10的硬盘或内存。所述存储器D101在另一些实施例中也可以是所述电子设备D10的外部存储设备，例如所述电子设备D10上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器D101还可以既包括所述电子设备D10的内部存储单元也包括外部存储设备。所述存储器D101用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等，例如所述计算机程序的程序代码等。所述存储器D101还可以用于暂时地存储已经输出或者将要输出的数据。

为了阐述方便，以下实施例中将上述电子设备统称为服务器，可以理解的是，这并不构成对本申请的电子设备的具体限定。

图2示出的是本申请实施例提供的一个对象关系网络图。图中的节点为实际应用场景中的对象，图中的边为对象间的关联关系，对应于对象的网络结构属性特征，图中节点的编号为节点对应的对象的编号。例如，若图2表示的对象关系网络图对应于蛋白质关联关系网络，则图2中节点对应的对象是蛋白质，图2中的边对应的是两蛋白质在细胞内的共表达。又例如，若图2表示的对象关系网络图对应于文献引用关系网络，则图2中的节点对应的对象是文献，图 2中的边对应的是两文献间的引用关系。当然，本领域技术人员可以根据本申请的指引，获得不同领域的对象关联关系图以应用到本申请实施例提供的方法。

图3示出了本申请实施例提供的空间域图卷积网络的训练方法的流程示意图，用于得到对象分类和对象网络结构属性预测的图卷积网络，应用于上述图1所示的电子设备(以下称服务器)，如图3所示该方法包括步骤S110和步骤S120，各步骤的具体实现原理如下：

S110，获取训练数据；其中，所述训练数据包多个对象的网络结构特征、每个对象的对象属性特征、以及所述多个对象中部分对象的标记类别；每个对象的所述网络结构特征为该对象与其他对象间的关联关系；所述多个对象中具有标记类别的对象为第二对象，不具有标记类别的对象为第一对象。

非限定性的，服务器获取训练数据，所述训练数据包多个对象的网络结构特征、每个对象的对象属性特征、以及所述多个对象中部分对象的标记类别；每个对象的所述网络结构特征为该对象与其他对象间的关联关系；所述多个对象中具有标记类别的对象为第二对象，不具有标记类别的对象为第一对象。可以理解的是，在图网络结构表示的对象关系图中，对象对应对象关系网络中的节点，对象的网络结构特征对应对象关系网络中节点与其他节点的连接关系。

在一个非限定性的具体示例中，所述对象为蛋白质关联关系网络中的蛋白质；所述对象属性特征为蛋白质的子空间结构；所述对象的网络结构特征为每个蛋白质和其他蛋白质在组织内的共表达；所述部分对象的标记类别为部分已知的细胞功的蛋白质的细胞功能；所述第一对象为未知细胞功能的蛋白质；所述第二对象为已知细胞功能的蛋白质。

在另一非限定性的示例中，所述对象为文献引用关系网络中的文献；所述对象属性特征为文献标题的关键词；所述对象的网络结构特征为每个文献与其他文献的引用关系；所述部分对象的标记类别为部分已知文献类别的文献；所述第一对象为未知文献类别的文献，所述第二对象为已知文献类别的文献。

以文献引用关系网络图为例，在一个非限定性的示例中，服务器获取文献引用关系网络中多个文献的网络结构特征，所述网络结构特征可以是该文献与其他文献引用关系的向量，也可以是文献引用关系网络中的多个文献以文献为节点，以文献间存在的引用关系为边构成的网络对应的邻接矩阵。文献的对象属性特征为文献标题的关键词与预设词典中关键词对应关系的向量。例如，词典为[生物，一种，信息学，……，预测，……]；一个示例文中，献的标题为“生物信息学中的MicroRNA预测研究”则该文献的对象属性特征为[1,0,1,……,1,……]；另一示例中，文献标题为“一种基于高斯混合模型的轨迹预测算法”则该文献的对象属性特征为[0,1,0,……,1,……]。用于训练图卷积网络的部分对象的类别是已知的，例如，已知“生物信息学中的MicroRNA预测研究”属于生物信息学类别，已知“一种基于高斯混合模型的轨迹预测算法”属于计算机科学类别。则该对象在类别向量y＝[y ₁,y ₂,……,y _n]，的相应类别的概率为1，例如，文献“生物信息学中的MicroRNA预测研究”用类别向量标识则为[0,1，0,……,0]，该类别向量中的第二个元素对应文献为生物信息学类别的概率，可以用该向量标记该文献的类别，作为该文献的标识类别数据。

可以理解的是，本领域技术人员可以根据上述示例获取蛋白质关系网络对应的训练数据，例如通过蛋白质子空间结构字典和蛋白质的子空间结构得到蛋白质属性特征向量，通过两蛋白质在组织内的共表达作为蛋白质关系网络的边，进而获得蛋白质在该网络中的网络结构特征，该网络结构特征可以是蛋白质关系网络的邻接矩阵，也可以是以蛋白质为对象的，该蛋白质与其他蛋白质关联关系的向量。进一步的，本领域技术人员也可以根据以上示例获取社交关系网络对应的训练数据、销售关系网络对应的训练数据，以及其他领域的训练数据，用以训练处理各领域对象分类和对象间关联关系预测的图卷积网络。

S120，根据所述训练数据对待训练的图卷积网络进行训练，得到用于对象分类和对象网络结构属性预测的图卷积网络。

非限定性的，服务器根据上述训练数据，例如蛋白质关系网络图的数据或文献引用关系网络图的数据，对待训练的图卷积网络进行训练，得到用于对象分类和对象网络结构属性预测的图卷积网络。

在一种可能的实现方式中，在图2所示的实施例的基础上，对步骤S120进行了细化，如图4所示，包括步骤S121～S125。具体的：

S121，基于所述待训练的图卷积网络，根据各个对象的对象属性特征获取没有连接关系的对象间的第一连接概率，根据所述第一连接概率更新所述对象的网络结构特征。

在一个非限定性的示例中，服务器根据各个对象的对象属性特征获取没有连接关系的对象间的第一连接概率，根据所述第一连接概率更新所述对象的网络结构特征。可以理解的是，除了第一次迭代每次迭代中的对象属性特征都是上一轮迭代更新的对象属性特征，第一次迭代采用的对象属性特征为S110步骤中获取的原始对象属性特征。可以理解的是，每次迭代后在步骤S110步骤获取的原始的对象图结构特征的基础上根据更新的对象属性特征计算对象间的第一连接概率，并根据第一连接概率更新原始的对象图结构特征，即更新对象与其他对象间的连接关系，也可以理解为补全原始的对象关系图网络结构的连接关系。在一种可能是实施方式中，在第一次迭代时不计算第一连接概率，也就是说不进行对象间连接关系补全操作。

在一个非限定性的具体的示例中，请一并参阅图2，如图2所示的对象关系图网络中。遍历图网络中的所有节点，选取不存在连接关系的两个节点对{(i,j),……}，通过下面公式计算每个节点对的连接概率e _ij，

其中，

为步骤S122中第K次循环(卷积)产生的节点标识，也就是节点的聚合特征，a为一个线性函数，该函数具有初始参数，其参数通过步骤S124的反馈学习过程更新，W ₁为降维向量，σ为一个非线性变换函数，例如sigmoid函数，用于将计算结果映射到[0,1]区间以获得概率值。

在一个非限定性的示例中，获取全部没有连接关系的两个对象间的第一连接概率后，对全部第一概率值由大至小进行排序，由大至小选取前O个概率值对应的对象，认为这O个概率值对应的两个对象间有连接关系，更新该概率值对应的对象的网络结构特征，也就是补全该对象和其他对象的连接关系。

在一个非限定性的示例中，获取全部没有连接关系的两个对象间的第一连接概率后，选取概率值大于第一阈值的概率值对应的对象，认为大于第一阈值的概率值对应的两个对象间有连接关系，更新该概率值对应的对象的网络结构特征，也就是补全该对象和其他对象的连接关系。

S122，根据各个对象更新后的所述网络结构特征和各个对象的所述对象属性特征获取各个对象的聚合特征，根据所述聚合特征更新各个对象的所述对象属性特征。

在一个非限定性的示例中，服务器通过图采样和聚合(Graph Sampling and Aggregating，GraphSAGE)算法获取各个对象的对象属性特征的聚合特征，并根据聚合特征更新对象的对象属性特征。

在一个非限定性的示例中，服务器通过图注意力网络(Graph Attention Network，GAT)算法更新各个对象的属性特征。

非限定性的，以应用GraphSAGE算法更新各个对象的所述对象属性特征为例阐述图卷积神经网络训练过程中的卷积过程。

执行K次循环过程，也就是卷积过程，每次卷积过程即为第k次卷积过程，其中K为大于等于1的整数。

在每次卷积过程中遍历图2所示的图网络中的每个节点，可以理解的是，这里不区分节点的访问顺序。可以理解的是，也可以选取图2所示节点中的部分节点。

对每个节点进行执行以下过程,直到每个节点都被访问过一次：

将当前访问的节点作为目标节点，表示为v，该节点对应的特征为x _v(当k＝1时)，或h ^k-1 _v(当k>1时)；

在S121更新的对象网络结构特征的基础上，也就是在补全的网络结构图基础上，匹配与这个目标节点v直接相连的节点，表示为N(v)；

对目标结点和所有邻居结点的特征表示，即对象的对象属性特征，进行聚合操作：

其中，AGGREGATE为向量聚合操作，CONCAT为向量拼接操作，k-1表示上一个循环步，h ^k-1表示上一个循环步产生的节点特征表示，k＝0时，h ^k＝x，即使用原始节点特征表示。W ^k为模型中的可学习参数，每个循环步(卷积)使用不同的参数。

可以理解的是，上述以GraphSAGE算法为例进行对象(节点)的对象属性特征聚合操作，那么所有GraphSAGE算法的变形算法对节点的聚合操作均适用于本实施例，其中的算法步骤和采样步骤这里不再赘述。可以理解的是，其他空间域图卷积网络对节点特征的卷积操作也均可以用于替换本步骤的聚合(卷积)操作，这里也不再赘述。

S123，根据各个对象的所述对象属性特征和原始网络结构特征，计算第二连接概率；所述第二连接概率为每个对象与根据该对象的所述网络结构特征采样选取的其他对象的连接概率。

在一个非限定性的示例中，服务器根据各个对象的所述对象属性特征和原始的网络结构特征，计算第二连接概率；所述第二连接概率为每个对象与根据该对象的所述网络结构特征采样选取的其他对象的连接概率。

一种可能的实施方式为，根据该对象的所述网络结构特征采样选取的其他对象，可以为根据每个对象的网络结构特征，选取对象关系网络图中与该对象对应的目标节点直接连接的全部第一跳节点，以及，采样选取与该节点无直接连接的I个第J跳节点；其中I为大于0的正整数，J为大于1的正整数。

在一种可能的实施方式中，根据该对象的所述网络结构特征采样选取的其他对象，可以为根据跳数进行采样，例如，跳数J越大，采样的节点数I越小。

在一种可能的实施方式中，根据该对象的所述网络结构特征采样选取的其他对象，可以为跳数J为大于0的正整数，也就是说对第一跳的节点数量也进行采样。

通过对目标节点外的其他节点进行采样可以保证采样的平衡和降低计算量。本领域技术人员可以根据本申请实施例的教导，在实际实施本申请实施例的技术方案时选取符合实际情况的采样方法。原始的网络结构特征即通过步骤S110获取的网络结构特征。

在一个非限定性的具体的示例中，根据更新后的对象属性特征，采用公式，

计算第二连接概率，该第二连接概率为节点间连接概率。

可以理解的是，步骤S123中节点的选取，本领域技术人员可以在本申请的教导下根据实际的需要进行选取和调整，以上节点选取的方法为非限定性示例性说明，并不构成对本申请的限定。

S124，根据更新后的各个对象的对象属性特征获得各个对象的预测类别；根据所述第二对象的预测类别、所述第二对象的标记类别、所述第二连接概率、各个对象的原始网络结构特征和损失函数调整所述图卷积网的参数。

在一个非限定性的示例中，服务器根据更新后的各个对象的对象属性特征获得各个对象的预测类别；根据所述第二对象的预测类别、所述第二对象的标记类别、所述第二连接概率、各个对象的原始网络结构特征和损失函数调整所述图卷积网络的参数。非限定性的，可以通过反向传播梯度下降法调整所述图卷积网络的参数。非限定性的，通过分类器对根据更新后的各个对象的对象属性特征获得各个对象的预测类别，所述分类器可以为两层的全连接神经网络，也可以为两层以上的多层神经网络或其他机器学习分类模型。

在一个非限定性的示例中，通过下面的损失函数计算奖惩值调整所述图卷积网的参数，

Loss＝Loss _link+Loss _cls

其中，Loss _link为第二连接概率和各个对象的原始网络结构特征的差值； Loss _cls为根据所述第二对象的预测类别、所述第二对象的标记类别的差值。可以理解的是，上述差值可以为差值的绝对值、均差、方差等差值，本领域技术人员可以根据实际需要对确定损失函数中差值的处理，这里不再赘述。

在一个非限定的示例中，第一损失函数具有第一损失函数系数，第二损失函数具有第二损失函数系数，根据所述第一损失函数的系数和所述第二损失函数的系数确定所述图卷积网络偏重对象分类或对象网络结构特征预测。在一个非限定性的具体的示例中，不受偏重任务的系数为γ，受偏重任务的系数为1-γ。例如，已知一个蛋白质关联关系网络，蛋白质节点间的连接关系大部分都是已知的，但是蛋白质在细胞内的功能大部分是未知的，此时需要训练图卷积网络偏重于节点分类任务，则损失函数为，

Loss＝γLoss _link+(1-γ)Loss _cls

又例如，已知一个蛋白质关联关系网络，蛋白质节点间的连接关系大部分都是未知的，但是蛋白质在细胞内的功能大部分是已知的，此时需要训练图卷积网络偏重于连接预测任务，则损失函数为，

Loss＝(1-γ)Loss _link+γLoss _cls

在一个非限定性的示例中，采用退火算法根据所述第一奖惩值计算所述第一损失函数的系数和所述第二损失函数的系数；或，采用退火算法根据所述第二奖惩值计算所述第一损失函数的系数和所述第二损失函数的系数。在一个非限定性的具体的示例中，设置初始退火温度为temp _ini，退火速率为ε。如果我们对当前的训练目标有所偏重，如更倾向于节点分类或连接预测任务，那么就需要在训练过程中加入对这两者的动态调节。因此，退火机制被引入其中，目标是使得：受偏重的任务在训练过程中随着训练的迭代过程受到递增的重视，反之，不受偏重任务所受的重视度递减。

如下定义一个退火策略，表示随着训练迭代过程，temp ^t越来越小，其中t为图卷积网络的训练迭代次数，

同时考虑到：即使是不受偏重的任务，过大的误差也应该被避免，因此本方法又进一步对高误差现象加入了惩罚，使得不受偏重任务的预测误差和重视度达到一种平衡，

Loss _aux表示不受偏重的训练任务所产生的损失。综合这两个因素得到了：不受偏重的训练任务的系数γ和受偏重的训练任务的系数1-γ。

可以理解的是，通过引入退火机制来平衡当前的任务重心，从而保证图卷积网络在学习多个任务的过程中，保证模型表现的前提下，对任务有所侧重。

在执行S124之后，判定当前是否满足迭代结束条件，当前不满足迭代结束条件时，返回S121，继续执行S121～S124；当前满足迭代结束条件时，执行S125。

S125，当对所述图卷积网络的训练满足迭代结束条件，停止训练，得到用于对象分类和对象网络结构属性预测的图卷积网络。

可以理解的是，若不满足迭代训练结束条件，则返回所述根据各个对象的对象属性特征获取没有连接关系的对象间的第一连接概率的步骤对所述图卷积网络进行迭代训练，直到对所述图卷积网络的训练满足迭代结束条件，停止训练，得到用于对象分类和对象网络结构属性预测的图卷积网络。

非限定性的，迭代训练结束条件可以为达到预设迭代次数，也可以为损失函数收敛到预设阈值以下。本领域技术人员可以根据实际需要设置迭代结束条件。如果未达到迭代训练结束条件则返回根据各个对象的对象属性特征获取没有连接关系的对象间的第一连接概率的步骤对所述图卷积网络进行迭代训练；如果达到迭代训练结束条件则结束对待训练的图卷积网络的训练。

可以理解的是，的本申请实施例训练得到的图卷积网络，一方面引入单模型多任务的图卷积网络训练方式来同时训练对象关系网络中节点对应的对象的分类任务，和节点间连接关系对应的对象的网络结构特征预测任务，获得的经训练的图卷积网络可以同时实现对象分类任务和对象的网络结构特征预测任务，从而充分利用了计算设备的算力，提高了资源利用率，降低了成本。另一方面，将预测得到的网络结构特征用于对象关系网络的连接补全，并将连接补全的结果作为额外的新输入信息来与对象分类任务一起协同训练，从而可以提高节点分类的预测精度和预测效率。

请参阅图5，图5示出的是本申请实施例提供的一种对象分类和对象的网络结构特征的预测方法，可由上述图1所示电子设备(以下称服务器)通过软件/硬件实现。如图5所示，该方法包括步骤S210至S220。各步骤的具体实现原理如下：

S210，获取待预测对象的测试数据。

在一个非限定性的示例中，所述测试数据包括所述待预测对象所在的对象关系网络中的各个对象的网络结构特征、对象属性特征。

非限定性的，在蛋白质关联关系网络中，所述待预测对象所在的对象关系网络中对象的网络结构特征为待预测蛋白质所在的蛋白质关联关系网络中每个蛋白质的与其他蛋白质在组织内的共表达；所述对象属性特征为蛋白质的子空间结构。

非限定性的，在文献引用关系网络中，所述待预测对象所在的对象关系网络中对象的网络结构特征为待预测文献所在的文献引用关系网络中每个文献的与其他文献的引用关系；所述对象属性特征为文献标题的关键词。

本领域技术人员也可以根据以上示例获取社交关系网络对应的训练数据、销售关系网络对应的预测数据，以及其他领域的预测数据，采用图卷积网络处理各领域对象分类和对象间关联关系预测的任务。

S220，采用经上述图3所示的方法得到的空间域图卷积网络对所述测试数据进行处理，获得所述对象的分类结果和对象间的网络结构属性预测结果。

在一个非限定性的示例中，服务器采用经上述图3所示的方法训练得到的空间域图卷积网络对所述测试数据进行处理，获得所述对象的分类结果和对象间的网络结构属性预测结果。

在一个具体的非限定性的示例中，根据各个对象的网络结构特征和对象属性特征获取各个对象的聚合特征，根据所述聚合特征更新各个对象的所述对象属性特征；根据各个对象的网络结构特征和各个对象更新的所述对象属性特征获取各个对象与其他对象的预测连接概率；根据所述预测连接概率更新所述对象的网络结构特征；根据待预测的对象更新后的对象属性特征获取待预测的对象的预测类别。

非限定性的，采用与前述图卷积网络训练方法相同的对象属性特征聚合操作，例如，以GraphSAGE算法对各个对象对应的目标结点和目标节点对应的所有邻居结点的对象属性特征进行聚合操作为例，对各个对象对应的对象属性特征采用以下公式的方法进行K次聚合操作，获得各个节点的聚合对象属性特征，再根据所述聚合特征更新各个对象的所述对象属性特征，其中的参数参考上述实施例中的阐述，

非限定性的，采用图3所述方法得到的空间域图卷积网络中的分类器，例如，两层全连接神经网络，或两层以上的神经网络，或其他机器学习分类模型，对待预测对象的对象属性特征进行识别，获得该待预测对象的分类结果。

非限定性的，根据以下公式获得各个没有连接关系对象(节点)间的预测连接概率，根据所述预测连接概率更新所述对象的网络结构特征，即补全待预测对象的图网络连接关系，其中的参数参考上述实施例中的阐述。

非限定性的，获取全部没有连接关系的两个对象间的预测连接概率后，对全部预测概率值由大至小进行排序，由大至小选取前Q个概率值对应的对象，判定这Q个概率值对应的两个对象间有连接关系，更新该概率值对应的对象的网络结构特征，也就是补全该对象和其他对象的连接关系。

非限定性的，获取全部没有连接关系的两个对象间的预测连接概率后，选取概率值大于预测阈值的概率值对应的对象，则判定大于第二阈值的概率值对应的两个对象间有连接关系，更新该概率值对应的对象的网络结构特征，也就是补全该对象和其他对象的连接关系。

可以理解的是，通过图5所示的方法，可以同时获得对象关系网络中对象分类和对象间连接关系的预测结果，从而节约了计算设备的算力，提高了效率，降低了成本。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

对应于上述图3以及图4所示的空间域图卷积网络的训练方法，图6示出的是本申请实施例提供的一种空间域图卷积网络的训练装置，包括：

数据获取模块M110，用于获取训练数据；其中，所述训练数据包多个对象的网络结构特征、每个对象的对象属性特征、以及所述多个对象中部分对象的标记类别；每个对象的所述网络结构特征为该对象与其他对象间的关联关系；所述多个对象中具有标记类别的对象为第二对象，不具有标记类别的对象为第一对象。

训练模块M120，用于根据所述训练数据对待训练的图卷积网络进行训练，得到用于对象分类和对象网络结构属性预测的图卷积网络。

其中，所述训练模块M120还包括以下子模块：

连接补全模块M121，用于根据各个对象的对象属性特征获取没有连接关系的对象间的第一连接概率，根据所述第一连接概率更新所述对象的网络结构特征；

特征聚合模块M122，用于根据各个对象更新后的所述网络结构特征和各个对象的所述对象属性特征获取各个对象的聚合特征，根据所述聚合特征更新各个对象的所述对象属性特征；

采样连接计算模块M123，根据各个对象的所述对象属性特征和原始的网络结构特征，计算第二连接概率；所述第二连接概率为每个对象与根据该对象的所述网络结构特征采样选取的其他对象的连接概率；

参数调整模块M124，根据更新后的各个对象的对象属性特征获得各个对象的预测类别；根据所述第二对象的预测类别、所述第二对象的标记类别、所述第二连接概率、各个对象的原始网络结构特征和损失函数调整所述图卷积网的参数；

迭代判断模块M125，用于判断迭代结束条件，若不满足迭代结束条件则返回根据各个对象的对象属性特征获取没有连接关系的对象间的第一连接概率的步骤对所述图卷积网络进行迭代训练，直到对所述图卷积网络的训练满足迭代结束条件，得到用于对象分类和对象网络结构属性预测的图卷积网络。

在一个非限定性示例中，所述损失函数包括第一损失函数和第二损失函数。

相应的，参数调整模块M124，用于根据更新后的各个对象的对象属性特征获得各个对象的预测类别；根据所述第二对象的预测类别、所述第二对象的标记类别、所述第二连接概率、各个对象的原始网络结构特征和损失函数调整所述图卷积网的参数，还包括：

第一奖惩值确定模块M1241，用于根据所述第二对象的预测类别、所述第二对象的标记类别和所述第一损失函数确定第一奖惩值；

第二奖惩值确定模块M1241，用于根据所述第二连接概率、各个对象的原始网络结构特征和所述第二损失函数确定第二奖惩值；

参数调整子模块M1243，根据所述第一奖惩值和所述第二奖惩值调整所述图卷积网络的参数。

在一个非限定性示例中，所述参数调整模块M124还用于，根据所述第一损失函数的系数和所述第二损失函数的系数，确定所述图卷积网络偏重对象分类或对象网络结构特征预测。

在一个非限定性示例中，所述参数调整模块M124还用于，采用退火算法根据所述第一奖惩值计算所述第一损失函数和所述第二损失函数的系数；或，

采用退火算法根据所述第二奖惩值计算所述第一损失函数和所述第二损失函数的系数。

在一个非限定性的示例中，所述对象为蛋白质关联关系网络中的蛋白质；所述对象属性特征为蛋白质的子空间结构；所述对象的网络结构特征每个蛋白质和其他蛋白质在组织内的共表达；所述部分对象的标记类别为部分已知的细胞功的蛋白质的细胞功能；所述第一对象为未知细胞功能的蛋白质；所述第二对象为已知细胞功能的蛋白质。

在一个非限定性的示例中，所述对象为文献引用关系网络中的文献；所述对象属性特征为文献标题的关键词；所述对象的网络结构特征为每个文献与其他文献的引用关系；所述部分对象的标记类别为部分已知文献类别的文献；所述第一对象为未知文献类别的文献，所述第二对象为已知文献类别的文献。

对应于上述图5所示的对象分类和对象的网络结构特征预测方法，图7示出的是本申请实施例提供的一种对象分类和对象间连接关系的预测装置，包括：测试数据获取模块M210，用于获取待预测对象的测试数据。

预测模块M220，用于采用经上述图卷积网络训练方法得到的空间域图卷积网络对所述测试数据进行处理，获得所述对象的分类结果和对象间的网络结构属性预测结果。

在一个非限定性的示例中，所述测试数据包括所述待预测对象所在的对象关系网络中的各个对象的网络结构特征、对象属性特征；

相应的，预测模块M220，用于所述采用空间域图卷积网络对所述测试数据进行处理，获得所述对象的分类结果和对象间的网络结构属性预测结果，所述空间域图卷积网络为经由权利要求1至6任一项所述的方法训练的到的图卷积网络，预测模块M220还包括以下子模块：

预测聚合模块M2201，用于根据各个对象的网络结构特征和对象属性特征获取各个对象的聚合特征，根据所述聚合特征更新各个对象的所述对象属性特征。

预测连接模块M2202，用于根据各个对象的网络结构特征和各个对象更新的所述对象属性特征获取各个对象与其他对象的预测连接概率；根据所述预测连接概率更新所述对象的网络结构特征。

预测类别模块M2203，根据待预测的对象更新后的对象属性特征获取待预测的对象的预测类别。

在一个非限定性的示例中，所述待预测对象所在的对象关系网络中对象的网络结构特征为待预测蛋白质所在的蛋白质关联关系网络中每个蛋白质的与其他蛋白质在组织内的共表达；所述对象属性特征为蛋白质的子空间结构。

在一个非限定性的示例中，所述待预测对象所在的对象关系网络中对象的网络结构特征为待预测文献所在的文献引用关系网络中每个文献的与其他文献的引用关系；所述对象属性特征为文献标题的关键词。

需要说明的是，上述图6和图7所示的装置/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

本申请实施例提供了一种计算机程序产品，当计算机程序产品在电子设备上运行时，使得电子设备执行时实现可实现上述各个方法实施例中的步骤。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括：能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/网络设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/网络设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种空间域图卷积网络的训练方法，其特征在于，包括：

获取训练数据；其中，所述训练数据包多个对象的网络结构特征、每个对象的对象属性特征、以及所述多个对象中部分对象的标记类别；每个对象的所述网络结构特征为该对象与其他对象间的关联关系；所述多个对象中具有标记类别的对象为第二对象，不具有标记类别的对象为第一对象；

根据所述训练数据对待训练的图卷积网络进行训练，得到用于对象分类和对象网络结构属性预测的图卷积网络。
如权利要求1所述的方法，其特征在于，所述根据所述训练数据对待训练的图卷积网络进行训练，得到用于对象分类和对象网络结构属性预测的图卷积网络，包括：

基于所述待训练的图卷积网络，根据各个对象的对象属性特征获取没有连接关系的对象间的第一连接概率，根据所述第一连接概率更新所述对象的网络结构特征；

根据各个对象更新后的所述网络结构特征和各个对象的所述对象属性特征获取各个对象的聚合特征，根据所述聚合特征更新各个对象的所述对象属性特征；

根据各个对象的所述对象属性特征和原始网络结构特征，计算第二连接概率；所述第二连接概率为每个对象与根据该对象的所述网络结构特征采样选取的其他对象的连接概率；

根据更新后的各个对象的对象属性特征获得各个对象的预测类别；根据所述第二对象的预测类别、所述第二对象的标记类别、所述第二连接概率、各个对象的原始网络结构特征和损失函数调整所述图卷积网的参数；

返回所述根据各个对象的对象属性特征获取没有连接关系的对象间的第一连接概率的步骤对所述图卷积网络进行迭代训练，直到对所述图卷积网络的训练满足迭代结束条件，停止训练，得到用于对象分类和对象网络结构属性预测的图卷积网络。
如权利要求2所述的方法，其特征在于，所述损失函数包括第一损失函数和第二损失函数；

相应的，根据更新后的各个对象的对象属性特征获得各个对象的预测类别；根据所述第二对象的预测类别、所述第二对象的标记类别、所述第二连接概率、各个对象的原始网络结构特征和损失函数调整所述图卷积网的参数，包括：

根据所述第二对象的预测类别、所述第二对象的标记类别和所述第一损失函数确定第一奖惩值；

根据所述第二连接概率、所述各个对象的原始网络结构特征和所述第二损失函数确定第二奖惩值；

根据所述第一奖惩值和所述第二奖惩值调整所述图卷积网络的参数。
如权利要求3所述的方法，其特征在于，所述根据所述第二对象的预测类别、所述第二对象的标记类别和所述第一损失函数确定第一奖惩值前，还包括：

根据所述第一损失函数的系数和所述第二损失函数的系数，确定所述图卷积网络偏重对象分类或对象网络结构特征预测。
如权利要求4所述的方法，其特征在于，还包括：

采用退火算法根据所述第一奖惩值计算所述第一损失函数的系数和所述第二损失函数的系数；或，

采用退火算法根据所述第二奖惩值计算所述第一损失函数的系数和所述第二损失函数的系数。
如权利要求1至5任一项所述的方法，其特征在于，

所述对象为蛋白质关联关系网络中的蛋白质；所述对象属性特征为蛋白质的子空间结构；所述对象的网络结构特征为每个蛋白质与其他蛋白质在组织内的共表达；所述部分对象的标记类别为部分已知的细胞功的蛋白质的细胞功能；所述第一对象为未知细胞功能的蛋白质；所述第二对象为已知细胞功能的蛋白质；或，

所述对象为文献引用关系网络中的文献；所述对象属性特征为文献标题的关键词；所述对象的网络结构特征为每个文献与其他文献的引用关系；所述部分对象的标记类别为部分已知类别的文献的文献类别；所述第一对象为未知文献类别的文献，所述第二对象为已知文献类别的文献。
一种对象分类和对象的网络结构特征的预测方法，其特征在于，包括：

获取待预测对象的测试数据；

采用空间域图卷积网络对所述测试数据进行处理，获得所述待预测对象的分类结果和对象的网络结构特征预测结果，所述空间域图卷积网络为经由权利要求1至6任一项所述的方法训练的到的图卷积网络。
如权利要求7所述的方法，其特征在于，所述测试数据包括所述待预测对象所在的对象关系网络中的各个对象的网络结构特征、对象属性特征；

相应的，所述采用空间域图卷积网络对所述测试数据进行处理，获得所述对象的分类结果和对象间的网络结构属性预测结果，所述空间域图卷积网络为经由权利要求1至6任一项所述的方法训练的到的图卷积网络，包括：

根据各个对象的所述网络结构特征和所述对象属性特征获取各个对象的聚合特征，根据所述聚合特征更新各个对象的所述对象属性特征；

根据各个对象的所述网络结构特征和各个对象更新的所述对象属性特征获取各个对象与其他对象的预测连接概率；根据所述预测连接概率更新所述对象的网络结构特征；

根据所述待预测的对象更新后的对象属性特征获取所述待预测的对象的预测类别。
如权利要求8所述的方法，其特征在于，

所述待预测对象所在的对象关系网络中对象的网络结构特征为待预测蛋白质所在的蛋白质关联关系网络中每个蛋白质的与其他蛋白质在组织内的共表达；所述对象属性特征为蛋白质的子空间结构；或，

所述待预测对象所在的对象关系网络中对象的网络结构特征为待预测文献所在的文献引用关系网络中每个文献的与其他文献的引用关系；所述对象属性特征为文献标题的关键词。
一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6，和/或7至9任一项所述的方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6，和/或7至9任一项所述的方法。