CN112200266B - 基于图结构数据的网络训练方法、装置以及节点分类方法 - Google Patents
基于图结构数据的网络训练方法、装置以及节点分类方法 Download PDFInfo
- Publication number
- CN112200266B CN112200266B CN202011169741.4A CN202011169741A CN112200266B CN 112200266 B CN112200266 B CN 112200266B CN 202011169741 A CN202011169741 A CN 202011169741A CN 112200266 B CN112200266 B CN 112200266B
- Authority
- CN
- China
- Prior art keywords
- graph structure
- data
- network
- structure data
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000547 structure data Methods 0.000 title claims abstract description 426
- 238000012549 training Methods 0.000 title claims abstract description 199
- 238000000034 method Methods 0.000 title claims abstract description 106
- 238000011084 recovery Methods 0.000 claims abstract description 43
- 239000011159 matrix material Substances 0.000 claims description 218
- 230000006870 function Effects 0.000 claims description 106
- 238000013528 artificial neural network Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 19
- 238000010586 diagram Methods 0.000 claims description 16
- 238000002910 structure generation Methods 0.000 claims description 10
- 230000008878 coupling Effects 0.000 abstract description 15
- 238000010168 coupling process Methods 0.000 abstract description 15
- 238000005859 coupling reaction Methods 0.000 abstract description 15
- 238000005516 engineering process Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 19
- 238000012545 processing Methods 0.000 description 17
- 238000013473 artificial intelligence Methods 0.000 description 14
- 238000005457 optimization Methods 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种基于图结构数据的网络训练方法、装置以及节点分类方法。所述网络训练方法包括:获取图结构训练数据对应的有损图结构数据;将有损图结构数据输入到目标网络的生成网络中,以对有损图结构数据进行连边恢复并生成对应的图结构更新数据;目标网络包括生成网络和预测网络;将图结构更新数据输入到预测网络中,以对图结构更新数据的节点进行分类预测得到图结构更新数据的节点分类结果;根据图结构更新数据的节点分类结果,对生成网络和预测网络进行网络参数调整,直至生成网络和预测网络收敛,得到已训练的目标网络。上述方案通过生成网络和预测网络的联合训练能得到耦合性良好的目标网络,进而可以对图结构数据中的节点进行准确分类。
Description
技术领域
本申请涉及网络技术领域,特别是涉及一种基于图结构数据的网络训练方法、装置、计算机设备和存储介质,以及,基于图结构数据的节点分类方法、装置、计算机设备和存储介质。
背景技术
图结构数据通过点的特征以及节点之间的连边关系来描述各种复杂的数据对象,例如,对于文章之间的引用关系,可以将各个文章作为节点生成图结构数据,基于图结构数据进行数据处理,以实现对文章的信息整合。
传统技术中,根据预先训练的网络模型对图结构数据中各个节点进行分类等。实际上,传统技术所得到的网络模型在处理现实生活中的噪声图结构数据、不完备图结构数据时无法得到最优解,即所训练的网络模型准确性不高,使得节点分类的准确性不高。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
基于此,有必要针对上述技术问题,提供一种基于图结构数据的网络训练方法、装置、计算机设备和存储介质,以及,基于图结构数据的节点分类方法、装置、计算机设备和存储介质,在图结构数据有损时能基于所训练的目标网络实现图结构节点的准确分类。
一种基于图结构数据的网络训练方法,所述方法包括:
获取图结构训练数据对应的有损图结构数据;
将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据;所述目标网络包括所述生成网络和预测网络;
将所述图结构更新数据输入到所述预测网络中,以对所述图结构更新数据的节点进行分类预测得到所述图结构更新数据的节点分类结果;
根据所述图结构更新数据的节点分类结果,对所述生成网络和所述预测网络进行网络参数调整,直至所述生成网络和所述预测网络收敛,得到已训练的目标网络。
在一个实施例中,所述通过所述图神经网络进行连边恢复,并根据恢复的连边数据确定所述图神经网络的核函数的函数值,包括:
通过所述图神经网络进行连边恢复,根据恢复的连边数据得到参考点特征矩阵;
根据相似度函数确定所述点特征矩阵和参考点特征矩阵的相似度;所述相似度函数包括欧式距离函数、余弦相似度函数和点积函数中的至少一项;
根据所述相似度确定所述核函数的函数值。
在一个实施例中,所述生成网络中的网络参数为第一网络参数,所述根据所述第一分类结果对所述生成网络进行网络参数调整,包括:
获取所述第一训练数据的节点的第一分类标签;
确定所述第一分类标签和所述第一分类结果对应的第一损失值;
根据所述第一损失值确定所述第一网络参数的第一梯度;
根据所述第一梯度对所述第一网络参数进行梯度下降处理。
在一个实施例中,所述预测网络中的网络参数为第二网络参数,所述根据所述第二分类结果对所述预测网络进行网络参数调整,包括:
获取所述第二训练数据的节点的第二分类标签;
确定所述第二分类标签和所述第二分类结果对应的第二损失值;
根据所述第二损失值确定所述第二网络参数的第二梯度;
根据所述第二梯度对所述第二网络参数进行梯度下降处理。
一种基于图结构数据的网络训练装置,所述装置包括:
第一图结构获取模块,用于获取图结构训练数据对应的有损图结构数据;
第一图结构生成模块,用于将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据;所述目标网络包括所述生成网络和预测网络;
第一节点分类模块,用于将所述图结构更新数据输入到所述预测网络中,以所述图结构更新数据的对节点进行分类预测得到所述图结构更新数据的节点分类结果;
参数调整模块,用于根据所述图结构更新数据的节点分类结果,对所述生成网络和所述预测网络进行网络参数调整,直至所述生成网络和所述预测网络收敛,得到已训练的目标网络。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取图结构训练数据对应的有损图结构数据;
将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据;所述目标网络包括所述生成网络和预测网络;
将所述图结构更新数据输入到所述预测网络中,以对所述图结构更新数据的节点进行分类预测得到所述图结构更新数据的节点分类结果;
根据所述图结构更新数据的节点分类结果,对所述生成网络和所述预测网络进行网络参数调整,直至所述生成网络和所述预测网络收敛,得到已训练的目标网络。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取图结构训练数据对应的有损图结构数据;
将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据;所述目标网络包括所述生成网络和预测网络;
将所述图结构更新数据输入到所述预测网络中,以对所述图结构更新数据的节点进行分类预测得到所述图结构更新数据的节点分类结果;
根据所述图结构更新数据的节点分类结果,对所述生成网络和所述预测网络进行网络参数调整,直至所述生成网络和所述预测网络收敛,得到已训练的目标网络。
上述基于图结构数据的网络训练方法、装置、计算机设备和存储介质,获取图结构训练数据对应的有损图结构数据,通过目标网络中的生成网络对有损图结构数据进行连边恢复并生成对应的图结构更新数据;通过目标网络中的预测网络对图结构更新数据的节点进行分类预测得到图结构更新数据的节点分类结果;根据图结构更新数据的节点分类结果,对生成网络和预测网络进行网络参数调整,直至生成网络和预测网络收敛,得到已训练的目标网络。通过生成网络和预测网络的联合训练能得到耦合性良好的目标网络,在图结构数据有损时能基于所训练的目标网络实现图结构节点的准确分类。
一种基于图结构数据的节点分类方法,所述方法包括:
获取连边数据有损的待分类图结构数据;
将所述待分类图结构数据输入到预先训练的目标网络;所述目标网络由有损图结构数据对生成网络和预测网络进行联合训练得到,所述有损图结构数据为图结构训练数据对应的有损的图结构数据;
所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,将所述目标图结构数据输入到所述预测网络中;
所述预测网络对所述目标图结构数据中的节点进行分类,得到与所述待分类图结构数据对应的节点分类结果。
一种基于图结构数据的节点分类装置,所述装置包括:
第二图结构获取模块,用于获取连边数据有损的待分类图结构数据;
图结构输入模块,用于将所述待分类图结构数据输入到预先训练的目标网络;所述目标网络由有损图结构数据对生成网络和预测网络进行联合训练得到,所述有损图结构数据为图结构训练数据对应的有损的图结构数据;
第二图结构生成模块,用于触发所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,将所述目标图结构数据输入到所述预测网络中;
第二节点分类模块,用于触发所述预测网络对所述目标图结构数据中的节点进行分类,得到与所述待分类图结构数据对应的节点分类结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取连边数据有损的待分类图结构数据;
将所述待分类图结构数据输入到预先训练的目标网络;所述目标网络由有损图结构数据对生成网络和预测网络进行联合训练得到,所述有损图结构数据为图结构训练数据对应的有损的图结构数据;
所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,将所述目标图结构数据输入到所述预测网络中;
所述预测网络对所述目标图结构数据中的节点进行分类,得到与所述待分类图结构数据对应的节点分类结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取连边数据有损的待分类图结构数据;
将所述待分类图结构数据输入到预先训练的目标网络;所述目标网络由有损图结构数据对生成网络和预测网络进行联合训练得到,所述有损图结构数据为图结构训练数据对应的有损的图结构数据;
所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,将所述目标图结构数据输入到所述预测网络中;
所述预测网络对所述目标图结构数据中的节点进行分类,得到与所述待分类图结构数据对应的节点分类结果。
上述基于图结构数据的节点分类方法、装置、计算机设备和存储介质,将连边数据有损的待分类图结构数据输入到预先训练的目标网络;其中,目标网络由生成网络和预测网络联合训练得到;生成网络对待分类图结构数据进行连边恢复并生成对应的目标图结构数据,将目标图结构数据输入到预测网络中;预测网络对目标图结构数据中的节点进行分类,得到与待分类图结构数据对应的节点分类结果。生成网络和预测网络的联合训练能得到耦合性良好的目标网络,在获取到有损的待分类图结构数据时通过该目标网络依然可以对图结构数据中的节点进行准确分类。
附图说明
图1为一个实施例中基于图结构数据的网络训练方法的应用环境图;
图2为一个实施例中基于图结构数据的网络训练方法的流程示意图;
图3为一个实施例中基于图结构数据的网络训练方法的流程框图;
图4为另一个实施例中基于图结构数据的网络训练方法的流程框图;
图5为再一个实施例中基于图结构数据的网络训练方法的流程框图;
图6为又一个实施例中基于图结构数据的网络训练方法的流程框图;
图7为一个实施例中基于图结构数据的节点分类方法的应用环境图;
图8为一个实施例中基于图结构数据的节点分类方法的流程示意图;
图9为一个实施例中基于图结构数据的网络训练装置的结构框图;
图10为一个实施例中基于图结构数据的节点分类装置的结构框图;
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本发明实施例提供的基于图结构数据的网络训练方法、装置、计算机设备和存储介质,以及,基于图结构数据的节点分类方法、装置、计算机设备和存储介质可以基于人工智能技术实现。其中,工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的机器学习等技术,具体通过如下实施例进行说明:
本申请提供的基于图结构数据的网络训练方法,可以应用于如图1所示的应用环境中。该应用环境中包括终端101和服务器102。终端101通过网络与服务器102进行通信。其中,服务器102接收终端101发送的图结构训练数据,据此对目标网络中的生成网络和预测网络进行联合训练,得到已训练的目标网络。其中,终端101可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,以文章为例,终端101可以是文章信息统计平台;服务器102可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于图结构数据的网络训练方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。所述方法包括以下步骤:
S201,获取图结构训练数据对应的有损图结构数据。
其中,图(Graph)是由顶点的有穷非空集合和顶点之间边(也称为连边)的集合组成。图结构是研究数据元素之间的多对多的关系。在图结构中,任意两个元素之间可能存在关系。即节点之间的关系可以是任意的,图中任意元素之间都可能相关。
图结构数据指的是用于描述图结构(由点和连边构成的网络结构)的数据,具体的,图结构数据可以是基于文章的引用关系构建的图结构,也可以是基于地图上各个目的地之间的线路关系构建的图结构。在本发明实施例中,图结构数据可以直接简称为图结构。在一个实施例中,图结构数据可以包括点特征矩阵、邻接矩阵等。一个图结构数据能够表示为G={V,E},其中V表示点(也称为节点)集合,E表示边(也称为连边)集合。一般的,给定一个N个点的图结构,可以用一个邻接矩阵A∈{0,1}N×N表示该图结构的边连接关系,其中,如果Ai,j=1表示存在一条边连接点i和点j,反之如果Ai,j=0则表示点i和点j之间不存在连接关系。每个点拥有自己的特征,可表示为xi∈RF,其中F表示点特征的维数,R表示特征空间。因此,可以用一个矩阵X∈RN×F表示整个图结构中的所有点特征,该矩阵X称为点特征矩阵。
在一个实施例中,图结构训练数据指的是用于对网络模型进行训练的图结构数据。传统的绝大部分网络模型在处理图结构数据时都假设图结构是完美无噪声的。这些假设使得在处理现实生活中的噪声图结构数据、不完备图结构数据时无法得到最优解,从而影响下游应用的性能,例如,使得下游对节点分类的结果准确性低。为了得到能够处理噪声图结构数据和不完备图结构数据。其中,噪声图结构数据指的是已知图结构中点之间存在错误连边;不完备图结构数据指的是已知图结构中点之间存在遗漏连边。本发明实施例对图结构训练数据的连边进行破坏,以得到有损图结构数据。即,有损图结构数据指的是连边数据有损的图结构数据。基于该有损图结构数据对目标网络中的生成网络和预测网络进行联合训练。其中,连边数据指的是图结构中连边对应的数据。对于存在连接关系的两点,其对应的连边数据可以为1,对于存不在连接关系的两点,其对应的连边数据可以为0。而连边数据有损指的是某些连边数据缺失,例如,图结构中有100个点,该图结构仅对应有98个点的连边数据,缺失2个点之间的连边数据。另外,图结构中各个点之间的连边数据可以通过邻接矩阵的方式表征。
在一个实施例中,有损图结构数据可以包括噪声图结构数据和不完备图结构数据中的至少一项。另外,有损图结构数据与图结构训练数据的连边可以不同,但是其中包含的节点相同。
对图结构训练数据的连边进行破坏的过程至少有以下两种实现方式:1、剔除所述图结构训练数据中的至少一条连边,得到所述有损图结构数据,2、改变所述图结构训练数据中至少一条连边所连接的节点,例如:将连接于A、B两节点的连边修改为连接A、C两节点,得到所述有损图结构数据。
S202,将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据;所述目标网络包括所述生成网络和预测网络。
得益于图神经网络(Graph Neural Networks,GNNs)高效且强大的节点和边特征的提取能力,其在机器学习领域受到越来越多的关注,如推荐系统、计算机视觉、自然语言处理等领域。
在一个实施例中,目标网络可以称为生成预测网络(Generative PredictiveNetwork,GPN)。生成预测网络可以是基于图神经网络构建的网络模型。具体的,该图神经网络可以是GCN(Graph Convolutional Networks,图卷积网络)、GAT(Graph AttentionNetworks,图形注意力网络)、GraphSage、GIN(Graph Isomorphic Networks,图同构网络)等。
以下对GCN说明如下:给定一张图G以及它的邻接矩阵A和点特征矩阵X,一个L层的GCN模型的传播过程如下:
其中,是一个对角矩阵/>Wl是第l层的可学习的参数,σ(·)是指定的激活函数。在叠加了L层GCN层之后,能得到GCN提取的点特征H(L)∈RN×D,其中D是提取的点特征的维数。与GCN相似,其他图神经网络都可以用一个通用的范式表示为H(L)=GNN(X,A)。图神经网络提取图结构的点特征,所提取可以用于后续的计算中,例如:基于GCN构建的生成网络提取点特征,根据所提取的点特征生成新的图结构数据,另外,基于GCN构建的预测网络提取图结构中的点特征,根据所提取的点特征进行节点分类。
其中,生成网络指的是能够基于输入的图结构数据生成新的图结构数据的网络。在输入的图结构数据为噪声图结构数据或者不完备结构数据时,生成网络能够对其中的噪声和不完备问题进行修复,使得生成的新的图结构数据具有较高的准确性,以便进行后续的节点分类过程。预测网络是对输入的图结构数据中的节点进行分类的网络。具体的,预测网络能够提取所输入的图结构数据在节点特征,同时能基于所提取的节点特征进行特征预测,基于所提取的节点特征和所预测的节点特征对各个节点进行分类,例如,对于文章引用的场景,能够提取出各篇文章的引用和被引用特征,同时对各篇文章的发表时间、作者、影响因子等特征进行预测,进而基于这些特征对各篇文章进行分类。
在一个实施例中,生成网络和预测网络构成双层规划框架,生成网络作为上层优化任务,预测网络作为下层优化任务。下层优化任务受上层优化任务的约束。这种嵌套耦合的结构使得整个优化问题需要上层问题的可用解必须基于下层问题的最优解,这种需求使得求解双层规划的优化问题十分棘手。本发明实施例,通过对生成网络和预测网络进行联合训练,能有效解决双层规划的优化问题,使得训练得到的目标网络中生成网络和预测网络具有较高的耦合性,基于此,预测网络能够基于生成网络所生成的图结构数据进行节点分类,得到准确的分类结果。
在一个实施例中,生成网络和预测网络都可以为图卷积神经网络,两者可以为相同或不同类型的图卷积神经网络,例如,生成网络为GCN,预测网络可以为GCN,也可以为GAT。
在一个实施例中,图结构更新数据为对有损图结构数据进行连边数据恢复后得到的图结构数据。根据连边恢复的效果,图结构更新数据可以与图结构训练数据一致,即实现了完全恢复;也可以不一致,即实现了部分恢复。
所述对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据,包括:对有损图结构数据进行连边恢复,以补充缺失的连边以及调整错误的连边,得到恢复后的连边,根据恢复后的连边生成对应的图结构更新数据。
S203,将所述图结构更新数据输入到所述预测网络中,以对所述图结构更新数据的节点进行分类预测得到所述图结构更新数据的节点分类结果。
相对于有损图结构数据而言,图结构更新数据中的连边数据噪声少且较为完备,甚至可能没有噪声且完备,即,图结构更新数据的信息更为完善。本步骤中,通过预测网络对图结构更新数据中的节点进行分类预测,能基于更为完善的信息来对节点进行分类,使得得到的图结构更新数据的节点分类结果具有较高的准确性。预测网络具体的分类过程可以根据实际情况进行,例如,基于所提取的文章特征将文章分为科技类、文艺类、考试工具类等,基于所提取的地图上各个目的地的特征将各个目的地划分到对应的行政区域内等。
在一个实施例中,给定一个N个点的图G,考虑一个K分类基于GNN的分类器作为预测网络,其中/>是邻接矩阵的取值空间,/>表示标签空间。其中,K的大小可以根据实际情况确定,例如可以为100,即,将图结构数据中的节点归到100个类别中。
S204,根据所述图结构更新数据的节点分类结果,对所述生成网络和所述预测网络进行网络参数调整,直至所述生成网络和所述预测网络收敛,得到已训练的目标网络。
其中,网络参数调整的过程可以为分别对生成网络和预测网络的网络参数进行调整。具体的,朝着使生成网络收敛的方向确定网络参数的梯度,基于该梯度对生成网络的网络参数进行调整;朝着使预测网络收敛的方向确定网络参数的梯度,基于该梯度对预测网络的网络参数进行调整。
在一个实施例中,生成网络和预测网络均对应有目标函数。可以根据目标函数实现对生成网络和预测网络的网络参数调整,即实现对生成网络和预测网络的训练。
其中,预测网络的目标函数可以嵌套于生成网络的目标函数中。
具体的,其中,/>
表示生成网络的目标函数,/>表示预测网络的目标函数。通过目标函数嵌套的方式能够实现生成网络和预测网络的联合训练。
具体的,在目标网络的训练过程中,生成网络将所生成的图结构更新数据输入到预测网络中,由该预测网络生成图结构更新数据的节点分类结果,根据图结构更新数据的节点分类结果和对应的目标函数对目标网络中的生成网络和预测网络进行联合训练,即同步调整生成网络和预测网络的网络参数,在生成网络和预测网络完成训练后,整个目标网络的训练也完成了,此时就得到了已联合训练的目标网络。
对于已联合训练的目标网络,在接收到待分类的图结构数据时,可以执行以下步骤:将待分类的图结构数据输入到已训练的生成网络中;由已训练的生成网络对该待分类的图结构数据中可能的连边问题进行恢复并生成新的图结构数据;将该新的图结构数据输入到已训练的预测网络中;由已训练的预测网络对该新的图结构数据中的节点进行分类,得到该待分类的图结构数据中节点的分类结果。
上述基于图结构数据的网络训练方法中,通过生成网络和预测网络的联合训练能得到耦合性良好鲁棒性高的目标网络,有效解决了双层规划问题,可以得到最优解,即可以对图结构数据中的节点进行准确分类。
另外,传统技术中采用可学习离散图结构方法(LDS)等将图结构参数化,从而使得增加新的边成为了可能,基于所增加的新的边进行节点分类。尽管这一方法存在一定的合理性,但是对于大尺度图结构数据的处理,其空间消耗是非常大的。本发明实施例通过生成网络直接生成新的图结构数据,进而基于该图结构数据进行分类,相较于LDS等方法,其所要处理的参数量大幅下降,有效节约了服务器的空间消耗。
在一个实施例中,所述对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据,包括:对所述有损图结构数据进行连边恢复;根据已恢复的连边数据得到残差邻接矩阵;根据所述残差邻接矩阵生成所述图结构更新数据。
其中,残差邻接矩阵指的是包含有连边损失信息的邻接矩阵。根据已恢复的连边数据得到残差邻接矩阵的实现过程可以为:获取有损图结构数据的点特征矩阵,作为原始点特征矩阵,根据已恢复的连边数据确定新的点特征矩阵,根据原始点特征矩阵和新的点特征矩阵之间的偏差生成残差邻接矩阵。
邻接矩阵可以理解为图结构的一种表达方式。因此,在一个实施例中,将残差邻接矩阵转换为图结构的形式就可以得到残差图结构数据。进而可以根据残差图结构数据与有损图结构数据整合得到图结构更新数据。当然,在其他实施例中,也可以获取有损图结构数据对应的邻接矩阵,作为原始邻接矩阵,根据原始邻接矩阵和残差邻接矩阵整合得到邻接更新矩阵,对邻接更新矩阵进行形式转换,得到对应的图结构更新数据。
上述实施例通过已恢复的连边数据得到残差邻接矩阵,该残差邻接矩阵中融合了已恢复的连边数据,根据该残差邻接矩阵生成的图结构更新数据也因此融合了已恢复的连边数据,具有较高的准确性。
在一个实施例中,所述有损图结构数据包括点特征矩阵和邻接矩阵(也可以称为原始邻接矩阵);所述对所述有损图结构数据进行连边恢复,根据已恢复的连边数据得到残差邻接矩阵,根据所述残差邻接矩阵生成所述图结构更新数据,包括:根据所述点特征矩阵和所述邻接矩阵进行连边恢复,根据已恢复的连边数据生成所述残差邻接矩阵;将所述邻接矩阵和所述残差邻接矩阵进行叠加;根据叠加得到的邻接矩阵生成所述图结构更新数据。
本实施例中,生成网络生成残差邻接矩阵,并将邻接矩阵和残差邻接矩阵进行叠加,可以是将邻接矩阵和残差邻接矩阵中同一位置的元素进行相加处理,根据叠加得到的邻接矩阵生成图结构更新数据,将该图结构更新数据输入到预测网络中。
在某些实施例中,如图3所示,生成网络也可以不直接输出图结构更新数据,而是根据连边恢复的信息输出邻接更新矩阵。由预测网络根据邻接更新矩阵生成图结构更新数据(图3中,更新图结构中1与5之间的连边被更改为1与2之间的连边,即修复了有损图结构数据中的连边问题),据此确定图结构更新数据的节点分类结果,例如:1/3/6为一个类别,2/4/5为另一个类别。
在一个实施例中,如图4所示,生成网络在获取到残差邻接矩阵时,通过残差链路将残差邻接矩阵输入到叠加模块中。由该叠加模块将原始邻接矩阵和残差邻接矩阵进行叠加得到邻接更新矩阵,并将邻接更新矩阵输入到预测网络中。该预测网络根据邻接更新矩阵得到对应的图结构更新数据,并据此进行节点分类预测,以得到图结构更新数据的节点分类结果。
上述实施例中,通过点特征矩阵和邻接矩阵来提取各个节点的特征,基于各个节点的特征进行连边恢复,进而生成残差邻接矩阵,将原始邻接矩阵和残差矩阵进行叠加以得到邻接更新矩阵,该邻接更新矩阵充分融合了已恢复的连边数据,据此可以根据邻接更新矩阵生成准确的图结构更新数据,以给预测网络提供准确的输入。
在一个实施例中,所述根据所述点特征矩阵和所述邻接矩阵进行连边恢复,根据已恢复的连边数据生成所述残差邻接矩阵,包括:将所述点特征矩阵和所述邻接矩阵输入到图神经网络中,以通过所述图神经网络进行连边恢复,并根据恢复的连边数据确定所述图神经网络的核函数的函数值;根据所述核函数的函数值生成所述残差邻接矩阵。
本实施例通过图神经网络来实现图结构数据的连边恢复。如图5所示,该图神经网络为GNN,生成网络通过GNN对有损图结构数据进行连边恢复,并根据恢复的连边数据确定核函数的函数值;根据核函数的函数值生成残差邻接矩阵。
其中,残差邻接矩阵可以通过gθ(X,A)表示。该残差邻接矩阵的确定方式可以为:通过表达式gθ(X,A)=K(GNNθ(X,A))确定。其中,θ是GNN的参数(即,生成网络的网络参数),k(·)是点嵌入的核函数K:RN×F×RN×F→RN×N。即,将GNN的核函数确定为残差邻接矩阵。
上述实施例基于核函数可以生成准确的残差邻接矩阵,并据此生成准确的图结构更新数据。
在一个实施例中,核函数的形式为K(H)i,j=k(Hi,Hj),其中k(·)可以是任意的相似函数,例如:基于欧几里得距离、向量余弦距离、点积距离等的相似函数。
具体的,所述通过所述图神经网络进行连边恢复,并根据恢复的连边数据确定所述图神经网络的核函数的函数值,包括:通过所述图神经网络进行连边恢复,根据恢复的连边数据得到参考点特征矩阵;根据相似度函数确定所述点特征矩阵和参考点特征矩阵的相似度;根据所述相似度确定所述核函数的函数值。其中,点特征矩阵和参考点特征矩阵的相似度可以根据两者之间的距离来确定。即,所述相似度函数包括欧式距离函数、余弦相似度函数和点积函数中的至少一项。
更为具体的,向生成网络输入有损图结构数据对应的点特征矩阵X和原始邻接矩阵A。生成网络根据X和A对有损图结构数据进行连边恢复并生成参考点特征矩阵计算X和/>之间的距离,将该距离确定为核函数的函数值。
上述实施例中生成网络生成新的点特征矩阵,基于该新的点特征矩阵能得到准确的核函数的函数值,进而可以生成准确的图结构更新数据。
在一个实施例中,目标网络的联合训练可以为迭代联合训练过程,即,对生成网络和预测网络进行至少一次的联合训练。
具体的,所述图结构训练数据为至少两个轮次的图结构训练数据,每个轮次的图结构训练数据均对应有有损图结构数据;所述获取图结构训练数据对应的有损图结构数据;将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据,包括:依次将各个轮次的有损图结构数据输入到所述生成网络中,以生成各个轮次的图结构更新数据;所述根据所述图结构更新数据的节点分类结果,对所述生成网络和所述预测网络进行网络参数调整,包括:根据所述各个轮次的图结构更新数据对应的节点分类结果,对所述生成网络和所述预测网络进行至少两个轮次的网络参数调整。
以下以两个迭代次数为例,说明对目标网络的迭代训练过程:
对于第一次迭代,获取一轮次图结构训练数据对应的一轮次有损图结构数据;将一轮次有损图结构数据输入到目标网络的生成网络中,以对一轮次有损图结构数据进行连边恢复并生成对应的一轮次图结构更新数据;将一轮次图结构更新数据输入到预测网络中,以对一轮次图结构更新数据的节点进行分类预测得到一轮次节点分类结果;根据一轮次节点分类结果,对生成网络和预测网络进行网络参数调整,得到经过一次迭代训练的一轮次目标网络;
对于第二次迭代,获取二轮次图结构训练数据对应的二轮次有损图结构数据;将二轮次有损图结构数据输入到一轮次目标网络的生成网络中,以对二轮次有损图结构数据进行连边恢复并生成对应的二轮次图结构更新数据;将二轮次图结构更新数据输入到预测网络中,以对二轮次图结构更新数据的节点进行分类预测得到二轮次节点分类结果;根据二轮次节点分类结果,对生成网络和预测网络进行网络参数调整。
其他轮次的训练过程以此类推,在此不再赘述。
当生成网络和预测网络均收敛或者迭代次数满足预设条件(例如:达到300次)时,可以停止对目标网络的迭代训练,将此时的目标网络确定为已训练的目标网络。
上述实施例通过多个轮次的图结构训练数据对目标网络进行迭代训练,能多次地对目标网络进行网络参数调整,使得生成网络和预测网络趋向于收敛,通过这样的方式能对目标网络进行尽可能充分的训练,进而得到准确可靠的已训练的目标网络。
在一个实施例中,一次迭代训练可以对生成网络和预测网络各进行一次网络参数的调整。一个轮次的所述图结构训练数据包括第一训练数据和第二训练数据,若所述图结构训练数据为第一训练数据,所述图结构更新数据的节点分类结果为第一分类结果,若所述图结构训练数据为第二训练数据,所述图结构更新数据的节点分类结果为第二分类结果;对于一个轮次的网络参数调整,所述根据所述各个轮次的图结构更新数据对应的节点分类结果,对所述生成网络和所述预测网络进行至少两个轮次的网络参数调整,包括:根据所述第一分类结果对所述生成网络进行网络参数调整;根据所述第二分类结果对所述预测网络进行网络参数调整。
其中,第一训练数据和第二训练数据可以为不同图结构训练数据集中的训练数据。图结构训练数据集可以包括验证集和训练集。其中,验证集和训练集可以由图结构数据样本随机均匀分配得到。在某些实施例中,验证集和训练集也可以相同,也可以不同(此时两者的差别可以仅在于样本内容的不同)。在一个实施例中,第一训练数据为验证集中的训练数据,第二训练数据为训练集中的训练数据。
在一个实施例中,由于训练数据的不同,生成网络和预测网络有可能不是同时达到收敛。对于这种情况,可以对先收敛的网络停止训练,得到已训练的网络,基于该已训练的网络来与另一个网络进行联合训练,也可以继续对先收敛的网络进行训练直到两个网络都满足收敛条件。例如:生成网络已收敛而预测网络未收敛,此时,可以有两种处理方式:1、停止对生成网络进行网络参数的调整,得到已训练的生成网络,将该已训练的生成网络与预测网络一起进行联合训练,当预测网络也满足收敛条件时,得到已训练的预测网络,此时可以结束联合训练过程,2、继续将该生成网络与预测网络一起进行联合训练,当预测网络也满足收敛条件时,得到已训练的生成网络和已训练的预测网络,此时可以结束联合训练过程。
在一个实施例中,一个轮次的网络参数调整过程为:从验证集中获取图结构训练数据,确定其对应的有损图结构数据,作为第一训练数据;将第一训练数据输入到生成网络中;该生成网络据此生成新的图结构数据并将其输入到预测网络中;预测网络根据新的图结构数据得到对应的第一分类结果;根据第一分类结果对生成网络进行网络参数的调整;从训练集中获取图结构训练数据,确定其对应的有损图结构数据,作为第二训练数据;将第二训练数据输入到生成网络中;该生成网络据此生成新的图结构数据并将其输入到预测网络中;预测网络根据新的图结构数据得到对应的第二分类结果;根据第二分类结果对预测网络进行网络参数的调整。
上述实施例,通过验证集中的图结构数据来对生成网络进行训练,能得到可以准确生成新的图结构数据的生成网络,通过训练集中的图结构数据来对预测网络进行训练,能得到可以对节点进行准确分类的预测网络,结合迭代训练过程,既能保证生成网络和预测网络的准确性,还能保证两者之间的耦合性,最终得到准确的目标网络。
在一个实施例中,所述生成网络中的网络参数为第一网络参数,所述根据所述第一分类结果对所述生成网络进行网络参数调整,包括:获取所述第一训练数据的节点的第一分类标签;确定所述第一分类标签和所述第一分类结果对应的第一损失值;根据所述第一损失值确定所述第一网络参数的第一梯度;根据所述第一梯度对所述第一网络参数进行梯度下降处理。
其中,节点对应的分类标签可以指节点的真实标签。真实标签可以是基于节点在具体场景中的实际类别所确定的标签,例如:对于一篇文章而言,将该文章所属期刊的类别确定为其真实标签,假设某一篇文章为科技类文章,则将该文章对应节点的分类标签确定为“科技类”。
在一个实施例中,可以基于网络参数预先构建生成网络的目标函数、损失函数、网络参数的梯度函数等网络函数。根据所构建的网络函数来对生成网络进行网络参数调整。
具体的,构建生成网络的目标函数。该目标函数可以如下:
其中,Vval表示验证集;θ表示第一网络参数;X是有损图结构数据的点特征矩阵;A是有损图结构数据的邻接矩阵;w表示第二网络参数;表示图结构更新数据对应的邻接矩阵;/>是节点的损失函数;hw(·)v是预测的节点v的分类结果;yv是节点v的分类标签。
在一个实施例中,gθ(X,A)=K(GNNθ(X,A))
一般地,损失函数可以定义为hw(X,A)v与真实标签yv之间的交叉熵损失函数。
在一个实施例中,根据生成网络的目标函数构建第一网络参数的梯度函数:
其中,/>表示梯度运算符号
预先基于分类标签标识和分类结果标识构建损失函数。确定所述第一分类标签和所述第一分类结果对应的第一损失值的实现过程可以为:将第一分类标签和第一分类结果分别代入预先构建的损失函数的分类标签标识和分类结果标识中,确定该损失函数的函数值,即得到第一损失值。
在一个实施例中,对预测网络的网络参数调整的实现过程可以为:在需要进行网络参数调整时,将原始的网络参数代入损失函数中,并据此计算第一分类标签和第一分类结果的第一损失值,将第一损失值代入梯度运算公式中,并进行以下梯度下降处理:
其中,A表示有损图结构数据对应的原始邻接矩阵。
此时就完成了第一网络参数的一次迭代下降。在下一次接收到有损图结构数据时,生成网络就能基于迭代下降处理后的第一网络参数对有损图结构数据进行连边恢复,并生成对应的图结构更新数据。
上述实施例,通过对网络参数的梯度下降实现对生成网络的网络参数调整,能使得生成网络尽快趋向于收敛,进而提高目标网络的训练效率。
在一个实施例中,所述预测网络中的网络参数为第二网络参数,所述根据所述第二分类结果对所述预测网络进行网络参数调整,包括:获取所述第二训练数据的节点的第二分类标签;确定所述第二分类标签和所述第二分类结果对应的第二损失值;根据所述第二损失值确定所述第二网络参数的第二梯度;根据所述第二梯度对所述第二网络参数进行梯度下降处理。
其中,预测网络的网络调整目标是最小化下游应用的训练误差,例如,使得的分类结果与真实标签之间的损失值足够小,此时可以判定为预测网络收敛,可以结束对预测网络的训练。
在一个实施例中,可以基于网络参数预先构建生成网络的目标函数、损失函数、网络参数的梯度函数等网络函数。根据所构建的网络函数来对生成网络进行网络参数调整。
具体的,构建生成网络的目标函数。该目标函数可以如下:
其中,Vtrain表示训练集。
在一个实施例中,hw可以用如下公式计算:hw(X,A)=softmax(GNNw(X,A))
在一个实施例中,根据预测网络的目标函数构建第二网络参数的梯度函数:
在一个实施例中,对预测网络的网络参数调整的实现过程可以为:在需要进行网络参数调整时,基于原始的网络参数和损失函数计算第二分类标签和第二分类结果的第二损失值,将第二损失值代入梯度运算公式中,并进行以下梯度下降处理:
其中,表示图结构更新数据对应的邻接矩阵(即邻接更新矩阵)。
在一个实施例中,还可以基于最初输入的有损图结构数据来对预测网络进行网络参数调整,其梯度下降可以通过以下方式实现:
上述实施例,通过对网络参数的梯度下降实现对预测网络的网络参数调整,能使得预测网络尽快趋向于收敛,进而提高目标网络的训练效率。
从生成网络和预测网络的目标函数表达式也可以看出,预测网络的目标函数嵌套于生成网络的目标函数中,通过这样的设置方式,能有效实现生成网络和预测网络的联合训练,有效解决双层规划问题,进而使得生成网络和预测网络具有较高的耦合性,通过两者的相互配合能最终对节点进行准确分类。
需要说明的是,生成网络和预测网络的参数调整顺序可以调整。具体的,可以先根据验证集的真实标签调整生成网络的网络参数,之后根据训练集调整预测网络的网络参数;也可以先根据训练集的真实标签调整预测网络的网络参数,之后根据验证集调整生成网络的网络参数。在某些实施例中,还可以并行对生成网络和预测网络同步进行网络参数的调整。
在一个实施例中,所述将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据,包括:将所述有损图结构数据输入到所述生成网络中,以使所述生成网络对所述有损图结构数据进行连边恢复并生成至少一个图结构更新数据;所述将所述图结构更新数据输入到所述预测网络中,以对所述图结构更新数据的节点进行分类预测得到所述图结构更新数据的节点分类结果,包括:将所述有损图结构数据和所述至少一个图结构更新数据输入到所述预测网络中,以使所述预测网络根据所述有损图结构数据和所述至少一个图结构更新数据进行节点的分类预测,得到所述图结构更新数据的节点分类结果。
在一个实施例中,可以通过一个生成网络对输入的有损图结构数据进行多次运算,以生成至少一个图结构更新数据。
在一个实施例中,生成网络也可以为多个,这些生成网络分别对输入的有损图结构数据进行运算,以得到至少一个图结构更新数据。其中,这些生成网络可以并行运行。在一个实施例中,如图6所示,将有损图结构输入到多个生成网络(生成网络1、生成网络2等等)中,这些生成网络分别生成对应的更新图结构(图结构1、图结构2等等),之后将有损图结构(图结构0)和所生成的更新图结构一起输入到预测网络中,由预测网络对这些图结构进行分析,进而得到对应的节点分类结果。
通过这样的方式,在有限样本的情况下能保证预测网络进行分类的数据量,进而得到尽可能准确的节点分类结果。
本申请还提供一种应用场景,该应用场景应用上述的基于图结构数据的网络训练方法。具体地,该基于图结构数据的网络训练方法在该应用场景的应用如下:
通过生成器和分类器构建双层网络框架,即构建生成预测网络,其中,生成器为上层规划目标,分类器为下层规划目标。
服务器从文章统计平台中获取文章的引用关系数据集,将该数据集分为训练集和验证集。服务器对生成预测网络进行多次迭代训练。
对于其中一次训练:服务器从验证集中获取图结构训练数据,确定该图结构训练数据对应的噪声图结构数据或者不完备图结构数据,作为第一训练数据;从训练集中获取训练图结构,确定该图结构训练数据对应的噪声图结构数据或者不完备图结构数据,作为第二训练数据。
基于第一训练数据来调整生成器的网络参数,基于第二训练数据来调整分类器的网络参数。以下以调整生成器的网络参数为例对服务器执行的步骤进行说明:
1)服务器获取第一训练数据对应的点特征矩阵X和邻接矩阵A。
2)服务器将点特征矩阵X和邻接矩阵A输入到基于GNN构建的生成器中,以通过GNN进行连边恢复,根据恢复的连边数据得到参考点特征矩阵
其中,生成器的目标函数为:
3)生成器确定点特征矩阵X和参考点特征矩阵的余弦相似度;根据余弦相似度得到残差邻接矩阵gθ(X,A)。
4)生成器将邻接矩阵A和残差邻接矩阵gθ(X,A)进行叠加得到邻接更新矩阵
5)生成器根据邻接更新矩阵生成图结构更新数据。
6)生成器将图结构更新数据输入到基于GNN构建的分类器中,以对文章进行分类得到图结构更新数据的文章分类结果。
其中,分类器的目标函数为:
7)服务器根据图结构更新数据的文章分类结果,对生成器和分类器进行网络参数调整。
对生成器和分类器进行多次的迭代训练,当生成器和分类器收敛时,得到已训练的生成预测网络。
上述基于图结构数据的网络训练方法中,根据图结构生成和下游应用的问题建模成双层规划问题,其中上层优化问题为图结构生成问题,下层优化问题为图预测问题,两层优化问题都使用图神经网络实现。分类器的目标函数嵌套于生成器的目标函数中,据此对生成器和分类器进行联合训练,能得到耦合性良好的生成预测网络,有效解决了双层规划问题,所得到的生成预测网络可以对图结构数据中的节点进行准确分类。
本申请提供的基于图结构数据的节点分类方法,可以应用于如图7所示的应用环境中。该应用环境中包括终端701和服务器702。终端701通过网络与服务器702进行通信。服务器702接收终端701发送的待分类图结构数据,生成网络生成待分类图结构数据的新的图结构,得到目标图结构数据,预测网络根据目标图结构数据进行节点分类,进而得到待分类图结构数据的节点分类结果。其中,终端701可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器702可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图8所示,提供了一种基于图结构数据的节点分类方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。
该节点分类方法为应用前述实施例中的方法训练得到的目标网络对待分类图结构数据进行分类的具体应用场景。待分类图结构数据输入到目标网络后,目标网络的处理过程可以参照前述实施例,即由生成网络对待分类图结构数据进行处理,以生成新的图结构数据,将新的图结构数据输入到预测网络中,该预测网络依据该新的图结构数据进行节点分类并输出最终的节点分类结果。对于实现过程与网络训练过程一致的内容,后续的内容不再重复描述,可以直接参见前述实施例的相关描述。
以该方法应用于图7中的服务器为例进行说明,包括以下步骤:
S801,获取连边数据有损的待分类图结构数据。
其中,待分类图结构数据可以包括噪声图结构数据和不完备图结构数据中的至少一项。在某些实施例中,待分类图结构数据也可以为无噪声且完备的图结构数据。
S802,将所述待分类图结构数据输入到预先训练的目标网络;所述目标网络由有损图结构数据对生成网络和预测网络进行联合训练得到,所述有损图结构数据为图结构训练数据对应的有损的图结构数据。
其中,联合训练的过程可以参见前述实施例中对目标网络的训练过程。
S803,所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,将所述目标图结构数据输入到所述预测网络中。
目标图结构数据为生成网络基于待分类图结构数据生成的新的图结构数据。
S804,所述预测网络对所述目标图结构数据中的节点进行分类,得到与所述待分类图结构数据对应的节点分类结果。
上述实施例通过生成网络和预测网络的联合训练能得到耦合性良好的目标网络,有效解决了双层规划问题,在接收到有损的图结构数据时依然可以对图结构数据中的节点进行准确分类。
在一个实施例中,所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,包括:所述生成网络对所述待分类图结构数据进行连边恢复,根据已恢复的连边数据得到残差邻接矩阵,根据所述残差邻接矩阵生成所述目标图结构数据。
上述实施例通过已恢复的连边数据得到残差邻接矩阵,该残差邻接矩阵中融合了已恢复的连边数据,根据该残差邻接矩阵生成的图结构更新数据充分融合了已恢复的连边数据,具有较高的准确性。
在一个实施例中,所述待分类图结构数据包括点特征矩阵和邻接矩阵;所述生成网络对所述待分类图结构数据进行连边恢复,根据已恢复的连边数据得到残差邻接矩阵,根据所述残差邻接矩阵生成所述目标图结构数据,包括:所述生成网络根据所述点特征矩阵和所述邻接矩阵进行连边恢复,根据已恢复的连边数据生成所述残差邻接矩阵,将所述邻接矩阵和所述残差邻接矩阵进行叠加,根据叠加得到的邻接矩阵生成所述目标图结构数据。
上述实施例中,通过点特征矩阵和邻接矩阵来提取各个节点的特征,基于各个节点的特征进行连边恢复,进而生成残差邻接矩阵,将原始邻接矩阵和残差矩阵进行叠加,得到邻接更新矩阵,该邻接更新矩阵充分融合了已恢复的连边数据,据此可以根据邻接更新矩阵生成准确的目标图结构数据。
在一个实施例中,所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,将所述目标图结构数据输入到所述预测网络中,包括:所述生成网络对所述待分类图结构数据进行连边恢复并生成至少一个目标图结构数据,将所述待分类图结构数据和所述至少一个目标图结构数据输入到所述预测网络中;所述预测网络对所述目标图结构数据中的节点进行分类,得到与所述待分类图结构数据对应的节点分类结果,包括:所述预测网络根据所述待分类图结构数据和所述至少一个目标图结构数据对所述待分类图结构数据中的节点进行分类预测以得到所述待分类图结构数据对应的节点分类结果。
上述实施例,在有限样本的情况下能保证预测网络进行分类的数据量,进而得到尽可能准确的节点分类结果。
本申请还提供一种应用场景,该应用场景应用上述的基于图结构数据的网络训练方法。具体地,以应用于服务器为例,该基于图结构数据的网络训练方法在该应用场景的应用如下:
1)接收终端发送的待分类图结构数据;该待分类图结构数据根据多篇文章之间的引用关系确定,各篇文章作为待分类图结构数据中的各个节点,文章之间的引用关系作为待分类图结构数据中的连边。
2)将待分类图结构数据对应的点特征矩阵和邻接矩阵输入到预先联合训练得到的生成预测网络;其中,点特征矩阵根据文章在关键词、发表时间、作者、影响因子等维度的信息构建得到,邻接矩阵根据各篇文章之间的引用关系确定。
3)生成器根据点特征矩阵和邻接矩阵对待分类图结构数据进行连边恢复,根据已恢复的连边数据得到残差邻接矩阵,根据残差邻接矩阵生成目标图结构数据。
4)将目标图结构数据输入到分类器中。分类器对目标图结构数据中的文章进行分类,得到与待分类图结构数据对应的文章分类结果。
5)在得到文章分类结果后可以向终端返回文章分类结果。
上述实施例通过生成网络和预测网络的联合训练能得到耦合性良好的生成预测网络,有效解决了双层规划问题,可以基于图结构数据实现对文章的准确分类。
本申请还提供一种应用场景,该应用场景应用上述的基于图结构数据的网络训练方法。具体地,以应用于服务器为例,该基于图结构数据的网络训练方法在该应用场景的应用如下:
1)接收终端发送的待分类图结构数据;该待分类图结构数据包括多个目的地之间的线路连接关系,各个目的地作为待分类图结构数据中的各个节点,目的地之间的线路作为待分类图结构数据中的连边。
2)将待分类图结构数据对应的点特征矩阵和邻接矩阵输入到预先联合训练得到的生成预测网络,其中,点特征矩阵根据目的地在坐标、目的地类型、人流量等维度的信息构建得到,邻接矩阵根据各个目的地之间的线路确定。该生成预测网络预先根据目的地之间的线路连接关系预先联合训练得到。
3)生成器根据点特征矩阵和邻接矩阵对待分类图结构数据进行连边恢复,根据已恢复的连边数据得到残差邻接矩阵,根据残差邻接矩阵生成目标图结构数据。
4)将目标图结构数据输入到分类器中。分类器对目标图结构数据中的目的地进行分类,以将各个目的地划分到对应的行政区域内,得到与待分类图结构数据对应的目的地分类结果。
5)在得到目的地分类结果后可以向终端返回目的地分类结果。此时,终端可以通过地图软件可以对各个行政区域内的目的地进行区分显示。
上述实施例通过生成网络和预测网络的联合训练能得到耦合性良好的生成预测网络,有效解决了双层规划问题,可以基于图结构数据实现对目的地的准确分类。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于与上述实施例中的基于图结构数据的网络训练方法相同的思想,本发明还提供基于图结构数据的网络训练装置,该装置可用于执行上述基于图结构数据的网络训练方法。为了便于说明,基于图结构数据的网络训练装置实施例的结构示意图中,仅仅示出了与本发明实施例相关的部分,本领域技术人员可以理解,图示结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在一个实施例中,如图9所示,提供了一种基于图结构数据的网络训练装置900,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:第一图结构获取模块901、第一图结构生成模块902、第一节点分类模块903和参数调整模块904,其中:
第一图结构获取模块901,用于获取图结构训练数据对应的有损图结构数据。
第一图结构生成模块902,用于将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据;所述目标网络包括所述生成网络和预测网络。
第一节点分类模块903,用于将所述图结构更新数据输入到所述预测网络中,以对所述图结构更新数据的节点进行分类预测得到所述图结构更新数据的节点分类结果。
参数调整模块904,用于根据所述图结构更新数据的节点分类结果,对所述生成网络和所述预测网络进行网络参数调整,直至所述生成网络和所述预测网络收敛,得到已训练的目标网络。
上述基于图结构数据的网络训练装置中,通过生成网络和预测网络的联合训练能得到耦合性良好的目标网络,进而可以对图结构数据中的节点进行准确分类。
在一个实施例中,第一图结构生成模块,包括:连边恢复子模块,用于对所述有损图结构数据进行连边恢复;矩阵确定子模块,用于根据已恢复的连边数据得到残差邻接矩阵;图结构生成子模块,用于根据所述残差邻接矩阵生成所述图结构更新数据。
在一个实施例中,所述有损图结构数据包括点特征矩阵和邻接矩阵;第一图结构生成模块,包括:矩阵生成子模块,用于根据所述点特征矩阵和所述邻接矩阵进行连边恢复,根据已恢复的连边数据生成所述残差邻接矩阵;矩阵叠加子模块,用于将所述邻接矩阵和所述残差邻接矩阵进行叠加;图结构数据生成子模块,用于根据叠加得到的邻接矩阵生成所述图结构更新数据。
在一个实施例中,矩阵生成子模块,包括:矩阵输入单元,用于将所述点特征矩阵和所述邻接矩阵输入到图神经网络中,以通过所述图神经网络进行连边恢复,并根据恢复的连边数据确定所述图神经网络的核函数的函数值;矩阵生成单元,用于根据所述核函数的函数值生成所述残差邻接矩阵。
在一个实施例中,矩阵输入单元,包括:点特征矩阵确定子单元,用于通过所述图神经网络进行连边恢复,根据恢复的连边数据得到参考点特征矩阵;相似度确定子单元,用于根据相似度函数确定所述点特征矩阵和参考点特征矩阵的相似度;所述相似度函数包括欧式距离函数、余弦相似度函数和点积函数中的至少一项;函数值确定子单元,用于根据所述相似度确定所述核函数的函数值。
在一个实施例中,所述图结构训练数据为至少两个轮次的图结构训练数据,每个轮次的图结构训练数据均对应有有损图结构数据;基于图结构数据的网络训练装置,包括:轮次图结构生成模块,用于依次将各个轮次的有损图结构数据输入到所述生成网络中,以生成各个轮次的图结构更新数据;参数调整模块,还用于根据所述各个轮次的图结构更新数据对应的节点分类结果,对所述生成网络和所述预测网络进行至少两个轮次的网络参数调整。
在一个实施例中,一个轮次的所述图结构训练数据包括第一训练数据和第二训练数据,若所述图结构训练数据为第一训练数据,所述图结构更新数据的节点分类结果为第一分类结果,若所述图结构训练数据为第二训练数据,所述图结构更新数据的节点分类结果为第二分类结果;对于一个轮次的网络参数调整,参数调整模块,包括:生成网络参数调整子模块,用于根据所述第一分类结果对所述生成网络进行网络参数调整;预测网络参数调整子模块,用于根据所述第二分类结果对所述预测网络进行网络参数调整。
在一个实施例中,所述生成网络中的网络参数为第一网络参数,生成网络参数调整子模块,包括:第一标签获取单元,用于获取所述第一训练数据的节点的第一分类标签;第一损失值确定单元,用于确定所述第一分类标签和所述第一分类结果对应的第一损失值;第一梯度确定单元,用于根据所述第一损失值确定所述第一网络参数的第一梯度;第一梯度下降单元,用于根据所述第一梯度对所述第一网络参数进行梯度下降处理。
在一个实施例中,所述预测网络中的网络参数为第二网络参数,预测网络参数调整子模块,包括:第二标签获取单元,用于获取所述第二训练数据的节点的第二分类标签;第二损失值确定单元,用于确定所述第二分类标签和所述第二分类结果对应的第二损失值;第二梯度确定单元,用于根据所述第二损失值确定所述第二网络参数的第二梯度;第二梯度下降单元,用于根据所述第二梯度对所述第二网络参数进行梯度下降处理。
在一个实施例中,第一图结构生成模块,还用于将所述有损图结构数据输入到所述生成网络中,以使所述生成网络对所述有损图结构数据进行连边恢复并生成至少一个图结构更新数据;第一节点分类模块,还用于将所述有损图结构数据和所述至少一个图结构更新数据输入到所述预测网络中,以使所述预测网络根据所述有损图结构数据和所述至少一个图结构更新数据进行节点的分类预测,得到所述图结构更新数据的节点分类结果。
在一个实施例中,如图10所示,提供了一种基于图结构数据的节点装置1000,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:第二图结构获取模块1001、图结构输入模块1002、第二图结构生成模块1003和第二节点分类模块1004,其中:
第二图结构获取模块1001,用于获取连边数据有损的待分类图结构数据。
图结构输入模块1002,用于将所述待分类图结构数据输入到预先训练的目标网络;所述目标网络由有损图结构数据对生成网络和预测网络进行联合训练得到,所述有损图结构数据为图结构训练数据对应的有损的图结构数据。
第二图结构生成模块1003,用于触发所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,将所述目标图结构数据输入到所述预测网络中。
第二节点分类模块1004,用于触发所述预测网络对所述目标图结构数据中的节点进行分类,得到与所述待分类图结构数据对应的节点分类结果。
上述基于图结构数据的网络训练装置中,通过生成网络和预测网络的联合训练能得到耦合性良好的目标网络,进而在输入有损的图结构数据时依然可以对图结构数据中的节点进行准确分类。
在一个实施例中,第二图结构生成模块,还用于所述生成网络对所述待分类图结构数据进行连边恢复,根据已恢复的连边数据得到残差邻接矩阵,根据所述残差邻接矩阵生成所述目标图结构数据。
在一个实施例中,所述待分类图结构数据包括点特征矩阵和邻接矩阵;第二图结构生成模块,还用于所述生成网络根据所述点特征矩阵和所述邻接矩阵进行连边恢复,根据已恢复的连边数据生成所述残差邻接矩阵,将所述邻接矩阵和所述残差邻接矩阵进行叠加,根据叠加得到的邻接矩阵生成所述目标图结构数据。
在一个实施例中,第二图结构生成模块,还用于所述生成网络对所述待分类图结构数据进行连边恢复并生成至少一个目标图结构数据,将所述待分类图结构数据和所述至少一个目标图结构数据输入到所述预测网络中;第二节点分类模块,还用于所述预测网络根据所述待分类图结构数据和所述至少一个目标图结构数据对所述待分类图结构数据中的节点进行分类预测以得到所述待分类图结构数据对应的节点分类结果。
关于基于图结构数据的网络训练装置的具体限定可以参见上文中对于基于图结构数据的网络训练方法的限定,在此不再赘述。上述基于图结构数据的网络训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于图结构数据的网络训练方法或者基于图结构数据的节点分类方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种基于图结构数据的网络训练方法,其特征在于,所述方法包括:
获取图结构训练数据对应的有损图结构数据,所述有损图结构数据包括基于文章的引用关系构建的图结构和基于地图上各个目的地之间的线路关系构建的图结构中的一种,所述有损图结构数据指的是连边数据有损的图结构数据;
将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据;所述目标网络包括所述生成网络和预测网络;
将所述图结构更新数据输入到所述预测网络中,以对所述图结构更新数据的节点进行分类预测得到所述图结构更新数据的节点分类结果;
根据所述图结构更新数据的节点分类结果,对所述生成网络和所述预测网络进行网络参数调整,直至所述生成网络和所述预测网络收敛,得到已训练的目标网络,其中所述预测网络的目标函数嵌套于所述生成网络的目标函数中。
2.根据权利要求1所述的方法,其特征在于,所述对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据,包括:
对所述有损图结构数据进行连边恢复;
根据已恢复的连边数据得到残差邻接矩阵,所述残差邻接矩阵指的是包含有连边损失信息的邻接矩阵;
根据所述残差邻接矩阵生成所述图结构更新数据。
3.根据权利要求2所述的方法,其特征在于,所述有损图结构数据包括点特征矩阵和邻接矩阵,其中点特征矩阵用于表示整个图结构中的所有点特征;
所述对所述有损图结构数据进行连边恢复,根据已恢复的连边数据得到残差邻接矩阵,根据所述残差邻接矩阵生成所述图结构更新数据,包括:
根据所述点特征矩阵和所述邻接矩阵进行连边恢复,根据已恢复的连边数据生成所述残差邻接矩阵;
将所述邻接矩阵和所述残差邻接矩阵进行叠加;
根据叠加得到的邻接矩阵生成所述图结构更新数据。
4.根据权利要求3所述的方法,其特征在于,所述根据所述点特征矩阵和所述邻接矩阵进行连边恢复,根据已恢复的连边数据生成所述残差邻接矩阵,包括:
将所述点特征矩阵和所述邻接矩阵输入到图神经网络中,以通过所述图神经网络进行连边恢复,并根据恢复的连边数据确定所述图神经网络的核函数的函数值;
根据所述核函数的函数值生成所述残差邻接矩阵。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述图结构训练数据为至少两个轮次的图结构训练数据,每个轮次的图结构训练数据均对应有有损图结构数据;
所述获取图结构训练数据对应的有损图结构数据;将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据,包括:
依次将各个轮次的有损图结构数据输入到所述生成网络中,以生成各个轮次的图结构更新数据;
所述根据所述图结构更新数据的节点分类结果,对所述生成网络和所述预测网络进行网络参数调整,包括:
根据所述各个轮次的图结构更新数据对应的节点分类结果,对所述生成网络和所述预测网络进行至少两个轮次的网络参数调整。
6.根据权利要求5所述的方法,其特征在于,一个轮次的所述图结构训练数据包括第一训练数据和第二训练数据,若所述图结构训练数据为第一训练数据,所述图结构更新数据的节点分类结果为第一分类结果,若所述图结构训练数据为第二训练数据,所述图结构更新数据的节点分类结果为第二分类结果;
对于一个轮次的网络参数调整,所述根据所述各个轮次的图结构更新数据对应的节点分类结果,对所述生成网络和所述预测网络进行至少两个轮次的网络参数调整,包括:
根据所述第一分类结果对所述生成网络进行网络参数调整;
根据所述第二分类结果对所述预测网络进行网络参数调整。
7.根据权利要求1至4任一项所述的方法,其特征在于,所述将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据,包括:
将所述有损图结构数据输入到所述生成网络中,以使所述生成网络对所述有损图结构数据进行连边恢复并生成至少一个图结构更新数据;
所述将所述图结构更新数据输入到所述预测网络中,以对所述图结构更新数据的节点进行分类预测得到所述图结构更新数据的节点分类结果,包括:
将所述有损图结构数据和所述至少一个图结构更新数据输入到所述预测网络中,以使所述预测网络根据所述有损图结构数据和所述至少一个图结构更新数据对所述图结构更新数据中的节点进行分类预测,得到所述图结构更新数据的节点分类结果。
8.一种基于图结构数据的节点分类方法,其特征在于,所述方法包括:
获取连边数据有损的待分类图结构数据,所述待分类图结构数据为以下数据中的一种:
所述待分类图结构数据根据多篇文章之间的引用关系确定,各篇文章作为待分类图结构数据中的各个节点,文章之间的引用关系作为待分类图结构数据中的连边;
所述待分类图结构数据包括多个目的地之间的线路连接关系,各个目的地作为待分类图结构数据中的各个节点,目的地之间的线路作为待分类图结构数据中的连边;
将所述待分类图结构数据输入到预先训练的目标网络;所述目标网络由有损图结构数据对生成网络和预测网络进行联合训练得到,其中所述预测网络的目标函数嵌套于所述生成网络的目标函数中,所述有损图结构数据指的是连边数据有损的图结构数据;
所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,将所述目标图结构数据输入到所述预测网络中;
所述预测网络对所述目标图结构数据中的节点进行分类,得到与所述待分类图结构数据对应的节点分类结果。
9.根据权利要求8所述的方法,其特征在于,所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,包括:
所述生成网络对所述待分类图结构数据进行连边恢复,根据已恢复的连边数据得到残差邻接矩阵,根据所述残差邻接矩阵生成所述目标图结构数据,所述残差邻接矩阵指的是包含有连边损失信息的邻接矩阵。
10.根据权利要求9所述的方法,其特征在于,所述待分类图结构数据包括点特征矩阵和邻接矩阵,其中点特征矩阵用于表示整个图结构中的所有点特征;
所述生成网络对所述待分类图结构数据进行连边恢复,根据已恢复的连边数据得到残差邻接矩阵,根据所述残差邻接矩阵生成所述目标图结构数据,包括:
所述生成网络根据所述点特征矩阵和所述邻接矩阵进行连边恢复,根据已恢复的连边数据生成所述残差邻接矩阵,将所述邻接矩阵和所述残差邻接矩阵进行叠加,根据叠加得到的邻接矩阵生成所述目标图结构数据。
11.根据权利要求9所述的方法,其特征在于,所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,将所述目标图结构数据输入到所述预测网络中,包括:
所述生成网络对所述待分类图结构数据进行连边恢复并生成至少一个目标图结构数据,将所述待分类图结构数据和所述至少一个目标图结构数据输入到所述预测网络中;
所述预测网络对所述目标图结构数据中的节点进行分类,得到与所述待分类图结构数据对应的节点分类结果,包括:
所述预测网络根据所述待分类图结构数据和所述至少一个目标图结构数据对所述待分类图结构数据中的节点进行分类预测以得到所述待分类图结构数据对应的节点分类结果。
12.一种基于图结构数据的网络训练装置,其特征在于,所述装置包括:
第一图结构获取模块,用于获取图结构训练数据对应的有损图结构数据,所述有损图结构数据包括基于文章的引用关系构建的图结构和基于地图上各个目的地之间的线路关系构建的图结构中的一种,所述有损图结构数据指的是连边数据有损的图结构数据;
第一图结构生成模块,用于将所述有损图结构数据输入到目标网络的生成网络中,以对所述有损图结构数据进行连边恢复并生成对应的图结构更新数据;所述目标网络包括所述生成网络和预测网络;
第一节点分类模块,用于将所述图结构更新数据输入到所述预测网络中,以对所述图结构更新数据的节点进行分类预测得到所述图结构更新数据的节点分类结果;
参数调整模块,用于根据所述图结构更新数据的节点分类结果,对所述生成网络和所述预测网络进行网络参数调整,直至所述生成网络和所述预测网络收敛,得到已训练的目标网络,其中所述预测网络的目标函数嵌套于所述生成网络的目标函数中。
13.一种基于图结构数据的节点分类装置,其特征在于,所述装置包括:
第二图结构获取模块,用于获取连边数据有损的待分类图结构数据,所述待分类图结构数据为以下数据中的一种:
所述待分类图结构数据根据多篇文章之间的引用关系确定,各篇文章作为待分类图结构数据中的各个节点,文章之间的引用关系作为待分类图结构数据中的连边;
所述待分类图结构数据包括多个目的地之间的线路连接关系,各个目的地作为待分类图结构数据中的各个节点,目的地之间的线路作为待分类图结构数据中的连边;
图结构输入模块,用于将所述待分类图结构数据输入到预先训练的目标网络;所述目标网络由有损图结构数据对生成网络和预测网络进行联合训练得到,其中所述预测网络的目标函数嵌套于所述生成网络的目标函数中,所述有损图结构数据指的是连边数据有损的图结构数据;
第二图结构生成模块,用于触发所述生成网络对所述待分类图结构数据进行连边恢复并生成对应的目标图结构数据,将所述目标图结构数据输入到所述预测网络中;
第二节点分类模块,用于触发所述预测网络对所述目标图结构数据中的节点进行分类,得到与所述待分类图结构数据对应的节点分类结果。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求8至11中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011169741.4A CN112200266B (zh) | 2020-10-28 | 2020-10-28 | 基于图结构数据的网络训练方法、装置以及节点分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011169741.4A CN112200266B (zh) | 2020-10-28 | 2020-10-28 | 基于图结构数据的网络训练方法、装置以及节点分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112200266A CN112200266A (zh) | 2021-01-08 |
CN112200266B true CN112200266B (zh) | 2024-04-02 |
Family
ID=74011713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011169741.4A Active CN112200266B (zh) | 2020-10-28 | 2020-10-28 | 基于图结构数据的网络训练方法、装置以及节点分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112200266B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112766609A (zh) * | 2021-02-05 | 2021-05-07 | 国网安徽省电力有限公司合肥供电公司 | 一种基于云计算的用电量预测方法 |
US20220383127A1 (en) * | 2021-06-01 | 2022-12-01 | Basmah ALTAF | Methods and systems for training a graph neural network using supervised contrastive learning |
CN114818973A (zh) * | 2021-07-15 | 2022-07-29 | 支付宝(杭州)信息技术有限公司 | 一种基于隐私保护的图模型训练方法、装置及设备 |
CN114594793B (zh) * | 2022-03-07 | 2023-04-25 | 四川大学 | 一种基站无人机的路径规划方法 |
CN115238808A (zh) * | 2022-07-30 | 2022-10-25 | 北京理工大学 | 一种基于多任务的通信网络中节点宕机的检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111026544A (zh) * | 2019-11-06 | 2020-04-17 | 中国科学院深圳先进技术研究院 | 图网络模型的节点分类方法、装置及终端设备 |
CN111401558A (zh) * | 2020-06-05 | 2020-07-10 | 腾讯科技(深圳)有限公司 | 数据处理模型训练方法、数据处理方法、装置、电子设备 |
CN111401192A (zh) * | 2020-03-10 | 2020-07-10 | 深圳市腾讯计算机系统有限公司 | 基于人工智能的模型训练方法和相关装置 |
CN111581488A (zh) * | 2020-05-14 | 2020-08-25 | 上海商汤智能科技有限公司 | 一种数据处理方法及装置、电子设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11468262B2 (en) * | 2017-10-30 | 2022-10-11 | Nec Corporation | Deep network embedding with adversarial regularization |
US11087174B2 (en) * | 2018-09-25 | 2021-08-10 | Nec Corporation | Deep group disentangled embedding and network weight generation for visual inspection |
-
2020
- 2020-10-28 CN CN202011169741.4A patent/CN112200266B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111026544A (zh) * | 2019-11-06 | 2020-04-17 | 中国科学院深圳先进技术研究院 | 图网络模型的节点分类方法、装置及终端设备 |
CN111401192A (zh) * | 2020-03-10 | 2020-07-10 | 深圳市腾讯计算机系统有限公司 | 基于人工智能的模型训练方法和相关装置 |
CN111581488A (zh) * | 2020-05-14 | 2020-08-25 | 上海商汤智能科技有限公司 | 一种数据处理方法及装置、电子设备和存储介质 |
CN111401558A (zh) * | 2020-06-05 | 2020-07-10 | 腾讯科技(深圳)有限公司 | 数据处理模型训练方法、数据处理方法、装置、电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112200266A (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112200266B (zh) | 基于图结构数据的网络训练方法、装置以及节点分类方法 | |
Gao et al. | Deep transfer learning for image‐based structural damage recognition | |
Xie et al. | Point clouds learning with attention-based graph convolution networks | |
Li et al. | Multiscale spatio-temporal graph neural networks for 3d skeleton-based motion prediction | |
CN111782838B (zh) | 图像问答方法、装置、计算机设备和介质 | |
CN110659723B (zh) | 基于人工智能的数据处理方法、装置、介质及电子设备 | |
CN109783666B (zh) | 一种基于迭代精细化的图像场景图谱生成方法 | |
CN109858390A (zh) | 基于端到端时空图学习神经网络的人体骨架的行为识别方法 | |
Wang et al. | 3d lidar and stereo fusion using stereo matching network with conditional cost volume normalization | |
TR201514432T1 (tr) | Veri̇ni̇n i̇leri̇ beslemeli̇ si̇ni̇r aği mi̇mari̇si̇ kullanilarak yalanci-yi̇neleme i̇le i̇şlenmesi̇ i̇çi̇n yöntem | |
CN110222718B (zh) | 图像处理的方法及装置 | |
CN113313232B (zh) | 一种基于预训练和图神经网络的功能脑网络分类方法 | |
Bandara et al. | Spin road mapper: Extracting roads from aerial images via spatial and interaction space graph reasoning for autonomous driving | |
CN112765370B (zh) | 知识图谱的实体对齐方法、装置、计算机设备和存储介质 | |
US11270425B2 (en) | Coordinate estimation on n-spheres with spherical regression | |
KR20190126857A (ko) | 이미지에서 오브젝트 검출 및 표현 | |
CN113822315A (zh) | 属性图的处理方法、装置、电子设备及可读存储介质 | |
CN111738074A (zh) | 基于弱监督学习的行人属性识别方法、系统及装置 | |
Li et al. | Multiscale receptive fields graph attention network for point cloud classification | |
Lian et al. | SORCNet: robust non-rigid shape correspondence with enhanced descriptors by Shared Optimized Res-CapsuleNet | |
CN111309923B (zh) | 对象向量确定、模型训练方法、装置、设备和存储介质 | |
CN116977265A (zh) | 缺陷检测模型的训练方法、装置、计算机设备和存储介质 | |
CN113628107B (zh) | 人脸图像超分辨率方法和系统 | |
Sun et al. | Real-time memory efficient large-pose face alignment via deep evolutionary network | |
CN112801138A (zh) | 基于人体拓扑结构对齐的多人姿态估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40037371 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |