CN112699938B - 一种基于图卷积网络模型的分类方法及装置 - Google Patents
一种基于图卷积网络模型的分类方法及装置 Download PDFInfo
- Publication number
- CN112699938B CN112699938B CN202011604370.8A CN202011604370A CN112699938B CN 112699938 B CN112699938 B CN 112699938B CN 202011604370 A CN202011604370 A CN 202011604370A CN 112699938 B CN112699938 B CN 112699938B
- Authority
- CN
- China
- Prior art keywords
- target object
- convolution
- target
- node
- feature data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000009466 transformation Effects 0.000 claims abstract description 46
- 238000000605 extraction Methods 0.000 claims abstract description 21
- 238000013507 mapping Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 24
- 238000005096 rolling process Methods 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 241000689227 Cora <basidiomycete fungus> Species 0.000 description 11
- 241000122205 Chamaeleonidae Species 0.000 description 7
- 241000555745 Sciuridae Species 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Abstract
本发明实施例提供了一种基于图卷积网络模型的分类方法及装置,获取目标对象的待处理特征数据,并输入至目标图卷积网络模型;目标图卷积网络模型包括多层感知器、卷积网络和特征变换层;通过多层感知器分别对每一目标对象的待处理特征数据进行非线性变换,得到该目标对象的第一特征数据;通过卷积网络,对各目标对象的第一特征数据进行特征提取,得到各目标对象的聚合特征数据;通过特征变换层分别对每一目标对象的聚合特征数据进行映射处理,得到该目标对象的类别标签;在预设的类别标签与类别的对应关系中,确定每一目标对象的类别标签对应的类别,作为该目标对象的类别。基于上述处理,可以提高确定出的目标对象的类别的准确性。
Description
技术领域
本发明涉及人工智能技术领域,特别是涉及一种基于图卷积网络模型的分类方法及装置。
背景技术
随着人工智能技术的快速发展,神经网络模型在系统辨识、模式识别、智能控制等领域有着广泛的应用前景。其中,GCN(Graph convolutional networks,图卷积网络)模型广泛应用于各种分类场景,例如,可以基于图卷积网络模型,对论文进行分类。
现有技术中,图卷积网络模型包括多个卷积层,每一卷积层的卷积核为低通滤波器。在基于图卷积网络模型对各目标对象进行分类时,可以将各目标对象(例如,论文)的特征数据输入至图卷积网络模型。然后,可以通过图卷积网络模型,对各目标对象的特征数据进行卷积,得到各目标对象的低频特征,并基于提取到的低频特征,确定各目标对象各自的类别标签。后续,可以根据预设的类别标签与类别的对应关系,确定各目标对象各自的类别。
然而,目标对象的低频特征仅能表示目标对象的一部分特征,因此,基于现有技术中的图卷积网络模型确定出的目标对象的类别的准确性较低。
发明内容
本发明实施例的目的在于提供一种基于图卷积网络模型的分类方法及装置,以提高确定出的目标对象的类别的准确性。具体技术方案如下:
第一方面,为了达到上述目的,本发明实施例提供了一种基于图卷积网络模型的分类方法,所述方法包括:
获取待分类的各目标对象的特征数据,作为待处理特征数据;
将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型;其中,所述目标图卷积网络模型包括:多层感知器、卷积网络和特征变换层;
通过所述多层感知器,分别对每一目标对象的待处理特征数据进行非线性变换,得到该目标对象的第一特征数据;
通过所述卷积网络,针对每一目标对象,对该目标对象的第一特征数据和该目标对象对应的关联对象的第一特征数据进行特征提取,得到该目标对象的聚合特征数据;其中,该目标对象的聚合特征数据表示该目标对象的低频特征和高频特征;该目标对象对应的关联对象与该目标对象之间存在关联关系;
通过所述特征变换层,分别对每一目标对象的聚合特征数据进行映射处理,得到该目标对象的类别标签;
针对每一目标对象,在预设的类别标签与类别的对应关系中,确定该目标对象的类别标签对应的类别,作为该目标对象的类别。
第二方面,为了达到上述目的,本发明实施例提供了一种基于图卷积网络模型的分类装置,所述装置包括:
获取模块,用于获取待分类的各目标对象的特征数据,作为待处理特征数据;
输入模块,用于将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型;其中,所述目标图卷积网络模型包括:多层感知器、卷积网络和特征变换层;
非线性变换模块,用于通过所述多层感知器,分别对每一目标对象的待处理特征数据进行非线性变换,得到该目标对象的第一特征数据;
特征提取模块,用于通过所述卷积网络,针对每一目标对象,对该目标对象的第一特征数据和该目标对象对应的关联对象的第一特征数据进行特征提取,得到该目标对象的聚合特征数据;其中,该目标对象的聚合特征数据表示该目标对象的低频特征和高频特征;该目标对象对应的关联对象与该目标对象之间存在关联关系;
映射模块,用于通过所述特征变换层,分别对每一目标对象的聚合特征数据进行映射处理,得到该目标对象的类别标签;
确定模块,用于针对每一目标对象,在预设的类别标签与类别的对应关系中,确定该目标对象的类别标签对应的类别,作为该目标对象的类别。
本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的基于图卷积网络模型的分类方法。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面或者第二方面任一所述的基于图卷积网络模型的分类方法的步骤。
本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的基于图卷积网络模型的分类方法。
本发明实施例提供的一种基于图卷积网络模型的分类方法,获取待分类的各目标对象的特征数据,作为待处理特征数据;将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型;目标图卷积网络模型包括:多层感知器、卷积网络和特征变换层;通过多层感知器,分别对每一目标对象的待处理特征数据进行非线性变换,得到该目标对象的第一特征数据;通过卷积网络,针对每一目标对象,对该目标对象的第一特征数据和该目标对象对应的关联对象的第一特征数据进行特征提取,得到该目标对象的聚合特征数据;该目标对象的聚合特征数据表示该目标对象的低频特征和高频特征;该目标对象对应的关联对象与该目标对象之间存在关联关系;通过特征变换层,分别对每一目标对象的聚合特征数据进行映射处理,得到该目标对象的类别标签;针对每一目标对象,在预设的类别标签与类别的对应关系中,确定该目标对象的类别标签对应的类别,作为该目标对象的类别。
基于上述处理,基于目标图卷积网络模型可以提取目标对象的聚合特征数据,由于目标对象的聚合特征数据能够表示目标对象的低频特征和高频特征,因此,目标对象的聚合特征数据能够更全面的表示目标对象的特征。进而,基于目标图卷积网络模型确定出的目标对象的类别的准确性较高,也就是说,可以提高确定出的目标对象的类别的准确性。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明实施例提供的一种基于图卷积网络模型的分类方法的流程图;
图2为本发明实施例提供的另一种基于图卷积网络模型的分类方法的流程图;
图3为本发明实施例提供的另一种基于图卷积网络模型的分类方法的流程图;
图4a为现有技术中基于图卷积网络模型进行特征提取的示意图;
图4b为本发明实施例提供的一种基于目标图卷积网络模型进行特征提取的示意图;
图5a为本发明提供的一种分类结果的正确率对比图;
图5b为本发明提供的另一种分类结果的正确率对比图;
图5c为本发明提供的另一种分类结果的正确率对比图;
图5d为本发明提供的另一种分类结果的正确率对比图;
图5e为本发明提供的另一种分类结果的正确率对比图;
图6为本发明实施例提供的一种基于图卷积网络模型的分类装置的结构图;
图7为本发明实施例提供的一种电子设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1为本发明实施例提供的一种基于图卷积网络模型的分类方法的流程图,该方法应用与电子设备,该电子设备可以用于进行分类。
该方法可以包括以下步骤:
S101:获取待分类的各目标对象的特征数据,作为待处理特征数据。
S102:将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型。
其中,目标图卷积网络模型包括:多层感知器、卷积网络和特征变换层。
S103:通过多层感知器,分别对每一目标对象的待处理特征数据进行非线性变换,得到该目标对象的第一特征数据。
S104:通过卷积网络,针对每一目标对象,对该目标对象的第一特征数据和该目标对象对应的关联对象的第一特征数据进行特征提取,得到该目标对象的聚合特征数据。
其中,该目标对象的聚合特征数据表示该目标对象的低频特征和高频特征;该目标对象对应的关联对象与该目标对象之间存在关联关系。
S105:通过特征变换层,分别对每一目标对象的聚合特征数据进行映射处理,得到该目标对象的类别标签。
S106:针对每一目标对象,在预设的类别标签与类别的对应关系中,确定该目标对象的类别标签对应的类别,作为该目标对象的类别。
基于本发明实施例提供的基于图卷积网络模型的分类方法,基于目标图卷积网络模型可以提取目标对象的聚合特征数据,由于目标对象的聚合特征数据能够表示目标对象的低频特征和高频特征,因此,目标对象的聚合特征数据能够更全面的表示目标对象的特征。进而,基于目标图卷积网络模型确定出的目标对象的类别的准确性较高,也就是说,可以提高确定出的目标对象的类别的准确性。
在步骤S101中,目标对象可以为论文,或者,目标对象也可以为网页。目标对象的特征数据用于表示目标对象的主题。相应的,如果目标对象为论文,则论文的特征数据可以为论文的关键词。如果目标对象为网页,网页的特征数据可以为网页显示的信息的关键词。
具体的,论文可以为Cora(提供机器学习方面的论文的数据库)中的各论文,或者,也可以为Citeeser(学术论文数字图书馆)中的各论文,或者,也可以为Pubmed(提供生物医学方面的论文的数据库)中的各论文。网页可以为维基百科的Chameleon(变色龙)网页,或者,也可以为维基百科的Squirrel(松鼠)网页。
在步骤S102中,在获取各目标对象的待处理特征数据之后,电子设备可以将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型。后续,可以基于目标图卷积网络模型,确定各目标对象的类别。
在本发明的一个实施例中,在步骤S102之前,该方法还可以包括以下步骤:
生成各目标对象对应的拓扑图,作为目标拓扑图。
其中,目标拓扑图包括多个节点;多个节点与各目标对象一一对应;多个节点按照各目标对象之间的关联关系相连接。
相应的,步骤S102可以包括以下步骤:
将目标拓扑图,输入至预先训练的目标图卷积网络模型。
一种实现方式中,当目标对象为论文时,各目标对象之间的关联关系可以为各论文之间的引用关系。例如,论文A引用了论文B,则论文A和论文B之间存在关联关系,即,论文B为论文A对应的关联对象,论文A为论文B对象的关联对象。当目标对象为网页时,各目标对象之间的关联关系可以为各网页之间的超链接。例如,网页A中存在网页B的超链接,则网页A和网页B之间存在关联关系,即,网页B为网页A对应的关联对象,网页A为网页B对应的关联对象。
上述将目标拓扑图输入至目标图卷积网络模型,也就是,将各目标对象的待处理特征数据和各目标对象之间的关联关系输入至目标图卷积网络模型,以使目标图卷积网络模型,基于各目标对象的待处理特征数据和各目标对象之间的关联关系,确定各目标对象的类别标签。
一种实现方式中,在基于预先训练的目标图卷积网络模型,确定各目标对象的类别标签之前,电子设备可以基于预设的训练样本,对初始目标图卷积网络模型进行训练。
预设的训练样本包括:各样本对象的待处理特征数据、各样本对象之间的关联关系和各样本对象的类别标签(可以称为样本类别标签)。
电子设备可以将各样本对象对应的样本拓扑图,输入至初始目标图卷积网络模型,得到各样本对象的类别标签(可以称为预测类别标签)。进而,电子设备可以计算表示预测类别标签与样本类别标签差异性的损失函数值,并基于计算得到的损失函数值,对初始目标图卷积网络模型的模型参数进行调整,直至达到预设收敛条件,得到训练好的目标图卷积网络模型。其中,预设收敛条件可以由技术人员根据经验设置。
可以理解的是,当目标对象为待分类的论文时,样本对象为已确定类别的论文。当目标对象为网页时,样本对象为已确定类别的网页。
在本发明的一个实施例中,步骤S103可以包括以下步骤:
通过多层感知器,基于第一预设公式,针对每一节点,对该节点对应的目标对象的待处理特征数据进行非线性变换,得到非线性变换后的特征数据,作为该目标对象的第一特征数据。
其中,第一预设公式为:
p(1)=φ(W1p(0)) (1)
p(1)表示该目标对象的第一特征数据;p(0)表示该节点对应的目标对象的待处理特征数据;W1表示第一预设权重矩阵;φ表示预设非线性变换函数。
其中,预设非线性变换函数可以由技术人员根据经验设置,例如,预设非线性变换函数可以为Sigmoid(S型)函数,或者,预设非线性变换函数也可以为tanh(双曲正切)函数,但并不限于此。
在本发明的一个实施例中,目标图卷积网络模型的卷积网络可以包含多个卷积层。例如,卷积网络可以包含3个卷积层,或者,卷积网络也可以包含4个卷积层,但并不限于此。
每一卷积层可以包括一个卷积核,或者,每一卷积层也可以包括多个卷积核。相应的,则可以根据每一卷积层包括的卷积层的数目,采取不同的方式,对目标对象的第一特征数据进行处理。
方式一:每一卷积层包含多个卷积核。即,每一卷积层可以包括:第一卷积核和第二卷积核。第一卷积核和第二卷积核均可以获取该卷积层的输入数据,并对该卷积层的输入数据进行卷积处理。
相应的,参见图2,步骤S104可以包括以下步骤:
S1041:通过每一卷积层的第一卷积核对该卷积层的输入数据进行卷积,得到该卷积层确定的各节点对应的目标对象的低频特征。
其中,卷积网络中的第一个卷积层的输入数据包括各目标对象的第一特征数据;第一卷积核为:
F1=(ε+1)I-L (2)
F1表示第一卷积核;ε表示预设系数,L表示目标拓扑图的拉普拉斯矩阵。
S1042:通过每一卷积层的第二卷积核对该卷积层的输入数据进行卷积,得到该卷积层确定的各节点对应的目标对象的高频特征。
其中,第二卷积核为:
F2=(ε-1)I+L(3)
F2表示第二卷积核;ε表示预设系数,L表示目标拓扑图的拉普拉斯矩阵。
S1043:通过每一卷积层,基于该卷积层确定的各节点对应的目标对象的低频特征、高频特征和第二预设公式,计算各节点对应的目标对象的备选特征数据。
其中,第二预设公式为:
表示卷积网络中第k个卷积层输出的第i个节点对应的目标对象的备选特征数据;/>表示第i个节点的第j个邻居节点对应的目标对象的低频特征的权重,/>表示第i个节点的第j个邻节点对应的目标对象的高频特征的权重;F1表示第一卷积核,Hk-1表示卷积网络中第k-1个卷积层输出的各目标对象的备选特征数据;(F1·Hk-1)i表示第k个卷积层确定的第i个节点对应的目标对象的低频特征;F2表示第二卷积核;(F2·Hk-1)i表示第k个卷积层确定的第i个节点对应的目标对象的高频特征。
S1044:针对每一节点,确定最后一个卷积层输出的该节点对应的目标对象的备选特征数据,作为该目标对象的聚合特征数据。
一种实现方式中,为了提取各目标对象的低频特征和高频特征,可以设置每一卷积层的卷积核包括:第一卷积核F1和第二卷积核F2。其中,第一卷积核用于提取各目标对象的低频特征,第二卷积核用于提取各目标对象的高频特征。
第一卷积核可以表示为如下公式(5),第二卷积核可以表示为如下公式(6)。
其中,L=D-A (7)
F1表示第一卷积核;ε表示预设系数,ε∈(0,1);I表示单位矩阵,D表示目标拓扑图的度矩阵,A表示目标拓扑图的邻接矩阵,F2表示第二卷积核,L表示目标拓扑图的拉普拉斯矩阵。
基于上述公式(5)和公式(7),可以得到如公式(2)所示的第一卷积核,基于上述公式(6)和公式(7),可以得到如公式(3)所示的第二卷积核。
进而,电子设备可以通过每一卷积层的第一卷积核,基于如下公式(8),对该卷积层的输入数据进行卷积,得到各节点对应的目标对象的低频特征,并通过该卷积层的第二卷积核,基于如下公式(9),对该卷积层的输入数据进行卷积,得到各节点对应的目标对象的高频特征。
F1*G(Hk-1)=U[(ε+1)I-Λ]UT(Hk-1)=F1·(Hk-1) (8)
F2*G(Hk-1)=U[(ε-1)I+Λ]UT(Hk-1)=F2·(Hk-1) (9)
F1*G(Hk-1)表示卷积网络中第k个卷积层确定的各目标对象的低频特征;Hk-1表示卷积网络中第k-1个卷积层输出的各目标对象的备选特征数据;Hk-1包含多个行向量,多个行向量与各目标对象一一对应,一个行向量为对应的目标对象的备选特征数据;F1表示第一卷积核;F1*G(Hk-1)表示对F1和Hk-1进行卷积;F2*G(Hk-1)表示卷积网络中第k个卷积层确定的各目标对象的高频特征;F2表示第二卷积核;F2*G(Hk-1)表示对F2和Hk-1进行卷积。ε表示预设系数;I表示单位矩阵;T表示转置运算;U表示将目标特征向量作为列向量,得到的特征矩阵,目标特征向量包括:对目标拓扑图的拉普拉斯矩阵L进行特征分解得到的特征向量;Λ表示将目标元素作为主对角线元素,得到的对角矩阵,目标元素包括:对目标拓扑图的拉普拉斯矩阵L进行特征分解得到的特征值。
另外,将第一卷积核中的L作为自变量,可以得到第一卷积核的函数形式为:F1(λ)=ε+1-λ。当第二个卷积层对第一个卷积层的输出数据进行卷积时,二阶卷积核的函数形式可以表示为:F1(λ)2=(ε+1-λ)2。由于ε∈(0,1),当λ=0时,F1(λ)2=(ε+1)2>1;当λ=1时,F1(λ)2=ε2>0;当λ=2时,F1(λ)2=(ε-1)2<1。因此,基于第一卷积核F1,可以放大低频特征,并抑制高频特征。
现有技术中,图卷积网络模型中的卷积层的卷积核为:θ(λ)=(1-λ),当第二个卷积层对第一个卷积层的输出数据进行卷积时,二阶卷积核为:θ(λ)2=(1-λ)2。当λ=0时,θ(λ)2=1;当λ=1时,θ(λ)2=0;当λ=2时,θ(λ)2=1。
将F1(λ)2与θ(λ)2进行对比,可以得到:当λ∈[0,1]时,θ(λ)2<F1(λ)2。因此,相对于现有技术中的图卷积网络模型中的卷积层的卷积核,本发明实施例提供的目标图卷积网络模型中的卷积层的第一卷积核,可以更好的放大低频特征,并抑制高频特征。也就是说,本发明实施例提供的目标图卷积网络模型,可以基于第一卷积核更好的提取各目标对象的低频特征。
另外,本发明实施例提供的目标图卷积网络模型还可以基于第二卷积核,提取各目标对象的高频特征。
在步骤S1043中,电子设备可以通过每一卷积层,基于该卷积层确定的各节点对应的目标对象的低频特征、高频特征和上述公式(4),计算各节点对应的目标对象的备选特征数据。
可以理解的是,卷积网络包含多个卷积层,每一卷积层的输入数据为:该卷积层的前一卷积层的输出数据。第一个卷积层的输入数据为:多层感知器的输出数据,也就是说,第一个卷积层的输入数据为:各目标对象的第一特征数据;第二个卷积层的输入数据为:第一个卷积层输出的各目标对象的备选特征数据。
相应的,第一个卷积层可以基于各节点对应的目标对象的第一特征数据,确定的各节点对应的目标对象的低频特征和高频特征,并输出的各节点对应的目标对象的一个备选特征数据。然后,第二个卷积层可以基于第一个卷积层输出的各节点对应的目标对象的备选特征数据,确定各节点对应的目标对象的低频特征和高频特征,并输出的各节点对应的目标对象的一个备选特征数据,以此类推,直至最后一个卷积层输出各节点对应的目标对象的一个备选特征数据。
在步骤S1044中,针对每一节点,电子设备可以确定最后一个卷积层输出的该节点对应的目标对象的备选特征数据,作为该目标对象的聚合特征数据。
然而,基于上述公式(4)确定目标对象的聚合特征数据时,需要计算F1·Hk-1的值,以及F2·Hk-1的值。当目标对象的数目较多时,Hk-1的维度较大,会导致计算难度较大,进而,导致对目标对象进行分类的效率较低。
另外,在提取目标对象的低频特征和高频特征之后,需要由技术人员预先确定目标对象之间的关联关系的类型。进而,根据目标对象之间的关联关系的类型,确定各目标对象的低频特征的权重和高频特征的权重(即和/>)。例如,当目标对象之间的关联关系的类型是同配类型时,设置/>大于/>当目标对象之间的关联关系的类型是异配类型时,设置/>小于/>然而,由技术人员预先确定目标对象之间的关联关系的类型,需要较大的成本。
同配类型是指各目标对象对应的目标拓扑图中,度较大的节点与度较大的节点连接。异配类型是指各目标对象对应的目标拓扑图中,度较大的节点与度较小的节点连接。一个节点的度是指该节点的邻居节点的数目,该节点的邻居节点与该节点相连接。一个节点的邻居节点对应的目标对象,为该节点对应的目标对象对应的关联对象。
为了降低成本,提高对目标对象进行分类的效率,可以采用方式二,对目标对象的第一特征数据进行处理。
方式二,每一卷积层包括一个卷积核(即后续实施例中的第三卷积核)。相应的,参见图3,步骤S104可以包括以下步骤:
S1045:针对每一节点,通过各卷积层,基于第三预设公式,对该节点对应的目标对象的第一特征数据,以及该节点对应的目标对象对应的关联对象的第一特征数据进行特征提取,得到各卷积层输出的该节点对应的目标对象的各备选特征数据。
其中,第三预设公式为:
p(k)表示卷积网络中第k个卷积层输出的该节点对应的目标对象的备选特征数据;ε表示预设系数;p(1)表示该节点对应的目标对象的第一特征数据;N表示该节点的邻居节点的集合;S表示该节点的度;表示该节点的第j个邻居节点对应的目标对象的高频特征的权重与低频特征的权重的差值;dj表示该节点的第j个邻居节点的度;/>表示卷积网络中第k-1个卷积层输出的该节点的第j个邻居节点对应的目标对象的备选特征数据。
S1046:确定最后一个卷积层输出的该节点对应的目标对象的备选特征数据,作为该目标对象的聚合特征数据。
在步骤S1045中,可以基于公式:以及上述公式(4),得到上述公式(10)。进而,基于上述公式(10)计算各目标对象的备选特征数据。
一种实现方式中,可以根据的大小,确定目标对象的聚合特征数据中的低频特征和高频特征的占比。当/>时,/>表明目标对象的聚合特征数据中,低频特征的占比大于高频特征的占比。/>时,/>表明目标对象的聚合特征数据中,高频特征的占比大于低频特征的占比。
另一种实现方式中,针对每一节点,还可以根据的大小,确定该节点的备选特征数据和该节点的邻居节点的备选特征数据的计算关系。当/>时,表明基于上述公式(10),计算该节点的备选特征数据和该节点的邻居节点的备选特征数据的和值。当/>时,表明基于上述公式(10),计算该节点的备选特征数据与该节点的邻居节点的备选特征数据的差值。
在本发明的一个实施例中,卷积网络包含的每一卷积层可以包括一个第三卷积核。在步骤S1045之前,该方法还可以包括以下步骤:
通过各卷积层,基于第四预设公式,针对每一节点,计算该节点的邻居节点对应的目标对象的高频特征的权重与低频特征的权重的差值。
其中,第四预设公式为:
表示该节点的第j个邻居节点对应的目标对象的高频特征的权重与低频特征的权重的差值;tanh表示正确双曲函数,g表示卷积网络中第k个卷积层的第三卷积核;T表示转置运算;p(k-1)表示卷积网络中第k-1个卷积层输出的该节点对应的目标对象的备选特征数据;/>表示第k-1个卷积层输出的该节点的第j个邻居节点对应的目标对象的备选特征数据;/>表示对p(k-1)和/>进行拼接。
在步骤S1046中,卷积网络包含多个卷积层,每一卷积层的输入数据为:该卷积层的前一卷积层的输出数据。第一个卷积层的输入数据为:多层感知器的输出数据,也就是说,第一个卷积层的输入数据为:各目标对象的第一特征数据;第二个卷积层的输入数据为:第一个卷积层输出的各目标对象的备选特征数据。
相应的,针对每一节点,第一个卷积层可以基于该节点对应的目标对象的第一特征数据,以及该节点对应的目标对象对应的关联对象的第一特征数据,输出的该节点对应的目标对象的一个备选特征数据。然后,第二个卷积层可以基于第一个卷积层输出的该节点对应的目标对象的备选特征数据,以及该节点对应的目标对象对应的关联对象的备选特征数据,输出的该节点对应的目标对象的一个备选特征数据,以此类推,直至最后一个卷积层输出该节点对应的目标对象的一个备选特征数据。
进而,电子设备可以确定最后一个卷积层输出的该节点对应的目标对象的备选特征数据,作为该目标对象的聚合特征数据。
基于上述处理,可以直接确定的值,并基于上述公式(10),确定各目标对象的聚合特征数据,不需要计算F1·Hk-1的值,以及F2·Hk-1的值,也不需要预先确定目标对象之间的关联关系的类型,可以降低成本,并提高对目标对象进行分类的效率。
在步骤S105中,在得到各目标对象的聚合特征数据之后,电子设备可以通过特征变换层,基于如下公式(12),分别对每一目标对象的聚合特征数据进行映射处理,得到该目标对象的类别标签。
Pout=W2P (12)
Pout表示该目标对象的类别标签,W2表示第二预设权重矩阵,P表示该目标对象的聚合特征数据。P也就是卷积网络中最后一个卷积层输出的该目标对象的备选特征数据。
在步骤S106中,针对每一目标对象,在预设的类别标签与类别的对应关系中,确定该目标对象的类别标签对应的类别,作为该目标对象的类别。
当目标对象为论文时,各目标对象的类别可以包括:医学、生物、通信和计算机等类别。当目标对象为网页时,如果以访问量作为类别,则各目标对象的类别可以包括:访问量小于1000、访问量属于1000至10000,以及访问量大于10000等类别。
参见图4a,图4a为现有技术中基于图卷积网络模型进行特征提取的示意图。
待分类的目标对象包括:目标对象1、目标对象2和目标对象3,目标对象对应的目标拓扑图包含3个节点,分别为:节点节点/>和节点/>目标对象1与节点/>相对应;目标对象2与节点/>相对应;目标对象3与节点/>相对应。α12表示节点/>的对应的目标对象的特征数据的权重,α13表示节点/>对应的目标对象的特征数据的权重。
现有技术中可以基于图卷积网络模型,根据节点对应的目标对象2的特征数据、节点/>对应的目标对象2的特征数据的权重、节点/>对应的目标对象3的特征数据、节点/>对应的目标对象3的特征数据的权重和节点/>对应的目标对象1的特征数据,确定节点/>对应的目标对象1的低频特征。进而,可以将节点/>更新为节点/>相应的,更新后的节点/>与目标对象1的低频特征相对应。
参见图4b,图4b为本发明实施例提供的一种基于目标图卷积网络模型进行特征提取的示意图。
待分类的目标对象包括:目标对象1、目标对象2和目标对象3,目标对象对应的目标拓扑图包含3个节点,分别为:节点节点/>和节点/>目标对象1与节点/>相对应;目标对象2与节点/>相对应;目标对象3与节点/>相对应。
表示节点/>的对应的目标对象的低频特征的权重,/>表示节点/>的对应的目标对象的高频特征的权重,/>表示节点/>对应的目标对象的低频特征的权重,/>表示节点/>对应的目标对象的高频特征的权重,ε表示预设系数。
基于本发明实施例提供的目标图卷积网络模型中的每一卷积层,可以根据节点对应的目标对象2的低频特征、节点/>对应的目标对象2的低频特征的权重、节点/>对应的目标对象2的高频特征、节点/>对应的目标对象2的高频特征的权重、节点/>对应的目标对象3的低频特征、节点/>对应的目标对象3的低频特征的权重、节点/>对应的目标对象3的高频特征、节点/>对应的目标对象3的高频特征的权重和节点/>对应的目标对象1的特征数据,确定节点/>对应的目标对象1的聚合特征数据。进而,可以将节点/>更新为节点相应的,更新后的节点/>与目标对象1的聚合特征数据相对应。/>
相对于现有技术中基于图卷积网络模型,只能提取目标对象的低频特征。基于本发明实施例提供的目标图卷积网络模型,可以提取目标对象的高频特征和低频特征,进而,基于目标对象的高频特征和低频特征,确定目标对象的聚合特征数据。因此,目标对象的聚合特征数据能够更全面的表示目标对象的特征,进而,基于目标图卷积网络模型确定出的目标对象的类别的准确性较高。
参见表1,表1为本发明提供的一种分类结果的正确率对比表。
可以分别从Cora、Citesser和Pubmed中各选取的500篇论文。然后,基于现有技术中的几种网络模型对选取的论文进行分类,得到第一分类结果。基于本发明提供的目标图卷积网络模型,对选取的论文进行分类,得到第二分类结果。进而,对第一分类结果和第二分类结果进行对比,可以得到表1所示的分类结果的正确率对比表。
表1
网络模型 | Cora | Citesser | Pubmed |
SGC | 81.0% | 71.9% | 78.9% |
GCN | 81.5% | 70.3% | 79.0% |
GWNN | 82.8% | 71.7% | 79.1% |
ChebNet | 81.2% | 69.8% | 74.4% |
GIN | 77.6% | 66.1% | 77.0% |
GAT | 83.0% | 72.5% | 79.0% |
GraphSAGE | 82.3% | 71.2% | 78.5% |
FAGCN | 84.1±0.5% | 72.7±0.8% | 79.4±0.3% |
表1中,FAGCN表示本发明实施例提供的目标图卷积网络模型。现有技术中的网络模型包括:SGC(Simplifying Graph Convolutional,简化图卷积)网络模型、GCN模型、GWNN(Graph Wavelet Neural Network,图小波神经网络)模型、ChebNet(切比雪夫)网络模型、GIN(Graph Isomorphic Network,图同构网络)模型、GAT(Graph Attention Networks,图注意力网络)模型和GraphSAGE(Graph Sample and Aggregate Network,图采样和聚合网络)模型。
可见,基于本发明实施例提供的FAGCN模型,对Cora中的论文进行分类的第二分类结果的正确率,高于基于现有技术中的网络模型,对Cora中的论文进行分类的第一分类结果的正确率。
基于本发明实施例提供的FAGCN模型,对Citesser中的论文进行分类的第二分类结果的正确率,高于基于现有技术中除SGC网络模型和GAT模型以外的其他网络模型,对Citesser中的论文进行分类的第一分类结果的正确率。
基于本发明实施例提供的FAGCN模型,对Pubmed中的论文进行分类的第二分类结果的正确率,高于基于现有技术中除GWNN模型以外的其他网络模型,对Pubmed中的论文进行分类的第一分类结果的正确率。
参见图5a,图5a为本发明提供的一种分类结果的正确率对比图。
图5a中,带圆点的折线表示基于现有技术中的图卷积网络(即GCN)模型对Cora中的论文进行分类时,GCN模型的卷积层的数目与分类结果的正确率的对应关系。带五角星的折线表示基于本发明实施例提供的目标图卷积网络(即FAGCN)模型对Cora中的论文进行分类时,FAGCN模型的卷积层的数目与分类结果的正确率的对应关系。
可见,卷积层的数目相同时,基于本发明实施例提供的FAGCN模型,对Cora中的论文进行分类的分类结果的正确率,高于基于现有技术中的GCN模型,对Cora中的论文进行分类的分类结果的正确率。
另外,随着卷积层的数目的增加,基于现有技术中的GCN模型,对Cora中的论文进行分类的分类结果的正确率逐渐降低。而随着卷积层的数目的增加,基于本发明实施例提供的FAGCN模型,对Cora中的论文进行分类的分类结果的正确率的变化较为平稳。
参见图5b,图5b为本发明提供的另一种分类结果的正确率对比图。
图5b中,带圆点的折线表示基于现有技术中的GCN模型对Citesser中的论文进行分类时,GCN模型的卷积层的数目与分类结果的正确率的对应关系。带五角星的折线表示基于本发明实施例提供的FAGCN模型对Citesser中的论文进行分类时,FAGCN模型的卷积层的数目与分类结果的正确率的对应关系。
可见,卷积层的数目相同时,基于本发明实施例提供的FAGCN模型,对Citesser中的论文进行分类的分类结果的正确率,高于基于现有技术中的GCN模型,对Citesser的论文进行分类的分类结果的正确率。
另外,随着卷积层的数目的增加,基于现有技术中的GCN模型,对Citesser中的论文进行分类的分类结果的正确率逐渐降低。而随着卷积层的数目的增加,基于本发明实施例提供的FAGCN模型,对Citesser中的论文进行分类的分类结果的正确率的变化较为平稳。
参见图5c,图5c为本发明提供的另一种分类结果的正确率对比图。
图5c中,带圆点的折线表示基于现有技术中的GCN模型对Pubmed中的论文进行分类时,GCN模型的卷积层的数目与分类结果的正确率的对应关系。带五角星的折线表示基于本发明实施例提供的FAGCN模型对Pubmed中的论文进行分类时,FAGCN模型的卷积层的数目与分类结果的正确率的对应关系。
可见,卷积层的数目相同,且卷积层的数目大于2时,基于本发明实施例提供的FAGCN模型,对Pubmed中的论文进行分类的分类结果的正确率,高于基于现有技术中的GCN模型,对Pubmed的论文进行分类的分类结果的正确率。
另外,随着卷积层的数目的增加,基于现有技术中的GCN模型,对Pubmed中的论文进行分类的分类结果的正确率逐渐降低。而随着卷积层的数目的增加,基于本发明实施例提供的FAGCN模型,对Pubmed中的论文进行分类的分类结果的正确率的变化较为平稳。
参见图5d,图5d为本发明提供的另一种分类结果的正确率对比图。
图5d中,带圆点的折线表示基于现有技术中的GCN模型对Chameleon网页进行分类时,GCN模型的卷积层的数目与分类结果的正确率的对应关系。带五角星的折线表示基于本发明实施例提供的FAGCN模型对Chameleon网页进行分类时,FAGCN模型的卷积层的数目与分类结果的正确率的对应关系。
可见,卷积层的数目相同时,基于本发明实施例提供的FAGCN模型,对Chameleon网页进行分类的分类结果的正确率,高于基于现有技术中的GCN模型,对Chameleon网页进行分类的分类结果的正确率。
另外,随着卷积层的数目的增加,基于现有技术中的GCN模型,对Chameleon网页进行分类的分类结果的正确率逐渐降低。而随着卷积层的数目的增加,基于本发明实施例提供的FAGCN模型,对Chameleon网页进行分类的分类结果的正确率的变化较为平稳。
参见图5e,图5e为本发明提供的另一种分类结果的正确率对比图。
图5e中,带圆点的折线表示基于现有技术中的GCN网络模型对Squirrel网页进行分类时,GCN模型的卷积层的数目与分类结果的正确率的对应关系。带五角星的折线表示基于本发明实施例提供的FAGCN模型对Squirrel网页进行分类时,FAGCN模型的卷积层的数目与分类结果的正确率的对应关系。
可见,卷积层的数目相同时,基于本发明实施例提供的FAGCN模型,对Squirrel网页进行分类的分类结果的正确率,高于基于现有技术中的GCN模型,对Squirrel网页进行分类的分类结果的正确率。
另外,随着卷积层的数目的增加,基于现有技术中的GCN模型,对Squirrel网页进行分类的分类结果的正确率逐渐降低。而随着卷积层的数目的增加,基于本发明实施例提供的FAGCN模型,对Squirrel网页进行分类的分类结果的正确率的变化较为平稳。
与图1的方法实施例相对应,参见图6,图6为本发明实施例提供的一种基于图卷积网络模型的分类装置的结构图,所述装置包括:
获取模块601,用于获取待分类的各目标对象的特征数据,作为待处理特征数据;
输入模块602,用于将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型;其中,所述目标图卷积网络模型包括:多层感知器、卷积网络和特征变换层;
非线性变换模块603,用于通过所述多层感知器,分别对每一目标对象的待处理特征数据进行非线性变换,得到该目标对象的第一特征数据;
特征提取模块604,用于通过所述卷积网络,针对每一目标对象,对该目标对象的第一特征数据和该目标对象对应的关联对象的第一特征数据进行特征提取,得到该目标对象的聚合特征数据;其中,该目标对象的聚合特征数据表示该目标对象的低频特征和高频特征;该目标对象对应的关联对象与该目标对象之间存在关联关系;
映射模块605,用于通过所述特征变换层,分别对每一目标对象的聚合特征数据进行映射处理,得到该目标对象的类别标签;
确定模块606,用于针对每一目标对象,在预设的类别标签与类别的对应关系中,确定该目标对象的类别标签对应的类别,作为该目标对象的类别。
可选的,所述装置还包括:
生成模块,用于在所述输入模块602执行将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型之前,执行生成各目标对象对应的拓扑图,作为目标拓扑图;其中,所述目标拓扑图包括多个节点;所述多个节点与各目标对象一一对应;所述多个节点按照各目标对象之间的关联关系相连接;
所述输入模块602,具体用于将所述目标拓扑图,输入至预先训练的目标图卷积网络模型。
可选的,所述非线性变换模块603,具体用于通过所述多层感知器,基于第一预设公式,针对每一节点,对该节点对应的目标对象的待处理特征数据进行非线性变换,得到非线性变换后的特征数据,作为该目标对象的第一特征数据;其中,所述第一预设公式为:
p(1)=φ(W1p(0))
p(1)表示该目标对象的第一特征数据;p(0)表示该节点对应的目标对象的待处理特征数据;W1表示第一预设权重矩阵;φ表示预设非线性变换函数。
可选的,所述卷积网络包含多个卷积层,且每一卷积层包括:第一卷积核和第二卷积核;
所述特征提取模块604,具体用于通过每一卷积层的第一卷积核对该卷积层的输入数据进行卷积,得到该卷积层确定的各节点对应的目标对象的低频特征;其中,所述卷积网络中的第一个卷积层的输入数据包括各目标对象的第一特征数据;
所述第一卷积核为:
F1=(ε+1)I-L
F1表示所述第一卷积核;ε表示预设系数,L表示所述目标拓扑图的拉普拉斯矩阵;
通过每一卷积层的第二卷积核对该卷积层的输入数据进行卷积,得到该卷积层确定的各节点对应的目标对象的高频特征;其中,所述第二卷积核为:
F2=(ε-1)I+L
F2表示所述第二卷积核;ε表示所述预设系数,L表示所述目标拓扑图的拉普拉斯矩阵;
通过每一卷积层,基于该卷积层确定的各节点对应的目标对象的低频特征、高频特征和第二预设公式,计算各节点对应的目标对象的备选特征数据;其中,所述第二预设公式为:
表示所述卷积网络中第k个卷积层输出的第i个节点对应的目标对象的备选特征数据;/>表示第i个节点的第j个邻居节点对应的目标对象的低频特征的权重,/>表示第i个节点的第j个邻节点对应的目标对象的高频特征的权重;F1表示所述第一卷积核,Hk-1表示所述卷积网络中第k-1个卷积层输出的各目标对象的备选特征数据;(F1·Hk-1)i表示第k个卷积层确定的第i个节点对应的目标对象的低频特征;F2表示所述第二卷积核;(F2·Hk -1)i表示第k个卷积层确定的第i个节点对应的目标对象的高频特征;
针对每一节点,确定最后一个卷积层输出的该节点对应的目标对象的备选特征数据,作为该目标对象的聚合特征数据。
可选的,所述卷积网络包含多个卷积层;
所述特征提取模块604,具体用于针对每一节点,通过各卷积层,基于第三预设公式,对该节点对应的目标对象的第一特征数据,以及该节点对应的目标对象对应的关联对象的第一特征数据进行特征提取,得到各卷积层输出的该节点对应的目标对象的各备选特征数据;其中,所述第三预设公式为:
p(k)表示所述卷积网络中第k个卷积层输出的该节点对应的目标对象的备选特征数据;ε表示预设系数;p(1)表示该节点对应的目标对象的第一特征数据;N表示该节点的邻居节点的集合;S表示该节点的度;表示该节点的第j个邻居节点对应的目标对象的高频特征的权重与低频特征的权重的差值;dj表示该节点的第j个邻居节点的度;/>表示所述卷积网络中第k-1个卷积层输出的该节点的第j个邻居节点对应的目标对象的备选特征数据;
确定最后一个卷积层输出的该节点对应的目标对象的备选特征数据,作为该目标对象的聚合特征数据。
可选的,所述卷积网络包含的每一卷积层包括一个第三卷积核;
所述特征提取模块604,具体用于通过各卷积层,基于第四预设公式,针对每一节点,计算该节点的邻居节点对应的目标对象的高频特征的权重与低频特征的权重的差值;其中,所述第四预设公式为:
表示该节点的第j个邻居节点对应的目标对象的高频特征的权重与低频特征的权重的差值;tanh表示正确双曲函数,g表示所述卷积网络中第k个卷积层的第三卷积核;T表示转置运算;p(k-1)表示所述卷积网络中第k-1个卷积层输出的该节点对应的目标对象的备选特征数据;/>表示所述第k-1个卷积层输出的该节点的第j个邻居节点对应的目标对象的备选特征数据;/>表示对p(k-1)和/>进行拼接。
基于本发明实施例提供的基于图卷积网络模型的分类装置,基于目标图卷积网络模型可以提取目标对象的聚合特征数据,由于目标对象的聚合特征数据能够表示目标对象的低频特征和高频特征,因此,目标对象的聚合特征数据能够更全面的表示目标对象的特征。进而,基于目标图卷积网络模型确定出的目标对象的类别的准确性较高,也就是说,可以提高确定出的目标对象的类别的准确性。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现上述实施例所述的基于图卷积网络模型的分类方法的步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一基于图卷积网络模型的分类方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一基于图卷积网络模型的分类方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质和计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (3)
1.一种基于图卷积网络模型的分类方法,其特征在于,所述方法包括:
获取待分类的各目标对象的特征数据,作为待处理特征数据;其中,所述各目标对象为论文,或者,网页;所述各目标对象的特征数据用于表示所述各目标对象的主题;如果所述各目标对象为论文,论文的特征数据为论文的关键词;如果所述各目标对象为网页,网页的特征数据为网页显示的信息的关键词;
将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型;其中,所述目标图卷积网络模型包括:多层感知器、卷积网络和特征变换层;
通过所述多层感知器,分别对每一目标对象的待处理特征数据进行非线性变换,得到该目标对象的第一特征数据;
通过所述卷积网络,针对每一目标对象,对该目标对象的第一特征数据和该目标对象对应的关联对象的第一特征数据进行特征提取,得到该目标对象的聚合特征数据;其中,该目标对象的聚合特征数据表示该目标对象的低频特征和高频特征;该目标对象对应的关联对象与该目标对象之间存在关联关系;当所述各目标对象为论文时,所述各目标对象之间的关联关系为各论文之间的引用关系;当所述各目标对象为网页时,所述各目标对象之间的关联关系为各网页之间的超链接;
通过所述特征变换层,分别对每一目标对象的聚合特征数据进行映射处理,得到该目标对象的类别标签;
针对每一目标对象,在预设的类别标签与类别的对应关系中,确定该目标对象的类别标签对应的类别,作为该目标对象的类别;
在所述将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型之前,所述方法还包括:
生成各目标对象对应的拓扑图,作为目标拓扑图;其中,所述目标拓扑图包括多个节点;所述多个节点与各目标对象一一对应;所述多个节点按照各目标对象之间的关联关系相连接;
所述将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型,包括:
将所述目标拓扑图,输入至预先训练的目标图卷积网络模型;
所述通过所述多层感知器,分别对每一目标对象的待处理特征数据进行非线性变换,得到该目标对象的第一特征数据,包括:
通过所述多层感知器,基于第一预设公式,针对每一节点,对该节点对应的目标对象的待处理特征数据进行非线性变换,得到非线性变换后的特征数据,作为该目标对象的第一特征数据;其中,所述第一预设公式为:
p(1)=φ(W1p(0))
p(1)表示该目标对象的第一特征数据;p(0)表示该节点对应的目标对象的待处理特征数据;W1表示第一预设权重矩阵;φ表示预设非线性变换函数;
所述卷积网络包含多个卷积层,且每一卷积层包括:第一卷积核和第二卷积核;
所述通过所述卷积网络,针对每一目标对象,对该目标对象的第一特征数据和该目标对象对应的关联对象的第一特征数据进行特征提取,得到该目标对象的聚合特征数据,包括:
通过每一卷积层的第一卷积核对该卷积层的输入数据进行卷积,得到该卷积层确定的各节点对应的目标对象的低频特征;其中,所述卷积网络中的第一个卷积层的输入数据包括各目标对象的第一特征数据;
所述第一卷积核为:
F1=(ε+1)I-L
F1表示所述第一卷积核;ε表示预设系数,L表示所述目标拓扑图的拉普拉斯矩阵;I表示单位矩阵;
通过每一卷积层的第二卷积核对该卷积层的输入数据进行卷积,得到该卷积层确定的各节点对应的目标对象的高频特征;其中,所述第二卷积核为:
F2=(ε-1)I+L
F2表示所述第二卷积核;ε表示所述预设系数,L表示所述目标拓扑图的拉普拉斯矩阵;
通过每一卷积层,基于该卷积层确定的各节点对应的目标对象的低频特征、高频特征和第二预设公式,计算各节点对应的目标对象的备选特征数据;其中,所述第二预设公式为:
表示所述卷积网络中第k个卷积层输出的第i个节点对应的目标对象的备选特征数据;/>表示第i个节点的第j个邻居节点对应的目标对象的低频特征的权重,/>表示第i个节点的第j个邻节点对应的目标对象的高频特征的权重;F1表示所述第一卷积核,Hk-1表示所述卷积网络中第k-1个卷积层输出的各目标对象的备选特征数据;(F1·Hk-1)i表示第k个卷积层确定的第i个节点对应的目标对象的低频特征;F2表示所述第二卷积核;(F2·Hk -1)i表示第k个卷积层确定的第i个节点对应的目标对象的高频特征;
针对每一节点,确定最后一个卷积层输出的该节点对应的目标对象的备选特征数据,作为该目标对象的聚合特征数据。
2.一种基于图卷积网络模型的分类装置,其特征在于,所述装置包括:
获取模块,用于获取待分类的各目标对象的特征数据,作为待处理特征数据;其中,所述各目标对象为论文,或者,网页;所述各目标对象的特征数据用于表示所述各目标对象的主题;如果所述各目标对象为论文,论文的特征数据为论文的关键词;如果所述各目标对象为网页,网页的特征数据为网页显示的信息的关键词;
输入模块,用于将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型;其中,所述目标图卷积网络模型包括:多层感知器、卷积网络和特征变换层;
非线性变换模块,用于通过所述多层感知器,分别对每一目标对象的待处理特征数据进行非线性变换,得到该目标对象的第一特征数据;
特征提取模块,用于通过所述卷积网络,针对每一目标对象,对该目标对象的第一特征数据和该目标对象对应的关联对象的第一特征数据进行特征提取,得到该目标对象的聚合特征数据;其中,该目标对象的聚合特征数据表示该目标对象的低频特征和高频特征;该目标对象对应的关联对象与该目标对象之间存在关联关系;当所述各目标对象为论文时,所述各目标对象之间的关联关系为各论文之间的引用关系;当所述各目标对象为网页时,所述各目标对象之间的关联关系为各网页之间的超链接;
映射模块,用于通过所述特征变换层,分别对每一目标对象的聚合特征数据进行映射处理,得到该目标对象的类别标签;
确定模块,用于针对每一目标对象,在预设的类别标签与类别的对应关系中,确定该目标对象的类别标签对应的类别,作为该目标对象的类别;
所述装置还包括:
生成模块,用于在所述输入模块执行将各目标对象的待处理特征数据输入至预先训练的目标图卷积网络模型之前,执行生成各目标对象对应的拓扑图,作为目标拓扑图;其中,所述目标拓扑图包括多个节点;所述多个节点与各目标对象一一对应;所述多个节点按照各目标对象之间的关联关系相连接;
所述输入模块,具体用于将所述目标拓扑图,输入至预先训练的目标图卷积网络模型;
所述非线性变换模块,具体用于通过所述多层感知器,基于第一预设公式,针对每一节点,对该节点对应的目标对象的待处理特征数据进行非线性变换,得到非线性变换后的特征数据,作为该目标对象的第一特征数据;其中,所述第一预设公式为:
p(1)=φ(W1p(0))
p(1)表示该目标对象的第一特征数据;p(0)表示该节点对应的目标对象的待处理特征数据;W1表示第一预设权重矩阵;φ表示预设非线性变换函数;
所述卷积网络包含多个卷积层,且每一卷积层包括:第一卷积核和第二卷积核;
所述特征提取模块,具体用于:
通过每一卷积层的第一卷积核对该卷积层的输入数据进行卷积,得到该卷积层确定的各节点对应的目标对象的低频特征;其中,所述卷积网络中的第一个卷积层的输入数据包括各目标对象的第一特征数据;
所述第一卷积核为:
F1=(ε+1)I-L
F1表示所述第一卷积核;ε表示预设系数,L表示所述目标拓扑图的拉普拉斯矩阵;I表示单位矩阵;
通过每一卷积层的第二卷积核对该卷积层的输入数据进行卷积,得到该卷积层确定的各节点对应的目标对象的高频特征;其中,所述第二卷积核为:
F2=(ε-1)I+L
F2表示所述第二卷积核;ε表示所述预设系数,L表示所述目标拓扑图的拉普拉斯矩阵;
通过每一卷积层,基于该卷积层确定的各节点对应的目标对象的低频特征、高频特征和第二预设公式,计算各节点对应的目标对象的备选特征数据;其中,所述第二预设公式为:
表示所述卷积网络中第k个卷积层输出的第i个节点对应的目标对象的备选特征数据;/>表示第i个节点的第j个邻居节点对应的目标对象的低频特征的权重,/>表示第i个节点的第j个邻节点对应的目标对象的高频特征的权重;F1表示所述第一卷积核,Hk-1表示所述卷积网络中第k-1个卷积层输出的各目标对象的备选特征数据;(F1·Hk-1)i表示第k个卷积层确定的第i个节点对应的目标对象的低频特征;F2表示所述第二卷积核;(F2·Hk-1)i表示第k个卷积层确定的第i个节点对应的目标对象的高频特征;
针对每一节点,确定最后一个卷积层输出的该节点对应的目标对象的备选特征数据,作为该目标对象的聚合特征数据。
3.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011604370.8A CN112699938B (zh) | 2020-12-30 | 2020-12-30 | 一种基于图卷积网络模型的分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011604370.8A CN112699938B (zh) | 2020-12-30 | 2020-12-30 | 一种基于图卷积网络模型的分类方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112699938A CN112699938A (zh) | 2021-04-23 |
CN112699938B true CN112699938B (zh) | 2024-01-05 |
Family
ID=75512309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011604370.8A Active CN112699938B (zh) | 2020-12-30 | 2020-12-30 | 一种基于图卷积网络模型的分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112699938B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292256A (zh) * | 2017-06-14 | 2017-10-24 | 西安电子科技大学 | 基于辅任务的深度卷积小波神经网络表情识别方法 |
CN109492691A (zh) * | 2018-11-07 | 2019-03-19 | 南京信息工程大学 | 一种超图卷积网络模型及其半监督分类方法 |
CN110276406A (zh) * | 2019-06-26 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 表情分类方法、装置、计算机设备及存储介质 |
WO2019183191A1 (en) * | 2018-03-22 | 2019-09-26 | Michael Bronstein | Method of news evaluation in social media networks |
CN111444340A (zh) * | 2020-03-10 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 文本分类和推荐方法、装置、设备及存储介质 |
CN111882002A (zh) * | 2020-08-06 | 2020-11-03 | 桂林电子科技大学 | 一种基于msf-am的低照度目标检测方法 |
CN112037038A (zh) * | 2020-09-02 | 2020-12-04 | 中国银行股份有限公司 | 银行信贷风险预测方法及装置 |
CN112037822A (zh) * | 2020-07-30 | 2020-12-04 | 华南师范大学 | 基于ICNN与Bi-LSTM的语音情感识别方法 |
CN112132719A (zh) * | 2020-08-11 | 2020-12-25 | 湖南大学 | 用于应急救援的人员搜救方法、装置、系统及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190354832A1 (en) * | 2018-05-17 | 2019-11-21 | Università della Svizzera italiana | Method and system for learning on geometric domains using local operators |
CN108829639B (zh) * | 2018-07-06 | 2023-10-27 | 上海联影医疗科技股份有限公司 | 一种磁共振成像方法和设备 |
CN109147048B (zh) * | 2018-07-23 | 2021-02-26 | 复旦大学 | 一种利用单张彩色图的三维网格重建方法 |
-
2020
- 2020-12-30 CN CN202011604370.8A patent/CN112699938B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292256A (zh) * | 2017-06-14 | 2017-10-24 | 西安电子科技大学 | 基于辅任务的深度卷积小波神经网络表情识别方法 |
WO2019183191A1 (en) * | 2018-03-22 | 2019-09-26 | Michael Bronstein | Method of news evaluation in social media networks |
CN109492691A (zh) * | 2018-11-07 | 2019-03-19 | 南京信息工程大学 | 一种超图卷积网络模型及其半监督分类方法 |
CN110276406A (zh) * | 2019-06-26 | 2019-09-24 | 腾讯科技(深圳)有限公司 | 表情分类方法、装置、计算机设备及存储介质 |
CN111444340A (zh) * | 2020-03-10 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 文本分类和推荐方法、装置、设备及存储介质 |
CN112037822A (zh) * | 2020-07-30 | 2020-12-04 | 华南师范大学 | 基于ICNN与Bi-LSTM的语音情感识别方法 |
CN111882002A (zh) * | 2020-08-06 | 2020-11-03 | 桂林电子科技大学 | 一种基于msf-am的低照度目标检测方法 |
CN112132719A (zh) * | 2020-08-11 | 2020-12-25 | 湖南大学 | 用于应急救援的人员搜救方法、装置、系统及存储介质 |
CN112037038A (zh) * | 2020-09-02 | 2020-12-04 | 中国银行股份有限公司 | 银行信贷风险预测方法及装置 |
Non-Patent Citations (2)
Title |
---|
图卷积算法的研究进展;郑睿刚 等;《中山大学学报(自然科学版)》;20200331;第59卷(第2期);全文 * |
改进VGG模型在苹果外观分类中的应用;岳有军 等;《科学技术与工程》;20200708;第20卷(第19期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112699938A (zh) | 2021-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11461628B2 (en) | Method for optimizing neural networks | |
CN110929029A (zh) | 一种基于图卷积神经网络的文本分类方法及系统 | |
CN111553215B (zh) | 人员关联方法及其装置、图卷积网络训练方法及其装置 | |
CN113705769A (zh) | 一种神经网络训练方法以及装置 | |
WO2019194299A1 (ja) | 学習装置、学習方法および学習プログラム | |
CN111783754B (zh) | 基于部位上下文的人体属性图像分类方法、系统和装置 | |
CN112784918B (zh) | 基于无监督图表示学习的节点识别方法、系统、装置 | |
CN110119805B (zh) | 基于回声状态网络分类的卷积神经网络算法 | |
WO2023035926A1 (zh) | 基于自注意力机制从病理图片预测微卫星不稳定性的方法 | |
CN109145107B (zh) | 基于卷积神经网络的主题提取方法、装置、介质和设备 | |
CN109726291B (zh) | 分类模型的损失函数优化方法、装置及样本分类方法 | |
CN110659667A (zh) | 图片分类模型训练方法、系统和计算机设备 | |
CN110993037A (zh) | 一种基于多视图分类模型的蛋白质活性预测装置 | |
CN111223128A (zh) | 目标跟踪方法、装置、设备及存储介质 | |
EP4343616A1 (en) | Image classification method, model training method, device, storage medium, and computer program | |
CN112364747A (zh) | 一种有限样本下的目标检测方法 | |
Günen et al. | Analyzing the contribution of training algorithms on deep neural networks for hyperspectral image classification | |
CN114613437A (zh) | 一种基于异构图的miRNA与疾病关联预测方法及系统 | |
CN111178364A (zh) | 一种图像识别方法和装置 | |
CN112699938B (zh) | 一种基于图卷积网络模型的分类方法及装置 | |
CN112445914A (zh) | 文本分类方法、装置、计算机设备和介质 | |
CN116912576A (zh) | 基于脑网络高阶结构的自适应图卷积脑疾病分类方法 | |
CN115019215B (zh) | 一种基于高光谱图像的大豆病虫害识别方法和装置 | |
CN110288020B (zh) | 基于声波传播方程的双路耦合深度学习的目标分类方法 | |
Zhang et al. | A spatial–spectral adaptive learning model for textile defect images recognition with few labeled data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |