CN112966114A - 基于对称图卷积神经网络的文献分类方法和装置 - Google Patents
基于对称图卷积神经网络的文献分类方法和装置 Download PDFInfo
- Publication number
- CN112966114A CN112966114A CN202110388284.6A CN202110388284A CN112966114A CN 112966114 A CN112966114 A CN 112966114A CN 202110388284 A CN202110388284 A CN 202110388284A CN 112966114 A CN112966114 A CN 112966114A
- Authority
- CN
- China
- Prior art keywords
- document
- matrix
- representing
- loss
- predicted value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 37
- 239000011159 matrix material Substances 0.000 claims abstract description 256
- 238000012549 training Methods 0.000 claims abstract description 45
- 230000002776 aggregation Effects 0.000 claims abstract description 20
- 238000004220 aggregation Methods 0.000 claims abstract description 20
- 238000000547 structure data Methods 0.000 claims abstract description 12
- 238000004364 calculation method Methods 0.000 claims description 72
- 230000006870 function Effects 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 12
- 238000009499 grossing Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 description 9
- 241000689227 Cora <basidiomycete fungus> Species 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明是关于一种基于对称图卷积神经网络的文献分类方法和装置,方法包括:获取文献引用数据集作为图结构数据,读取文献数据集生成对应的特征矩阵和邻接矩阵,构建相似度矩阵;分别以相似度矩阵和邻接矩阵作为聚合矩阵,对文献数据的特征矩阵进行图卷积操作,得到基于相似度矩阵的第一预测值和基于邻接矩阵的第二预测值;分别计算文献数据中标记节点的监督损失和基于第一预测值和第二预测值的所有文献节点的无监督损失,并将监督损失和无监督损失进行合并,确定最终损失;利用最终损失训练和预设训练集进行训练,得到目标图卷积神经网络,对文献数据集中的目标数据进行半监督分类。通过该技术方案,可以充分嵌入图形知识,提高文献分类的准确性。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于对称图卷积神经网络的文献分类方法和装置。
背景技术
图数据广泛存在于现实生活中,例如文献引用关系、社交网络等等。因其可以自然地刻画数据之间的相互关系,所以对于图数据的研究具有重要的现实意义和价值。传统的图数据分析方法大多基于图数据的统计信息或者手动设计的特征,在大部分情况下表现不佳且过程耗时耗力。近年来,深度学习由于其强大的特征表征能力和不依赖过多的先验知识被广泛应用到许多研究领域,一定程度上减少了对数据统计信息和手动设计特征的依赖。因而利用深度神经网络处理图数据成为了图研究的热点,并由此产生图神经网络的概念。
图神经网络被应用于各类图数据建模,包括链接预测、图分类和半监督节点分类。其中,基于图神经网络的半监督节点分类已经取得了巨大的成功。图神经网络在半监督节点分类中的成功主要取决于假设连接的节点倾向于具有相同的标签。在此假设下,图神经网络利用来自相邻节点的信息来改善目标节点的表示学习。例如,图卷积网络(GCN)通过聚合相邻节点的特征信息来迭代更新每个节点的特征表示。GCN模型在卷积中结合了图结构和节点特征,其中未标记节点的特征与附近标记节点的特征混合在一起。由于GCN模型在训练中利用了未标记节点的功能,因此只需要较少的标记节点即可获得较好的预测结果。尽管,图卷积网络在半监督节点分类任务中,已经取得了不错的预测效果。但是,图卷积网络是单通道的网络模型,在更新节点特征信息时仅使用邻接矩阵作为聚合矩阵,只能从单一角度提取特征信息,不能充分嵌入图形知识。
发明内容
为克服相关技术中存在的问题,本发明提供一种基于对称图卷积神经网络的文献分类方法和装置,从而实现双通道图网络,从文献数据的不同视角进行卷积操作,以充分嵌入图形知识,提高文献分类的准确性。
根据本发明实施例的第一方面,提供一种基于对称图卷积神经网络的文献分类方法,所述方法包括:
获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的特征矩阵和邻接矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵;
分别以所述相似度矩阵和所述邻接矩阵作为聚合矩阵,对所述文献引用数据的特征矩阵进行图卷积操作,以得到基于所述相似度矩阵的第一预测值和基于所述邻接矩阵的第二预测值;
分别计算所述文献引用数据中标记节点的监督损失和基于所述第一预测值和所述第二预测值的无监督损失,并将所述监督损失和无监督损失进行合并,以确定最终损失,其中,所述监督损失用于表征标记文献节点的基于所述邻接矩阵的第二预测值与真实值之间的误差,所述无监督损失用于所有文献节点的所述第二预测值与第一预测值之间的误差;
利用所述最终损失训练和预设训练集进行训练,得到目标图卷积神经网络;
使用所述目标图卷积神经网络对文献数据集中的目标文献数据进行半监督分类。
在一个实施例中,优选地,获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的特征矩阵和邻接矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵,包括:
生成特征矩阵X=[X1,X2,…,Xn]T和邻接矩阵A,其中,X∈Rn×c,A∈Rn×n表示所有文献之间的引用关系,如果两篇文献之间具有引用关系,则将它们称为图中的相邻节点,n表示文献节点个数,c表示特征维数;
使用第一计算公式计算任意两个相邻文献节点i和j之间的特征距离;
根据所述特征距离,使用第二计算公式计算任意两个相邻文献节点i和j之间的特征相似度系数;
采用第三计算公式,根据所有相邻文献节点的特征相似度系数构建所述相似度矩阵。
在一个实施例中,优选地,所述第一计算公式包括:
其中,dij表示所述节点i和j之间的特征相似度,Xi∈Rc是节点i的c维特征向量,Xj∈Rc是节点j的c维特征向量;
所述第二计算公式包括:
其中,αij表示所述文献节点i和j之间的特征相似度系数,μ表示平滑参数;
所述第三计算公式包括:
在一个实施例中,优选地,采用以下第四计算公式和第五计算公式计算基于所述相似度矩阵的第一预测值:
其中,表示所述相似度矩阵的第一预测值,S表示所述相似度矩阵,表示规范化的相似度矩阵,D表示一个对角矩阵,Dii=∑jSij,softmax表示分类器,用于预测每个文献节点属于不同类别的概率,表示基于相似度矩阵的第(t-1)层的输出,等于输入特征矩阵X,Θ(t)表示第t层网络的可训练的权重参数,σ表示激活函数。
在一个实施例中,优选地,采用以下第六计算公式和第七计算公式计算基于所述邻接矩阵的第二预测值:
其中,I表示单位矩阵,表示规范化的邻接矩阵,表示基于邻接矩阵的第(t-1)层的输出,等于输入特征矩阵X,输入特征矩阵X由所有标记和未标记的文献节点特征组成,Θ(t)表示第t层网络的可训练的权重参数,σ表示激活函数。
在一个实施例中,优选地,采用以下第八计算公式计算所述标记文献节点的监督损失;
采用以下第九计算公式计算基于所述第一预测值和所述第二预测值的无监督损失;
采用以下第十计算公式计算所述最终损失;
根据本发明实施例的第二方面,提供一种基于对称图卷积神经网络的文献分类装置,所述装置包括:
生成模块,用于获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的特征矩阵和邻接矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵;
处理模块,用于分别以所述相似度矩阵和所述邻接矩阵作为聚合矩阵,对所述文献引用数据的特征矩阵进行图卷积操作,以得到基于所述相似度矩阵的第一预测值和基于所述邻接矩阵的第二预测值;
计算模块,用于分别计算所述文献引用数据中标记文献节点的监督损失和基于所述第一预测值和所述第二预测值的无监督损失,并将所述监督损失和无监督损失进行合并,以确定最终损失,其中,所述监督损失用于表征标记文献节点的基于所述邻接矩阵的第二预测值与真实值之间的误差,所述无监督损失用于所有文献节点的所述第二预测值与第一预测值之间的误差;
训练模块,用于利用所述最终损失训练和预设训练集进行训练,得到目标图卷积神经网络;
分类模块,用于使用所述目标图卷积神经网络对文献数据集中的目标数据进行半监督分类。
在一个实施例中,优选地,所述生成模块用于:
生成特征矩阵X=[X1,X2,…,Xn]T和邻接矩阵A,其中,X∈Rn×c,A∈Rn×n表示所有文献之间的引用关系,如果两篇文献之间具有引用关系,则将它们称为图中的相邻文献节点,n表示文献节点个数,c表示特征维数;
使用第一计算公式计算任意两个相邻文献节点i和j之间的特征距离;
根据所述特征距离,使用第二计算公式计算任意两个相邻文献节点i和j之间的特征相似度系数;
采用第三计算公式,根据所有相邻文献节点的特征相似度系数构建所述相似度矩阵;
所述第一计算公式包括:
其中,dij表示所述节点i和j之间的特征距离,Xi∈Rc是节点i的c维特征向量,Xj∈Rc是节点j的c维特征向量;
所述第二计算公式包括:
其中,αij表示所述文献节点i和j之间的特征相似度系数,μ表示平滑参数;
所述第三计算公式包括:
采用以下第四计算公式和第五计算公式计算基于所述相似度矩阵的第一预测值:
其中,表示所述相似度矩阵的第一预测值,S表示所述相似度矩阵,表示规范化的相似度矩阵,D表示一个对角矩阵,Dii=∑jSij,softmax表示分类器,用于预测每个文献节点属于不同类别的概率,表示基于相似度矩阵的第(t-1)层的输出,等于输入特征矩阵X,Θ(t)表示第t层网络的可训练的权重参数,σ表示激活函数。
采用以下第六计算公式和第七计算公式计算基于所述邻接矩阵的第二预测值:
其中,I表示单位矩阵,表示规范化的邻接矩阵,表示基于邻接矩阵的第(t-1)层的输出,等于输入特征矩阵X,输入特征矩阵X由所有标记和未标记的文献节点特征组成,Θ(t)表示第t层网络的可训练的权重参数,σ表示激活函数。
采用以下第八计算公式计算所述标记文献节点的监督损失;
采用以下第九计算公式计算基于所述第一预测值和所述第二预测值的无监督损失;
采用以下第十计算公式计算所述最终损失;
根据本发明实施例的第三方面,提供一种基于对称图卷积神经网络的文献分类装置,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的特征矩阵和邻接矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵;
分别以所述相似度矩阵和所述邻接矩阵作为聚合矩阵,对所述文献引用数据的特征矩阵进行图卷积操作,以得到基于所述相似度矩阵的第一预测值和基于所述邻接矩阵的第二预测值;
分别计算所述文献引用数据中标记节点的监督损失和基于所述第一预测值和所述第二预测值的无监督损失,并将所述监督损失和无监督损失进行合并,以确定最终损失,其中,所述监督损失用于表征标记文献节点的基于所述邻接矩阵的第二预测值与真实值之间的误差,所述无监督损失用于所有文献节点的所述第二预测值与第一预测值之间的误差;
利用所述最终损失训练和预设训练集进行训练,得到目标图卷积神经网络;
使用所述目标图卷积神经网络对文献数据集中的目标数据进行半监督分类。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面中任一项所述方法的步骤。
本发明的实施例提供的技术方案可以包括以下有益效果:
本发明实施例中,通过计算所有相邻节点对的特征相似性构建了一个相似度矩阵作为聚合矩阵,然后分别以邻接矩阵和相似度矩阵作为聚合矩阵进行图卷积操作,得到基于文献数据的不同角度的预测值,最后通过添加一个无监督损失集成不同角度的预测值。现有的图卷积神经网络是单通道网络,本发明提供了一种双通道图网络,从文献数据的不同视角进行卷积操作,以充分嵌入图形知识,极大地提高了文献分类的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种基于对称图卷积神经网络的文献分类方法的流程图。
图2是根据一示例性实施例示出的另一种基于对称图卷积神经网络的文献分类方法的流程图。
图3是根据一示例性实施例示出的一种基于对称图卷积神经网络的文献分类装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种基于对称图卷积神经网络的文献分类方法的流程图,如图1所示,该方法包括:
步骤S101,获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的特征矩阵和邻接矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵;
机器学习中,有多种计算相似度的方法,本发明使用欧式距离计算相邻节点之间的特征相似度。输入特征矩阵由X[X1,X2,…,Xn]T∈Rn×c表示,n表示文献节点个数,c是特征维数,图结构由邻接矩阵A∈Rn×n表示。输入特征矩阵X包含所有标记和未标记文献节点的特征信息。
如果节点i和j是图中的相邻文献节点,它们特征之间的特征距离dij可以通过公式1得到:
式1中,Xi∈Rc是文献节点i的c维特征向量,Xj∈Rc是文献节点j的c维特征向量。
文献节点i和j的特征相似度系数αij可以由公式2计算得到:
式中,μ是平滑参数。通过公式2可以使较小的特征距离获得较大的相似度系数。
相似度矩阵S∈Rn×n可通过公式3来定义:
文献节点i和j的相似度系数αij由公式(1)和(2)计算,只需计算所有相邻文献节点对的特征相似度。
步骤S102,分别以所述相似度矩阵和所述邻接矩阵作为聚合矩阵,对所述文献数据的特征矩阵进行图卷积操作,以得到基于所述相似度矩阵的第一预测值和基于所述邻接矩阵的第二预测值;
邻接矩阵作为聚合矩阵,在更新目标节点特征时,度越小的邻居节点,所占的比重更大,度越大的邻居节点所占的比重则更小。邻接矩阵作为聚合矩阵是根据邻居节点的度的大小来区分邻居节点的相对重要性。给定输入特征矩阵X和邻接矩阵A,基于邻接矩阵的第t层网络模型的输出定义为:
其中,I是单位矩阵,是规范化的邻接矩阵。是基于邻接矩阵的第(t-1)层的输出,等于输入特征矩阵X,输入特征矩阵X由所有标记和未标记的文献节点特征组成。Θ(t)是第t层网络的可训练的权重参数,σ表示激活函数,比如ReLU/Sigmoid等。
基于邻接矩阵的t层网络模型的标签预测可以通过下列公式计算:
其中,softmax是一个分类器,用于预测每个文献节点属于各个类别的概率。
相似度矩阵作为聚合矩阵,在更新目标节点特征时,与目标节点特征相似度越大的邻居节点所占的比重越大。相似度矩阵作为聚合矩阵是根据目标节点与邻居节点的原始特征分布关系区分邻居节点的相对重要性。给定输入特征矩阵X和相似度矩阵S,基于相似度矩阵的第t层网络模型的输出定义为:
基于相似度矩阵的t层网络模型的标签预测可由下列公式计算:
步骤S103,分别计算所述文献数据中标记节点的监督损失和基于所述第一预测值和所述第二预测值的无监督损失,并将所述监督损失和无监督损失进行合并,以确定最终损失,其中,所述监督损失用于表征标记文献节点的基于所述邻接矩阵的第二预测值与真实值之间的误差,所述无监督损失用于所有文献节点的所述第二预测值与第一预测值之间的误差;
监督损失是标记文献节点的预测值和真实值的误差,可通过交叉熵损失函数计算,计算公式如下:
添加一个无监督损失用于集成不同角度的预测值,计算公式如下:
将监督损失和无监督损失进行合并,具体计算公式如下:
其中,是监督损失由公式8计算得到,是无监督损失由公式9计算得到,λ是正则化系数,用于平衡监督损失和无监督损失。在训练中,监督损失用于缩小标记文献节点的预测值和真实值的差异,无监督损失用于缩小同一文献节点不同角度卷积操作的预测差异,这两部分损失的减小均可优化参数更新,以提高模型的预测能力。
步骤S104,利用所述最终损失训练和预设训练集进行训练,得到目标图卷积神经网络;其中,设置网络超参数,训练网络模型,依据反向传播和随机梯度下降学习网络的权重参数以及正则性系数。
步骤S105,使用所述目标图卷积神经网络对文献数据集中的目标数据进行半监督分类。
下面以一个具体实施例,详细说明本发明的上述技术方案。
本发明以Cora、Citeseer和Pubmed三个文献引用数据集进行实验,数据集的具体信息如表1所示。
表1数据集具体信息
其中,每篇文献都表示图中的一个节点,文献中的关键词作为节点特征,文献之间的引用关系作为图的边。标签率是训练节点数与节点总数的比值。
如图2所示,本发明具体实施包括如下具体步骤:
步骤S201,根据邻接矩阵A和特征矩阵X构建相似度矩阵S
读取图结构数据集生成特征矩阵和邻接矩阵,使用X=[X1,X2,…,Xn]T∈Rn×c表示特征矩阵,n表示文献节点个数,c是特征维数,图结构由邻接矩阵A∈Rn×n表示。通常,通过计算两个节点之间的特征距离来比较两个节点之间的特征相似度。距离越小,相似度越大,反之,相似度越小。在本发明中,使用欧式距离来计算两个节点之间的特征相似度。
如果节点i和j是图中的相邻节点,它们特征之间的欧式距离dij可以通过公式1得到:
式1中,Xi∈Rc是节点i的c维特征向量,Xj∈Rc是节点j的c维特征向量。
节点i和j的特征相似度系数αij可以由公式2计算得到:
式中,μ是平滑参数,一般设μ为1,通过公式2可以使较小的特征距离获得较大的相似度系数。
相似度矩阵S∈Rn×n可通过公式3得到:
节点i和j的相似度系数αij由公式(1)和(2)计算,只需计算所有相邻节点的特征相似度。相邻节点i和j在相似度矩阵S中对应位置为下标是第i行和第j列的位置。初始化的S是一个全0矩阵,只需要将相邻节点位置的0替换为相似度系数即可。
步骤S202,分别以相似矩阵S和邻接矩阵A作为聚合矩阵对文献数据的特征矩阵X进行图卷积操作,得到基于文献数据不同卷积操作的预测值。
基于邻接矩阵进行图卷积操作:
输入特征矩阵X和邻接矩阵A,基于邻接矩阵的2层网络模型的标签概率预测为:
其中,规范化的邻接矩阵,并且I是一个单位矩阵,表示给图中每个文献节点添加一个自环,可以在更新节点特征时保留一部分节点本身的特征信息。是一个对角矩阵,除对角线上的元素外,其他元素都为0。 的每一行对角线上的元素等于中对应行的元素和。Θ(1)和Θ(2)分别是第一层和第二层网络的可学习权重参数,softmax是分类器,用于预测每个文献节点属于不同类别的概率。
基于相似度矩阵进行图卷积操作如下:
输入特征矩阵X和相似度矩阵S,基于相似度矩阵的2层网络模型的标签概率预测为:
步骤S203,计算标记文献节点的监督损失并添加一个无监督损集成不同卷积操作的预测值。
计算标记文献节点的监督损失,并计算基于邻接矩阵和相似度矩阵的预测值的无监督损失,然后将这两部分损失进行合并作为最终的损失,具体计算公式如下:
其中,L为标记文献节点集合,Y是一个真实标签矩阵,如果标记文献节点i属于第l类,Yil=1,否则,Yil=0,f是类别数。n是图中文献节点个数(即图数据集的样本个数),是基于邻接矩阵的预测值,是基于相似度矩阵的预测值。是监督损失(标记文献节点的预测值与真实值的误差)。是一个无监督损失(基于邻接矩阵和基于相似度矩阵的预测值的误差),λ是正则化系数,用于平衡监督损失和无监督损失。监督损失用于缩小标记文献节点的预测值和真实值的差异,无监督损失用于缩小同一文献节点不同角度卷积操作的预测差异,这两部分损失的减小均可优化参数更新,以提高模型的预测能力。
步骤S204,训练网络模型,实现半监督文献分类。
设置网络超参数,训练网络模型,通过步骤203中计算得到的损失进行反向传播和随机梯度下降学习网络的权重参数以及正则化系数;对于给定文献数据,用训练好的模型预测未知文献节点的类别,从而实现半监督文献分类。
步骤S205,使用三个基准数据集对算法进行有效性验证。
本发明将所提算法用于科学文献的分类,并与已有算法进行实验对比,以验证算法的有效性。具体是使用Cora、Citeseer和Pumed三个文献引用数据集进行实验。训练集/验证集/测试集使用的是标准的固定分割。在这三个文献引用数据集中,节点表示文献,边表示引用链接。所有实验为每个类别选取20个文献节点作为训练节点,使用500个文献节点进行验证,并使用1000个文献节点进行测试。实验结果如表2所示。
参数设置:参数设置:所提算法的网络层数设置为2,使用Adam优化器进行训练,Cora,Citeseer和Pubmed的初始学习率都设置为0.01,最大训练次数为200,权重衰减为0.0005。为避免过度拟合,使用dropout=0.5的正则化。同时,如果验证损失连续10个周期没有减少,就提前终止训练。Cora,Citeseer和Pubmed的正则化系数λ,分别设置为0.2,0.01,0.01。
表2本发明方法S-GGN与已有方法分类精度对比
方法 | Cora | Citeseer | Pubmed |
MLP | 55.1% | 46.5% | 71.4% |
ManiReg | 59.5% | 60.1% | 70.7% |
DeepWalk | 67.2% | 43.2% | 65.3% |
GCN | 81.5% | 70.3% | 79.0% |
DGI | 82.3% | 71.8% | 76.8% |
S-GGN | 84.0% | 72.0% | 80.0% |
从表2可以看出,本发明方法(S-GCN)在这三个数据集上实现了最好的分类效果。实验对比说明本发明提出的基于对称图卷积神经网络的文献分类方法的科学性和精确性。
本发明提出的一种基于对称图卷积神经网络的文献分类方法。首先通过计算所有相邻文献节点的原始特征分布相似性构建了一个相似度矩阵作为聚合矩阵,然后分别以邻接矩阵和相似度矩阵作为聚合矩阵进行图卷积操作,得到基于文献数据的不同视角的预测值,最后通过添加一个无监督损失集成不同视角的预测。所提算法从文献数据的不同视角进行卷积操作,以充分嵌入图形知识。在具体实施中,将所提算法在Cora、Citeseer和Pubmed三个数据集上进行了测试,实验结果表明本发明所提出的基于对称图卷积神经网络的文献分类方法极大的提高了文献分类的准确度。
图3是根据一示例性实施例示出的一种基于对称图卷积神经网络的文献分类装置的框图。
如图3所示,根据本发明实施例的第二方面,提供一种基于对称图卷积神经网络的文献分类装置,所述装置包括:
生成模块31,用于获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的特征矩阵和邻接矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵;
处理模块32,用于分别以所述相似度矩阵和所述邻接矩阵作为聚合矩阵,对所述文献数据的特征矩阵进行图卷积操作,以得到基于所述相似度矩阵的第一预测值和基于所述邻接矩阵的第二预测值;
计算模块33,用于分别计算所述文献数据中标记节点的监督损失和基于所述第一预测值和所述第二预测值的无监督损失,并将所述监督损失和无监督损失进行合并,以确定最终损失,其中,所述监督损失用于表征标记文献节点的基于所述邻接矩阵的第二预测值与真实值之间的误差,所述无监督损失用于所有文献节点的所述第二预测值与第一预测值之间的误差;
训练模块34,用于利用所述最终损失训练和预设训练集进行训练,得到目标图卷积神经网络;
分类模块35,用于使用所述目标图卷积神经网络对文献数据集中的目标数据进行半监督分类。
在一个实施例中,优选地,所述生成模块31用于:
生成特征矩阵X=[X1,X2,…,Xn]T和邻接矩阵A,其中,X∈Rn×c,A∈Rn×n表示所有文献之间的引用关系,如果两篇文献之间具有引用关系,则将它们称为图中的相邻节点,n表示文献节点个数,c表示特征维数;
使用第一计算公式计算任意两个相邻文献节点i和j之间的特征距离;
根据所述特征距离,使用第二计算公式计算任意两个相邻文献节点i和j之间的特征相似度系数;
采用第三计算公式,根据所有相邻文献节点的特征相似度系数构建所述相似度矩阵;
所述第一计算公式包括:
其中,dij表示所述节点i和j之间的特征距离,Xi∈Rc是文献节点i的c维特征向量,Xj∈Rc是文献节点j的c维特征向量;
所述第二计算公式包括:
其中,αij表示所述文献节点i和j之间的特征相似度系数,μ表示平滑参数;
所述第三计算公式包括:
采用以下第四计算公式和第五计算公式计算基于所述相似度矩阵的第一预测值:
其中,表示所述相似度矩阵的第一预测值,S表示所述相似度矩阵,表示规范化的相似度矩阵,D表示一个对角矩阵,Dii=∑jSij,softmax表示分类器,用于预测每个文献节点属于不同类别的概率,表示基于相似度矩阵的第(t-1)层的输出,等于输入特征矩阵X,Θ(t)表示第t层网络的可训练的权重参数,σ表示激活函数。
采用以下第六计算公式和第七计算公式计算基于所述邻接矩阵的第二预测值:
其中,I表示单位矩阵,表示规范化的邻接矩阵,表示基于邻接矩阵的第(t-1)层的输出,等于输入特征矩阵X,输入特征矩阵X由所有标记和未标记的文献节点特征组成,Θ(t)表示第t层网络的可训练的权重参数,σ表示激活函数。
采用以下第八计算公式计算所述标记文献节点的监督损失;
采用以下第九计算公式计算基于所述第一预测值和所述第二预测值的无监督损失;
采用以下第十计算公式计算所述最终损失;
根据本发明实施例的第三方面,提供一种基于对称图卷积神经网络的文献分类装置,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的特征矩阵和邻接矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵;
分别以所述相似度矩阵和所述邻接矩阵作为聚合矩阵,对所述文献引用数据的特征矩阵进行图卷积操作,以得到基于所述相似度矩阵的第一预测值和基于所述邻接矩阵的第二预测值;
分别计算所述文献引用数据中标记节点的监督损失和基于所述第一预测值和所述第二预测值的无监督损失,并将所述监督损失和无监督损失进行合并,以确定最终损失,其中,所述监督损失用于表征标记文献节点的基于所述邻接矩阵的第二预测值与真实值之间的误差,所述无监督损失用于所有文献节点的所述第二预测值与第一预测值之间的误差;
利用所述最终损失训练和预设训练集进行训练,得到目标图卷积神经网络;
使用所述目标图卷积神经网络对文献数据集中的目标数据进行半监督分类。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面中任一项所述方法的步骤。
进一步可以理解的是,本发明中“多个”是指两个或两个以上,其它量词与之类似。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
进一步可以理解的是,术语“第一”、“第二”等用于描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开,并不表示特定的顺序或者重要程度。实际上,“第一”、“第二”等表述完全可以互换使用。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。
进一步可以理解的是,本发明实施例中尽管在附图中以特定的顺序描述操作,但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作,或是要求执行全部所示的操作以得到期望的结果。在特定环境中,多任务和并行处理可能是有利的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (10)
1.一种基于对称图卷积神经网络的文献分类方法,其特征在于,所述方法包括:
获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的邻接矩阵和特征矩阵,并根据特征矩阵和邻接矩阵构建相似度矩阵;
分别以所述相似度矩阵和所述邻接矩阵作为聚合矩阵,对所述文献引用数据的特征矩阵进行图卷积操作,以得到基于所述相似度矩阵的第一预测值和基于所述邻接矩阵的第二预测值;
分别计算所述文献引用数据中标记文献节点的监督损失和基于所述第一预测值和所述第二预测值的无监督损失,并将所述监督损失和无监督损失进行合并,以确定最终损失,其中,所述监督损失用于表征标记文献节点的基于所述邻接矩阵的第二预测值与真实值之间的误差,所述无监督损失用于所有文献节点的所述第二预测值与第一预测值之间的误差;
利用所述最终损失训练和预设训练集进行训练,得到目标图卷积神经网络;
使用所述目标图卷积神经网络对文献数据集中的目标文献数据进行半监督分类。
2.根据权利要求1所述的方法,其特征在于,获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的邻接矩阵和特征矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵,包括:
生成特征矩阵X=[X1,X2,…,Xn]T和邻接矩阵A,其中,X∈Rn×c,A∈Rn×n表示所有文献之间的引用关系,如果两篇文献之间具有引用关系,则将它们称为图中的相邻文献节点,n表示文献节点的个数,c表示特征维数;
使用第一计算公式计算任意两个相邻文献节点i和j之间的特征距离;
根据所述特征距离,使用第二计算公式计算任意两个相邻文献节点i和j之间的特征相似度系数;
采用第三计算公式,根据所有相邻文献节点的特征相似度系数构建所述相似度矩阵。
7.一种基于对称图卷积神经网络的文献分类装置,其特征在于,所述装置包括:
生成模块,用于获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的特征矩阵和邻接矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵;
处理模块,用于分别以所述相似度矩阵和所述邻接矩阵作为聚合矩阵,对所述文献引用数据的特征矩阵进行图卷积操作,以得到基于所述相似度矩阵的第一预测值和基于所述邻接矩阵的第二预测值;
计算模块,用于分别计算所述文献数据中标记文献节点的监督损失和基于所述第一预测值和所述第二预测值的无监督损失,并将所述监督损失和无监督损失进行合并,以确定最终损失,其中,所述监督损失用于表征标记文献节点的基于所述邻接矩阵的第二预测值与真实值之间的误差,所述无监督损失用于所有文献节点的所述第二预测值与第一预测值之间的误差;
训练模块,用于利用所述最终损失训练和预设训练集进行训练,得到目标图卷积神经网络;
分类模块,用于使用所述目标图卷积神经网络对文献数据集中的目标数据进行半监督分类。
8.根据权利要求7所述的装置,其特征在于,所述生成模块用于:
生成特征矩阵X=[X1,X2,…,Xn]T和邻接矩阵A,其中,X∈Rn×x,A∈Rn×n表示所有文献之间的引用关系,如果两篇文献之间具有引用关系,则将它们称为图中的相邻文献节点,n表示文献节点个数,c表示特征维数;
使用第一计算公式计算任意两个相邻文献节点i和j之间的特征距离;
根据所述特征距离,使用第二计算公式计算任意两个相邻文献节点i和j之间的特征相似度系数;
采用第三计算公式,根据所有相邻文献节点的特征相似度系数构建所述相似度矩阵;
所述第一计算公式包括:
其中,dij表示所述相邻文献节点i和j之间的特征距离,Xi∈Rc是节点i的c维特征向量,Xj∈Rc是节点j的c维特征向量;
所述第二计算公式包括:
其中,αij表示所述文献节点i和j之间的特征相似度系数,μ表示平滑参数;
所述第三计算公式包括:
采用以下第四计算公式和第五计算公式计算基于所述相似度矩阵的第一预测值:
其中,表示所述相似度矩阵的第一预测值,S表示所述相似度矩阵,表示规范化的相似度矩阵,D表示一个对角矩阵,Dii=∑jSij,softmax表示分类器,用于预测每个文献节点属于不同类别的概率,表示基于相似度矩阵的第(t-1)层的输出,等于输入特征矩阵X,Θ(t)表示第t层网络的可训练的权重参数,σ表示激活函数;
采用以下第六计算公式和第七计算公式计算基于所述邻接矩阵的第二预测值:
其中,I表示单位矩阵,表示规范化的邻接矩阵,表示基于邻接矩阵的第(t-1)层的输出,等于输入特征矩阵X,输入特征矩阵X由所有标记和未标记文献节点特征组成,Θ(t)表示第t层网络的可训练的权重参数,σ表示激活函数;
采用以下第八计算公式计算所述标记文献节点的监督损失;
采用以下第九计算公式计算基于所述第一预测值和所述第二预测值的无监督损失;
采用以下第十计算公式计算所述最终损失;
9.一种基于对称图卷积神经网络的文献分类装置,其特征在于,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的特征矩阵和邻接矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵;
分别以所述相似度矩阵和所述邻接矩阵作为聚合矩阵,对所述文献数据的特征矩阵进行图卷积操作,以得到基于所述相似度矩阵的第一预测值和基于所述邻接矩阵的第二预测值;
分别计算所述文献数据中标记节点的监督损失和基于所述第一预测值和所述第二预测值的无监督损失,并将所述监督损失和无监督损失进行合并,以确定最终损失,其中,所述监督损失用于表征标记文献节点的基于所述邻接矩阵的第二预测值与真实值之间的误差,所述无监督损失用于所有文献节点的所述第二预测值与第一预测值之间的误差;
利用所述最终损失训练和预设训练集进行训练,得到目标图卷积神经网络;
使用所述目标图卷积神经网络对文献数据集中的目标数据进行半监督分类。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-6中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110388284.6A CN112966114B (zh) | 2021-04-10 | 2021-04-10 | 基于对称图卷积神经网络的文献分类方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110388284.6A CN112966114B (zh) | 2021-04-10 | 2021-04-10 | 基于对称图卷积神经网络的文献分类方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112966114A true CN112966114A (zh) | 2021-06-15 |
CN112966114B CN112966114B (zh) | 2023-08-15 |
Family
ID=76280092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110388284.6A Active CN112966114B (zh) | 2021-04-10 | 2021-04-10 | 基于对称图卷积神经网络的文献分类方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112966114B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113591997A (zh) * | 2021-08-03 | 2021-11-02 | 湖州绿色智能制造产业技术研究院 | 基于图学习卷积神经网络的装配特征图连接关系分类方法 |
CN113822419A (zh) * | 2021-09-26 | 2021-12-21 | 广东技术师范大学 | 一种基于结构信息的自监督图表示学习运行方法 |
CN114511027A (zh) * | 2022-01-29 | 2022-05-17 | 重庆工业职业技术学院 | 通过大数据网络进行英语远程数据提取方法 |
CN114896898A (zh) * | 2022-07-14 | 2022-08-12 | 深圳市森辉智能自控技术有限公司 | 一种空压机集群系统能耗优化方法及系统 |
CN115982654A (zh) * | 2023-03-21 | 2023-04-18 | 北京芯盾时代科技有限公司 | 一种基于自监督图神经网络的节点分类方法及装置 |
CN116226388A (zh) * | 2023-05-08 | 2023-06-06 | 浪潮电子信息产业股份有限公司 | 一种文献分类方法、一种图神经网络训练方法及相关组件 |
CN116304367A (zh) * | 2023-02-24 | 2023-06-23 | 河北师范大学 | 基于图自编码器自监督训练用于获得社区的算法及装置 |
CN116431816A (zh) * | 2023-06-13 | 2023-07-14 | 浪潮电子信息产业股份有限公司 | 一种文献分类方法、装置、设备和计算机可读存储介质 |
CN117828090A (zh) * | 2024-02-29 | 2024-04-05 | 苏州元脑智能科技有限公司 | 一种文献分类方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492691A (zh) * | 2018-11-07 | 2019-03-19 | 南京信息工程大学 | 一种超图卷积网络模型及其半监督分类方法 |
US10387531B1 (en) * | 2015-08-18 | 2019-08-20 | Google Llc | Processing structured documents using convolutional neural networks |
CN111079780A (zh) * | 2019-11-06 | 2020-04-28 | 中国科学院深圳先进技术研究院 | 空间图卷积网络的训练方法、电子设备及存储介质 |
-
2021
- 2021-04-10 CN CN202110388284.6A patent/CN112966114B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10387531B1 (en) * | 2015-08-18 | 2019-08-20 | Google Llc | Processing structured documents using convolutional neural networks |
CN109492691A (zh) * | 2018-11-07 | 2019-03-19 | 南京信息工程大学 | 一种超图卷积网络模型及其半监督分类方法 |
CN111079780A (zh) * | 2019-11-06 | 2020-04-28 | 中国科学院深圳先进技术研究院 | 空间图卷积网络的训练方法、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
张思凡;牛振东;陆浩;朱一凡;王荣荣;: "基于图卷积嵌入与特征交叉的文献被引量预测方法:以交通运输领域为例", 数据分析与知识发现, no. 09 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113591997B (zh) * | 2021-08-03 | 2024-01-02 | 湖州绿色智能制造产业技术研究院 | 基于图学习卷积神经网络的装配特征图连接关系分类方法 |
CN113591997A (zh) * | 2021-08-03 | 2021-11-02 | 湖州绿色智能制造产业技术研究院 | 基于图学习卷积神经网络的装配特征图连接关系分类方法 |
CN113822419B (zh) * | 2021-09-26 | 2023-08-01 | 广东技术师范大学 | 一种基于结构信息的自监督图表示学习运行方法 |
CN113822419A (zh) * | 2021-09-26 | 2021-12-21 | 广东技术师范大学 | 一种基于结构信息的自监督图表示学习运行方法 |
CN114511027A (zh) * | 2022-01-29 | 2022-05-17 | 重庆工业职业技术学院 | 通过大数据网络进行英语远程数据提取方法 |
CN114896898A (zh) * | 2022-07-14 | 2022-08-12 | 深圳市森辉智能自控技术有限公司 | 一种空压机集群系统能耗优化方法及系统 |
CN114896898B (zh) * | 2022-07-14 | 2022-09-27 | 深圳市森辉智能自控技术有限公司 | 一种空压机集群系统能耗优化方法及系统 |
CN116304367B (zh) * | 2023-02-24 | 2023-12-01 | 河北师范大学 | 基于图自编码器自监督训练用于获得社区的算法及装置 |
CN116304367A (zh) * | 2023-02-24 | 2023-06-23 | 河北师范大学 | 基于图自编码器自监督训练用于获得社区的算法及装置 |
CN115982654B (zh) * | 2023-03-21 | 2023-08-04 | 北京芯盾时代科技有限公司 | 一种基于自监督图神经网络的节点分类方法及装置 |
CN115982654A (zh) * | 2023-03-21 | 2023-04-18 | 北京芯盾时代科技有限公司 | 一种基于自监督图神经网络的节点分类方法及装置 |
CN116226388A (zh) * | 2023-05-08 | 2023-06-06 | 浪潮电子信息产业股份有限公司 | 一种文献分类方法、一种图神经网络训练方法及相关组件 |
CN116431816A (zh) * | 2023-06-13 | 2023-07-14 | 浪潮电子信息产业股份有限公司 | 一种文献分类方法、装置、设备和计算机可读存储介质 |
CN116431816B (zh) * | 2023-06-13 | 2023-09-19 | 浪潮电子信息产业股份有限公司 | 一种文献分类方法、装置、设备和计算机可读存储介质 |
CN117828090A (zh) * | 2024-02-29 | 2024-04-05 | 苏州元脑智能科技有限公司 | 一种文献分类方法、装置、设备及存储介质 |
CN117828090B (zh) * | 2024-02-29 | 2024-05-03 | 苏州元脑智能科技有限公司 | 一种文献分类方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112966114B (zh) | 2023-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112966114B (zh) | 基于对称图卷积神经网络的文献分类方法和装置 | |
CN110263227B (zh) | 基于图神经网络的团伙发现方法和系统 | |
Lucca et al. | CC-integrals: Choquet-like copula-based aggregation functions and its application in fuzzy rule-based classification systems | |
WO2022063151A1 (en) | Method and system for relation learning by multi-hop attention graph neural network | |
CN110473592B (zh) | 一种多视角人类协同致死基因预测方法 | |
CN114048331A (zh) | 一种基于改进型kgat模型的知识图谱推荐方法及系统 | |
CN112508085A (zh) | 基于感知神经网络的社交网络链路预测方法 | |
WO2022105108A1 (zh) | 一种网络数据分类方法、装置、设备及可读存储介质 | |
US20220114455A1 (en) | Pruning and/or quantizing machine learning predictors | |
Wang et al. | ELITE: Ensemble of optimal input-pruned neural networks using TRUST-TECH | |
CN116628597B (zh) | 一种基于关系路径注意力的异质图节点分类方法 | |
Sun et al. | Reference line-based estimation of distribution algorithm for many-objective optimization | |
CN114154557A (zh) | 癌症组织分类方法、装置、电子设备及存储介质 | |
CN113627471A (zh) | 一种数据分类方法、系统、设备及信息数据处理终端 | |
Cheung et al. | Hybrid evolution of convolutional networks | |
CN115496144A (zh) | 配电网运行场景确定方法、装置、计算机设备和存储介质 | |
CN116759100B (zh) | 基于联邦学习构建慢性心血管疾病大模型方法 | |
Farooq | Genetic algorithm technique in hybrid intelligent systems for pattern recognition | |
Liu et al. | A modified support vector machine model for credit scoring | |
CN108765137A (zh) | 一种信贷需求预测方法和系统、存储介质 | |
CN113516019A (zh) | 高光谱图像解混方法、装置及电子设备 | |
Antonietti et al. | Accelerating algebraic multigrid methods via artificial neural networks | |
Liu et al. | Semi‐supervised breast histopathological image classification with self‐training based on non‐linear distance metric | |
CN112884028A (zh) | 一种系统资源调整方法、装置及设备 | |
Sheet et al. | Identification of Cancer Mediating Biomarkers using Stacked Denoising Autoencoder Model-An Application on Human Lung Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |