CN112925909A - 一种考虑局部不变性约束的图卷积文献分类方法及系统 - Google Patents
一种考虑局部不变性约束的图卷积文献分类方法及系统 Download PDFInfo
- Publication number
- CN112925909A CN112925909A CN202110206857.9A CN202110206857A CN112925909A CN 112925909 A CN112925909 A CN 112925909A CN 202110206857 A CN202110206857 A CN 202110206857A CN 112925909 A CN112925909 A CN 112925909A
- Authority
- CN
- China
- Prior art keywords
- graph
- node
- loss
- matrix
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种考虑局部不变性约束的图卷积文献分类方法及系统。该方案包括获取文献引用数据集,输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集;输入特征矩阵和邻接矩阵,根据两层的GCN模型生成标签预测;获取所有的图节点的特征矩阵和邻接矩阵,生成图半监督学习损失;更新训练参数值,获得图卷积网络损失的最小值,并将图卷积网络损失的最小值对应的训练参数值保存为目标分类参数;进行反向推演和随机梯度下降学习,构建目标模型。该方案为文献引用数据集中每个节点找出特征分布最相似相邻节点,并改进图卷积网络的损失函数,使特征最相似的邻近节点的输出尽可能有相同标签预测。
Description
技术领域
本发明涉及文献图结构数据处理技术领域,更具体地,涉及一种考虑局部不变性约束的图卷积文献分类方法及系统。
背景技术
随着文献数量的不断增加,对文献按照一定分类体系进行分类,显得越来越重要。目前,对文献分类工作的大部分仍由专业人士手动完成,费时又费力。因此,急需要一种能够自动完成对文献分类的方法。现有的方法主要采用卷积神经网络对文献进行分类。而且文献之间的引用关系十分复杂,可呈现为一种图结构数据关系。卷积神经网络算法主要用于处理1维,2维和3维欧氏结构数据,在各种学习任务中展示了卷积神经网络算法先进的性能。但是,卷积神经网络算法的卷积运算不适用于处理非欧几里德结构数据,例如图结构数据。这是因为图结构数据的每个节点可能具有不同数量的相邻节点,所以,很难使用相同大小的卷积核执行卷积运算。
但现有的技术主要采用图卷积网络算法存在以下缺陷:图卷积网络可以用于图结构数据的半监督分类和深度特征表示,但现有的图卷积网络在学习和表示过程中普遍没有考虑到局部不变性约束。这种局部不变性约束为两个数据点的特征分布相似,那么它们的标签预测也应该彼此接近。这样严重降低了数据分类的鲁棒性。
发明内容
鉴于上述问题,本发明提出了一种考虑局部不变性约束的图卷积文献分类方法及系统,其利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,为每个节点找出特征分布最相似的相邻节点,并通过改进图卷积网络的损失函数,使特征最相似的邻近节点的输出尽可能有相同标签预测。
根据本发明实施例第一方面,提供一种考虑局部不变性约束的图卷积文献分类方法。
在一个或多个实施例中,优选地,所述的一种考虑局部不变性约束的图卷积文献分类方法包括:
获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集;
输入所述特征矩阵和所述邻接矩阵,根据两层的GCN模型生成所述标签预测;
获取所有的图节点的所述特征矩阵和所述邻接矩阵,生成图半监督学习损失;
更新训练参数值,获得图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为目标分类参数;
获取所述目标分类参数,进行反向推演和随机梯度下降学习,构建半监督分类目标模型。
在一个或多个实施例中,优选地,所述获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集,具体包括:
所述获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为所述图结构数据;
读取所述图结构数据中的所述邻接矩阵、所述特征矩阵和真实标签矩阵,其中,所述特征矩阵包括所有的标记节点特征和所有的未标记节点特征;
根据所述邻接矩阵获得所述图结构数据中每个图节点对应的所有的相邻节点;
利用第一计算公式计算每个所述图节点对其所有相邻节点的特征距离;
确定每个图节点的特征距离最小的邻接节点,并保存为特征最相似邻节点,加入到所述最近邻接数据集;
所述第一计算公式为:
其中,dij为第i图节点和第j图节点之间的特征距离,c为所有的图节点的特征维数,Xik为第i个图节点对应的第k维特征,Xjk为第j个图节点对应的第k维特征,k为1到c之间的整数。
在一个或多个实施例中,优选地,所述输入所述特征矩阵和所述邻接矩阵,根据两层的GCN模型生成所述标签预测,具体包括:
获取所有的图节点的所述特征矩阵和所述邻接矩阵;
利用第二计算公式生成所述标签预测;
所述第二计算公式为:
其中,X为输入特征矩阵,由所有的标记节点特征和所有的未标记节点特征组成,为一个规范化的邻接矩阵,Θ(0)和Θ(1)为可更新的参数矩阵,用于学习输入特征矩阵,ReLU为非线性激活函数,softmax为分类器,Z为生成的所述标签预测。
在一个或多个实施例中,优选地,所述获取所有的图节点的所述特征矩阵和所述邻接矩阵,生成图半监督学习损失,具体包括:
获取所有的图节点的所述特征矩阵和所述邻接矩阵;
根据所述标签预测利用第三计算公式计算获得标准的监督损失;
根据第四计算公式图拉普拉斯正则化;
根据所述图拉普拉斯正则化和所述标准的监督损失利用第五计算公式获得所述图半监督学习损失;
所述第三计算公式为:
其中,Llabel为所述标准的监督损失,l为损失函数,L为标记节点编号的集合,f为图数据类别个数,f(Xi)为节点i的标签预测,Yi为节点i的真实标签;
所述第四计算公式为:
其中,Lreg为所述图拉普拉斯正则化,Xi为节点i特征向量,Yi为节点i的真实标签,E为图边的集合,aij为节点i和节点j之间的关系,f(Xi)为节点i的标签预测,f(Xj)为节点j的标签预测;
所述第五计算公式为:
L=Llabel+λLreg
其中,L为所述图半监督学习损失,Llabel为标准的监督损失,Lreg为所述图拉普拉斯正则化,λ为正则化系数。
在一个或多个实施例中,优选地,所述更新训练参数值,获得图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为目标分类参数,具体包括:
更新训练参数值,利用所述第二计算公式进行迭代获得训练标签预测;
根据所述训练标签预测根据第六计算公式和第七计算公式获得监督损失和无监督损失;
根据所述监督损失和所述无监督损失利用第八计算公式获得所述图卷积网络损失;
当出现参数训练的终止标记时,获得所述图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为所述目标分类参数;
所述第六计算公式:
其中,Llabel1为所述监督损失,Y为真实标签矩阵,L为标记节点编号的集合,f为图数据类别个数,Z为图卷积操作生成的所述标签预测;
所述第七计算公式为:
所述第八计算公式为:
L1=Llabel1+λLreg1
其中,L1为所述图卷积网络损失,Llabel1为所述监督损失,Lreg1为所述无监督损失,λ为正则化系数。
在一个或多个实施例中,优选地,所述获取所述目标分类参数,进行反向推演和随机梯度下降学习,构建半监督分类目标模型,具体包括:
获取所述目标分类参数,获得对应的训练网络模型;
根据所述训练网络模型进行网络超参数设置;
进行反向推演和随机梯度下降学习,生成权重参数和正则化系数;
根据权重参数和正则化系数构建半监督分类目标模型。
在一个或多个实施例中,优选地,所述参数训练的终止标记包括数量标记和裕度标记;
所述裕度标记为当验证损失连续预设个周期没有减少超过预设降低幅度,则停止模型的训练;
所述数量标记为当参数训练此时达到预设次数时,则停止模型的训练。
根据本发明实施例第二方面,提供一种考虑局部不变性约束的图卷积文献分类系统。
在一个或多个实施例中,优选地,所述的一种考虑局部不变性约束的图卷积文献分类系统包括:
相似邻节点获取子系统,用于获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集;
标签预测子系统,用于输入所述特征矩阵和所述邻接矩阵,根据两层的GCN模型生成所述标签预测;
损失函数运算子系统,用于获取所有的图节点的所述特征矩阵和所述邻接矩阵,生成图半监督学习损失;
目标分类参数生成子系统,用于更新训练参数值,获得图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为目标分类参数;
半监督分类目标模型生成子系统,用于获取所述目标分类参数,进行反向推演和随机梯度下降学习,构建半监督分类目标模型。
根据本发明实施例第三方面,提供一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如本发明实施例第一方面中任一项所述的方法。
根据本发明实施例第四方面,提供一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现本发明实施例第一方面中任一项所述的步骤。
本发明的实施例提供的技术方案可以包括以下有益效果:
1)该方法基于已有的图卷积网络的文献分类方法在半监督节点分类中并没有考虑局部的不变性约束,通过改进损失函数,在图卷积网络中引入了一种局部不变性约束,解决了原始图卷积网络的卷积运算不适用于处理非欧几里德结构数据的图结构数据的文献集的问题。
2)该方案通过同时对标记节点和未标记节点进行学习,在文献分类的训练阶段仅使用标记节点的真实标签信息进行学习,仅使用标记节点的真实标签信息进行学习,并且可以优化参数更新,提升模型的学习的能力,相比先前的图卷积网络模型,改进后的算法在半监督节点分类任务中,文献分类的准确性有所提升。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法的流程图。
图2是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法中的获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集的流程图。
图3是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法中的输入所述特征矩阵和所述邻接矩阵,根据两层的GCN模型生成所述标签预测的流程图。
图4是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法中的获取所有的图节点的所述特征矩阵和所述邻接矩阵,生成图半监督学习损失的流程图。
图5是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法中的更新训练参数值,获得图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为目标分类参数的流程图。
图6是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法中的获取所述目标分类参数,进行反向推演和随机梯度下降学习,构建半监督分类目标模型的流程图。
图7是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类系统的结构图。
图8是本发明一个实施例中一种电子设备的结构图。
具体实施方式
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着文献数量的不断增加,对文献按照一定分类体系进行分类,显得越来越重要。目前,对文献分类工作的大部分仍由专业人士手动完成,费时又费力。因此,急需要一种能够自动完成对文献分类的方法。现有的方法主要采用卷积神经网络对文献进行分类。而且文献之间的引用关系十分复杂,可呈现为一种图结构数据关系。卷积神经网络算法主要用于处理1维,2维和3维欧氏结构数据,在各种学习任务中展示了卷积神经网络算法先进的性能。但是,卷积神经网络算法的卷积运算不适用于处理非欧几里德结构数据,例如图结构数据。这是因为图结构数据的每个节点可能具有不同数量的相邻节点,所以,很难使用相同大小的卷积核执行卷积运算。
但现有的技术主要采用图卷积网络算法存在以下缺陷:图卷积网络可以用于图结构数据的半监督分类和深度特征表示,但现有的图卷积网络在学习和表示过程中普遍没有考虑到局部不变性约束。这种局部不变性约束为两个数据点的特征分布相似,那么它们的标签预测也应该彼此接近。这样严重降低了数据分类的鲁棒性。
本发明实施例中,提供了一种考虑局部不变性约束的图卷积文献分类方法及系统。该方案利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,为每个节点找出特征分布最相似的相邻节点,并通过改进图卷积网络的损失函数,使特征最相似的邻近节点的输出尽可能有相同标签预测。
根据本发明实施例第一方面,提供一种考虑局部不变性约束的图卷积文献分类方法。
图1是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法的流程图。
如图1所示,在一个或多个实施例中,优选地,所述的一种考虑局部不变性约束的图卷积文献分类方法包括:
S101、获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集;
S102、输入所述特征矩阵和所述邻接矩阵,根据两层的GCN模型生成所述标签预测;
S103、获取所有的图节点的所述特征矩阵和所述邻接矩阵,生成图半监督学习损失;
S104、更新训练参数值,获得图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为目标分类参数;
S105、获取所述目标分类参数,进行反向推演和随机梯度下降学习,构建半监督分类目标模型。
其中,(Graph Convolutional Network,GCN)是指图卷积网络模型,为图论中的用顶点和边建立相应关系的拓扑图进行分析的模型。
在本发明实施例中,针对于文献分类,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,进而提供了一个整体的基于局部不变图卷积神经网络的半监督节点分类方式。该方式通过同时对标记节点和未标记节点进行学习,并仅使用标记节点的真实标签信息进行学习,是一种半监督分类方法。此外,该方法基于已有的GCN模型在半监督节点分类中并没有考虑局部的不变性约束,通过改进损失函数,在GCN模型中引入了一种局部不变性约束。最终,解决了原始CNN的卷积运算不适用于处理非欧几里德结构数据的图结构数据的问题,所提出的改进图卷积网络算法能够同时对图结构和节点特征进行编码,并能保持局部不变性约束,从而提高数据表示的鲁棒性。
图2是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法中的获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集的流程图。
如图2所示,在一个或多个实施例中,优选地,所述获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集,具体包括:
S201、所述获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为所述图结构数据;
S202、读取所述图结构数据中的所述邻接矩阵、所述特征矩阵和真实标签矩阵,其中,所述特征矩阵包括所有的标记节点特征和所有的未标记节点特征;
S203、根据所述邻接矩阵获得所述图结构数据中每个图节点对应的所有的相邻节点;
S204、利用第一计算公式计算每个所述图节点对其所有相邻节点的特征距离;
S205、确定每个图节点的特征距离最小的邻接节点,并保存为特征最相似邻节点,加入到所述最近邻接数据集;
所述第一计算公式为:
其中,dij为第i图节点和第j图节点之间的特征距离,c为所有的图节点的特征维数,Xik为第i个图节点对应的第k维特征,Xjk为第j个图节点对应的第k维特征,k为1到c之间的整数。
具体的,在机器学习中衡量两个数据的特征相似性大小,一般通过计算它们的特征距离,特征距离越小,相似性越大,而特征距离越大,相似性则越小。因此,可以通过计算每个节点与其相邻节点的特征距离来找出特征分布最相似的邻节点。
在本发明实施例中,由于每个图节点都存在其特征距离最近的节点,因此可以通过数据处理先获得与各个图节点特征距离最小的点,也对应了相似性最大。因此,在进行图卷积操作之前,为每个节点找出特征分布最相似的相邻节点,并记录特征最相似的邻节点的编号。
图3是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法中的输入所述特征矩阵和所述邻接矩阵,根据两层的GCN模型生成所述标签预测的流程图。
如图3所示,在一个或多个实施例中,优选地,所述输入所述特征矩阵和所述邻接矩阵,根据两层的GCN模型生成所述标签预测,具体包括:
S301、获取所有的图节点的所述特征矩阵和所述邻接矩阵;
S302、利用第二计算公式生成所述标签预测;
所述第二计算公式为:
其中,X为输入特征矩阵,由所有的标记节点特征和所有的未标记节点特征组成,A~为一个规范化的邻接矩阵,Θ(0)和Θ(1)为可更新的参数矩阵,用于学习输入特征矩阵,ReLU为非线性激活函数,softmax为分类器,Z为生成的所述标签预测。
在本发明实施例中,针对所有的图节点的数据输入特征矩阵和邻接矩阵,进而利用了一个双层GCN模型进行数据的预测,最终生成的是标签预测。所述标签预测是进行后续的基于图的半监督学习的数据来源。
图4是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法中的获取所有的图节点的所述特征矩阵和所述邻接矩阵,生成图半监督学习损失的流程图。
如图4所示,在一个或多个实施例中,优选地,所述获取所有的图节点的所述特征矩阵和所述邻接矩阵,生成图半监督学习损失,具体包括:
S401、获取所有的图节点的所述特征矩阵和所述邻接矩阵;
S402、根据所述标签预测利用第三计算公式计算获得标准的监督损失;
S403、根据第四计算公式图拉普拉斯正则化;
S404、根据所述图拉普拉斯正则化和所述标准的监督损失利用第五计算公式获得所述图半监督学习损失;
所述第三计算公式为:
其中,Llabel为所述标准的监督损失,l为损失函数,L为标记节点编号的集合,f为图数据类别个数,f(Xi)为节点i的标签预测,Yi为节点i的真实标签;
所述第四计算公式为:
其中,Lreg为所述图拉普拉斯正则化,Xi为节点i特征向量,Yi为节点i的真实标签,E为图边的集合,aij为节点i和节点j之间的关系,f(Xi)为节点i的标签预测,f(Xj)为节点j的标签预测;
所述第五计算公式为:
L=Llabel+λLreg
其中,L为所述图半监督学习损失,Llabel为标准的监督损失,Lreg为所述图拉普拉斯正则化,λ为正则化系数。
在本发明实施例中,在获取所有的图节点的所述特征矩阵和所述邻接矩阵的基础上进行了标准监督损失的计算,其中,监督损失是指标记节点的预测值与真实值的误差,可由交叉熵损失函数来计算,但标准的监督损失并未最终的损失,进一步还叠加了半监督学习损失函数,形成了图半监督学习损失函数。
图5是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法中的更新训练参数值,获得图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为目标分类参数的流程图。
如图5所示,在一个或多个实施例中,优选地,所述更新训练参数值,获得图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为目标分类参数,具体包括:
S501、更新训练参数值,利用所述第二计算公式进行迭代获得训练标签预测;
S502、根据所述训练标签预测根据第六计算公式和第七计算公式获得监督损失和无监督损失;
S503、根据所述监督损失和所述无监督损失利用第八计算公式获得所述图卷积网络损失;
S504、当出现参数训练的终止标记时,获得所述图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为所述目标分类参数;
所述第六计算公式:
其中,Llabel1为所述监督损失,Y为真实标签矩阵,L为标记节点编号的集合,f为图数据类别个数,Z为图卷积操作生成的所述标签预测;
所述第七计算公式为:
所述第八计算公式为:
L1=Llabel1+λLreg1
其中,L1为所述图卷积网络损失,Llabel1为所述监督损失,Lreg1为所述无监督损失,λ为正则化系数。
在本发明实施例中,训练过程中,可以通过更新公式第二计算公式中的训练参数来减小损失,随着训练次数的增加,目标损失会逐渐减少,每个节点与其特征分布最接近的邻节点的标签预测也会越接近,这就是一种局部不变性约束。如果两个相邻节点的真实特征分布相似,那么对应的标签预测应该相互接近。基于局部不变性的图卷积神经网络,在训练过程中,仍然保持着真实特征分布关系的制约。该方案主要通过改进损失函数以优化参数更新,从而提高图卷积网络的分类精度。
图6是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类方法中的获取所述目标分类参数,进行反向推演和随机梯度下降学习,构建半监督分类目标模型的流程图。
如图6所示,在一个或多个实施例中,优选地,所述获取所述目标分类参数,进行反向推演和随机梯度下降学习,构建半监督分类目标模型,具体包括:
S601、获取所述目标分类参数,获得对应的训练网络模型;
S602、根据所述训练网络模型进行网络超参数设置;
S603、进行反向推演和随机梯度下降学习,生成权重参数和正则化系数;
S604、根据权重参数和正则化系数构建半监督分类目标模型。
在本发明实施例中,通过所述目标分类参数获得对应训练网络模型,进而进行半监督节点分类。在设置网络超参数,训练网络模型的基础上,进一步,计算得到的损失进行反向传播和随机梯度下降学习网络的权重参数以及正则化系数,进而对于给定数据,用训练好的模型预测未知的样本类别,实现半监督分类。
在一个或多个实施例中,优选地,所述参数训练的终止标记包括数量标记和裕度标记;
所述裕度标记为当验证损失连续预设个周期没有减少超过预设降低幅度,则停止模型的训练;
所述数量标记为当参数训练此时达到预设次数时,则停止模型的训练。
在本发明实施例中,为了验证数学模型的可靠性,需要保证参数训练有固定的终止方式,因此提供了除了固定此时的参数训练和验证的终止标记之外的裕度标记。保证在不产生数据变更的训练中可以快速的终止训练。
在本发明实施例中,举例说明,本发明可以选择使用Cora、Citeseer和Pumed三个文献引用数据集进行算法有效性验证,与已有的一些算法进行实验对比。训练集/验证集/测试集使用的是标准的固定分割,为每个类别选取20个节点作为训练节点,使用500个节点进行验证,并使用1000个节点进行测试。以Cora、Citeseer和Pubmed三个文献引用数据集进行实验,数据集的具体信息如表1所示。
表1数据集具体信息
数据集 | 类别数 | 特征维数 | 节点总数 | 边数 | 标签率 | 训练节点数 |
Cora | 7 | 1433 | 2708 | 5429 | 0.052 | 140 |
Citeseer | 6 | 3703 | 3327 | 4732 | 0.036 | 120 |
Pubmed | 3 | 500 | 19717 | 44338 | 0.003 | 60 |
其中,每篇文献都表示一个节点,文献中的关键词作为节点特征,文献之间的引用关系作为图的边,标签率为训练节点数与节点总数的比值。
采用如下参数设置方式:所述考虑局部不变性约束的图卷积文献分类方法的网络层数设置为2,使用Adam优化器进行训练,Cora,Citeseer和Pubmed的初始学习率都设置为0.01,最大训练次数为200,权重衰减为0.0005。为避免过度拟合,使用dropout=0.5的正则化。同时,如果验证损失连续10个周期没有减少,就提前终止训练。Cora,Citeseer和Pubmed的正则化系数λ,λ分别设置为0.2,0.001,0.02。算法测试结果对比表如表2所示。
表2算法测试结果对比表
其中,MLP为多层感知器,SemiEmb为半监督嵌入,ManiReg为流形正则化,LP为标签传播,DeepWalk为截断随机游走学习;
从表2可以看出,本发明提供的方法的分类精度在所有数据集上均达到了最好,实验对比进一步证明了所提供的考虑局部不变性约束的图卷积文献分类方法的科学性和精确性。
根据本发明实施例第二方面,提供一种考虑局部不变性约束的图卷积文献分类系统。图7是本发明一个实施例的一种考虑局部不变性约束的图卷积文献分类系统的结构图。
在一个或多个实施例中,优选地,所述的一种考虑局部不变性约束的图卷积文献分类系统包括:
相似邻节点获取子系统701,用于获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集;
标签预测子系统702,用于输入所述特征矩阵和所述邻接矩阵,根据两层的GCN模型生成所述标签预测;
其中,(Graph Convolutional Network,GCN)是指图卷积网络模型,为图论中的用顶点和边建立相应关系的拓扑图进行分析的模型。
损失函数运算子系统703,用于获取所有的图节点的所述特征矩阵和所述邻接矩阵,生成图半监督学习损失;
目标分类参数生成子系统704,用于更新训练参数值,获得图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为目标分类参数;
半监督分类目标模型生成子系统705,用于获取所述目标分类参数,进行反向推演和随机梯度下降学习,构建半监督分类目标模型。
本发明实施例中,提供了一种考虑局部不变性约束的图卷积文献分类系统,该系统至少包括了五个部分,分别为:相似邻节点获取子系统、标签预测子系统、损失函数运算子系统、目标分类参数生成子系统、半监督分类目标模型生成子系统,几个部分之间通过传递图节点的特征参数,完成了基于半监督数据的分类训练,生成了半监督分类模型的生成,由于该模型能够同时对图结构和节点特征进行编码,同时也能保持局部不变性约束,从而提高数据表示的鲁棒性。
根据本发明实施例第三方面,提供一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如本发明实施例第一方面中任一项所述的方法。
根据本发明实施例第四方面,提供一种电子设备。图8是本发明一个实施例中一种电子设备的结构图。图8所示的电子设备为通用型图卷积文献分类装置,其包括通用的计算机硬件结构,其至少包括处理器801和存储器802。处理器801和存储器802通过总线803连接。存储器802适于存储处理器801可执行的指令或程序。处理器801可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器801通过执行存储器802所存储的指令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其它装置的控制。总线803将上述多个组件连接在一起,同时将上述组件连接到显示控制器804和显示装置以及输入/输出(I/O)装置805。输入/输出(I/O)装置805可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出装置805通过输入/输出(I/O)控制器806与系统相连。
本发明的实施例提供的技术方案可以包括以下有益效果:
1)该方法基于已有的图卷积网络的文献分类方法在半监督节点分类中并没有考虑局部的不变性约束,通过改进损失函数,在图卷积网络中引入了一种局部不变性约束,解决了原始图卷积网络的卷积运算不适用于处理非欧几里德结构数据的图结构数据的文献集的问题。
2)该方案通过同时对标记节点和未标记节点进行学习,在文献分类的训练阶段仅使用标记节点的真实标签信息进行学习,仅使用标记节点的真实标签信息进行学习,并且可以优化参数更新,提升模型的学习的能力,相比先前的图卷积网络模型,改进后的算法在半监督节点分类任务中,文献分类的准确性有所提升。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种考虑局部不变性约束的图卷积文献分类方法,其特征在于,包括:
获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集;
输入所述特征矩阵和所述邻接矩阵,根据两层的GCN模型生成所述标签预测;
获取所有的图节点的所述特征矩阵和所述邻接矩阵,生成图半监督学习损失;
更新训练参数值,获得图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为目标分类参数;
获取所述目标分类参数,进行反向推演和随机梯度下降学习,构建半监督分类目标模型。
2.如权利要求1所述的一种考虑局部不变性约束的图卷积文献分类方法,其特征在于,所述获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集,具体包括:
所述获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为所述图结构数据;
读取所述图结构数据中的所述邻接矩阵、所述特征矩阵和真实标签矩阵,其中,所述特征矩阵包括所有的标记节点特征和所有的未标记节点特征;
根据所述邻接矩阵获得所述图结构数据中每个图节点对应的所有的相邻节点;
利用第一计算公式计算每个所述图节点对其所有相邻节点的特征距离;
确定每个图节点的特征距离最小的邻接节点,并保存为特征最相似邻节点,加入到所述最近邻接数据集;
所述第一计算公式为:
其中,dij为第i图节点和第j图节点之间的特征距离,c为所有的图节点的特征维数,Xik为第i个图节点对应的第k维特征,Xjk为第j个图节点对应的第k维特征,k为1到c之间的整数。
4.如权利要求1所述的一种考虑局部不变性约束的图卷积文献分类方法,其特征在于,所述获取所有的图节点的所述特征矩阵和所述邻接矩阵,生成图半监督学习损失,具体包括:
获取所有的图节点的所述特征矩阵和所述邻接矩阵;
根据所述标签预测利用第三计算公式计算获得标准的监督损失;
根据第四计算公式图拉普拉斯正则化;
根据所述图拉普拉斯正则化和所述标准的监督损失利用第五计算公式获得所述图半监督学习损失;
所述第三计算公式为:
其中,Llabel为所述标准的监督损失,l为损失函数,L为标记节点编号的集合,f为图数据类别个数,f(Xi)为节点i的标签预测,Yi为节点i的真实标签;
所述第四计算公式为:
其中,Lreg为所述图拉普拉斯正则化,Xi为节点i特征向量,Yi为节点i的真实标签,E为图边的集合,aij为节点i和节点j之间的关系,f(Xi)为节点i的标签预测,f(Xj)为节点j的标签预测;
所述第五计算公式为:
L=Llabel+λLreg
其中,L为所述图半监督学习损失,Llabel为标准的监督损失,Lreg为所述图拉普拉斯正则化,λ为正则化系数。
5.如权利要求3所述的一种考虑局部不变性约束的图卷积文献分类方法,其特征在于,所述更新训练参数值,获得图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为目标分类参数,具体包括:
更新训练参数值,利用所述第二计算公式进行迭代获得训练标签预测;
根据所述训练标签预测根据第六计算公式和第七计算公式获得监督损失和无监督损失;
根据所述监督损失和所述无监督损失利用第八计算公式获得所述图卷积网络损失;
当出现参数训练的终止标记时,获得所述图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为所述目标分类参数;
所述第六计算公式:
其中,Llabel1为所述监督损失,Y为真实标签矩阵,L为标记节点编号的集合,f为图数据类别个数,Z为图卷积操作生成的所述标签预测;
所述第七计算公式为:
所述第八计算公式为:
L1=Llabel1+λLreg1
其中,L 1为所述图卷积网络损失,Llabel1为所述监督损失,Lreg1为所述无监督损失,λ为正则化系数。
6.如权利要求1所述的一种考虑局部不变性约束的图卷积文献分类方法,其特征在于,所述获取所述目标分类参数,进行反向推演和随机梯度下降学习,构建半监督分类目标模型,具体包括:
获取所述目标分类参数,获得对应的训练网络模型;
根据所述训练网络模型进行网络超参数设置;
进行反向推演和随机梯度下降学习,生成权重参数和正则化系数;
根据权重参数和正则化系数构建半监督分类目标模型。
7.如权利要求5所述的一种考虑局部不变性约束的图卷积文献分类方法,其特征在于,所述参数训练的终止标记包括数量标记和裕度标记;
所述裕度标记为当验证损失连续预设个周期没有减少超过预设降低幅度,则停止模型的训练;
所述数量标记为当参数训练此时达到预设次数时,则停止模型的训练。
8.一种考虑局部不变性约束的图卷积文献分类系统,其特征在于,该系统包括:
相似邻节点获取子系统,用于获取文献引用数据集,利用节点表示文档,利用边表示引用连接,将所述文献引用数据集输入为图结构数据,生成邻接矩阵和特征矩阵,并获得每个图节点的特征最相似邻节点,加入到最近邻接数据集;
标签预测子系统,用于输入所述特征矩阵和所述邻接矩阵,根据两层的GCN模型生成所述标签预测;
损失函数运算子系统,用于获取所有的图节点的所述特征矩阵和所述邻接矩阵,生成图半监督学习损失;
目标分类参数生成子系统,用于更新训练参数值,获得图卷积网络损失的最小值,并将所述图卷积网络损失的最小值对应的训练参数值保存为目标分类参数;
半监督分类目标模型生成子系统,用于获取所述目标分类参数,进行反向推演和随机梯度下降学习,构建半监督分类目标模型。
9.一种计算机可读存储介质,其上存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现如权利要求1-7中任一项所述的方法。
10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-7任一项所述的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110206857.9A CN112925909B (zh) | 2021-02-24 | 2021-02-24 | 一种考虑局部不变性约束的图卷积文献分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110206857.9A CN112925909B (zh) | 2021-02-24 | 2021-02-24 | 一种考虑局部不变性约束的图卷积文献分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112925909A true CN112925909A (zh) | 2021-06-08 |
CN112925909B CN112925909B (zh) | 2023-04-07 |
Family
ID=76171581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110206857.9A Active CN112925909B (zh) | 2021-02-24 | 2021-02-24 | 一种考虑局部不变性约束的图卷积文献分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112925909B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705772A (zh) * | 2021-07-21 | 2021-11-26 | 浪潮(北京)电子信息产业有限公司 | 一种模型训练方法、装置、设备及可读存储介质 |
CN113762625A (zh) * | 2021-09-09 | 2021-12-07 | 国网山东省电力公司经济技术研究院 | 一种基于图卷积网络的配电网状态评估方法和系统 |
CN116127386A (zh) * | 2023-04-19 | 2023-05-16 | 浪潮电子信息产业股份有限公司 | 一种样本分类方法、装置、设备和计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492691A (zh) * | 2018-11-07 | 2019-03-19 | 南京信息工程大学 | 一种超图卷积网络模型及其半监督分类方法 |
US20190251480A1 (en) * | 2018-02-09 | 2019-08-15 | NEC Laboratories Europe GmbH | Method and system for learning of classifier-independent node representations which carry class label information |
CN111476261A (zh) * | 2019-12-16 | 2020-07-31 | 天津工业大学 | 一种社区增强的图卷积神经网络方法 |
US20200285944A1 (en) * | 2019-03-08 | 2020-09-10 | Adobe Inc. | Graph convolutional networks with motif-based attention |
US20200356858A1 (en) * | 2019-05-10 | 2020-11-12 | Royal Bank Of Canada | System and method for machine learning architecture with privacy-preserving node embeddings |
-
2021
- 2021-02-24 CN CN202110206857.9A patent/CN112925909B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190251480A1 (en) * | 2018-02-09 | 2019-08-15 | NEC Laboratories Europe GmbH | Method and system for learning of classifier-independent node representations which carry class label information |
CN109492691A (zh) * | 2018-11-07 | 2019-03-19 | 南京信息工程大学 | 一种超图卷积网络模型及其半监督分类方法 |
US20200285944A1 (en) * | 2019-03-08 | 2020-09-10 | Adobe Inc. | Graph convolutional networks with motif-based attention |
US20200356858A1 (en) * | 2019-05-10 | 2020-11-12 | Royal Bank Of Canada | System and method for machine learning architecture with privacy-preserving node embeddings |
CN111476261A (zh) * | 2019-12-16 | 2020-07-31 | 天津工业大学 | 一种社区增强的图卷积神经网络方法 |
Non-Patent Citations (2)
Title |
---|
XIANG GAO, ET AL.: "Exploring Structure-Adaptive Graph Learning for Robust Semi-Supervised Classification", 《ARXIV》 * |
郑睿刚 等: "图卷积算法的研究进展", 《中山大学学报(自然科学版)》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705772A (zh) * | 2021-07-21 | 2021-11-26 | 浪潮(北京)电子信息产业有限公司 | 一种模型训练方法、装置、设备及可读存储介质 |
WO2023000574A1 (zh) * | 2021-07-21 | 2023-01-26 | 浪潮(北京)电子信息产业有限公司 | 一种模型训练方法、装置、设备及可读存储介质 |
CN113762625A (zh) * | 2021-09-09 | 2021-12-07 | 国网山东省电力公司经济技术研究院 | 一种基于图卷积网络的配电网状态评估方法和系统 |
CN116127386A (zh) * | 2023-04-19 | 2023-05-16 | 浪潮电子信息产业股份有限公司 | 一种样本分类方法、装置、设备和计算机可读存储介质 |
CN116127386B (zh) * | 2023-04-19 | 2023-08-08 | 浪潮电子信息产业股份有限公司 | 一种样本分类方法、装置、设备和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112925909B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112925909B (zh) | 一种考虑局部不变性约束的图卷积文献分类方法及系统 | |
US11086292B2 (en) | Methods and apparatus for machine learning predictions of manufacturing processes | |
CN109657805B (zh) | 超参数确定方法、装置、电子设备及计算机可读介质 | |
US11650968B2 (en) | Systems and methods for predictive early stopping in neural network training | |
US20240346317A1 (en) | Neural network method and apparatus | |
CN112966114B (zh) | 基于对称图卷积神经网络的文献分类方法和装置 | |
CN111768285A (zh) | 信贷风控模型构建系统、方法、风控系统及存储介质 | |
Yu et al. | Control chart recognition based on the parallel model of CNN and LSTM with GA optimization | |
Chew et al. | Large-scale 3D point-cloud semantic segmentation of urban and rural scenes using data volume decomposition coupled with pipeline parallelism | |
CN115812210A (zh) | 用于增强机器学习分类任务的性能的方法和设备 | |
CN118152901B (zh) | 基于数据驱动的设备故障预测方法及系统 | |
Sharma et al. | A semi-supervised generalized vae framework for abnormality detection using one-class classification | |
CN116340726A (zh) | 一种能源经济大数据清洗方法、系统、设备及存储介质 | |
CN116452333A (zh) | 异常交易检测模型的构建方法、异常交易检测方法及装置 | |
Thorne et al. | Topological approximate Bayesian computation for parameter inference of an angiogenesis model | |
CN113656707A (zh) | 一种理财产品推荐方法、系统、存储介质及设备 | |
Kuleshov et al. | Adaptive models of complex systems based on data handling | |
CN115952438B (zh) | 社交平台用户属性预测方法、系统、移动设备及存储介质 | |
Chen et al. | An airfoil mesh quality criterion using deep neural networks | |
CN115687882A (zh) | 一种输电断面极限传输容量概率分布估计方法及装置 | |
CN115116549A (zh) | 细胞数据注释方法、装置、设备及介质 | |
CN112836763A (zh) | 一种图结构数据分类方法及装置 | |
CN118569738B (zh) | 一种工程质量审核方法、系统及存储介质 | |
CN112906301B (zh) | 金融交易的可信欺诈检测方法、系统、介质及终端 | |
Nobari et al. | Conformal predictions enhanced expert-guided meshing with graph neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |