CN113378913B - 一种基于自监督学习的半监督节点分类方法 - Google Patents
一种基于自监督学习的半监督节点分类方法 Download PDFInfo
- Publication number
- CN113378913B CN113378913B CN202110637743.XA CN202110637743A CN113378913B CN 113378913 B CN113378913 B CN 113378913B CN 202110637743 A CN202110637743 A CN 202110637743A CN 113378913 B CN113378913 B CN 113378913B
- Authority
- CN
- China
- Prior art keywords
- graph
- node
- supervised
- semi
- self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000013145 classification model Methods 0.000 claims abstract description 19
- 238000013528 artificial neural network Methods 0.000 claims abstract description 15
- 230000007246 mechanism Effects 0.000 claims abstract description 10
- 230000014509 gene expression Effects 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 10
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000007635 classification algorithm Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于自监督学习的半监督节点分类方法,包括以下步骤:S1、构建半监督分类数据集;S2、根据半监督分类数据依次构建拓扑图和特征图;S3、构建半监督节点分类模型,并基于拓扑图和特征图对其进行自监督训练,获得半监督节点分类结果。本发明从拓扑图和特征图的角度描述图数据,在图卷积神经网络框架中引入自监督学习模块融合节点特征和图拓扑结构的信息,在半监督节点分类任务上获得了更好的性能;本发明具备更高的计算效率,和基于注意力机制的方法相比需要更少的训练时间、对显卡等硬件设备要求更低,能够节省计算的资源。
Description
技术领域
本发明属于数据信息处理技术领域,具体涉及一种基于自监督学习的半监督节点分类方法。
背景技术
在实际生活生产中,无标签的数据往往好获得,而有标签的数据难以获得,此外为标签数据打上标签需要耗费大量的人力物力,在这种情况下半监督学习(Semi-supervisedLearning)更加适用于现实世界的应用。半监督学习将大量无标签数据和少部分有标签数据一起加入到模型中进行训练,从而提升模型性能。近年来,图学习已然成为人工智能领域的研究热点,图上的基于半监督学习的节点分类算法则使用少量有标签节点和大量无标签节点一起训练模型,最终赋予图上所有节点分类结果(标签),图上的半监督节点分类在实际生活中有着广泛的应用,比如可以在社交网络中对所有用户进行分类。
近年来,卷积神经网络因为其强大的建模能力引起了广泛的关注,在图像识别和自然语言处理等领域有着广泛的应用。然而传统的卷积神经网络只能处理欧氏空间的数据,但在现实生活中的很多场景,如交通运输网络、社交网络、引用网络等,都是以图数据的形式存在。图卷积神经网络(Graph Convolutional network,GCN)提供了为图数据建模的方法,图卷积神经网络定义了一种聚合方法,聚合了中心节点和对应的邻居节点,从而实现了节点属性沿图拓扑结构的传播,GCN的结构如图1所示;图卷积神经网络存在的主要缺点在于过于强调节点之间在图和拓扑结构上的关联,忽视了节点属性之间的联系。例如,在一个引用网络中,假设每个节点代表一篇文献,如果两个的文献包含相同的作者则两个对应的节点之间建立一条边。如果按照图卷积神经网络的方法学习这个图,则会忽视两种情况:1)两篇文献虽然同属于一个作者,但是文献的研究内容有很大的差异;2)两篇文献研究内容很相关,但是由不同作者完成。上述缺陷很可能导致模型学习到错误的模式,进而影响分类的结果。
针对图卷积神经网络的缺陷,图注意力网络(Graph Attention Network,GAT)提出了新的信息聚合方式。图注意力网络引入了注意力机制,通过计算相邻节点属性之间的相似度,赋予连接节点的边一个权重。不同边上的权重代表了不同邻居节点相对中心节点的重要性。因此,图注意力网络在进行信息聚合时可以更好的考虑到节点之间属性上的关联。GAT的结构如实例2所示。基于图注意力网络的半监督节点分类算法的主要缺陷在于计算开销较大。该方案需要为整个图上的每一条边都计算权重,对于规模较大、节点和边比较多的图,这个步骤会消耗较多计算资源。
为了进一步融合图节点属性和图拓扑结构之间的信息,可适应的多通道图卷积神经网络(Adaptive Multi-channel Graph ConvolutionalNetworks,AMGCN)分别抽取节点特征和图拓扑结构上的表达,并使用注意力机制融合得到最终的节点表达。AMGCN的结构如示例3所示。和GAT相似,AMGCN引入了注意力机制,在较大规模的图上容易产生较大的计算开销。
发明内容
针对现有技术中的上述不足,本发明提供的基于自监督学习的半监督节点分类方法解决了现有的节点分类方法中难以融合节点属性和图拓扑信息,且计算效率低下的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于自监督学习的半监督节点分类方法,包括以下步骤:
S1、构建半监督分类数据集;
其中,所述半监督分类数据集包括引用网络和社交网络数据集;
S2、根据半监督分类数据依次构建拓扑图和特征图;
S3、构建半监督节点分类模型,并基于拓扑图和特征图对其进行自监督训练,获得半监督节点分类结果。
进一步地,所述步骤S2具体为:
S21、确定半监督分类数据的拓扑图Gt={At,X};
S22、基于拓扑图Gt={At,X}中共享的节点属性构建初步特征图;
S22、计算初步特征图中各个节点之间的相似度,并选取K个最相似的节点构建边形式的用于描述节点特征之间联系的特征图Gf={X,Af}。
进一步地,所述步骤S3中,对构建的半监督节点分类模型进行自监督训练包括依次进行利用图卷积神经网络分别抽取节点在拓扑图和特征图上的表达、利用基于聚类思路的自监督机制确定相同节点在节点属性空间的表达和图拓扑结构空间的表达一致性、计算各个节点上的自监督损失、计算有标签节点上的交叉熵损失、半监督节点分类模型的总损失和通过反向传播的方法优化模型参数。
进一步地,所述步骤S3中,利用图卷积神经网络分别抽取节点在拓扑图和特征图上的表达时,对于输入图G,图卷积神经网络的第l+1层的输出H(l+1)为:
式中,D为输入图G对应的度矩阵,A是输入图G对应的邻近矩阵,ReL U(·)为ReLU激活函数;
将拓扑图Gt={At,X}和特征图Gf={X,Af}分别输入到图卷积神经网络中,训练学习到对应的节点表达Xt={xt1,xt2,...,xtN}和Xf={xf1,xf2,...,xfN},其中,xti和xfi分别指节点i在拓扑图和特征图中的表达。
进一步地,所述步骤S3中,计算自监督损失的方法具体为:
A1、分别计算拓扑图和特征图的聚类分配概率;
A2、分别计算拓扑图和特征图的聚类目标概率;
A3、根据聚类分配概率和聚类目标概率,计算自监督损失。
进一步地,所述步骤A1中,计算聚类分配概率时,在半监督节点分类模型训练开始前随机初始化一个线性层C用于存储B个原型的向量B={c1,c2,...,cB},将节点i在拓扑图和特征图中的表达xti和xfi分别输入到C,得到对应的各类打分和/>
式中,上标T为转置运算符;
基于和/>计算得到节点i在拓扑图中分配到各个原型的概率/>和在特征图中分配到各个原型的概率/>
其中,节点i在拓扑图和特征图上被聚类分配到第j个原型上的概率和/>分别为:
所述步骤A2中,使用Sinkhorn算法计算和/>的聚类目标概率qi (t)和qi (f)分别为:
qi (t)=sinkhorn(zi (t))
qi (f)=sinkhorn(zi (f))
式中,sinkhorn(·)为sinkhorn函数;
所述步骤A3中,自监督损失Lss的计算公式为:
式中,N为图上包含节点数,τ为调和参数,l(·)为交叉熵损失函数。
进一步地,所述步骤S3中,使用有标签节点上的交叉熵损失预测节点分类Y′ij和真实分类Yij的差异;
其中,有标签节点上的交叉熵损失Lce的计算公式为:
式中,T为半监督分类数据集中有标签的节点的集合,B为半监督分类数据集中原型的数量。
进一步地,所述步骤S3中,半监督节点分类模型的总损失L为:
L=Lce+LSS
式中,Lce和LSS分别为自监督损失和有标签节点上的交叉熵损失。
本发明的有益效果是:
(1)本发明从拓扑图和特征图的角度描述图数据,在图卷积神经网络框架中引入自监督学习模块融合节点特征和图拓扑结构的信息,在半监督节点分类任务上获得了更好的性能;
(2)本发明具备更高的计算效率,和基于注意力机制的方法相比需要更少的训练时间、对显卡等硬件设备要求更低,能够节省计算的资源。
附图说明
图1为本发明背景技术中的图卷积神经网络结构示意图。
图2为本发明背景技术中的图注意力网络结构示意图。
图3为本发明背景技术中的可适应的多通道图卷积神经网络结构示意图。
图4为本发明提供的基于自监督学习的节点分类方法。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
实施例1:
对于本实施例中的半监督节点分类,其分类问题可以描述为:
给定图G={A,X},图中全体节点的集合为V;节点的数目为N;全体边的集合为E;根据节点之间是否有边,可以得到邻接矩阵A。在图上各个节点都会有一个自身的属性,所有节点的属性记作X。半监督节点分类指的是使用部分有标签信息的节点T和包含了无标签的节点信息的邻接矩阵A训练模型,最终给图中所有的节点分类,且假设图中共有B类节点。
基于此,本实施例提供了如图1所示的基于自监督学习的半监督节点分类方法,包括以下步骤:
S1、构建半监督分类数据集;
其中,所述半监督分类数据集包括引用网络和社交网络数据集,数据集中的每个节点代表一个论文,边代表论文之间的引用关系,每个节点的属性为对论文内容的描述,节点根据论文内容可以分为不同的类别。
S2、根据半监督分类数据依次构建拓扑图和特征图;
S3、构建半监督节点分类模型,并基于拓扑图和特征图对其进行自监督训练,获得半监督节点分类结果。
本实施例的步骤S2具体为:
S21、确定半监督分类数据的拓扑图Gt={At,X};
S22、基于拓扑图Gt={At,X}中共享的节点属性构建初步特征图;
S22、计算初步特征图中各个节点之间的相似度,并选取K个最相似的节点构建边形式的用于描述节点特征之间联系的特征图Gf={X,Af}。
其中,对于图中第i个节点,利用余弦相似度公式计算该属性xi与其他任意节点属性xj之间的相似度,其中,余弦相似度计算公式为:
在计算完第i个节点和其他节点属性的相似度之后,按照从高到低的顺序进行排序,从排序后的节点中选出前K个,依此和第i个节点建立边,进而得到用于描述节点特征之间联系的特征图Gf={X,Af}。
本实施例的步骤S3中,对构建的半监督节点分类模型进行自监督训练包括依次进行利用图卷积神经网络分别抽取节点在拓扑图和特征图上的表达、利用基于聚类思路的自监督机制确定相同节点在节点属性空间的表达和图拓扑结构空间的表达一致性、计算各个节点上的自监督损失、计算有标签节点上的交叉熵损失、半监督节点分类模型的总损失和通过反向传播的方法优化模型参数。
具体地,利用图卷积神经网络分别抽取节点在拓扑图和特征图上的表达时,对于输入图G,图卷积神经网络的第l+1层的输出H(l+1)为:
式中,D为输入图G对应的度矩阵,A是输入图G对应的邻近矩阵,ReL U(·)为ReLU激活函数;
将拓扑图Gt={At,X}和特征图Gf={X,Af}分别输入到图卷积神经网络中,训练学习到对应的节点表达Xt=(xt1,xt2,...,xtN和Xf={xf1,xf2,...,xfN},其中,xti和xfi分别指节点i在拓扑图和特征图中的表达。
计算自监督损失的方法具体为:
A1、分别计算拓扑图和特征图的聚类分配概率;
A2、分别计算拓扑图和特征图的聚类目标概率;
A3、根据聚类分配概率和聚类目标概率,计算自监督损失。
上述步骤A1中,计算聚类分配概率时,在半监督节点分类模型训练开始前随机初始化一个线性层C用于存储B个原型的向量B={c1,c2,...,cB},将节点i在拓扑图和特征图中的表达xti和xfi分别输入到C,得到对应的各类打分和/>
式中,上标T为转置运算符;
基于和/>计算得到节点i在拓扑图中分配到各个原型的概率/>和在特征图中分配到各个原型的概率/>
其中,节点i在拓扑图和特征图上被聚类分配到第j个原型上的概率和/>分别为:
所述步骤A2中,为了充分挖掘数据信息,实现自监督机制,需要为和/>设定一个聚类目标,本发明将寻找聚类目标问题转化为最优传输问题,使用Sinkhom算法计算和/>的聚类目标概率qi (t)和qi (f)分别为:
qi (t)=sinkhorn(zi (t))
qi (f)=sinkhorn(zi (f))
式中,sinkhorn(·)为sinkhorn函数;
上述步骤A3中,为了约束模型从拓扑图和特征图学习到一致的信息,本发明进一步定义了“交叉预测”问题,即某一个节点在拓扑图上的表达应该可以指向该节点在特征图上的分类结果,反之亦然,具体的,本发明假设为分类问题的“预测值”,/>为“真实值”,使用交叉熵函数来衡量“预测值”和“真实值”之间的差异,在第i个节点上,交叉预测问题的损失可以按如下方法计算:
在所有的节点上进行“交叉预测”,得到总的交叉预测损失,即自监督损失Lss为:
式中,N为图上包含节点数,τ为调和参数,一般取0.3,l(·)为交叉熵损失函数。
本实施例中,通过组合和/>得到节点i属于各个类的概率:
使用有标签节点上的交叉熵损失预测节点分类Y′ij和真实分类Yij的差异;
其中,有标签节点上的交叉熵损失Lce的计算公式为:
式中,T为半监督分类数据集中有标签的节点的集合,B为半监督分类数据集中原型的数量。
本实施例的步骤S3中,半监督节点分类模型的总损失L为:
L=Lce+LSS
式中,Lce和LSS分别为自监督损失和有标签节点上的交叉熵损失。
同时在训练过程中通过方向传播更新参数,优化模型。
最后,当模型训练得到收敛后,在测试集上测试模型性能,得到测试的准确率和F1值。
实施例2:
为了验证提出的基于自监督学习的节点分类算法的优越性,本发明在六个公开数据集上进行了半监督节点分类的实验。表1给出了数据集的详细描述。实验中使用准确率(Accuracy,ACC)和F1值(F1 Score,F1)来评估模型效果。在各个数据集中分别从每类节点中选择20/40/60个做训练集,另取1000个节点做测试集。本发明方法和DeepWalk、ChebNet、GCN、GAT、AMGCN进行了比较。为了保证公平,所有的方法均运行5次,并汇报平均的ACC和F1。
在表2中对比了本发明和其他方法的平均ACC和F1,其中L/C表示各类节点中带标签节点的数目。一般的,ACC和F1越高,表示模型的分类性能越好。为了验证算法的效率,在GeForce GTX 1080Ti 11G GPU的实验环境下分别训练本算法和AMGCN各5次,并汇报每次迭代所需要的平均时间(单位毫秒)。实验结果如表3所示,其中“*”表示训练中出现“显存不足”的错误。
从实验数据可以看出本发明有如下优点:
1)本发明可以有限融合图节点属性和图拓扑结构的信息,相比DeepWalk、GCN等传统方法在半监督节点分类任务上有着非常明显的提升,对比较新的AMGCN算法亦在各数据集上的ACC和F1上取得了2.74%和2.94%的平均提升。
2)本发明具备更好的效率,相比基于注意力机制的AMGCN算法,在训练的过程中需要更少的时间。
表1.图数据集描述
表2.本发明和其他方法的对比
表3.本发明和AMGCN的训练时间(ms)对比
Claims (3)
1.一种基于自监督学习的半监督节点分类方法,其特征在于,包括以下步骤:
S1、构建半监督分类数据集;
其中,所述半监督分类数据集包括引用网络和社交网络数据集,数据集中的每个节点代表一个论文,边代表论文之间的引用关系,每个节点的属性为对论文内容的描述,节点根据论文内容可以分为不同的类别;
S2、根据半监督分类数据依次构建拓扑图和特征图;
S3、构建半监督节点分类模型,并基于拓扑图和特征图对其进行自监督训练,获得半监督节点分类结果;
所述步骤S2具体为:
S21、确定半监督分类数据的拓扑图Gt={At,X};
S22、基于拓扑图Gt={At,X}中共享的节点属性构建初步特征图;
S22、计算初步特征图中各个节点之间的相似度,并选取K个最相似的节点构建边形式的用于描述节点特征之间联系的特征图Gf={X,Af};
所述步骤S3中,对构建的半监督节点分类模型进行自监督训练包括依次进行利用图卷积神经网络分别抽取节点在拓扑图和特征图上的表达、利用基于聚类思路的自监督机制确定相同节点在节点属性空间的表达和图拓扑结构空间的表达一致性、计算各个节点上的上的自监督损失、计算有标签节点上的交叉熵损失、半监督节点分类模型的总损失和通过反向传播的方法优化模型参数;
所述步骤S3中,计算自监督损失的方法具体为:
A1、分别计算拓扑图和特征图的聚类分配概率;
A2、分别计算拓扑图和特征图的聚类目标概率;
A3、根据聚类分配概率和聚类目标概率,计算自监督损失;
所述步骤A1中,计算聚类分配概率时,在半监督节点分类模型训练开始前随机初始化一个线性层C用于存储B个原型的向量B={c1,c2,...,cB},将节点i在拓扑图和特征图中的表达xti和xfi分别输入到C,得到对应的各类打分和/>
式中,上标T为转置运算符;
基于和/>计算得到节点i在拓扑图中分配到各个原型的概率/>和在特征图中分配到各个原型的概率/>
其中,节点i在拓扑图和特征图上被聚类分配到第j个原型上的概率和/>分别为:
所述步骤A2中,使用Sinkhom算法计算和/>的聚类目标概率qi (t)和qi (f)分别为:
qi (t)=sinkhorn(zi (t))
qi (f)=sinkhorn(zi (f))
式中,sinkhorn(·)为sinkhorn函数;
所述步骤A3中,自监督损失Lss的计算公式为:
式中,N为图上包含节点数,τ为调和参数,l(·)为交叉熵损失函数;
所述步骤S3中,利用图卷积神经网络分别抽取节点在拓扑图和特征图上的表达时,对于输入图G,图卷积神经网络的第l+1层的输出H(l+1)为:
式中,D为输入图G对应的度矩阵,A是输入图G对应的邻近矩阵,ReLU(·)为ReLU激活函数;
将拓扑图Gt={At,X}和特征图Gf={X,Af}分别输入到图卷积神经网络中,训练学习到对应的节点表达Xt={xt1,xt2,...,xtN}和Xf={xf1,xf2,...,xfN},其中,xti和xfi分别指节点i在拓扑图和特征图中的表达。
2.根据权利要求1所述的基于自监督学习的半监督节点分类方法,其特征在于,所述步骤S3中,使用有标签节点上的交叉熵损失预测节点分类Y′ij和真实分类Yij的差异;
其中,有标签节点上的交叉熵损失Lce的计算公式为:
式中,T为半监督分类数据集中有标签的节点的集合,B为半监督分类数据集中原型的数量。
3.根据权利要求1所述的基于自监督学习的半监督节点分类方法,其特征在于,所述步骤S3中,半监督节点分类模型的总损失L为:
L=Lce+LSS
式中,Lce和LSS分别为自监督损失和有标签节点上的交叉熵损失。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110637743.XA CN113378913B (zh) | 2021-06-08 | 2021-06-08 | 一种基于自监督学习的半监督节点分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110637743.XA CN113378913B (zh) | 2021-06-08 | 2021-06-08 | 一种基于自监督学习的半监督节点分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113378913A CN113378913A (zh) | 2021-09-10 |
CN113378913B true CN113378913B (zh) | 2023-10-31 |
Family
ID=77576449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110637743.XA Active CN113378913B (zh) | 2021-06-08 | 2021-06-08 | 一种基于自监督学习的半监督节点分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113378913B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113869424A (zh) * | 2021-09-29 | 2021-12-31 | 重庆理工大学 | 基于双通道图卷积网络的半监督节点分类方法 |
CN113988175B (zh) * | 2021-10-27 | 2024-06-11 | 支付宝(杭州)信息技术有限公司 | 聚类处理方法和装置 |
CN114169466B (zh) * | 2021-12-24 | 2023-07-07 | 马上消费金融股份有限公司 | 图数据处理、文章分类、流量预测方法、装置、设备及存储介质 |
CN114662748B (zh) * | 2022-03-07 | 2024-06-25 | 北京工业大学 | 一种基于图结构学习的多行为融合图神经网络学生成绩预测方法 |
CN114863234A (zh) * | 2022-04-29 | 2022-08-05 | 华侨大学 | 一种基于拓扑结构保持的图表示学习方法及系统 |
CN114781553B (zh) * | 2022-06-20 | 2023-04-07 | 浙江大学滨江研究院 | 一种基于并行多图卷积神经网络的无监督专利聚类方法 |
CN117557118B (zh) * | 2023-11-13 | 2024-08-06 | 国网江苏省电力有限公司镇江供电分公司 | 基于机器学习的ups系统供电拓扑图生成方法 |
CN117971356B (zh) * | 2024-03-29 | 2024-06-14 | 苏州元脑智能科技有限公司 | 基于半监督学习的异构加速方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492691A (zh) * | 2018-11-07 | 2019-03-19 | 南京信息工程大学 | 一种超图卷积网络模型及其半监督分类方法 |
CN110442800A (zh) * | 2019-07-22 | 2019-11-12 | 哈尔滨工程大学 | 一种融合节点属性和图结构的半监督社区发现方法 |
CN110889015A (zh) * | 2019-10-31 | 2020-03-17 | 天津工业大学 | 面向图数据的独立解耦卷积神经网络表征算法 |
CN110942091A (zh) * | 2019-11-15 | 2020-03-31 | 武汉理工大学 | 寻找可靠的异常数据中心的半监督少样本图像分类方法 |
CN111046907A (zh) * | 2019-11-02 | 2020-04-21 | 国网天津市电力公司 | 一种基于多头注意力机制的半监督卷积网络嵌入方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11544535B2 (en) * | 2019-03-08 | 2023-01-03 | Adobe Inc. | Graph convolutional networks with motif-based attention |
-
2021
- 2021-06-08 CN CN202110637743.XA patent/CN113378913B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492691A (zh) * | 2018-11-07 | 2019-03-19 | 南京信息工程大学 | 一种超图卷积网络模型及其半监督分类方法 |
CN110442800A (zh) * | 2019-07-22 | 2019-11-12 | 哈尔滨工程大学 | 一种融合节点属性和图结构的半监督社区发现方法 |
CN110889015A (zh) * | 2019-10-31 | 2020-03-17 | 天津工业大学 | 面向图数据的独立解耦卷积神经网络表征算法 |
CN111046907A (zh) * | 2019-11-02 | 2020-04-21 | 国网天津市电力公司 | 一种基于多头注意力机制的半监督卷积网络嵌入方法 |
CN110942091A (zh) * | 2019-11-15 | 2020-03-31 | 武汉理工大学 | 寻找可靠的异常数据中心的半监督少样本图像分类方法 |
Non-Patent Citations (5)
Title |
---|
Adaptive multi-channel graph convolutional networks;Wang X等;《Proceedings of the 26th ACM SIGKDD International conference on knowledge discovery & data mining》;1243-1253 * |
Self-weighted Multiple Kernel Learning for Graph-based Clustering and Semi-supervised Classification;Zhao Kang等;《Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence (IJCAI-18)》;2321-2318 * |
基于光滑表示的半监督分类算法;王省等;《计算机科学》;第48卷(第3期);124-129 * |
基于半监督图神经网络的短文本分类;张斌艳等;《山东大学学报(理学版)》;第56卷(第5期);57-65 * |
基于图卷积神经网络和注意力机制的短时交通流量预测;李志帅等;《交通工程》;第19卷(第4期);15-19,28 * |
Also Published As
Publication number | Publication date |
---|---|
CN113378913A (zh) | 2021-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113378913B (zh) | 一种基于自监督学习的半监督节点分类方法 | |
CN108388651B (zh) | 一种基于图核和卷积神经网络的文本分类方法 | |
CN112685504B (zh) | 一种面向生产过程的分布式迁移图学习方法 | |
CN108038492A (zh) | 一种基于深度学习的感性词向量及情感分类方法 | |
CN109753589A (zh) | 一种基于图卷积网络的图可视化方法 | |
CN103258210B (zh) | 一种基于字典学习的高清图像分类方法 | |
CN103116766A (zh) | 一种基于增量神经网络和子图编码的图像分类方法 | |
CN113554100B (zh) | 异构图注意力网络增强的Web服务分类方法 | |
WO2023155508A1 (zh) | 一种基于图卷积神经网络和知识库的论文相关性分析方法 | |
CN110598022B (zh) | 一种基于鲁棒深度哈希网络的图像检索系统与方法 | |
CN114565053A (zh) | 基于特征融合的深层异质图嵌入模型 | |
CN111859936A (zh) | 一种基于深度混合网络的面向跨域立案的法律文书专业管辖权识别方法 | |
CN116503676A (zh) | 一种基于知识蒸馏小样本增量学习的图片分类方法及系统 | |
CN112256870A (zh) | 基于自适应随机游走的属性网络表示学习方法 | |
CN114781611A (zh) | 自然语言处理方法、语言模型训练方法及其相关设备 | |
CN117992805B (zh) | 基于张量积图融合扩散的零样本跨模态检索方法、系统 | |
CN116010813A (zh) | 基于图神经网络融合标签节点影响度的社区检测方法 | |
Sun et al. | Network structure and transfer behaviors embedding via deep prediction model | |
CN114897085A (zh) | 一种基于封闭子图链路预测的聚类方法及计算机设备 | |
CN112668633B (zh) | 一种基于细粒度领域自适应的图迁移学习方法 | |
CN108198084A (zh) | 一种复杂网络重叠社区发现方法 | |
CN111126443A (zh) | 基于随机游走的网络表示学习方法 | |
CN102496027A (zh) | 基于约束自适应传递的半监督图像分类方法 | |
CN114997360A (zh) | 神经架构搜索算法的演化参数优化方法、系统及存储介质 | |
CN114596473A (zh) | 一种基于图神经网络分层损失函数的网络嵌入预训练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |