CN114357167A - 基于Bi-LSTM-GCN的多标签文本分类方法和系统 - Google Patents

基于Bi-LSTM-GCN的多标签文本分类方法和系统 Download PDF

Info

Publication number
CN114357167A
CN114357167A CN202111668305.6A CN202111668305A CN114357167A CN 114357167 A CN114357167 A CN 114357167A CN 202111668305 A CN202111668305 A CN 202111668305A CN 114357167 A CN114357167 A CN 114357167A
Authority
CN
China
Prior art keywords
label
acquiring
level features
word
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111668305.6A
Other languages
English (en)
Other versions
CN114357167B (zh
Inventor
余本功
宋宇婷
杨善林
张强
周开乐
张书文
谢星雨
罗贺
丁帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202111668305.6A priority Critical patent/CN114357167B/zh
Publication of CN114357167A publication Critical patent/CN114357167A/zh
Application granted granted Critical
Publication of CN114357167B publication Critical patent/CN114357167B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于Bi‑LSTM‑GCN的多标签文本分类方法、系统、存储介质和电子设备,涉及文本分类领域。本发明实施例分别利用Bi‑LSTM提取文本特征,综合考虑了不同粒度的信息;利用GCN提取标签隐层关系,并结合注意力的思想,捕获句子中对分类效果提高更有效的重要词汇;融合含有全局特征的句级特征用于标签预测;最终获得更加全面的特征信息从而提高多标签分类效果。

Description

基于Bi-LSTM-GCN的多标签文本分类方法和系统
技术领域
本发明涉及文本分类领域,具体涉及一种基于Bi-LSTM-GCN的多标签文本分类方法、系统、存储介质和电子设备。
背景技术
随着互联网技术的飞速发展以及网民的增多,各大网站、软件上出现了海量的数据,而这些数据大部分都是文本,如何从这些隐藏丰富信息的文本数据中获取潜在需求与有用内容,是当前一个严峻的挑战。因此针对此问题而提出的文本分类,其重要性日益提高。
传统的文本分类一般是针对单标签问题,每个数据只有一个标签,而且各个标签都是孤立的;但是在现实社会中出现的问题往往更加复杂,一个样本数据往往具有多样化的意义,仅仅靠一个标签并不能准确的表示出来。而多标签文本分类作为文本分类的重要一支,可以为每个样本数据分配最相关的两个或多个标签,更加全面的表示了数据的意义,可以更好的解决文本分类实用性的问题,例如在进行论文所属领域分类中,一篇论文可以既属于“管理”领域又属于“计算机”领域,同时还可能属于“教育”领域;在对舆论的分析中,人们的情感往往是复杂的,可能既有“愤怒”又含有“委屈”等多种不同情感,研究可以帮助引导舆论的正确走向。当前被广泛应用的神经网络如CNN、LSTM、GRU等深度学习算法不仅在图像分类,命名实体识别等领域应用广泛,而且在多标签分类中取得了不错的效果。
但是,现有的多标签分类方案未完全利用标签信息,分类效果有待进一步提高。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于Bi-LSTM-GCN的多标签文本分类方法、系统、存储介质和电子设备,解决了未完全利用标签信息的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
一种基于Bi-LSTM-GCN的多标签文本分类方法,包括Bi-LSTM模型和GCN模型,包括:
获取并预处理多标签文本和对应的标签类别集合;
将预处理后的多标签文本输入Bi-LSTM模型,获取词级特征和句级特征;
根据预处理后的标签类别集合,获取标签语义表示集合;以及获取各个标签类别两两之间的共现概率,确定共现矩阵;
将所述标签语义表示集合和共现矩阵输入GCN模型中,建立关于标签的无向图,获取各个标签类别之间的隐层关系信息;
根据所述词级特征和隐层关系信息,获取赋权后的词级特征;融合所述句级特征和赋权后的词级特征,获取所述多标签文本的预测分类结果。
优选的,所述预处理过程包括词嵌入处理。
优选的,所述获取标签语义表示集合,包括:
根据预处理后的标签类别集合,获取各个标签类别对应的单词数量;
向量化各个标签类别对应的所有单词和所述多标签文本至同一维度;
平均化向量化后的各个单词,获取单个标签类别的语义表示;
根据所述各个单个标签类别的语义表示,获取所述标签语义表示集合。
优选的,所述获取各个标签类别两两之间的共现概率,确定邻接矩阵,包括:
根据所述预处理后的标签类别集合中各个标签类别的出现概率,获取各个标签类别两两之间的共现概率;
根据各个所述共现概率,获取各个标签类别两两之间的共现关系;
根据各个所述共现关系,获取共现矩阵;
所述建立关于标签的无向图,包括:
采用预处理后的标签类别集合作为所述无向图的节点集合,采用所述标签语义表示集合作为所述无向图的对应节点的语义特征,采用邻接矩阵作为所述无向图的邻接矩阵。
优选的,所述获取各个标签类别之间的隐层关系信息,包括:
Figure BDA0003448899300000031
Figure BDA0003448899300000032
Figure BDA0003448899300000041
其中,A表示所述邻接矩阵,I表示单位矩阵,
Figure BDA0003448899300000042
Figure BDA0003448899300000043
表示无向图G的度矩阵,σ(·)是激活函数,W为权重参数矩阵,H(l)H(l+1)分别表示第l和l+1层的特征,
Figure BDA0003448899300000044
表示最后一层的特征,即隐层关系信息。
优选的,所述根据所述词级特征和隐层关系信息,参考注意力机制获取赋权后的词级特征,包括:
Y=softmax(H·XT)
Figure BDA0003448899300000045
其中,H表示隐层关系信息;XT表示各个词级特征的集合X的转置矩阵;Y表示权重矩阵;
Figure BDA0003448899300000046
表示各个词级特征的得分集合;
所述融合所述句级特征和赋权后的词级特征,获取所述多标签文本的预测分类结果,包括:
Figure BDA0003448899300000047
S=fc(hn)
Figure BDA0003448899300000048
其中,
Figure BDA0003448899300000049
fc表示Function函数;O表示融合信息;hn表示所述句级特征;
将所述融合信息O通过sigmoid函数返回不同的概率值,从而进行所述多标签文本的分类预测。
优选的,采用二元交叉熵函数作为损失函数。
一种基于Bi-LSTM-GCN的多标签文本分类系统,包括Bi-LSTM模型和GCN模型,包括:
预处理模块,用于获取并预处理多标签文本和对应的标签类别集合;
第一提取模块,用于将预处理后的多标签文本输入Bi-LSTM模型,获取词级特征和句级特征;
确定模块,用于根据预处理后的标签类别集合,获取标签语义表示集合;以及获取各个标签类别两两之间的共现概率,确定共现矩阵;
第二提取模块,用于将所述标签语义表示集合和共现矩阵输入GCN模型中,建立关于标签的无向图,获取各个标签类别之间的隐层关系信息;
预测模块,用于根据所述词级特征和隐层关系信息,获取赋权后的词级特征;融合所述句级特征和赋权后的词级特征,获取所述多标签文本的预测分类结果。
一种存储介质,其存储有用于基于Bi-LSTM-GCN的多标签文本分类的计算机程序,其中,所述计算机程序使得计算机执行如上所述的多标签文本分类方法。
一种电子设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上所述的多标签文本分类方法。
(三)有益效果
本发明提供了一种基于Bi-LSTM-GCN的多标签文本分类方法、系统、存储介质和电子设备。与现有技术相比,具备以下有益效果:
本发明分别利用Bi-LSTM提取文本特征,综合考虑了不同粒度的信息;利用GCN提取标签隐层关系,并结合注意力的思想,捕获句子中对分类效果提高更有效的重要词汇;融合含有全局特征的句级特征用于标签预测;最终获得更加全面的特征信息从而提高多标签分类效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于Bi-LSTM-GCN的多标签文本分类方法的流程示意图;
图2为本发明实施例提供的一种基于Bi-LSTM-GCN的多标签文本分类系统的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种基于Bi-LSTM-GCN的多标签文本分类方法、系统、存储介质和电子设备,解决了未完全利用标签信息的技术问题。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明实施例分别利用Bi-LSTM提取文本特征,综合考虑了不同粒度的信息;利用GCN提取标签隐层关系,并结合注意力的思想,捕获句子中对分类效果提高更有效的重要词汇;融合含有全局特征的句级特征用于标签预测;最终获得更加全面的特征信息从而提高多标签分类效果。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例:
第一方面,如图1所示,本发明实施例提供了一种基于Bi-LSTM-GCN的多标签文本分类方法,包括Bi-LSTM模型和GCN模型,包括:
S1、获取并预处理多标签文本和对应的标签类别集合;
S2、将预处理后的多标签文本输入Bi-LSTM模型,获取词级特征和句级特征;
S3、根据预处理后的标签类别集合,获取标签语义表示集合;以及获取各个标签类别两两之间的共现概率,确定共现矩阵;
S4、将所述标签语义表示集合和共现矩阵输入GCN模型中,建立关于标签的无向图,获取各个标签类别之间的隐层关系信息;
S5、根据所述词级特征和隐层关系信息,获取赋权后的词级特征;融合所述句级特征和赋权后的词级特征,获取所述多标签文本的预测分类结果。
本发明实施例分别利用Bi-LSTM提取文本特征,综合考虑了不同粒度的信息;利用GCN提取标签隐层关系,并结合注意力的思想,捕获句子中对分类效果提高更有效的重要词汇;融合含有全局特征的句级特征用于标签预测;最终获得更加全面的特征信息从而提高多标签分类效果。
下面将结合具体内容详细介绍上述技术方案的各个步骤:
首先需要说明的是,本发明实施例中的Bi-LSTM模型的全称为Bi-directionalLong Short-Term Memory,即双向长短期神经网络;GCN模型的全称为GraphConvolutional Network,即图卷积神经网络。
S1、获取并预处理多标签文本和对应的标签类别集合。
所述预处理过程包括词嵌入处理。
预处理后的多标签文本表示为si={w1,w2,w3,……,wn},其中
Figure BDA0003448899300000081
Figure BDA0003448899300000082
表示文本中第i个单词;
预处理后的标签类别集合表示为V={l1,l2,l3,……lk},其中li表示为第i个标签。
S2、将预处理后的多标签文本输入Bi-LSTM模型,获取词级特征和句级特征。
首先补充说明一下,LSTM利用输入门,遗忘门,输出门来捕获远距离的文本特征,并改进了RNN中梯度消失的问题。而Bi-LSTM模型由前向和后向LSTM组成,不仅考虑了由前到后的上文信息还结合了由后到前的下文信息。
在本发明实施例中,正如上述提及的给定多标签文本si={w1,w2,w3,……,wn},
Figure BDA0003448899300000091
向量化后分别通过前向和后向LSTM得到特征表示:
Figure BDA0003448899300000092
Figure BDA0003448899300000093
其中,
Figure BDA0003448899300000094
分别表示由前向后的第i和i-1状态下单词的隐状态,由后向前的第i和i-1状态下单词的隐状态。
将前向和后向结果拼接,得到的hi为每个单词在t时刻的隐藏状态:
Figure BDA0003448899300000095
X={h1,h2,h3,……hn}
Figure BDA0003448899300000096
作为句子中每个单词的词向量,及所述词级特征,取hn作为所述多标签文本的句向量,及所述句级特征。
S3、根据预处理后的标签类别集合,获取标签语义表示集合;以及获取各个标签类别两两之间的共现概率,确定共现矩阵。
所述获取标签语义表示集合,包括:
根据预处理后的标签类别集合,获取各个标签类别对应的单词数量;向量化各个标签类别对应的所有单词和所述多标签文本至同一维度;平均化向量化后的各个单词,获取单个标签类别的语义表示;根据所述各个单个标签类别的语义表示,获取所述标签语义表示集合。
由上述可知,所述标签类别集合V={l1,l2,l3,……lk}包含了所有k个种类的标签,由于每个标签的单词数量不固定,为了得到li标签类别的表示向量,先将该标签类别含有的所有单词向量化和所述多标签文本的单词同一维度。假设li含有单词{d1,d2,d3,……dp},其中di∈Rd,之后在进行平均化,使得每个种类的标签也映射在同一个向量空间内。
L={e1,e2,e3,……ek}
其中
Figure BDA0003448899300000101
表示标签类别i的语义表示;L表示所有标签语义表示的集合,即所述标签语义表示集合,作为后续GCN模型的输入之一。
所述获取各个标签类别两两之间的共现概率,确定邻接矩阵,包括:
S10、根据所述预处理后的标签类别集合中各个标签类别的出现概率,获取各个标签类别两两之间的共现概率;
Figure BDA0003448899300000102
其中,Pij表示类别i与类别j的共现概率,Pi表示类别i出现的概率,Pj表示类别j出现的概率。
S20、根据各个所述共现概率,获取各个标签类别两两之间的共现关系。
Figure BDA0003448899300000103
S30、根据各个所述共现关系Aij,获取共现矩阵A,那么显然A∈Rk*k
S4、将所述标签语义表示集合和共现矩阵输入GCN模型中,建立关于标签的无向图,获取各个标签类别之间的隐层关系信息。
其中,建立关于标签的无向图,包括:
采用预处理后的标签类别集合作为所述无向图的节点集合,采用所述标签语义表示集合作为所述无向图的对应节点的语义特征,采用邻接矩阵作为所述无向图的邻接矩阵。
具体而言,为了进一步得到标签内的关系,本发明实施例利用GCN模型进行特征交互,提取标签之间的隐性关系。由于GCN层数过多时会产生过拟合的问题,因此可以选用两层GCN进行堆叠,来提取标签的关系。
模型利用上述相关结果建立关于标签的无向图G∈(V,E),V表示无向图G的节点集合,E表示无向图G的边集合。其中不同的标签类别作为图的各个节点V={l1,l2,l3,……lk},标签的语义表示集合L={e1,e2,e3,……ek}作为对应节点的语义特征。
由上述可知,在Aij中若Aij=1则认为标签i与标签j有关,二者之间存在一条边bi,j;若Aij=0则认为标签i与标签j无关,二者之间没有边相连。
由各个标签之间是否有边构建无向图G的边E={b1,2,…bi,j…},因此标签的共现矩阵Aij可以看作是无向图G的邻接矩阵A,边集合E表示两两标签之间是否有关;并且在图中为每个节点添加自循环,来增加图中的节点信息。
而获取各个标签类别之间的隐层关系信息,则包括:
Figure BDA0003448899300000111
Figure BDA0003448899300000112
Figure BDA0003448899300000113
其中,A表示所述邻接矩阵,I表示单位矩阵,
Figure BDA0003448899300000114
Figure BDA0003448899300000115
表示无向图G的度矩阵,σ(·)是激活函数,W为权重参数矩阵,H(l)H(l+1)分别表示第l和l+1层的特征,
Figure BDA0003448899300000121
表示最后一层的特征,即隐层关系信息,用来提取单词与标签之间的权重捕获重要单词。
S5、根据所述词级特征和隐层关系信息,获取赋权后的词级特征;融合所述句级特征和赋权后的词级特征,获取所述多标签文本的预测分类结果。
在词粒度上,每个单词对不同的标签预测结果的重要性都不同,为了捕获多标签文本分类中的重要单词,本发明实施例参考注意力机制为评论文本中的单词赋权,从而得到更加准确的分类结果。通过GCN提取到的标签相关特征并归一化得到权重矩阵Y,再计算每个单词的得分。
具体而言,所述根据所述词级特征和隐层关系信息,参考注意力机制获取赋权后的词级特征,包括:
Y=softmax(H·XT)
Figure BDA0003448899300000122
其中,H表示隐层关系信息;XT表示各个词级特征的集合X的转置矩阵;Y表示权重矩阵;
Figure BDA0003448899300000123
表示各个词级特征的得分集合;
所述融合所述句级特征和赋权后的词级特征,获取所述多标签文本的预测分类结果,包括:
Figure BDA0003448899300000124
S=fc(hn)
Figure BDA0003448899300000125
其中,
Figure BDA0003448899300000131
fc表示Function函数;O表示融合信息;hn表示所述句级特征;
将所述融合信息O通过sigmoid函数返回不同的概率值,从而进行所述多标签文本的分类预测。
特别的,本发明实施例中采用二元交叉熵函数(binary cross entropy loss)作为损失函数:
Figure BDA0003448899300000132
其中,wn为参数,yij∈{0,1}为所述多标签文本的真实标签,
Figure BDA0003448899300000133
Figure BDA0003448899300000134
为所述多标签文本的预测标签。
第二方面,如图2所示,本发明实施例提供了一种基于Bi-LSTM-GCN的多标签文本分类系统,包括Bi-LSTM模型和GCN模型,包括:
预处理模块,用于获取并预处理多标签文本和对应的标签类别集合;
第一提取模块,用于将预处理后的多标签文本输入Bi-LSTM模型,获取词级特征和句级特征;
确定模块,用于根据预处理后的标签类别集合,获取标签语义表示集合;以及获取各个标签类别两两之间的共现概率,确定共现矩阵;
第二提取模块,用于将所述标签语义表示集合和共现矩阵输入GCN模型中,建立关于标签的无向图,获取各个标签类别之间的隐层关系信息;
预测模块,用于根据所述词级特征和隐层关系信息,采用注意力机制获取赋权后的词级特征;融合所述句级特征和赋权后的词级特征,获取所述多标签文本的预测分类结果。
第三方面,本发明实施例提供了一种存储介质,其特征在于,其存储有用于基于Bi-LSTM-GCN的多标签文本分类的计算机程序,其中,所述计算机程序使得计算机执行如上所述的多标签文本分类方法。
第四方面,本发明实施例提供了一种电子设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上所述的多标签文本分类方法。
可理解的是,本发明实施例提供的基于Bi-LSTM-GCN的多标签文本分类系统、存储介质和电子设备与本发明实施例提供的基于Bi-LSTM-GCN的多标签文本分类方法相对应,其有关内容的解释、举例和有益效果等部分可以参考多标签文本分类方法中的相应部分,此处不再赘述。
综上所述,与现有技术相比,具备以下有益效果:
本发明实施例分别利用Bi-LSTM提取文本特征,综合考虑了不同粒度的信息;利用GCN提取标签隐层关系,并结合注意力的思想,捕获句子中对分类效果提高更有效的重要词汇;融合含有全局特征的句级特征用于标签预测;最终获得更加全面的特征信息从而提高多标签分类效果。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于Bi-LSTM-GCN的多标签文本分类方法,其特征在于,包括Bi-LSTM模型和GCN模型,包括:
获取并预处理多标签文本和对应的标签类别集合;
将预处理后的多标签文本输入Bi-LSTM模型,获取词级特征和句级特征;
根据预处理后的标签类别集合,获取标签语义表示集合;以及获取各个标签类别两两之间的共现概率,确定共现矩阵;
将所述标签语义表示集合和共现矩阵输入GCN模型中,建立关于标签的无向图,获取各个标签类别之间的隐层关系信息;
根据所述词级特征和隐层关系信息,获取赋权后的词级特征;融合所述句级特征和赋权后的词级特征,获取所述多标签文本的预测分类结果。
2.如权利要求1所述的多标签文本分类方法,其特征在于,所述预处理过程包括词嵌入处理。
3.如权利要求1所述的多标签文本分类方法,其特征在于,所述获取标签语义表示集合,包括:
根据预处理后的标签类别集合,获取各个标签类别对应的单词数量;
向量化各个标签类别对应的所有单词和所述多标签文本至同一维度;
平均化向量化后的各个单词,获取单个标签类别的语义表示;
根据所述各个单个标签类别的语义表示,获取所述标签语义表示集合。
4.如权利要求3所述的多标签文本分类方法,其特征在于,
所述获取各个标签类别两两之间的共现概率,确定邻接矩阵,包括:
根据所述预处理后的标签类别集合中各个标签类别的出现概率,获取各个标签类别两两之间的共现概率;
根据各个所述共现概率,获取各个标签类别两两之间的共现关系;
根据各个所述共现关系,获取共现矩阵;
所述建立关于标签的无向图,包括:
采用预处理后的标签类别集合作为所述无向图的节点集合,采用所述标签语义表示集合作为所述无向图的对应节点的语义特征,采用邻接矩阵作为所述无向图的邻接矩阵。
5.如权利要求4所述的多标签文本分类方法,其特征在于,所述获取各个标签类别之间的隐层关系信息,包括:
Figure FDA0003448899290000021
Figure FDA0003448899290000022
Figure FDA0003448899290000023
其中,A表示所述邻接矩阵,I表示单位矩阵,
Figure FDA0003448899290000024
Figure FDA0003448899290000025
表示无向图G的度矩阵,σ(·)是激活函数,W为权重参数矩阵,H(l)H(l+1)分别表示第l和l+1层的特征,
Figure FDA0003448899290000026
表示最后一层的特征,即隐层关系信息。
6.如权利要求5所述的多标签文本分类方法,其特征在于,
所述根据所述词级特征和隐层关系信息,参考注意力机制获取赋权后的词级特征,包括:
Y=softmax(H·XT)
Figure FDA0003448899290000031
其中,H表示隐层关系信息;XT表示各个词级特征的集合X的转置矩阵;Y表示权重矩阵;
Figure FDA0003448899290000032
表示各个词级特征的得分集合;
所述融合所述句级特征和赋权后的词级特征,获取所述多标签文本的预测分类结果,包括:
Figure FDA0003448899290000033
S=fc(hn)
Figure FDA0003448899290000034
其中,
Figure FDA0003448899290000035
fc表示Function函数;O表示融合信息;hn表示所述句级特征;
将所述融合信息O通过sigmoid函数返回不同的概率值,从而进行所述多标签文本的分类预测。
7.如权利要求1~6任一项所述的多标签文本分类方法,其特征在于,采用二元交叉熵函数作为损失函数。
8.一种基于Bi-LSTM-GCN的多标签文本分类系统,其特征在于,包括Bi-LSTM模型和GCN模型,包括:
预处理模块,用于获取并预处理多标签文本和对应的标签类别集合;
第一提取模块,用于将预处理后的多标签文本输入Bi-LSTM模型,获取词级特征和句级特征;
确定模块,用于根据预处理后的标签类别集合,获取标签语义表示集合;以及获取各个标签类别两两之间的共现概率,确定共现矩阵;
第二提取模块,用于将所述标签语义表示集合和共现矩阵输入GCN模型中,建立关于标签的无向图,获取各个标签类别之间的隐层关系信息;
预测模块,用于根据所述词级特征和隐层关系信息,获取赋权后的词级特征;融合所述句级特征和赋权后的词级特征,获取所述多标签文本的预测分类结果。
9.一种存储介质,其特征在于,其存储有用于基于Bi-LSTM-GCN的多标签文本分类的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1~7任一项所述的多标签文本分类方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如权利要求1~7任一项所述的多标签文本分类方法。
CN202111668305.6A 2021-12-30 2021-12-30 基于Bi-LSTM-GCN的多标签文本分类方法和系统 Active CN114357167B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111668305.6A CN114357167B (zh) 2021-12-30 2021-12-30 基于Bi-LSTM-GCN的多标签文本分类方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111668305.6A CN114357167B (zh) 2021-12-30 2021-12-30 基于Bi-LSTM-GCN的多标签文本分类方法和系统

Publications (2)

Publication Number Publication Date
CN114357167A true CN114357167A (zh) 2022-04-15
CN114357167B CN114357167B (zh) 2024-07-16

Family

ID=81105826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111668305.6A Active CN114357167B (zh) 2021-12-30 2021-12-30 基于Bi-LSTM-GCN的多标签文本分类方法和系统

Country Status (1)

Country Link
CN (1) CN114357167B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905533A (zh) * 2022-11-24 2023-04-04 重庆邮电大学 一种多标签文本智能分类方法
CN117273015A (zh) * 2023-11-22 2023-12-22 湖南省水运建设投资集团有限公司 一种语义分析的电子文件归档分类方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020073530A1 (zh) * 2018-10-12 2020-04-16 平安科技(深圳)有限公司 客服机器人会话文本分类方法及装置、电子设备、计算机可读存储介质
CN111274405A (zh) * 2020-02-26 2020-06-12 北京工业大学 一种基于gcn的文本分类方法
US20200356851A1 (en) * 2019-05-10 2020-11-12 Baidu Usa Llc Systems and methods for large scale semantic indexing with deep level-wise extreme multi-label learning
CN112906720A (zh) * 2021-03-19 2021-06-04 河北工业大学 基于图注意力网络的多标签图像识别方法
US20210201930A1 (en) * 2019-12-27 2021-07-01 Robert Bosch Gmbh Ontology-aware sound classification
CN113641820A (zh) * 2021-08-10 2021-11-12 福州大学 基于图卷积神经网络的视角级文本情感分类方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020073530A1 (zh) * 2018-10-12 2020-04-16 平安科技(深圳)有限公司 客服机器人会话文本分类方法及装置、电子设备、计算机可读存储介质
US20200356851A1 (en) * 2019-05-10 2020-11-12 Baidu Usa Llc Systems and methods for large scale semantic indexing with deep level-wise extreme multi-label learning
US20210201930A1 (en) * 2019-12-27 2021-07-01 Robert Bosch Gmbh Ontology-aware sound classification
CN111274405A (zh) * 2020-02-26 2020-06-12 北京工业大学 一种基于gcn的文本分类方法
CN112906720A (zh) * 2021-03-19 2021-06-04 河北工业大学 基于图注意力网络的多标签图像识别方法
CN113641820A (zh) * 2021-08-10 2021-11-12 福州大学 基于图卷积神经网络的视角级文本情感分类方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BENGONG YU: "Question classification based on MAC-LSTM", 2018 IEEE THIRD INTERNATIONAL CONFERENCE ON DATA SCIENCE IN CYBERSPACE, 31 December 2018 (2018-12-31) *
王冲;张虎;王鑫;刘全明;: "融合敏感词规则和字符级RCNN模型的用户意图识别", 计算机应用与软件, no. 03, 12 March 2020 (2020-03-12) *
肖琳;陈博理;黄鑫;刘华锋;景丽萍;于剑;: "基于标签语义注意力的多标签文本分类", 软件学报, no. 04, 31 December 2019 (2019-12-31) *
陈文实;刘心惠;鲁明羽;: "基于编码解码器与深度主题特征抽取的多标签文本分类", 南京师大学报(自然科学版), no. 04, 31 December 2019 (2019-12-31) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905533A (zh) * 2022-11-24 2023-04-04 重庆邮电大学 一种多标签文本智能分类方法
CN115905533B (zh) * 2022-11-24 2023-09-19 湖南光线空间信息科技有限公司 一种多标签文本智能分类方法
CN117273015A (zh) * 2023-11-22 2023-12-22 湖南省水运建设投资集团有限公司 一种语义分析的电子文件归档分类方法
CN117273015B (zh) * 2023-11-22 2024-02-13 湖南省水运建设投资集团有限公司 一种语义分析的电子文件归档分类方法

Also Published As

Publication number Publication date
CN114357167B (zh) 2024-07-16

Similar Documents

Publication Publication Date Title
Li et al. Context-aware emotion cause analysis with multi-attention-based neural network
Khouja Stance prediction and claim verification: An Arabic perspective
CN111078836B (zh) 基于外部知识增强的机器阅读理解方法、系统、装置
Lei et al. Tag recommendation by text classification with attention-based capsule network
CN111401061A (zh) 基于BERT及BiLSTM-Attention的涉案新闻观点句识别方法
Ma et al. A deep-learning based citation count prediction model with paper metadata semantic features
Li et al. UD_BBC: Named entity recognition in social network combined BERT-BiLSTM-CRF with active learning
CN113128227A (zh) 实体抽取方法及装置
CN114357167B (zh) 基于Bi-LSTM-GCN的多标签文本分类方法和系统
CN113378090B (zh) 一种互联网网站相似度分析方法、装置以及可读存储介质
Rong et al. Structural information aware deep semi-supervised recurrent neural network for sentiment analysis
CN113392209A (zh) 一种基于人工智能的文本聚类方法、相关设备及存储介质
CN113704392A (zh) 文本中实体关系的抽取方法、装置、设备及存储介质
CN112667816B (zh) 一种基于深度学习的方面级情感分析方法及系统
CN115391570A (zh) 一种基于方面的情感知识图谱构建方法及装置
Lin et al. Multi-label emotion classification based on adversarial multi-task learning
CN114579741B (zh) 融合句法信息的gcn-rn方面级情感分析方法和系统
CN112667813A (zh) 用于裁判文书的敏感身份信息的识别方法
Tarride et al. A comparative study of information extraction strategies using an attention-based neural network
CN112131345A (zh) 文本质量的识别方法、装置、设备及存储介质
Wagle et al. Explainable ai for multimodal credibility analysis: Case study of online beauty health (mis)-information
Keya et al. G-bert: an efficient method for identifying hate speech in Bengali texts on social media
CN113516094B (zh) 一种用于为文档匹配评议专家的系统以及方法
CN117150436B (zh) 多模态自适应融合的主题识别方法及系统
Du et al. Multiple userids identification with deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant