CN115238075A - 一种基于超图池化的文本情感分类方法 - Google Patents
一种基于超图池化的文本情感分类方法 Download PDFInfo
- Publication number
- CN115238075A CN115238075A CN202210912341.0A CN202210912341A CN115238075A CN 115238075 A CN115238075 A CN 115238075A CN 202210912341 A CN202210912341 A CN 202210912341A CN 115238075 A CN115238075 A CN 115238075A
- Authority
- CN
- China
- Prior art keywords
- hypergraph
- text
- node
- pooling
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于超图池化的文本情感分类方法,将文本数据转化为文本超图,然后输入到超图模型中;超图模型设置有三个模块,每个模块均分为卷积层、池化层和读出层,且前一个模块输出的超图数据输入到后一个模块继续计算;超图卷积层通过超图卷积更新节点特征;超图池化层通过多层感知器线性变换得到节点重要度评分,并通过PageRank算法得到超边重要度评分,然后根据综合得分过滤节点;超图读出层读取每个维度节点特征的最大值和平均值,并进行求和;最后,将三个模块的读出层数值求和得到最终的文本超图特征表示,然后送入线性层进行文本情感分类。本发明采用上述文本情感分类方法,能够得到准确的文本情感信息,在情感分类任务中得到良好的表现效果。
Description
技术领域
本发明涉及深度学习技术领域,尤其是涉及基于超图池化的文本情感分类方法。
背景技术
近年来,基于图的深度学习方法受到了研究人员的广泛关注,图神经网络方法也在诸多任务上取得了良好的成绩。在文本情感分类任务中,也有人提出了将文本建模成图结构,然后应用图神经网络的方法实现情感分类。该类方法往往是以单词为节点,将一个句子内的单词两两相连,容易因边数过多消耗巨大内存。还有些研究设定了滑动窗口,将窗口内的单词两两相连,减少了内存消耗,但这样又会割裂句子本身的结构,使得情感信息不准确。
随着超图概念的提出,文本表示有了新的突破。超图由一个节点集和一个超边集组成。其中,每一个超边包含两个及以上的节点,使得超图更适合于表示非两两关系的数据结构。在超图中,仍然以单词为节点,把每个自然句视为一条超边,进而将一个文本用一个超图来进行表达。
传统的图卷积神经网络方法基于图的拉普拉斯矩阵实现卷积运算,该方法并不能直接迁移到超图结构中。最近,超图神经网络(Hypergraph Neural Network, HGNN)使用超图结构进行表示学习,该模型重新定义了在超图上的拉普拉斯矩阵,通过节点和超边卷积运算分别进行特征聚合,进而更好地利用高阶数据相关性学习节点嵌入,在引文网络和视觉对象等超图节点分类任务上取得了良好的效果。此外,还有很多关于超图的研究工作,如动态超图结构学习(Dynamic Hypergraph Structure Learning,DHSL)研究了基于普通图实现的超图结构的构建与动态更新学习;动态超图神经网络框架(Dynamic HypergraphNeural Networks,DHGNN)在每一层上动态地更新超图结构,结合超图卷积运算,对高阶数据关系进行编码。
然而,这些超图神经网络技术都是基于节点维度的研究。在情感分类任务中,若将文本数据建模成超图,本质上只是对文本中所有单词的特征进行一个更新,对于文本超图的特征往往是所有节点特征的简单聚合,这样基于所有单词去分析文本情感的操作,既不利于文本情感的判断,在长文本中又造成数据庞大的问题。因此,目前在情感分类任务中,并没有一种合理有效的方法可以对整个文本超图进行特征表示。
发明内容
为解决上述问题,本发明在超图池化过程中引入评分环节,以对节点进行筛选,在提高分析效率的同时,更准确的找到文本的高阶信息,提高文本超图的情感分类准确度。
为实现上述目的,本发明提出了如下技术方案:
基于超图池化的文本情感分类方法,包括:
S1、超图构建;确定文本数据的单词节点和超边,利用独热向量编码的方式得到单词节点的初始特征矩阵,并确定单词节点与超边的关联矩阵;
S2、超图卷积;对超图的初始特征矩阵和关联矩阵执行卷积操作,从而得到单词节点的更新特征矩阵,即超图的高阶信息;
S3、超图池化;对更新特征矩阵执行池化操作,以确定节点评分;采用节点选择机制保留排名最高的若干个单词节点,并更新超图的特征矩阵和关联矩阵;
S4、超图读出;提取特征矩阵中单词节点在每一特征维度的最大值和平均值的和,来表示池化超图在该维度的特征信息;
S5、情感分类;将超图特征信息送入线性层变换,并输出文本情感分类。
进一步的,超图池化从超图的更新特征矩阵和关联矩阵角度对超图重要度分析;通过多层感知器对更新特征矩阵线性变换得到单词节点的重要度评分,并通过PageRank算法对关联矩阵处理得到超边重要度评分,结合两种分数得到每个节点的最终评分。
进一步的,超图卷积、超图池化、超图读出共同构成超图模型的一个模块,且该模块设置有三个;前一个模块输出的特征矩阵和关联矩阵作为下一个模块的输入,最后通过对三个超度读出的特征信息求和,然后再输入情感分类的线性层进行判断。
本发明采用上述基于超图池化的文本情感分类方法,针对文本超图数据进行下采样操作,通过超图结构传递更新高阶信息,通过池化算法有效提取关键信息,最终得到准确的文本情感信息,在情感分类任务中得到良好的表现效果。
附图说明
图1为本发明实施例的整体流程框架;
图2为本发明实施例中文本超图及其对应的特征矩阵和关联矩阵;
图3为本发明实施例中超图卷积过程的处理示意图;
图4为本发明实施例中超图池化过程的评分示意图;
图5为本发明实施例中节点筛选和筛选后的特征矩阵和关联矩阵;
图6为本发明实施例中超图读出过程的处理示意图。
具体实施方式
以下结合附图和实施例对本发明的技术方案作进一步说明。
如图所示的基于超图池化的文本情感分类方法,共分为五个阶段进行。
一、超图构建
首先定义超图,超图由一个节点集和一个超边集组成,表示为G=(V;E),它包括一个大小为|V|的节点集V和一个大小为|E|的超边集E,其中每一条超边可以连接两个或多个节点。整个超图的结构可以用关联矩阵H表示:
即,对于v∈V的节点v和e∈E的超边e,H(v,e)=1表示节点v与超边e相连; H(v,e)=0表示节点v与超边e不相连。
根据上述超图定义,本实施例采取如下方式定义并构建超图:针对每一个文本数据,一个单词表示一个节点,一个句子视为一条超边,超边连接该句子中所有的单词节点,这样每一个文本就构成了一个超图,我们的任务即对文本超图进行情感分类。
例如,文本“这是一部引人入胜的成长题材电影。该影片讲述了一个敏感的小女孩经历了一系列寄养家庭的艰辛历程。电影十分精彩!”,是一篇情感类别为积极的电影影评文本,该文本构造的超图可以由图2(a)表示。首先将中文文本利用分词技术分成单词节点,图中用v0~v24表示,并采取独热向量编码的方式得到单词节点的初始特征矩阵X∈Rn*D,如图2(b)所示,其中n=|V|=25,D=25,即每个节点的输入特征维度为25,X={x0,x1,x2,...,x24},xi∈RD,xi表示节点vi的特征。由于该文本有三个自然句,因此在文本超图中有三条超边,即|E|=3,分别为e0,e1和e2。该文本超图的关联矩阵H∈Rn*|E|可以表示为图2(c)。
二、超图卷积
根据构造的文本超图,关联矩阵H表示其结构信息,特征矩阵X表示节点的初始特征信息,X和H即为模型的输入。
采用超图神经网络HGNN中定义的超图卷积操作,整个过程可以看作信息在节点-超边-节点上的聚合和传递,因此能够有效地提取超图上的高阶信息,具体表示为:
其中,W∈R|E|是超边权值的对角矩阵,W表示超边e的权值,W初始化为单位 矩阵;节点v∈V的度数为d(v)=∑e∈EW(e)H(v,e),超边e∈E的度数为 σ(e)=∑v∈VH(v,e)。进而所有节点的度矩阵表示为Dv∈Rn*n,所有超边的度矩阵表 示为De∈R|E|*|E|,Dv和De都是对角矩阵。表示超图拉普 拉斯矩阵,Θ∈RD*D'是模型参数,D'是输出特征维度,通常令D'<D,σ是校正 线性单元(Rectified Linear Units,ReLU)激活函数,能够有效防止模型过拟合。
针对图2的文本示例,超图卷积层的输出为更新的节点特征表示 X'={x'0,x'1,x'2,...,x'24},x'i∈RD'表示节点vi更新后的特征。图3展示了超图卷积层实现根据文本超图结构更新单词节点的特征信息的过程,降低了单词特征维度可以避免模型参数过多,同时使特征表示更贴近文本的含义,并融合其句子内部的信息。
三、超图池化
在超图池化层采用节点选择机制进行节点的筛选,进一步得到池化超图。本实施例采用两种评分函数来进行节点重要度分析,分别是基于节点特征信息的节点评分和基于拓扑结构的超边评分,使得最终评分能够同时考虑超图的节点特征和拓扑结构。
首先,将超图卷积层得到的更新节点特征矩阵X'送入多层感知器(MultilayerPerception,MLP)进行线性变换,计算得到每个节点特征信息的重要度评分:
Score_node=σ(MLP(X')) (3)
其中,X'∈Rn*D'是超图卷积层的输出,σ是softmax激活函数,目的是使得评分结果分布在0-1之间。Score_node∈Rn*1表示基于节点特征信息的节点评分。
除此之外,进一步根据超图拓扑结构得到超边评分,本实施例采用PageRank 算法来计算,具体流程如下:
首先,利用一维的超图卷积网络得到初始的pr值:
其中,Θpr∈RD'*1是一维超图卷积网络的参数,σ是sigmoid激活函数,使pr0分布在[0,1]之间,并相对集中分布。pr0∈Rn*1表示所有节点的初始pr值。
接下来,分别以每个节点为起点,从该节点开始游走,每游走到一个节点都以一定的概率γ停止游走并从原节点重新开始,或者以1-γ的概率从当前节点连接的节点中按照均匀分布随机选择一个节点继续游走。经过多轮游走之后,每个节点的pr值会趋于稳定,该值表示每一个节点在结构上与其他节点的关联程度。我们令游走轮数为k轮k≥1,假设第k-1轮得到的pr值为prk-1,则有:
其中,γ表示停止游走并返回原节点的概率,prk-1∈Rn*1为最终经过k轮游走得到的收敛的pr值。
一个节点在结构上与其他节点的关联程度能够反映该节点在结构上的重要程度。为了更好地融合特征重要性和结构重要性,我们根据prk和关联矩阵H,进一步得到超边重要度评分Score_edge∈R|E|*1,每条超边重要性定义为该超边内所有节点pr值的和,因此有:
Score_edge=sum(HT*prk) (6)
最后,每个节点的最终得分表示为Score_edge和Score_node的结合:
Score=Score_node⊙sum(H*Score_edge) (7)
其中,⊙表示元素按位相乘,Score∈Rn*1,整个过程意味着每个节点的得分由其自身的特征得分和该节点所在的超边重要性得分之和的乘积表示。
在图2示例文本中,Score_node∈R25*1表示25个单词特征的重要性得分, Score_edge∈R3*1表示3个句子在结构上的重要性得分,分值越高意味着该单词或句子对文本情感的判断越重要。Score∈R25*1表示25个单词在特征和结构上的综合得分,整个得分计算过程如图4所示。
接下来,采用节点选择机制,根据总分Score的值选择保留排名最高的[kn]个节点:
idx=topk(Score,[kn]) (8)
其中,池化比率k∈(0,1),它决定池化要保留的节点比率,topk函数返回Score 中分数最高的[kn]个节点的索引id,索引id对应的节点将保留下来,其余节点得分较低,意味着重要度不高,将予以删除。
由于删除节点使得原超图的拓扑结构和节点数发生变化,因此需要根据索引 id更新节点特征和超图拓扑结构,描述为:
其中,Xid,:和Scoreid,:分别为根据索引id保留的节点特征矩阵和评分向量,⊙为元素的哈达玛乘积,两者相乘能够对保留节点的重要程度加以区分,进而更好地表示超图。Hid,:为保留节点的关联矩阵,process(·)操作针对以下情况做出不同的处理:
(1)若删除未保留节点,将使池化后的超边不包含任何节点,则池化后的关联矩阵中删除该超边;
(2)其他情况下,只在关联矩阵的对应边中删除未保留节点;
最终,Xout∈R[kn]*D′和Hout∈R[kn]*|E|′分别表示池化后超图的特征矩阵和相应的关联矩阵,其中|E|′是池化超图的超边数。
在图2的示例文本中,若选择k=0.5,则根据Score排名保留前50%的节点,结果如图5(a)所示,其中置灰的单词节点由于对文本情感贡献度不大将被删除。池化超图表示为图5(b),对应的单词节点数为[kn]=13,超边数|E|′=3。其更新的特征矩阵Xout∈R[kn]*D′和关联矩阵Hout∈R[kn]*|E|′分别如图5(c)(d)。
四、超图读出
读出层用于聚合池化超图的节点特征信息以生成固定大小的表示。本文采用最大值和平均值操作,提取池化超图中节点在每一特征维度的最大值和平均值的和,来表示池化超图在该维度的特征信息。读出层的输出特性如下式:
针对图2和图5示例文本的超图池化层输出Xout进行最大值和平均值的计算,最终得到池化超图表示h∈RD′,如图6所示。
五、情感分类(线性层)
本文采用三个模块相连接的架构,连续进行三次超图卷积-池化-读出操作。读出层提取三次池化超图的特征表示,最后对三个读出层的输出求和,以获得最终超图表示:
z=h1+h2+h3 (11)
其中,hi表示第i个读出层的输出,z∈RD′是最终的超图特征表示。
最后将超图特征z送入线性层变换超图特征表示维度为输出类别数,进而进行文本情感分类任务:
Y=softmax(z*W+b) (12)
其中,W∈RD′*C和b∈RC是线性层参数,C是情感分类的类别数目,softmax函数将结果映射到[0,1]区间,Y∈RC是最终的模型输出,其第i维度的数值表示该文本超图属于C个情感类别中的第i类的概率,进而我们合理地判断每个文本的类别为概率最大的那一类。
图2的示例文本是影评文本,我们可以将情感分为积极和消极两种类别,令积极的情感类别标签为1,消极的标签为0,则该文本标签应为1。模型输出 Y∈R2,当Y[1]的数值大于Y[0]时,判定该文本为积极情感。
以上是本发明的具体实施方式,但本发明的保护范围不应局限于此。任何熟悉本领域的技术人员在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内,因此本发明的保护范围应以权利要求书所限定的保护范围为准。
Claims (3)
1.基于超图池化的文本情感分类方法,其特征在于,包括:
S1、超图构建;确定文本数据的单词节点和超边,利用独热向量编码的方式得到单词节点的初始特征矩阵,并确定单词节点与超边的关联矩阵;
S2、超图卷积;对超图的初始特征矩阵和关联矩阵执行卷积操作,从而得到单词节点的更新特征矩阵,即超图的高阶信息;
S3、超图池化;对更新特征矩阵执行池化操作,以确定节点评分;采用节点选择机制保留排名最高的若干个单词节点,并更新超图的特征矩阵和关联矩阵;
S4、超图读出;提取特征矩阵中单词节点在每一特征维度的最大值和平均值的和,来表示池化超图在该维度的特征信息;
S5、情感分类;将超图特征信息送入线性层变换,并输出文本情感分类。
2.根据权利要求1所述的文本情感分类方法,其特征在于,超图池化从超图的更新特征矩阵和关联矩阵角度对超图重要度分析;通过多层感知器对更新特征矩阵线性变换得到单词节点的重要度评分,并通过PageRank算法对关联矩阵处理得到超边重要度评分,结合两种分数得到每个节点的最终评分。
3.根据权利要求2所述的文本情感分类方法,其特征在于,超图卷积、超图池化、超图读出共同构成超图模型的一个模块,且该模块设置有三个;前一个模块输出的特征矩阵和关联矩阵作为下一个模块的输入,最后通过对三个超度读出的特征信息求和,然后再输入情感分类的线性层进行判断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210912341.0A CN115238075B (zh) | 2022-07-30 | 2022-07-30 | 一种基于超图池化的文本情感分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210912341.0A CN115238075B (zh) | 2022-07-30 | 2022-07-30 | 一种基于超图池化的文本情感分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115238075A true CN115238075A (zh) | 2022-10-25 |
CN115238075B CN115238075B (zh) | 2023-04-07 |
Family
ID=83677996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210912341.0A Active CN115238075B (zh) | 2022-07-30 | 2022-07-30 | 一种基于超图池化的文本情感分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115238075B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118333132A (zh) * | 2024-06-13 | 2024-07-12 | 湘江实验室 | 情感识别模型训练方法、情感识别方法及相关设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112862015A (zh) * | 2021-04-01 | 2021-05-28 | 北京理工大学 | 一种基于超图神经网络的论文分类方法及系统 |
US20210386344A1 (en) * | 2018-11-08 | 2021-12-16 | Anthony E.D. MOBBS | An improved psychometric testing system |
CN113919441A (zh) * | 2021-11-03 | 2022-01-11 | 北京工业大学 | 一种基于超图变换网络的分类方法 |
CN114118088A (zh) * | 2021-10-25 | 2022-03-01 | 首都师范大学 | 基于超图卷积神经网络的文档级实体关系抽取方法及装置 |
CN114416997A (zh) * | 2022-01-24 | 2022-04-29 | 集智学园(北京)科技有限公司 | 一种文本分类与术语网络生长的共演化方法 |
CN114549429A (zh) * | 2022-01-29 | 2022-05-27 | 清华大学 | 基于超图结构的深度数据质量评价方法及装置 |
-
2022
- 2022-07-30 CN CN202210912341.0A patent/CN115238075B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210386344A1 (en) * | 2018-11-08 | 2021-12-16 | Anthony E.D. MOBBS | An improved psychometric testing system |
CN112862015A (zh) * | 2021-04-01 | 2021-05-28 | 北京理工大学 | 一种基于超图神经网络的论文分类方法及系统 |
CN114118088A (zh) * | 2021-10-25 | 2022-03-01 | 首都师范大学 | 基于超图卷积神经网络的文档级实体关系抽取方法及装置 |
CN113919441A (zh) * | 2021-11-03 | 2022-01-11 | 北京工业大学 | 一种基于超图变换网络的分类方法 |
CN114416997A (zh) * | 2022-01-24 | 2022-04-29 | 集智学园(北京)科技有限公司 | 一种文本分类与术语网络生长的共演化方法 |
CN114549429A (zh) * | 2022-01-29 | 2022-05-27 | 清华大学 | 基于超图结构的深度数据质量评价方法及装置 |
Non-Patent Citations (1)
Title |
---|
郑诚等: "结合GNN的信息融合用于归纳式文本分类", 《小型微型计算机系统》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118333132A (zh) * | 2024-06-13 | 2024-07-12 | 湘江实验室 | 情感识别模型训练方法、情感识别方法及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115238075B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112529168B (zh) | 一种基于gcn的属性多层网络表示学习方法 | |
CN112884551B (zh) | 一种基于近邻用户和评论信息的商品推荐方法 | |
CN111667022A (zh) | 用户数据处理方法、装置、计算机设备和存储介质 | |
CN111159395A (zh) | 基于图神经网络的谣言立场检测方法、装置和电子设备 | |
CN112308115B (zh) | 一种多标签图像深度学习分类方法及设备 | |
CN110837602A (zh) | 基于表示学习和多模态卷积神经网络的用户推荐方法 | |
Shah et al. | Sentimental Analysis Using Supervised Learning Algorithms | |
CN112966091A (zh) | 一种融合实体信息与热度的知识图谱推荐系统 | |
CN113962358A (zh) | 一种基于时序超图注意力神经网络的信息扩散预测方法 | |
CN112862015A (zh) | 一种基于超图神经网络的论文分类方法及系统 | |
CN114741519A (zh) | 一种基于图卷积神经网络和知识库的论文相关性分析方法 | |
CN113378573A (zh) | 面向内容大数据的小样本关系抽取方法和装置 | |
CN112884045B (zh) | 基于多视角的随机删边嵌入模型的分类方法 | |
CN112508181A (zh) | 一种基于多通道机制的图池化方法 | |
CN115952424A (zh) | 一种基于多视图结构的图卷积神经网络聚类方法 | |
CN115858919A (zh) | 基于项目领域知识和用户评论的学习资源推荐方法及系统 | |
CN115238075B (zh) | 一种基于超图池化的文本情感分类方法 | |
Li et al. | DLW-NAS: differentiable light-weight neural architecture search | |
CN117194771B (zh) | 一种图模型表征学习的动态知识图谱服务推荐方法 | |
CN114265954B (zh) | 基于位置与结构信息的图表示学习方法 | |
CN114297498B (zh) | 一种基于关键传播结构感知的意见领袖识别方法和装置 | |
CN109086373B (zh) | 一种构建公平的链接预测评估系统的方法 | |
Wincott et al. | Communication of Design Space Relationships Learned by Bayesian Networks | |
CN113515947B (zh) | 一种用于级联地名实体识别模型的训练方法 | |
CN114936296B (zh) | 超大规模知识图谱存储的索引方法、系统及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |