CN115374283A - 一种基于双图注意力网络的方面类别情感分类方法 - Google Patents
一种基于双图注意力网络的方面类别情感分类方法 Download PDFInfo
- Publication number
- CN115374283A CN115374283A CN202211200728.XA CN202211200728A CN115374283A CN 115374283 A CN115374283 A CN 115374283A CN 202211200728 A CN202211200728 A CN 202211200728A CN 115374283 A CN115374283 A CN 115374283A
- Authority
- CN
- China
- Prior art keywords
- word
- graph
- information
- node
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于双图注意力网络的方面类别情感分类方法,该方法充分考虑了用户评论数据中蕴含的序列上下文信息和句法依赖关系;其首先构建两个图网络来描述句子的序列上下文信息和句法结构信息,然后利用注意力机制在单个图内聚合来自邻域节点的信息,并使用双仿射模块来协调序列图和句法图之间的异构信息。最后,本文利用特定方面的屏蔽机制和基于检索的注意力机制,使模型更加关注特定方面类别下的句子情感信息,从而推断出特定方面类别的情绪极性。本申请能够挖掘出句子中更细粒度的信息,更能体现用户的真实想法,其不仅为用户提供了丰富的决策信息,还提醒平台对某一方面存在的缺陷进行改进,促进了互联网服务质量的提升。
Description
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种基于双图注意力网络的方面类别情感分类方法。
背景技术
近年来,由于人们对消费需求的转型升级,国内互联网服务业飞速发展,积累了海量的用户评论信息。这些信息蕴含着巨大的商业价值和社会价值,能够从一定程度上呈现出用户对商品、环境或体验的一种主观看法和情感表达。对这些用户评论进行情感分类,可以了解到用户的情绪是积极还是消极的,从而获取诸多及时有效的信息。运用这些信息,医疗平台可以帮助患者有针对性地做出决策,帮助医生改进服务质量;电商平台可以了解用户的需求,对商品的缺陷进行改进;政府机关可以对某一新闻事件进行舆情监测。
然而,在现实生活场景中,一个用户评论可能涉及多个方面,传统情感分类太过于笼统,无法对一篇文档中的多个方面进行单独分析,不能区分一条用户评论中多个方面的情绪极性。例如,给定评论句“这个餐馆虽然位置很偏,但饭菜很可口”,可见“地理位置”和“食物”方面表达的情绪正好相反,模型有必要正确预测出每个方面对应的情感极性。方面级情感分类的出现和发展,不仅能够针对特定方面词找到相应的情感词,还能解决文本评论信息中存在的多个不同方面类别的不同情感极性问题,更能体现用户的真实想法。
目前的方面级情感分类研究主要集中在方面术语情感分类任务上,其直接检测到评论句中明确出现过的方面术语,并分析其所对应的情绪极性。然而,在实际生活中很多评论句缺乏明确的方面词,方面类别情感分类成了一个更具挑战性的问题。它需要通过不同的语境获取更加复杂的评论句特征,从而推断出评论句在隐式方面类别下的情感倾向。因此,需要设计一个强大的神经网络模型,它可以判断用户评论中特定方面类别的情感倾向,为用户快速的决策和平台的自我提升提供参考,从而提高整体的互联网服务水平。
发明内容
本申请的目的在于提供一种基于双图注意力网络的方面类别情感分类方法,其不仅可以帮助网络平台进行商品推荐、舆情监测、升级改进等活动,还使得其他用户更加全面地了解某个产品或事件,为快速决策提供参考,从而提升整体互联网服务水平。
为实现上述目的,本申请提出一种基于双图注意力网络的方面类别情感分类方法,包括:
步骤1:对评论文本进行去除停用词、特殊符号和无用字符等预处理操作,从嵌入查找表中获得词嵌入矩阵(其维度可以为300),将预处理后的评论句和方面词进行词嵌入编码,使用BERT编码器提取出评论句和方面词的隐藏上下文表示;
步骤2:将所述隐藏上下文表示作为图网络中节点的初始化表示,然后利用评论句的序列上下文信息和句法结构信息分别获取节点之间的边权值,根据相同节点表示和不同边权值分别构建序列图和句法图;
步骤3:通过所述序列图和句法图进行消息传递,即在每个图内利用图注意力网络分别捕获单词节点与其邻近节点之间的关系,两图之间采用双仿射变换学习序列图和句法图蕴含的异构信息,并对节点矩阵进行维度变换,得到评论句特征表示;
步骤4:对所述评论句特征表示进一步处理,即利用特定方面的 Mask机制和注意力机制,来突出评论句中方面类别词的重要性,得到评论句中每个方面类别对应的情感极性。
进一步的,所述步骤2具体实现方式为:
步骤21:将每个单词节点与步骤1获得的相应隐藏上下文表示关联,使用逐点互信息描述两个单词在固定大小的滑动窗口内的序列关系,从而实现序列图中边信息的添加,每对节点之间的边权值为:
其中#N是评论句中滑动窗口的总数,#N(wi,wj)是单词对(wi,wj)在相同的滑动窗口内共现的次数,#N(wi)和#N(wj)分别是单词wi和单词wj在评论句的滑动窗口内出现的次数;
步骤22:将每个单词节点与步骤1获得的相应隐藏上下文表示关联,利用依赖解析器标注注意力层(Label Attention Layer,LAL) 对输入序列进行依赖解析,得到表示单词之间依赖关系的大小为n×n 的概率矩阵Asyn,并将单词之间的关系扩展为其所有子词之间的依赖关系;每对节点之间的边权值为:
进一步的,所述步骤3具体实现方式为:
步骤31:针对步骤2构建的序列图和句法图,利用图注意力网络进行图内信息传递,从而捕获单词节点与其邻近节点之间的关系;具体来说,图注意力网络使用多头注意力来获取两个节点之间的注意力权重:
其中αij是节点vi和节点vj之间的注意力系数,Ni表示节点vi的所有邻居节点集合,vt是该集合中的一个邻居节点,hi,hj和ht分别表示节点vi,vj和vt的特征向量表示,f(·)是一个LeakyReLU非线性激活函数,[·||·]表示向量的串联操作,W和w是模型中可训练的参数;
步骤32:采用双仿射变换来学习两图节点之间的异构信息,并利用softmax函数对两图之间的关系进行评分,最后将输出的矩阵分布与图的原始信息进行线性变换,其过程用以下公式进行定义:
步骤33:交换完图的不同信息后,进行平均池化和串联操作,得到了方面类别情感分类任务的评论句特征表示:
进一步的,所述步骤4具体实现方式为:
步骤41:将步骤33得到的评论句特征表示进行特定方面的Mask 操作,屏蔽掉无关词语的隐藏状态向量,并且突出评论句中方面类别词的重要性;
步骤42:通过基于检索的注意力机制对Mask操作后的评论句特征表示进行处理,从隐藏状态向量中检索出与语义相关的重要特征,从而在特定方面类别词和上下文表示之间捕捉重要的情感依赖关系:
其中ht表示第t个单词节点的BERT隐藏状态向量,gi是步骤41得到的与第i个方面词在语义上相关的向量表示,将两者进行点积操作后,可以获得基于检索的注意力权重λt和softmax归一化后的向量ηt。
步骤43:将获得的方面级情感表示r输入到一个线性层中,接着使用softmax函数来产生一个情感概率分布,具体过程如下:
y=softmax(Wor+bo) (14)
其中Wo和bo都是可学习的权重和偏差;
步骤44:通过最小化预测值和真实值之间的交叉熵损失来训练分类器,损失函数表示为:
依据步骤43产生的情感概率分布,预测出用户评论句中每个方面类别对应的情绪极性,包括积极、消极和中性三种。
本发明由于采用以上技术方案,能够取得如下的技术效果:本发明充分考虑了评论句的序列上下文信息和句法结构信息,从多个不同的方面对网络平台上的用户评论进行细粒度分析,能够推断出文本序列中更全面、更深入的情感极性。本方法不仅让用户更加全面地了解某个产品或事件,为他们提供了丰富的决策信息,还能帮助平台充分理解用户需求,提醒平台对某一方面存在的缺陷进行改进,可以广泛应用于社会事件、生活服务、医疗保健等领域,从而有效地促进互联网服务质量的提升。
附图说明
图1为一种基于双图注意力网络的方面类别情感分类方法流程图;
图2为节点的图间信息传递过程图。
具体实施方式
本发明的实施例是在以本发明技术方案为前提下进行实施的,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述实施例。
实施例1
本发明提供了一种基于双图注意力网络的深度学习模型来处理方面类别情感分类任务,充分考虑了评论句在特定方面类别下的序列上下文信息和句法结构信息。该模型采用图内传播和图间传播相结合的方式对评论句表示进行编码,利用了单词之间的序列、句法和情感关系,还利用特定方面的掩码和注意力机制来减少无用信息产生的噪声影响,进而预测出评论句中特定方面类别对应的情绪极性。
模型在PyTorch框架上运行,并使用BERT-base模型作为评论句的基本编码器。所有的模型使用Adam优化器进行优化,学习率和批次大小分别设置为2e-5和16。Transformer的隐藏层大小为768,并且dropout的值为0.1。最大评论句长度设置为128,并迭代20次。当连续5个epoch的验证集损失没有改善时,模型将会提前停止训练。
以下结合实施例和附图对本发明做详细的说明,以使本领域普通技术人员参照本说明书后能够据以实施。
本实施例以Pycharm为开发平台,Python为开发语言,在SemEval 2015,SemEval2016和MAMS数据集上进行实验。以下为具体过程:
步骤1:对评论文本进行预处理操作,并对处理后的评论句和方面词进行BERT编码,提取它们的隐藏上下文表示;
步骤2:将步骤1提取的隐藏上下文表示作为图网络中节点的初始化表示,然后利用评论句的序列上下文信息和句法结构信息分别获取节点之间的边权值,从而构建序列图和句法图,具体为:
步骤21:将每个单词节点与步骤1获得的相应隐藏状态相关联,利用逐点互信息实现序列图中边信息的添加,从而构建出序列图;
步骤22:将每个单词节点与步骤1获得的相应隐藏状态相关联,利用LAL依赖解析器对输入序列进行依赖解析,将获取的依赖解析矩阵作为句法图中的边权值,从而构建出句法图;
步骤3:针对步骤2中得到的序列图和句法图进行图内和图间信息传递,得到最终评论句特征表示,具体为:
步骤31:利用图注意力网络分别在序列图和句法图内进行信息传递,通过聚合一个节点的邻域节点表示来迭代地更新该节点的表示;
步骤32:采用双仿射变换来学习序列图和句法图中蕴含的异构信息,实现两个图网络的相互作用与更新;
步骤33:将步骤32获取的图节点表示进行平均池化和串联操作,得到评论句特征表示;
步骤4:利用特定方面的Mask机制和注意力机制对步骤3得到的评论句特征表示进行处理,进而预测出评论句中每个方面类别对应的情感极性,具体为:
步骤41:将步骤33得到的评论句特征表示进行特定方面的Mask 操作,用来屏蔽掉无关词语的隐藏状态向量;
步骤42:通过基于检索的注意力机制对步骤41的评论句表示进行处理,从隐藏状态向量中检索出与语义相关的重要特征;
步骤43:将获得的方面级情感表示输入到一个线性层中,并使用softmax函数来产生评论句的情感概率分布,从而预测出评论句中每个方面类别对应的情感极性。
根据以上步骤,本发明进行了消融实验来进一步研究不同组件对模型整体效果的影响,如表1所示。实验证明,本发明中基于双图注意力网络的深度学习模型能够有效提高方面类别情感分类任务的准确率(Acc)和Macro-F1值。
表1模型在不同公共数据集上的消融实验结果
以上所述,仅为本发明创造较佳的具体实施方式,但本发明创造的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。
Claims (4)
1.一种基于双图注意力网络的方面类别情感分类方法,其特征在于,包括:
步骤1:对评论文本进行预处理操作,从嵌入查找表中获得词嵌入矩阵,将预处理后的评论句和方面词进行词嵌入编码,使用BERT编码器提取出评论句和方面词的隐藏上下文表示;
步骤2:将所述隐藏上下文表示作为图网络中节点的初始化表示,然后利用评论句的序列上下文信息和句法结构信息分别获取节点之间的边权值,根据相同节点表示和不同边权值分别构建序列图和句法图;
步骤3:通过所述序列图和句法图进行消息传递,即在每个图内利用图注意力网络分别捕获单词节点与其邻近节点之间的关系,两图之间采用双仿射变换学习序列图和句法图蕴含的异构信息,并对节点矩阵进行维度变换,得到评论句特征表示;
步骤4:对所述评论句特征表示进一步处理,即利用特定方面的Mask机制和注意力机制,来突出评论句中方面类别词的重要性,得到评论句中每个方面类别对应的情感极性。
2.根据权利要求1所述一种基于双图注意力网络的方面类别情感分类方法,其特征在于,所述步骤2具体实现方式为:
步骤21:将每个单词节点与步骤1获得的相应隐藏上下文表示关联,使用逐点互信息描述两个单词在固定大小的滑动窗口内的序列关系,从而实现序列图中边信息的添加,每对节点之间的边权值为:
其中#N是评论句中滑动窗口的总数,#N(wi,wj)是单词对(wi,wj)在相同的滑动窗口内共现的次数,#N(wi)和#N(wj)分别是单词wi和单词wj在评论句的滑动窗口内出现的次数;
步骤22:将每个单词节点与步骤1获得的相应隐藏上下文表示关联,利用依赖解析器标注注意力层对输入序列进行依赖解析,得到表示单词之间依赖关系的大小为n×n的概率矩阵Asyn,并将单词之间的关系扩展为其所有子词之间的依赖关系;每对节点之间的边权值为:
3.根据权利要求2所述一种基于双图注意力网络的方面类别情感分类方法,其特征在于,所述步骤3具体实现方式为:
步骤31:针对步骤2构建的序列图和句法图,利用图注意力网络进行图内信息传递,从而捕获单词节点与其邻近节点之间的关系;具体来说,图注意力网络使用多头注意力来获取两个节点之间的注意力权重:
其中αij是节点vi和节点vj之间的注意力系数,Ni表示节点vi的所有邻居节点集合,vt是该集合中的一个邻居节点,hi,hj和ht分别表示节点vi,vj和vt的特征向量表示,f(·)是一个LeakyReLU非线性激活函数,[·||·]表示向量的串联操作,W和w是模型中可训练的参数;
步骤32:采用双仿射变换来学习两图节点之间的异构信息,并利用softmax函数对两图之间的关系进行评分,最后将输出的矩阵分布与图的原始信息进行线性变换,其过程用以下公式进行定义:
步骤33:交换完图的不同信息后,进行平均池化和串联操作,得到了方面类别情感分类任务的评论句特征表示:
4.根据权利要求3所述一种基于双图注意力网络的方面类别情感分类方法,其特征在于,所述步骤4具体实现方式为:
步骤41:将步骤33得到的评论句特征表示进行特定方面的Mask操作,屏蔽掉无关词语的隐藏状态向量,并且突出评论句中方面类别词的重要性;
步骤42:通过基于检索的注意力机制对Mask操作后的评论句特征表示进行处理,从隐藏状态向量中检索出与语义相关的重要特征,从而在特定方面类别词和上下文表示之间捕捉重要的情感依赖关系:
其中ht表示第t个单词节点的BERT隐藏状态向量,gi是步骤41得到的与第i个方面词在语义上相关的向量表示,将两者进行点积操作后,获得基于检索的注意力权重λt和softmax归一化后的向量ηt;
步骤43:将获得的方面级情感表示r输入到一个线性层中,接着使用softmax函数来产生一个情感概率分布,具体过程如下:
y=softmax(Wor+bo) (14)
其中Wo和bo都是可学习的权重和偏差;
步骤44:通过最小化预测值和真实值之间的交叉熵损失来训练分类器,损失函数表示为:
依据步骤43产生的情感概率分布,预测出用户评论句中每个方面类别对应的情绪极性,包括积极、消极和中性三种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211200728.XA CN115374283A (zh) | 2022-09-29 | 2022-09-29 | 一种基于双图注意力网络的方面类别情感分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211200728.XA CN115374283A (zh) | 2022-09-29 | 2022-09-29 | 一种基于双图注意力网络的方面类别情感分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115374283A true CN115374283A (zh) | 2022-11-22 |
Family
ID=84074020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211200728.XA Pending CN115374283A (zh) | 2022-09-29 | 2022-09-29 | 一种基于双图注意力网络的方面类别情感分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115374283A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116644759A (zh) * | 2023-07-19 | 2023-08-25 | 成都晓多科技有限公司 | 语句中方面类别及其语义极性的提取方法和系统 |
-
2022
- 2022-09-29 CN CN202211200728.XA patent/CN115374283A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116644759A (zh) * | 2023-07-19 | 2023-08-25 | 成都晓多科技有限公司 | 语句中方面类别及其语义极性的提取方法和系统 |
CN116644759B (zh) * | 2023-07-19 | 2023-10-03 | 成都晓多科技有限公司 | 语句中方面类别及其语义极性的提取方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111368074B (zh) | 一种基于网络结构和文本信息的链路预测方法 | |
CN107066446B (zh) | 一种嵌入逻辑规则的循环神经网络文本情感分析方法 | |
CN109933789B (zh) | 一种基于神经网络的司法领域关系抽取方法及系统 | |
CN114169330B (zh) | 融合时序卷积与Transformer编码器的中文命名实体识别方法 | |
CN107688576B (zh) | 一种cnn-svm模型的构建及倾向性分类方法 | |
CN107357899B (zh) | 基于和积网络深度自动编码器的短文本情感分析方法 | |
CN113254675B (zh) | 基于自适应少样本关系抽取的知识图谱构建方法 | |
CN116468460B (zh) | 基于人工智能的消费金融客户画像识别系统及其方法 | |
CN113705238B (zh) | 基于bert和方面特征定位模型的方面级情感分析方法及系统 | |
WO2022218139A1 (zh) | 融合注意力机制的个性化搜索方法和搜索系统 | |
Tammina et al. | Sentiment analysis on customer reviews using convolutional neural network | |
CN115062003B (zh) | 基于gpt2的云erp社区生成式问答方法 | |
CN114004220A (zh) | 一种基于cpc-ann的文本情绪原因识别方法 | |
CN115374283A (zh) | 一种基于双图注意力网络的方面类别情感分类方法 | |
CN117216281A (zh) | 一种基于知识图谱的用户兴趣扩散推荐方法及系统 | |
CN116956289B (zh) | 动态调整潜在黑名单和黑名单的方法 | |
Shukla et al. | Role of hybrid optimization in improving performance of sentiment classification system | |
Hegde et al. | Employee sentiment analysis towards remote work during COVID-19 using Twitter data | |
Sarkar et al. | Multi-source transfer learning for facial emotion recognition using multivariate correlation analysis | |
CN111221941B (zh) | 基于文本内容和行文风格的社交媒体谣言鉴别算法 | |
Manasa et al. | Detection of twitter spam using GLoVe vocabulary features, bidirectional LSTM and convolution neural network | |
CN113076424A (zh) | 一种面向不平衡文本分类数据的数据增强方法及系统 | |
CN112269876A (zh) | 一种基于深度学习的文本分类方法 | |
Yan et al. | A time-aware inductive representation learning strategy for heterogeneous graphs | |
CN114936283B (zh) | 一种基于Bert的网络舆情分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |