CN115860006B - 一种基于语义句法的方面级情感预测方法及装置 - Google Patents

一种基于语义句法的方面级情感预测方法及装置 Download PDF

Info

Publication number
CN115860006B
CN115860006B CN202310102503.9A CN202310102503A CN115860006B CN 115860006 B CN115860006 B CN 115860006B CN 202310102503 A CN202310102503 A CN 202310102503A CN 115860006 B CN115860006 B CN 115860006B
Authority
CN
China
Prior art keywords
vector
semantic
preset
expression
syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310102503.9A
Other languages
English (en)
Other versions
CN115860006A (zh
Inventor
冯忠武
刘广聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202310102503.9A priority Critical patent/CN115860006B/zh
Publication of CN115860006A publication Critical patent/CN115860006A/zh
Application granted granted Critical
Publication of CN115860006B publication Critical patent/CN115860006B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本申请公开了一种基于语义句法的方面级情感预测方法及装置,方法包括:将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得待分析语义向量;基于自注意力机制,采用预设Bi‑GRU对待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加,得增强邻接矩阵,依存树根据目标文本序列解析得到;通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算,得到句法信息向量;对语义信息向量和句法信息向量分别进行方面词的向量表达,并预测得到情感类别。本申请能解决现有技术中复杂文本与句法依存关系缺失,导致预测结果缺乏准确性的技术问题。

Description

一种基于语义句法的方面级情感预测方法及装置
技术领域
本申请涉及自然语言分析技术领域,尤其涉及一种基于语义句法的方面级情感预测方法及装置。
背景技术
方面级情感分析是情感分析的一个子领域,是一种更细粒度的情感分析,对于评论文本中出现的方面词给出对应的情感极性,通常分为积极,中立,消极三种情感态度。例如在“这款笔记本电脑屏幕非常不错,但是电池续航差了些。”这条评论中,用户分别对笔记本的屏幕给了正面评价,对于笔记本的电池给了消极的评价。粗粒度情感分析只给出对于这款笔记本积极或者消极的预测,过于笼统。而方面级情感分析则是要将评论中用户对某个事物不同方面的态度进行分析;这种更细粒度的分析,一方面,有助于买家从自己看重的特征方面决定是否购买,另一方面,让商家能对自身的产品有更全面的认识,从而进行针对性的改进。方面级情感分析能够提供更多维度的评价信息,因此具有更大实际应用价值。
目前基于方面级情感分析的主要方法有两种,即基于上下文语义特征提取的方法和基于句法特征提取的方法。然而,现有方法大多数采用循环神经网络和注意力机制来获取文本的上下文隐式语义,这会导致在一些复杂的长句中难以准确地获取方面词和对应情感词的对应关系。而且,在一些评论文本中存在大量口语化的表达,并不符合正式的语法规则,从而导致依存树中可能会存在依存关系缺失的问题,使得关系矩阵过于稀疏,导致模型预测的准确率不高。
发明内容
本申请提供了一种基于语义句法的方面级情感预测方法及装置,用于解决现有技术中复杂文本与句法依存关系缺失,导致预测结果缺乏准确性的技术问题。
有鉴于此,本申请第一方面提供了一种基于语义句法的方面级情感预测方法,包括:
将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;
基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;
将根据依存树构建的关系邻接矩阵与所述注意力分数矩阵相加,得到增强邻接矩阵,所述依存树根据所述目标文本序列解析得到;
通过预设图神经网络对所述语义信息向量和所述增强邻接矩阵进行句法分析计算,得到句法信息向量;
对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
优选地,所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量,包括:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将所述词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
优选地,所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量,之前还包括:
通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
根据所述目标文本序列在所述实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
优选地,所述基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵,包括:
将所述待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据所述上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
优选地,所述对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别,包括:
采用预设平均池化函数将所述语义信息向量和所述句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将所述语义向量表达和所述语法向量表达通过门控机制融合成融合表达向量;
依据所述融合表达向量进行情感预测操作,得到情感类别。
本申请第二方面提供了一种基于语义句法的方面级情感预测装置,包括:
向量拼接单元,用于将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;
语义分析单元,用于基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;
矩阵优化单元,用于将根据依存树构建的关系邻接矩阵与所述注意力分数矩阵相加,得到增强邻接矩阵,所述依存树根据所述目标文本序列解析得到;
句法分析单元,用于通过预设图神经网络对所述语义信息向量和所述增强邻接矩阵进行句法分析计算,得到句法信息向量;
情感预测单元,用于对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
优选地,所述向量拼接单元,具体用于:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将所述词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
优选地,还包括:
实体表制备单元,用于通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
常识知识查找单元,用于根据所述目标文本序列在所述实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
优选地,所述语义分析单元,具体用于:
将所述待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据所述上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
优选地,所述情感预测单元,具体用于:
采用预设平均池化函数将所述语义信息向量和所述句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将所述语义向量表达和所述语法向量表达通过门控机制融合成融合表达向量;
依据所述融合表达向量进行情感预测操作,得到情感类别。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中,提供了一种基于语义句法的方面级情感预测方法,包括:将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;基于自注意力机制,采用预设Bi-GRU对待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加,得到增强邻接矩阵,依存树根据目标文本序列解析得到;通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算,得到句法信息向量;对语义信息向量和句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
本申请提供的基于语义句法的方面级情感预测方法,本引入常识知识嵌入向量,从而加强模型对于复杂句子的理解,缓解复杂长句较难获取到方面词与情感词之间的对应关系的问题;且在语义信息向量和句法信息向量的分析过程中通过注意力分数矩阵辅助关系邻接矩阵增强图神经网络的特征提取能力,从而保证预测结果的准确性和可靠性。因此,本申请能够解决现有技术中复杂文本与句法依存关系缺失,导致预测结果缺乏准确性的技术问题。
附图说明
图1为本申请实施例提供的一种基于语义句法的方面级情感预测方法的流程示意图;
图2为本申请实施例提供的一种基于语义句法的方面级情感预测装置的结构示意图;
图3为本申请实施例提供的文本序列分析网络结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供的一种基于语义句法的方面级情感预测方法的实施例,包括:
步骤101、将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量。
进一步地,步骤101,包括:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
采用S={s1, s2,..., st+1,..., st+m,..., sn}表示目标文本序列,其中,si则表示目标文本序列中的第i个单词,而n为文本长度,方面词为{st+1,...,st+m},m为方面词长度;对每个单词si都可以采用预设向量映射模型进行向量映射操作,得到词嵌入向量,多个词嵌入向量组合在一起可以表达为词嵌入矩阵V={v1,v2,...,vn},其中d emb 表示词向量的维度。预置常识知识嵌入向量是根据先验知识信息提取的向量,能够为文本中的长句分析提供先验知识,从而提高长句分析的准确率。此外,在本实施例中,预设向量映射模型选取的是Roberta,还可以根据需要作其他设计,在此仅作示例,不作限定。
进一步地,步骤101,之前还包括:
通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
根据目标文本序列在实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
DistMult模型是一种双线性模型,可以提取知识库中的实体和关系的表示,本实施例采用该模型完成实体向量表达表的构建。预置常识知识嵌入向量是在wordNet2数据集中提取出来的,首先是采用DistMult模型对wordNet2数据集进行训练,得到实体向量表示表,即实体向量表达表,然后根据目标文本序列S在表中查找对应的知识嵌入向量,得到预置常识知识嵌入向量,将常识知识嵌入向量组合就可以得到常识知识嵌入矩阵,表达为K={k1, k2,..., kn},k emb 表示向量的维度。
此外,词嵌入向量vi与预置常识知识嵌入向量ki进行拼接可以是矩阵拼接,向量拼接得到待分析语义向量表达为xi=[vi;ki],,而形成的待分析语义矩阵表达为X={x1, x2,..., xn}。
步骤102、基于自注意力机制,采用预设Bi-GRU对待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵。
进一步地,步骤102,包括:
将待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
预设Bi-GRU能够有效缓解RNN梯度消失,并且比Bi-LSTM所需的训练参数更少,可以在保证网络性能的情况下,减少计算量。
将X={x1, x2,..., xn}作为输入,采用预设Bi-GRU提取语义信息向量中上下文语义特征,得到语义信息向量,表达为H={h1, h2,..., hn},其中,,而表示隐状态向量的维度,的计算公式表达为:
其中,为第 i个单词的嵌入向量表达,为正向GRU计算的上下文语义信息的第 i个单词的隐状态表示,为反向GRU计算的上下文语义信息的第 i个单词的隐状态表示,将使用concat函数拼接得到,其中,的维度均为dh
基于自注意力机制根据上下文语义特征向量H可以计算出语义信息向量Hc,同时计算出注意力分数矩阵 M score ,具体计算过程表达为:
其中,表示文本中第 j个单词对第 i个单词的重要程度,均为可训练的参数矩阵, d的维度。
语义信息向量Hc的计算过程表达为:
其中,同样是可训练的参数矩阵,为深层语义表征。
步骤103、将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加,得到增强邻接矩阵,依存树根据目标文本序列解析得到。
使用spacy工具对目标文本序列进行解析,就可以得到句法依存树,本质上句法依存树是一个图,可以表达为G={V,E},文本中所有单词都是一个顶点v,构成集合V,单词之间的连接关系作为边e,形成集合E;根据句法依存树创建一个关于句子的邻接矩阵,即关系邻接矩阵,,其中n为文本长度,即单词个数,表示节点vi和vj在依存树中的连接关系,若vi和vj之间存在连接关系,则赋值为1,否则赋值为0。此外,为了保留节点信息,对所有节点加入自循环,当i=j时,赋值为1。
由于自注意力机制能够挖掘句子中每个单词与其它所有单词之间的关联程度,一定程度上包含了潜在的语法信息。因此,将注意力分数矩阵 M score 与关系邻接矩阵相加得到增强邻接矩阵,表达为:
其中,,优化后的增强邻接矩阵能够缓解依存树中连接关系缺失的问题,进而提高分类的准确率。
步骤104、通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算,得到句法信息向量。
相比于卷积神经网络和循环神经网络,图神经网络GCN更能捕获图结构数据的信息,本实施例中的预设图神经网络模型使用两层的GCN来提取特征,将语义信息向量Hc和增强邻接矩阵作为第 层GCN的输入,第二层GCN的输出作为句法信息向量Hs;其中第 l层的计算公式如下:
其中,为第 l层GCN的输出,为第 l层GCN的权重矩阵,为第 l层GCN的偏置矩阵,ReLU是线性激活函数,l-1层图神经网络的输出,作为第 l层的输入,为增强邻接矩阵的度矩阵。
步骤105、对语义信息向量和句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
进一步地,步骤105,包括:
采用预设平均池化函数将语义信息向量和句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将语义向量表达和语法向量表达通过门控机制融合成融合表达向量;
依据融合表达向量进行情感预测操作,得到情感类别。
方面词的语义感知向量可以表达为,即基于语义信息向量提取的方面词对应的语义感知向量集,方面词的语法感知向量表达为,即基于句法信息向量提取的方面词的语法感知向量集。
预设平均池化函数可以根据实际情况配置,只要能实现方面词的语义语法向量表达即可,本实施例采用预设平均池化函数pooling进行向量化表达:
其中,分别为语义向量表达和语法向量表达。
采用门控机制将语义向量表达和语法向量表达进行融合:
其中,为sigmoid激活函数,为可训练权重矩阵,为偏置向量,为计算得到的比例系数,为方面词的融合表达向量。将融合表达向量输入网络模型的全连接层,采用softmax分类器进行极性预测:
其中,Wp和bp是可训练的权重矩阵和偏置量,c为情感类别的数量。请参阅图3,为本实施例的整体情感预测网络结构示意图,本实施例引入常识知识,能够增强模型对于复杂句子的理解,得到更为准确的特定方面的情感信息。而通过使用注意力分数矩阵辅助依赖关系邻接矩阵,能够缓解由于评论语句口语化导致的依赖关系丢失的问题,从而增强图神经网络提取特征的能力,获得更好的预测效果。
本申请实施例提供的基于语义句法的方面级情感预测方法,本引入常识知识嵌入向量,从而加强模型对于复杂句子的理解,缓解复杂长句较难获取到方面词与情感词之间的对应关系的问题;且在语义信息向量和句法信息向量的分析过程中通过注意力分数矩阵辅助关系邻接矩阵增强图神经网络的特征提取能力,从而保证预测结果的准确性和可靠性。因此,本申请实施例能够解决现有技术中复杂文本与句法依存关系缺失,导致预测结果缺乏准确性的技术问题。
为了便于理解,请参阅图2,本申请提供了一种基于语义句法的方面级情感预测装置的实施例,包括:
向量拼接单元201,用于将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;
语义分析单元202,用于基于自注意力机制,采用预设Bi-GRU对待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;
矩阵优化单元203,用于将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加,得到增强邻接矩阵,依存树根据目标文本序列解析得到;
句法分析单元204,用于通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算,得到句法信息向量;
情感预测单元205,用于对语义信息向量和句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
进一步地,向量拼接单元201,具体用于:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
进一步地,还包括:
实体表制备单元206,用于通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
常识知识查找单元207,用于根据目标文本序列在实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
进一步地,语义分析单元202,具体用于:
将待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
进一步地,情感预测单元205,具体用于:
采用预设平均池化函数将语义信息向量和句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将语义向量表达和语法向量表达通过门控机制融合成融合表达向量;
依据融合表达向量进行情感预测操作,得到情感类别。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种基于语义句法的方面级情感预测方法,其特征在于,包括:
将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;
基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;
将根据依存树构建的关系邻接矩阵与所述注意力分数矩阵相加,得到增强邻接矩阵,所述依存树根据所述目标文本序列解析得到;
通过预设图神经网络对所述语义信息向量和所述增强邻接矩阵进行句法分析计算,得到句法信息向量;
对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
2.根据权利要求1所述的基于语义句法的方面级情感预测方法,其特征在于,所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量,包括:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将所述词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
3.根据权利要求1所述的基于语义句法的方面级情感预测方法,其特征在于,所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量,之前还包括:
通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
根据所述目标文本序列在所述实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
4.根据权利要求1所述的基于语义句法的方面级情感预测方法,其特征在于,所述基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵,包括:
将所述待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据所述上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
5.根据权利要求1所述的基于语义句法的方面级情感预测方法,其特征在于,所述对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别,包括:
采用预设平均池化函数将所述语义信息向量和所述句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将所述语义向量表达和所述语法向量表达通过门控机制融合成融合表达向量;
依据所述融合表达向量进行情感预测操作,得到情感类别。
6.一种基于语义句法的方面级情感预测装置,其特征在于,包括:
向量拼接单元,用于将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;
语义分析单元,用于基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;
矩阵优化单元,用于将根据依存树构建的关系邻接矩阵与所述注意力分数矩阵相加,得到增强邻接矩阵,所述依存树根据所述目标文本序列解析得到;
句法分析单元,用于通过预设图神经网络对所述语义信息向量和所述增强邻接矩阵进行句法分析计算,得到句法信息向量;
情感预测单元,用于对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
7.根据权利要求6所述的基于语义句法的方面级情感预测装置,其特征在于,所述向量拼接单元,具体用于:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将所述词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
8.根据权利要求6所述的基于语义句法的方面级情感预测装置,其特征在于,还包括:
实体表制备单元,用于通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
常识知识查找单元,用于根据所述目标文本序列在所述实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
9.根据权利要求6所述的基于语义句法的方面级情感预测装置,其特征在于,所述语义分析单元,具体用于:
将所述待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据所述上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
10.根据权利要求6所述的基于语义句法的方面级情感预测装置,其特征在于,所述情感预测单元,具体用于:
采用预设平均池化函数将所述语义信息向量和所述句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将所述语义向量表达和所述语法向量表达通过门控机制融合成融合表达向量;
依据所述融合表达向量进行情感预测操作,得到情感类别。
CN202310102503.9A 2023-02-13 2023-02-13 一种基于语义句法的方面级情感预测方法及装置 Active CN115860006B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310102503.9A CN115860006B (zh) 2023-02-13 2023-02-13 一种基于语义句法的方面级情感预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310102503.9A CN115860006B (zh) 2023-02-13 2023-02-13 一种基于语义句法的方面级情感预测方法及装置

Publications (2)

Publication Number Publication Date
CN115860006A CN115860006A (zh) 2023-03-28
CN115860006B true CN115860006B (zh) 2023-04-25

Family

ID=85657947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310102503.9A Active CN115860006B (zh) 2023-02-13 2023-02-13 一种基于语义句法的方面级情感预测方法及装置

Country Status (1)

Country Link
CN (1) CN115860006B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116029294B (zh) * 2023-03-30 2023-06-09 华南师范大学 词项配对方法、装置及设备
CN116304748B (zh) * 2023-05-17 2023-07-28 成都工业学院 一种文本相似度计算方法、系统、设备及介质
CN117194614B (zh) * 2023-11-02 2024-01-30 北京中电普华信息技术有限公司 一种文本差异识别方法、装置和计算机可读介质
CN118013045A (zh) * 2024-04-02 2024-05-10 深圳市奥福德电子科技有限公司 基于人工智能的语句情感检测方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259142A (zh) * 2020-01-14 2020-06-09 华南师范大学 基于注意力编码和图卷积网络的特定目标情感分类方法
CN112115700A (zh) * 2020-08-19 2020-12-22 北京交通大学 一种基于依存句法树和深度学习的方面级情感分析方法
CN112131383A (zh) * 2020-08-26 2020-12-25 华南师范大学 特定目标的情感极性分类方法
CN112528672A (zh) * 2020-12-14 2021-03-19 北京邮电大学 一种基于图卷积神经网络的方面级情感分析方法及装置
CN113535904A (zh) * 2021-07-23 2021-10-22 重庆邮电大学 一种基于图神经网络的方面级情感分析方法
CN115099219A (zh) * 2022-07-06 2022-09-23 曲阜师范大学 一种基于增强图卷积神经网络的方面级情感分析方法
CN115204183A (zh) * 2022-09-19 2022-10-18 华南师范大学 基于知识增强的双通道情感分析方法、装置以及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11501187B2 (en) * 2019-09-24 2022-11-15 International Business Machines Corporation Opinion snippet detection for aspect-based sentiment analysis

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259142A (zh) * 2020-01-14 2020-06-09 华南师范大学 基于注意力编码和图卷积网络的特定目标情感分类方法
CN112115700A (zh) * 2020-08-19 2020-12-22 北京交通大学 一种基于依存句法树和深度学习的方面级情感分析方法
CN112131383A (zh) * 2020-08-26 2020-12-25 华南师范大学 特定目标的情感极性分类方法
CN112528672A (zh) * 2020-12-14 2021-03-19 北京邮电大学 一种基于图卷积神经网络的方面级情感分析方法及装置
CN113535904A (zh) * 2021-07-23 2021-10-22 重庆邮电大学 一种基于图神经网络的方面级情感分析方法
CN115099219A (zh) * 2022-07-06 2022-09-23 曲阜师范大学 一种基于增强图卷积神经网络的方面级情感分析方法
CN115204183A (zh) * 2022-09-19 2022-10-18 华南师范大学 基于知识增强的双通道情感分析方法、装置以及设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Luwei Xiao et.al.Multi-head self-attention based gated graph convolutional networks for aspect-based sentiment classification.《Multimedia Tools and Applications (2022)》.2020,第19051–19070页. *
Zheng Zhang et.al.SSEGCN: Syntactic and Semantic Enhanced Graph Convolutional Network for Aspect-based Sentiment Analysis.《Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies》.2022,第4916 - 4925页. *
张文轩 等.用于方面级情感分析的情感增强双图卷积网络.《计算机科学与探索》.2023,第1-18页. *

Also Published As

Publication number Publication date
CN115860006A (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
CN109213995B (zh) 一种基于双语词嵌入的跨语言文本相似度评估技术
CN115860006B (zh) 一种基于语义句法的方面级情感预测方法及装置
CN112668671B (zh) 预训练模型的获取方法和装置
WO2019080863A1 (zh) 文本情感分类方法、存储介质及计算机
CN106202010A (zh) 基于深度神经网络构建法律文本语法树的方法和装置
CN110619044B (zh) 一种情感分析方法、系统、存储介质及设备
CN108038725A (zh) 一种基于机器学习的电商产品客户满意度分析方法
JP2004110161A (ja) テキスト文比較装置
CN110929034A (zh) 一种基于改进lstm的商品评论细粒度情感分类方法
CN107357793A (zh) 信息推荐方法和装置
CN110765769B (zh) 一种基于子句特征的实体属性依赖情感分析方法
CN108319734A (zh) 一种基于线性组合器的产品特征结构树自动构建方法
CN108108468A (zh) 一种基于概念和文本情感的短文本情感分析方法和装置
CN114547298A (zh) 基于多头注意力和图卷积网络结合R-Drop机制的生物医学关系抽取方法、装置和介质
Zhang et al. A multi-feature fusion model for Chinese relation extraction with entity sense
JP2018025874A (ja) テキスト解析装置及びプログラム
CN114358201A (zh) 基于文本的情感分类方法和装置、计算机设备、存储介质
CN115795030A (zh) 文本分类方法、装置、计算机设备和存储介质
CN114547303A (zh) 基于Bert-LSTM的文本多特征分类方法及装置
CN113361252B (zh) 基于多模态特征和情感词典的文本抑郁倾向检测系统
CN110874392A (zh) 基于深度双向注意力机制的文本网络信息融合嵌入方法
CN114417823A (zh) 一种基于句法和图卷积网络的方面级情感分析方法及装置
CN112800244A (zh) 一种中医药及民族医药知识图谱的构建方法
Midhunchakkaravarthy et al. A novel approach for feature fatigue analysis using HMM stemming and adaptive invasive weed optimisation with hybrid firework optimisation method
Preethi Survey on text transformation using Bi-LSTM in natural language processing with text data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant