CN115860006A - 一种基于语义句法的方面级情感预测方法及装置 - Google Patents
一种基于语义句法的方面级情感预测方法及装置 Download PDFInfo
- Publication number
- CN115860006A CN115860006A CN202310102503.9A CN202310102503A CN115860006A CN 115860006 A CN115860006 A CN 115860006A CN 202310102503 A CN202310102503 A CN 202310102503A CN 115860006 A CN115860006 A CN 115860006A
- Authority
- CN
- China
- Prior art keywords
- vector
- semantic
- preset
- expression
- syntactic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 33
- 239000013598 vector Substances 0.000 claims abstract description 277
- 239000011159 matrix material Substances 0.000 claims abstract description 76
- 230000014509 gene expression Effects 0.000 claims abstract description 64
- 238000004458 analytical method Methods 0.000 claims abstract description 40
- 230000007246 mechanism Effects 0.000 claims abstract description 26
- 238000013528 artificial neural network Methods 0.000 claims abstract description 15
- 238000004364 calculation method Methods 0.000 claims abstract description 11
- 238000013507 mapping Methods 0.000 claims description 15
- 230000004927 fusion Effects 0.000 claims description 13
- 239000013604 expression vector Substances 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 11
- 238000011176 pooling Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Machine Translation (AREA)
Abstract
本申请公开了一种基于语义句法的方面级情感预测方法及装置,方法包括:将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得待分析语义向量;基于自注意力机制,采用预设Bi‑GRU对待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加,得增强邻接矩阵,依存树根据目标文本序列解析得到;通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算,得到句法信息向量;对语义信息向量和句法信息向量分别进行方面词的向量表达,并预测得到情感类别。本申请能解决现有技术中复杂文本与句法依存关系缺失,导致预测结果缺乏准确性的技术问题。
Description
技术领域
本申请涉及自然语言分析技术领域,尤其涉及一种基于语义句法的方面级情感预测方法及装置。
背景技术
方面级情感分析是情感分析的一个子领域,是一种更细粒度的情感分析,对于评论文本中出现的方面词给出对应的情感极性,通常分为积极,中立,消极三种情感态度。例如在“这款笔记本电脑屏幕非常不错,但是电池续航差了些。”这条评论中,用户分别对笔记本的屏幕给了正面评价,对于笔记本的电池给了消极的评价。粗粒度情感分析只给出对于这款笔记本积极或者消极的预测,过于笼统。而方面级情感分析则是要将评论中用户对某个事物不同方面的态度进行分析;这种更细粒度的分析,一方面,有助于买家从自己看重的特征方面决定是否购买,另一方面,让商家能对自身的产品有更全面的认识,从而进行针对性的改进。方面级情感分析能够提供更多维度的评价信息,因此具有更大实际应用价值。
目前基于方面级情感分析的主要方法有两种,即基于上下文语义特征提取的方法和基于句法特征提取的方法。然而,现有方法大多数采用循环神经网络和注意力机制来获取文本的上下文隐式语义,这会导致在一些复杂的长句中难以准确地获取方面词和对应情感词的对应关系。而且,在一些评论文本中存在大量口语化的表达,并不符合正式的语法规则,从而导致依存树中可能会存在依存关系缺失的问题,使得关系矩阵过于稀疏,导致模型预测的准确率不高。
发明内容
本申请提供了一种基于语义句法的方面级情感预测方法及装置,用于解决现有技术中复杂文本与句法依存关系缺失,导致预测结果缺乏准确性的技术问题。
有鉴于此,本申请第一方面提供了一种基于语义句法的方面级情感预测方法,包括:
将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;
基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;
将根据依存树构建的关系邻接矩阵与所述注意力分数矩阵相加,得到增强邻接矩阵,所述依存树根据所述目标文本序列解析得到;
通过预设图神经网络对所述语义信息向量和所述增强邻接矩阵进行句法分析计算,得到句法信息向量;
对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
优选地,所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量,包括:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将所述词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
优选地,所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量,之前还包括:
通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
根据所述目标文本序列在所述实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
优选地,所述基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵,包括:
将所述待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据所述上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
优选地,所述对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别,包括:
采用预设平均池化函数将所述语义信息向量和所述句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将所述语义向量表达和所述语法向量表达通过门控机制融合成融合表达向量;
依据所述融合表达向量进行情感预测操作,得到情感类别。
本申请第二方面提供了一种基于语义句法的方面级情感预测装置,包括:
向量拼接单元,用于将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;
语义分析单元,用于基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;
矩阵优化单元,用于将根据依存树构建的关系邻接矩阵与所述注意力分数矩阵相加,得到增强邻接矩阵,所述依存树根据所述目标文本序列解析得到;
句法分析单元,用于通过预设图神经网络对所述语义信息向量和所述增强邻接矩阵进行句法分析计算,得到句法信息向量;
情感预测单元,用于对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
优选地,所述向量拼接单元,具体用于:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将所述词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
优选地,还包括:
实体表制备单元,用于通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
常识知识查找单元,用于根据所述目标文本序列在所述实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
优选地,所述语义分析单元,具体用于:
将所述待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据所述上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
优选地,所述情感预测单元,具体用于:
采用预设平均池化函数将所述语义信息向量和所述句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将所述语义向量表达和所述语法向量表达通过门控机制融合成融合表达向量;
依据所述融合表达向量进行情感预测操作,得到情感类别。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中,提供了一种基于语义句法的方面级情感预测方法,包括:将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;基于自注意力机制,采用预设Bi-GRU对待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加,得到增强邻接矩阵,依存树根据目标文本序列解析得到;通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算,得到句法信息向量;对语义信息向量和句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
本申请提供的基于语义句法的方面级情感预测方法,本引入常识知识嵌入向量,从而加强模型对于复杂句子的理解,缓解复杂长句较难获取到方面词与情感词之间的对应关系的问题;且在语义信息向量和句法信息向量的分析过程中通过注意力分数矩阵辅助关系邻接矩阵增强图神经网络的特征提取能力,从而保证预测结果的准确性和可靠性。因此,本申请能够解决现有技术中复杂文本与句法依存关系缺失,导致预测结果缺乏准确性的技术问题。
附图说明
图1为本申请实施例提供的一种基于语义句法的方面级情感预测方法的流程示意图;
图2为本申请实施例提供的一种基于语义句法的方面级情感预测装置的结构示意图;
图3为本申请实施例提供的文本序列分析网络结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供的一种基于语义句法的方面级情感预测方法的实施例,包括:
步骤101、将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量。
进一步地,步骤101,包括:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
采用S={s1, s2,..., st+1,..., st+m,..., sn}表示目标文本序列,其中,si则表示目标文本序列中的第i个单词,而n为文本长度,方面词为{st+1,...,st+m},m为方面词长度;对每个单词si都可以采用预设向量映射模型进行向量映射操作,得到词嵌入向量,多个词嵌入向量组合在一起可以表达为词嵌入矩阵V={v1,v2,...,vn},其中,d emb 表示词向量的维度。预置常识知识嵌入向量是根据先验知识信息提取的向量,能够为文本中的长句分析提供先验知识,从而提高长句分析的准确率。此外,在本实施例中,预设向量映射模型选取的是Roberta,还可以根据需要作其他设计,在此仅作示例,不作限定。
进一步地,步骤101,之前还包括:
通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
根据目标文本序列在实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
DistMult模型是一种双线性模型,可以提取知识库中的实体和关系的表示,本实施例采用该模型完成实体向量表达表的构建。预置常识知识嵌入向量是在wordNet2数据集中提取出来的,首先是采用DistMult模型对wordNet2数据集进行训练,得到实体向量表示表,即实体向量表达表,然后根据目标文本序列S在表中查找对应的知识嵌入向量,得到预置常识知识嵌入向量,将常识知识嵌入向量组合就可以得到常识知识嵌入矩阵,表达为K={k1, k2,..., kn},,k emb 表示向量的维度。
步骤102、基于自注意力机制,采用预设Bi-GRU对待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵。
进一步地,步骤102,包括:
将待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
预设Bi-GRU能够有效缓解RNN梯度消失,并且比Bi-LSTM所需的训练参数更少,可以在保证网络性能的情况下,减少计算量。
将X={x1, x2,..., xn}作为输入,采用预设Bi-GRU提取语义信息向量中上下文语义特征,得到语义信息向量,表达为H={h1, h2,..., hn},其中,,而表示隐状态向量的维度,的计算公式表达为:
其中,为第i个单词的嵌入向量表达,为正向GRU计算的上下文语义信息的第i个单词的隐状态表示,为反向GRU计算的上下文语义信息的第i个单词的隐状态表示,将和使用concat函数拼接得到,其中,和的维度均为dh。
基于自注意力机制根据上下文语义特征向量H可以计算出语义信息向量Hc,同时计算出注意力分数矩阵M score ,具体计算过程表达为:
步骤103、将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加,得到增强邻接矩阵,依存树根据目标文本序列解析得到。
使用spacy工具对目标文本序列进行解析,就可以得到句法依存树,本质上句法依存树是一个图,可以表达为G={V,E},文本中所有单词都是一个顶点v,构成集合V,单词之间的连接关系作为边e,形成集合E;根据句法依存树创建一个关于句子的邻接矩阵,即关系邻接矩阵,,其中n为文本长度,即单词个数,表示节点vi和vj在依存树中的连接关系,若vi和vj之间存在连接关系,则赋值为1,否则赋值为0。此外,为了保留节点信息,对所有节点加入自循环,当i=j时,赋值为1。
步骤104、通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算,得到句法信息向量。
相比于卷积神经网络和循环神经网络,图神经网络GCN更能捕获图结构数据的信息,本实施例中的预设图神经网络模型使用两层的GCN来提取特征,将语义信息向量Hc和增强邻接矩阵作为第一层GCN的输入,第二层GCN的输出作为句法信息向量Hs;其中第l层的计算公式如下:
步骤105、对语义信息向量和句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
进一步地,步骤105,包括:
采用预设平均池化函数将语义信息向量和句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将语义向量表达和语法向量表达通过门控机制融合成融合表达向量;
依据融合表达向量进行情感预测操作,得到情感类别。
预设平均池化函数可以根据实际情况配置,只要能实现方面词的语义语法向量表达即可,本实施例采用预设平均池化函数pooling进行向量化表达:
采用门控机制将语义向量表达和语法向量表达进行融合:
其中,Wp和bp是可训练的权重矩阵和偏置量,,c为情感类别的数量。请参阅图3,为本实施例的整体情感预测网络结构示意图,本实施例引入常识知识,能够增强模型对于复杂句子的理解,得到更为准确的特定方面的情感信息。而通过使用注意力分数矩阵辅助依赖关系邻接矩阵,能够缓解由于评论语句口语化导致的依赖关系丢失的问题,从而增强图神经网络提取特征的能力,获得更好的预测效果。
本申请实施例提供的基于语义句法的方面级情感预测方法,本引入常识知识嵌入向量,从而加强模型对于复杂句子的理解,缓解复杂长句较难获取到方面词与情感词之间的对应关系的问题;且在语义信息向量和句法信息向量的分析过程中通过注意力分数矩阵辅助关系邻接矩阵增强图神经网络的特征提取能力,从而保证预测结果的准确性和可靠性。因此,本申请实施例能够解决现有技术中复杂文本与句法依存关系缺失,导致预测结果缺乏准确性的技术问题。
为了便于理解,请参阅图2,本申请提供了一种基于语义句法的方面级情感预测装置的实施例,包括:
向量拼接单元201,用于将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;
语义分析单元202,用于基于自注意力机制,采用预设Bi-GRU对待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;
矩阵优化单元203,用于将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加,得到增强邻接矩阵,依存树根据目标文本序列解析得到;
句法分析单元204,用于通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算,得到句法信息向量;
情感预测单元205,用于对语义信息向量和句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
进一步地,向量拼接单元201,具体用于:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
进一步地,还包括:
实体表制备单元206,用于通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
常识知识查找单元207,用于根据目标文本序列在实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
进一步地,语义分析单元202,具体用于:
将待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
进一步地,情感预测单元205,具体用于:
采用预设平均池化函数将语义信息向量和句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将语义向量表达和语法向量表达通过门控机制融合成融合表达向量;
依据融合表达向量进行情感预测操作,得到情感类别。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种基于语义句法的方面级情感预测方法,其特征在于,包括:
将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;
基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;
将根据依存树构建的关系邻接矩阵与所述注意力分数矩阵相加,得到增强邻接矩阵,所述依存树根据所述目标文本序列解析得到;
通过预设图神经网络对所述语义信息向量和所述增强邻接矩阵进行句法分析计算,得到句法信息向量;
对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
2.根据权利要求1所述的基于语义句法的方面级情感预测方法,其特征在于,所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量,包括:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将所述词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
3.根据权利要求1所述的基于语义句法的方面级情感预测方法,其特征在于,所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量,之前还包括:
通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
根据所述目标文本序列在所述实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
4.根据权利要求1所述的基于语义句法的方面级情感预测方法,其特征在于,所述基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵,包括:
将所述待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据所述上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
5.根据权利要求1所述的基于语义句法的方面级情感预测方法,其特征在于,所述对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别,包括:
采用预设平均池化函数将所述语义信息向量和所述句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将所述语义向量表达和所述语法向量表达通过门控机制融合成融合表达向量;
依据所述融合表达向量进行情感预测操作,得到情感类别。
6.一种基于语义句法的方面级情感预测装置,其特征在于,包括:
向量拼接单元,用于将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接,得到待分析语义向量;
语义分析单元,用于基于自注意力机制,采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析,得到语义信息向量和注意力分数矩阵;
矩阵优化单元,用于将根据依存树构建的关系邻接矩阵与所述注意力分数矩阵相加,得到增强邻接矩阵,所述依存树根据所述目标文本序列解析得到;
句法分析单元,用于通过预设图神经网络对所述语义信息向量和所述增强邻接矩阵进行句法分析计算,得到句法信息向量;
情感预测单元,用于对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达,并预测得到情感类别。
7.根据权利要求6所述的基于语义句法的方面级情感预测装置,其特征在于,所述向量拼接单元,具体用于:
采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作,得到词嵌入向量;
将所述词嵌入向量与预置常识知识嵌入向量拼接,得到待分析语义向量。
8.根据权利要求6所述的基于语义句法的方面级情感预测装置,其特征在于,还包括:
实体表制备单元,用于通过DistMult模型对wordNet2数据集进行训练,得到实体向量表达表;
常识知识查找单元,用于根据所述目标文本序列在所述实体向量表达表中进行知识查找,得到预置常识知识嵌入向量。
9.根据权利要求6所述的基于语义句法的方面级情感预测装置,其特征在于,所述语义分析单元,具体用于:
将所述待分析语义向量输入预设Bi-GRU中进行特征提取,得到上下文语义特征向量;
基于自注意力机制根据所述上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。
10.根据权利要求6所述的基于语义句法的方面级情感预测装置,其特征在于,所述情感预测单元,具体用于:
采用预设平均池化函数将所述语义信息向量和所述句法信息向量分别进行向量表达,得到方面词的语义向量表达和语法向量表达;
将所述语义向量表达和所述语法向量表达通过门控机制融合成融合表达向量;
依据所述融合表达向量进行情感预测操作,得到情感类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310102503.9A CN115860006B (zh) | 2023-02-13 | 2023-02-13 | 一种基于语义句法的方面级情感预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310102503.9A CN115860006B (zh) | 2023-02-13 | 2023-02-13 | 一种基于语义句法的方面级情感预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115860006A true CN115860006A (zh) | 2023-03-28 |
CN115860006B CN115860006B (zh) | 2023-04-25 |
Family
ID=85657947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310102503.9A Active CN115860006B (zh) | 2023-02-13 | 2023-02-13 | 一种基于语义句法的方面级情感预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115860006B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116029294A (zh) * | 2023-03-30 | 2023-04-28 | 华南师范大学 | 词项配对方法、装置及设备 |
CN116304748A (zh) * | 2023-05-17 | 2023-06-23 | 成都工业学院 | 一种文本相似度计算方法、系统、设备及介质 |
CN117194614A (zh) * | 2023-11-02 | 2023-12-08 | 北京中电普华信息技术有限公司 | 一种文本差异识别方法、装置和计算机可读介质 |
CN118013045A (zh) * | 2024-04-02 | 2024-05-10 | 深圳市奥福德电子科技有限公司 | 基于人工智能的语句情感检测方法及装置 |
CN118469408A (zh) * | 2024-07-11 | 2024-08-09 | 杭州和利时自动化有限公司 | 火电厂运行人员绩效数据处理方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259142A (zh) * | 2020-01-14 | 2020-06-09 | 华南师范大学 | 基于注意力编码和图卷积网络的特定目标情感分类方法 |
CN112115700A (zh) * | 2020-08-19 | 2020-12-22 | 北京交通大学 | 一种基于依存句法树和深度学习的方面级情感分析方法 |
CN112131383A (zh) * | 2020-08-26 | 2020-12-25 | 华南师范大学 | 特定目标的情感极性分类方法 |
CN112528672A (zh) * | 2020-12-14 | 2021-03-19 | 北京邮电大学 | 一种基于图卷积神经网络的方面级情感分析方法及装置 |
US20210089936A1 (en) * | 2019-09-24 | 2021-03-25 | International Business Machines Corporation | Opinion snippet detection for aspect-based sentiment analysis |
CN113535904A (zh) * | 2021-07-23 | 2021-10-22 | 重庆邮电大学 | 一种基于图神经网络的方面级情感分析方法 |
CN115099219A (zh) * | 2022-07-06 | 2022-09-23 | 曲阜师范大学 | 一种基于增强图卷积神经网络的方面级情感分析方法 |
CN115204183A (zh) * | 2022-09-19 | 2022-10-18 | 华南师范大学 | 基于知识增强的双通道情感分析方法、装置以及设备 |
-
2023
- 2023-02-13 CN CN202310102503.9A patent/CN115860006B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210089936A1 (en) * | 2019-09-24 | 2021-03-25 | International Business Machines Corporation | Opinion snippet detection for aspect-based sentiment analysis |
CN111259142A (zh) * | 2020-01-14 | 2020-06-09 | 华南师范大学 | 基于注意力编码和图卷积网络的特定目标情感分类方法 |
CN112115700A (zh) * | 2020-08-19 | 2020-12-22 | 北京交通大学 | 一种基于依存句法树和深度学习的方面级情感分析方法 |
CN112131383A (zh) * | 2020-08-26 | 2020-12-25 | 华南师范大学 | 特定目标的情感极性分类方法 |
CN112528672A (zh) * | 2020-12-14 | 2021-03-19 | 北京邮电大学 | 一种基于图卷积神经网络的方面级情感分析方法及装置 |
CN113535904A (zh) * | 2021-07-23 | 2021-10-22 | 重庆邮电大学 | 一种基于图神经网络的方面级情感分析方法 |
CN115099219A (zh) * | 2022-07-06 | 2022-09-23 | 曲阜师范大学 | 一种基于增强图卷积神经网络的方面级情感分析方法 |
CN115204183A (zh) * | 2022-09-19 | 2022-10-18 | 华南师范大学 | 基于知识增强的双通道情感分析方法、装置以及设备 |
Non-Patent Citations (3)
Title |
---|
LUWEI XIAO ET.AL: "Multi-head self-attention based gated graph convolutional networks for aspect-based sentiment classification" * |
ZHENG ZHANG ET.AL: "SSEGCN: Syntactic and Semantic Enhanced Graph Convolutional Network for Aspect-based Sentiment Analysis" * |
张文轩 等: "用于方面级情感分析的情感增强双图卷积网络" * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116029294A (zh) * | 2023-03-30 | 2023-04-28 | 华南师范大学 | 词项配对方法、装置及设备 |
CN116304748A (zh) * | 2023-05-17 | 2023-06-23 | 成都工业学院 | 一种文本相似度计算方法、系统、设备及介质 |
CN116304748B (zh) * | 2023-05-17 | 2023-07-28 | 成都工业学院 | 一种文本相似度计算方法、系统、设备及介质 |
CN117194614A (zh) * | 2023-11-02 | 2023-12-08 | 北京中电普华信息技术有限公司 | 一种文本差异识别方法、装置和计算机可读介质 |
CN117194614B (zh) * | 2023-11-02 | 2024-01-30 | 北京中电普华信息技术有限公司 | 一种文本差异识别方法、装置和计算机可读介质 |
CN118013045A (zh) * | 2024-04-02 | 2024-05-10 | 深圳市奥福德电子科技有限公司 | 基于人工智能的语句情感检测方法及装置 |
CN118469408A (zh) * | 2024-07-11 | 2024-08-09 | 杭州和利时自动化有限公司 | 火电厂运行人员绩效数据处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115860006B (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109213995B (zh) | 一种基于双语词嵌入的跨语言文本相似度评估技术 | |
WO2019153737A1 (zh) | 用于对评论进行评估的方法、装置、设备和存储介质 | |
CN115860006A (zh) | 一种基于语义句法的方面级情感预测方法及装置 | |
CN109376222B (zh) | 问答匹配度计算方法、问答自动匹配方法及装置 | |
CN113095415B (zh) | 一种基于多模态注意力机制的跨模态哈希方法及系统 | |
CN106611375A (zh) | 一种基于文本分析的信用风险评估方法及装置 | |
CN109214006B (zh) | 图像增强的层次化语义表示的自然语言推理方法 | |
CN112115700A (zh) | 一种基于依存句法树和深度学习的方面级情感分析方法 | |
CN108108468A (zh) | 一种基于概念和文本情感的短文本情感分析方法和装置 | |
JP6720764B2 (ja) | テキスト解析装置及びプログラム | |
CN113326374B (zh) | 基于特征增强的短文本情感分类方法及系统 | |
Zhang et al. | A multi-feature fusion model for Chinese relation extraction with entity sense | |
CN106997341A (zh) | 一种创新方案匹配方法、装置、服务器及系统 | |
CN109101490B (zh) | 一种基于融合特征表示的事实型隐式情感识别方法和系统 | |
CN114547298A (zh) | 基于多头注意力和图卷积网络结合R-Drop机制的生物医学关系抽取方法、装置和介质 | |
CN112883714A (zh) | 基于依赖图卷积和迁移学习的absc任务句法约束方法 | |
CN110874536A (zh) | 语料质量评估模型生成方法和双语句对互译质量评估方法 | |
CN114818717A (zh) | 融合词汇和句法信息的中文命名实体识别方法及系统 | |
CN114417823B (zh) | 一种基于句法和图卷积网络的方面级情感分析方法及装置 | |
CN115510230A (zh) | 一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法 | |
CN111259147A (zh) | 基于自适应注意力机制的句子级情感预测方法及系统 | |
Hu et al. | A cross-media deep relationship classification method using discrimination information | |
Obamuyide et al. | Contextual pattern embeddings for one-shot relation extraction. | |
Zhang et al. | Text Sentiment Analysis with Event Information | |
CN115168599B (zh) | 多三元组抽取方法、装置、设备、介质及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |