CN115860006B

CN115860006B - 一种基于语义句法的方面级情感预测方法及装置

Info

Publication number: CN115860006B
Application number: CN202310102503.9A
Authority: CN
Inventors: 冯忠武; 刘广聪
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2023-02-13
Filing date: 2023-02-13
Publication date: 2023-04-25
Anticipated expiration: 2043-02-13
Also published as: CN115860006A

Abstract

本申请公开了一种基于语义句法的方面级情感预测方法及装置，方法包括：将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接，得待分析语义向量；基于自注意力机制，采用预设Bi‑GRU对待分析语义向量进行上下文语义分析，得到语义信息向量和注意力分数矩阵；将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加，得增强邻接矩阵，依存树根据目标文本序列解析得到；通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算，得到句法信息向量；对语义信息向量和句法信息向量分别进行方面词的向量表达，并预测得到情感类别。本申请能解决现有技术中复杂文本与句法依存关系缺失，导致预测结果缺乏准确性的技术问题。

Description

一种基于语义句法的方面级情感预测方法及装置

技术领域

本申请涉及自然语言分析技术领域，尤其涉及一种基于语义句法的方面级情感预测方法及装置。

背景技术

方面级情感分析是情感分析的一个子领域，是一种更细粒度的情感分析，对于评论文本中出现的方面词给出对应的情感极性，通常分为积极，中立，消极三种情感态度。例如在“这款笔记本电脑屏幕非常不错，但是电池续航差了些。”这条评论中，用户分别对笔记本的屏幕给了正面评价，对于笔记本的电池给了消极的评价。粗粒度情感分析只给出对于这款笔记本积极或者消极的预测，过于笼统。而方面级情感分析则是要将评论中用户对某个事物不同方面的态度进行分析；这种更细粒度的分析，一方面，有助于买家从自己看重的特征方面决定是否购买，另一方面，让商家能对自身的产品有更全面的认识，从而进行针对性的改进。方面级情感分析能够提供更多维度的评价信息，因此具有更大实际应用价值。

目前基于方面级情感分析的主要方法有两种，即基于上下文语义特征提取的方法和基于句法特征提取的方法。然而，现有方法大多数采用循环神经网络和注意力机制来获取文本的上下文隐式语义，这会导致在一些复杂的长句中难以准确地获取方面词和对应情感词的对应关系。而且，在一些评论文本中存在大量口语化的表达，并不符合正式的语法规则，从而导致依存树中可能会存在依存关系缺失的问题，使得关系矩阵过于稀疏，导致模型预测的准确率不高。

发明内容

本申请提供了一种基于语义句法的方面级情感预测方法及装置，用于解决现有技术中复杂文本与句法依存关系缺失，导致预测结果缺乏准确性的技术问题。

有鉴于此，本申请第一方面提供了一种基于语义句法的方面级情感预测方法，包括：

将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接，得到待分析语义向量；

基于自注意力机制，采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析，得到语义信息向量和注意力分数矩阵；

将根据依存树构建的关系邻接矩阵与所述注意力分数矩阵相加，得到增强邻接矩阵，所述依存树根据所述目标文本序列解析得到；

通过预设图神经网络对所述语义信息向量和所述增强邻接矩阵进行句法分析计算，得到句法信息向量；

对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达，并预测得到情感类别。

优选地，所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接，得到待分析语义向量，包括：

采用预设向量映射模型对目标文本序列中的单词进行词向量映射操作，得到词嵌入向量；

将所述词嵌入向量与预置常识知识嵌入向量拼接，得到待分析语义向量。

优选地，所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接，得到待分析语义向量，之前还包括：

通过DistMult模型对wordNet2数据集进行训练，得到实体向量表达表；

根据所述目标文本序列在所述实体向量表达表中进行知识查找，得到预置常识知识嵌入向量。

优选地，所述基于自注意力机制，采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析，得到语义信息向量和注意力分数矩阵，包括：

将所述待分析语义向量输入预设Bi-GRU中进行特征提取，得到上下文语义特征向量；

基于自注意力机制根据所述上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。

优选地，所述对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达，并预测得到情感类别，包括：

采用预设平均池化函数将所述语义信息向量和所述句法信息向量分别进行向量表达，得到方面词的语义向量表达和语法向量表达；

将所述语义向量表达和所述语法向量表达通过门控机制融合成融合表达向量；

依据所述融合表达向量进行情感预测操作，得到情感类别。

本申请第二方面提供了一种基于语义句法的方面级情感预测装置，包括：

向量拼接单元，用于将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接，得到待分析语义向量；

语义分析单元，用于基于自注意力机制，采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析，得到语义信息向量和注意力分数矩阵；

矩阵优化单元，用于将根据依存树构建的关系邻接矩阵与所述注意力分数矩阵相加，得到增强邻接矩阵，所述依存树根据所述目标文本序列解析得到；

句法分析单元，用于通过预设图神经网络对所述语义信息向量和所述增强邻接矩阵进行句法分析计算，得到句法信息向量；

情感预测单元，用于对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达，并预测得到情感类别。

优选地，所述向量拼接单元，具体用于：

优选地，还包括：

实体表制备单元，用于通过DistMult模型对wordNet2数据集进行训练，得到实体向量表达表；

常识知识查找单元，用于根据所述目标文本序列在所述实体向量表达表中进行知识查找，得到预置常识知识嵌入向量。

优选地，所述语义分析单元，具体用于：

优选地，所述情感预测单元，具体用于：

依据所述融合表达向量进行情感预测操作，得到情感类别。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请中，提供了一种基于语义句法的方面级情感预测方法，包括：将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接，得到待分析语义向量；基于自注意力机制，采用预设Bi-GRU对待分析语义向量进行上下文语义分析，得到语义信息向量和注意力分数矩阵；将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加，得到增强邻接矩阵，依存树根据目标文本序列解析得到；通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算，得到句法信息向量；对语义信息向量和句法信息向量分别进行方面词的向量表达，并预测得到情感类别。

本申请提供的基于语义句法的方面级情感预测方法，本引入常识知识嵌入向量，从而加强模型对于复杂句子的理解，缓解复杂长句较难获取到方面词与情感词之间的对应关系的问题；且在语义信息向量和句法信息向量的分析过程中通过注意力分数矩阵辅助关系邻接矩阵增强图神经网络的特征提取能力，从而保证预测结果的准确性和可靠性。因此，本申请能够解决现有技术中复杂文本与句法依存关系缺失，导致预测结果缺乏准确性的技术问题。

附图说明

图1为本申请实施例提供的一种基于语义句法的方面级情感预测方法的流程示意图；

图2为本申请实施例提供的一种基于语义句法的方面级情感预测装置的结构示意图；

图3为本申请实施例提供的文本序列分析网络结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于理解，请参阅图1，本申请提供的一种基于语义句法的方面级情感预测方法的实施例，包括：

步骤101、将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接，得到待分析语义向量。

进一步地，步骤101，包括：

将词嵌入向量与预置常识知识嵌入向量拼接，得到待分析语义向量。

采用S={s₁, s₂,..., s_t+1,..., s_t+m,..., s_n}表示目标文本序列，其中，s_i则表示目标文本序列中的第i个单词，而n为文本长度，方面词为{s_t+1,...,s_t+m}，m为方面词长度；对每个单词s_i都可以采用预设向量映射模型进行向量映射操作，得到词嵌入向量，多个词嵌入向量组合在一起可以表达为词嵌入矩阵V={v₁,v₂,...,v_n}，其中， d _emb表示词向量的维度。预置常识知识嵌入向量是根据先验知识信息提取的向量，能够为文本中的长句分析提供先验知识，从而提高长句分析的准确率。此外，在本实施例中，预设向量映射模型选取的是Roberta，还可以根据需要作其他设计，在此仅作示例，不作限定。

进一步地，步骤101，之前还包括：

根据目标文本序列在实体向量表达表中进行知识查找，得到预置常识知识嵌入向量。

DistMult模型是一种双线性模型，可以提取知识库中的实体和关系的表示，本实施例采用该模型完成实体向量表达表的构建。预置常识知识嵌入向量是在wordNet2数据集中提取出来的，首先是采用DistMult模型对wordNet2数据集进行训练，得到实体向量表示表，即实体向量表达表，然后根据目标文本序列S在表中查找对应的知识嵌入向量，得到预置常识知识嵌入向量，将常识知识嵌入向量组合就可以得到常识知识嵌入矩阵，表达为K={k1, k2,..., kn}，， k _emb表示向量的维度。

此外，词嵌入向量v_i与预置常识知识嵌入向量k_i进行拼接可以是矩阵拼接，向量拼接得到待分析语义向量表达为xi=[vi；ki]，，而形成的待分析语义矩阵表达为X={x1, x2,..., xn}。

步骤102、基于自注意力机制，采用预设Bi-GRU对待分析语义向量进行上下文语义分析，得到语义信息向量和注意力分数矩阵。

进一步地，步骤102，包括：

将待分析语义向量输入预设Bi-GRU中进行特征提取，得到上下文语义特征向量；

基于自注意力机制根据上下文语义特征向量分别计算出语义信息向量和注意力分数矩阵。

预设Bi-GRU能够有效缓解RNN梯度消失，并且比Bi-LSTM所需的训练参数更少，可以在保证网络性能的情况下，减少计算量。

将X={x₁, x₂,..., x_n}作为输入，采用预设Bi-GRU提取语义信息向量中上下文语义特征，得到语义信息向量，表达为H={h₁, h₂,..., h_n}，其中，，而表示隐状态向量的维度，的计算公式表达为：

；

其中，为第 i个单词的嵌入向量表达，为正向GRU计算的上下文语义信息的第 i个单词的隐状态表示，为反向GRU计算的上下文语义信息的第 i个单词的隐状态表示，将和使用concat函数拼接得到，其中，和的维度均为d_h。

基于自注意力机制根据上下文语义特征向量H可以计算出语义信息向量Hc，同时计算出注意力分数矩阵 M ^score，具体计算过程表达为：

；

其中，，表示文本中第 j个单词对第 i个单词的重要程度，，，均为可训练的参数矩阵， d为的维度。

语义信息向量Hc的计算过程表达为：；

其中，同样是可训练的参数矩阵，为深层语义表征。

步骤103、将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加，得到增强邻接矩阵，依存树根据目标文本序列解析得到。

使用spacy工具对目标文本序列进行解析，就可以得到句法依存树，本质上句法依存树是一个图，可以表达为G={V，E}，文本中所有单词都是一个顶点v，构成集合V，单词之间的连接关系作为边e，形成集合E；根据句法依存树创建一个关于句子的邻接矩阵，即关系邻接矩阵，，其中n为文本长度，即单词个数，表示节点v_i和v_j在依存树中的连接关系，若v_i和v_j之间存在连接关系，则赋值为1，否则赋值为0。此外，为了保留节点信息，对所有节点加入自循环，当i=j时，赋值为1。

由于自注意力机制能够挖掘句子中每个单词与其它所有单词之间的关联程度，一定程度上包含了潜在的语法信息。因此，将注意力分数矩阵 M ^score与关系邻接矩阵相加得到增强邻接矩阵，表达为：

；

其中，，优化后的增强邻接矩阵能够缓解依存树中连接关系缺失的问题，进而提高分类的准确率。

步骤104、通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算，得到句法信息向量。

相比于卷积神经网络和循环神经网络，图神经网络GCN更能捕获图结构数据的信息，本实施例中的预设图神经网络模型使用两层的GCN来提取特征，将语义信息向量Hc和增强邻接矩阵作为第一层GCN的输入，第二层GCN的输出作为句法信息向量Hs；其中第 l层的计算公式如下：

；

其中，为第 l层GCN的输出，为第 l层GCN的权重矩阵，为第 l层GCN的偏置矩阵，ReLU是线性激活函数，为 l-1层图神经网络的输出，作为第 l层的输入，为增强邻接矩阵的度矩阵。

步骤105、对语义信息向量和句法信息向量分别进行方面词的向量表达，并预测得到情感类别。

进一步地，步骤105，包括：

采用预设平均池化函数将语义信息向量和句法信息向量分别进行向量表达，得到方面词的语义向量表达和语法向量表达；

将语义向量表达和语法向量表达通过门控机制融合成融合表达向量；

依据融合表达向量进行情感预测操作，得到情感类别。

方面词的语义感知向量可以表达为，即基于语义信息向量提取的方面词对应的语义感知向量集，方面词的语法感知向量表达为，即基于句法信息向量提取的方面词的语法感知向量集。

预设平均池化函数可以根据实际情况配置，只要能实现方面词的语义语法向量表达即可，本实施例采用预设平均池化函数pooling进行向量化表达：

；

其中，，分别为语义向量表达和语法向量表达。

采用门控机制将语义向量表达和语法向量表达进行融合：

；

其中，为sigmoid激活函数，为可训练权重矩阵，为偏置向量，为计算得到的比例系数，为方面词的融合表达向量。将融合表达向量输入网络模型的全连接层，采用softmax分类器进行极性预测：

；

其中，W_p和b_p是可训练的权重矩阵和偏置量，， c为情感类别的数量。请参阅图3，为本实施例的整体情感预测网络结构示意图，本实施例引入常识知识，能够增强模型对于复杂句子的理解，得到更为准确的特定方面的情感信息。而通过使用注意力分数矩阵辅助依赖关系邻接矩阵，能够缓解由于评论语句口语化导致的依赖关系丢失的问题，从而增强图神经网络提取特征的能力，获得更好的预测效果。

本申请实施例提供的基于语义句法的方面级情感预测方法，本引入常识知识嵌入向量，从而加强模型对于复杂句子的理解，缓解复杂长句较难获取到方面词与情感词之间的对应关系的问题；且在语义信息向量和句法信息向量的分析过程中通过注意力分数矩阵辅助关系邻接矩阵增强图神经网络的特征提取能力，从而保证预测结果的准确性和可靠性。因此，本申请实施例能够解决现有技术中复杂文本与句法依存关系缺失，导致预测结果缺乏准确性的技术问题。

为了便于理解，请参阅图2，本申请提供了一种基于语义句法的方面级情感预测装置的实施例，包括：

向量拼接单元201，用于将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接，得到待分析语义向量；

语义分析单元202，用于基于自注意力机制，采用预设Bi-GRU对待分析语义向量进行上下文语义分析，得到语义信息向量和注意力分数矩阵；

矩阵优化单元203，用于将根据依存树构建的关系邻接矩阵与注意力分数矩阵相加，得到增强邻接矩阵，依存树根据目标文本序列解析得到；

句法分析单元204，用于通过预设图神经网络对语义信息向量和增强邻接矩阵进行句法分析计算，得到句法信息向量；

情感预测单元205，用于对语义信息向量和句法信息向量分别进行方面词的向量表达，并预测得到情感类别。

进一步地，向量拼接单元201，具体用于：

进一步地，还包括：

实体表制备单元206，用于通过DistMult模型对wordNet2数据集进行训练，得到实体向量表达表；

常识知识查找单元207，用于根据目标文本序列在实体向量表达表中进行知识查找，得到预置常识知识嵌入向量。

进一步地，语义分析单元202，具体用于：

进一步地，情感预测单元205，具体用于：

依据融合表达向量进行情感预测操作，得到情感类别。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以通过一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（英文全称：Read-OnlyMemory，英文缩写：ROM）、随机存取存储器（英文全称：Random Access Memory，英文缩写：RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种基于语义句法的方面级情感预测方法，其特征在于，包括：

2.根据权利要求1所述的基于语义句法的方面级情感预测方法，其特征在于，所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接，得到待分析语义向量，包括：

3.根据权利要求1所述的基于语义句法的方面级情感预测方法，其特征在于，所述将基于目标文本序列提取的词嵌入向量与预置常识知识嵌入向量进行拼接，得到待分析语义向量，之前还包括：

4.根据权利要求1所述的基于语义句法的方面级情感预测方法，其特征在于，所述基于自注意力机制，采用预设Bi-GRU对所述待分析语义向量进行上下文语义分析，得到语义信息向量和注意力分数矩阵，包括：

5.根据权利要求1所述的基于语义句法的方面级情感预测方法，其特征在于，所述对所述语义信息向量和所述句法信息向量分别进行方面词的向量表达，并预测得到情感类别，包括：

依据所述融合表达向量进行情感预测操作，得到情感类别。

6.一种基于语义句法的方面级情感预测装置，其特征在于，包括：

7.根据权利要求6所述的基于语义句法的方面级情感预测装置，其特征在于，所述向量拼接单元，具体用于：

8.根据权利要求6所述的基于语义句法的方面级情感预测装置，其特征在于，还包括：

9.根据权利要求6所述的基于语义句法的方面级情感预测装置，其特征在于，所述语义分析单元，具体用于：

10.根据权利要求6所述的基于语义句法的方面级情感预测装置，其特征在于，所述情感预测单元，具体用于：

依据所述融合表达向量进行情感预测操作，得到情感类别。