CN113377908A

CN113377908A - 基于可学习多单词对打分器的方面级情感三元组抽取方法

Info

Publication number: CN113377908A
Application number: CN202110638892.8A
Authority: CN
Inventors: 雷印杰; 苟延杰
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2021-06-08
Filing date: 2021-06-08
Publication date: 2021-09-10
Anticipated expiration: 2041-06-08
Also published as: CN113377908B

Abstract

本发明提供基于可学习多单词对打分器的方面级情感三元组抽取方法，属于自然语言处理领域，通过将将句子评论中的单词(字)转换编码，得到词向量表征；将编码后的词向量表征使用点乘注意力机制对编码后的词向量进行加权；再输出一个二维的多通道单词对的特征图；将该二维的多通道单词对的特征图送入一卷积编码‑解码框架，输出二维的标注矩阵；对该标注矩阵进行解码，输出最终的情感三元组集合；使用损失函数训练模型；保存训练模型，即可应用于方面级情感三元组抽取。本发明是基于端到端的解决方案，使用可学习多单词对打分器更高效地建模句中方面词及情感词间的全局关系，以生成更有效的特征并抽取情感三元组。

Description

基于可学习多单词对打分器的方面级情感三元组抽取方法

技术领域

本发明涉及自然语言处理领域，特别涉及基于可学习多单词对打分器的方面级情感三元组抽取方法。

背景技术

方面级情感三元组抽取任务通常用于细粒度地抽取评论句子中包含的三元组<方面词，观点，情感>，在这里，方面词指评价的对象，观点是评论对象时用到的描述词，情感是指对象在上下文中的整体情感，一般包括正向，中性，负向。其目的是从句子中获得全面的信息用于细粒度情感分析，可以广泛应用于电商评论挖掘、社会计算等领域。

由于深度学习强大的建模能力，基于深度学习方法的模型一般被用来对该任务进行建模。具体讲，基于深度学习的方面级情感三元组抽取通常有两种解决方案：(1)流水线式：这种方法一般先在第一个阶段对句子中的方面词和观点词分别抽取；在第二阶段，再对抽取得到的多个方面词及情感词进行组合判断对应的情感分类并组成三元组。然而，流水线式的方法存在错误传播的问题，会导致模型性能无法达到最优。(2)端到端式：这种方法通过设计更符合该任务的标注方案，从而使得可以端到端优化模型，从理论上解决了流水线式错误传播的问题。然而，现有端到端的解决方法无法像流水线式方法那样显示地全局组合方面词和观点词。

发明内容

本发明的主要目的在于提供一种基于可学习多单词对打分器的方面级情感三元组抽取方法，可以有效弥补背景技术中提出的不足。

为实现上述目的，本发明采取的技术方案为：

基于可学习多单词对打分器的方面级情感三元组抽取方法，包括以下步骤：

S1、将句子评论中的单词(字)转换为词向量序列，并经过一长短期记忆循环网络编码器对词向量序列进行编码，得到编码后的词向量表征；

S2、将编码后的词向量表征使用点乘注意力机制对编码后的词向量进行加权；

S3、使用一可学习的多单词对打分器对每个单词对进行打分，输出一个二维的多通道单词对的特征图；

S4、将该二维的多通道单词对的特征图送入一卷积编码-解码框架，输出二维的标注矩阵；

S5、对该标注矩阵进行解码，输出最终的情感三元组集合；

S6、使用损失函数训练模型；

S7、保存训练模型，即可应用于方面级情感三元组抽取。

优选的，所述S1、S2中的所有操作还可使用预训练神经网络在一步内完成。

优选的，所述S2中加权后的每个词向量都可以对其上下文进行进一步感知。

与现有技术相比，本发明具有如下有益效果：

1.能够在兼顾模型对三元组元素的全局组合性和局部一致性的同时，避免错误传播问题。

2.效果高，在基于长短期记忆循环网络编码器的模型中，在四个数据集RES14、LAP14、RES15和RES16上，模型可以达到68.86、52.13、56.81和67.52的F1值。在基于预训练网络(BERT)的模型中，在四个数据集RES14、LAP14、RES15和RES16上，模型可以达到71.20、58.36、60.47和69.13的F1值。

附图说明

图1为本发明的流程示意图；

图2为本发明的模型结构示意图；

图3为本发明使用的卷积编解码器结构图。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体实施方式，进一步阐述本发明。

如图1-3所示:基于可学习多单词对打分器的方面级情感三元组抽取方法，系统架构主要包括以下步骤：

S2、将编码后的词向量表征使用点乘注意力机制对编码后的词向量进行加权，使每个词向量都能对其上下文进行进一步感知；

上述两步中的所有操作也可使用预训练神经网络(如BERT)在一步内完成；

S5、对该标注矩阵进行解码，输出最终的情感三元组集合；

S6、使用损失函数训练模型；

S7、保存训练模型，即可应用于方面级情感三元组抽取。

在本实施例中，步骤S2使用点乘注意力机制对编码后的词向量进行加权，使每个词向量都能对其上下文进行进一步感知，可以形式化如下：

A^e＝softmax(HH^T),

H′＝(1+A^e)H,

其中，H是经过LSTM编码得到的向量，A^e是其本身经过点乘注意力后的注意力权重，H′是该步骤得到的注意力加权后的词向量表征。

在本实施例中，步骤S4使用一可学习的多单词对打分器对每个单词对进行打分，具体实现细节如下：

A＝[A₁；...；A_h],

其中，A表示得到的h通道的特征图。该特征图由h个一通道特征图组成，每个特征图都由全连接层将映射到H′映射到不同子空间后进行点乘注意力以建模三元组元素间的全局联系。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.基于可学习多单词对打分器的方面级情感三元组抽取方法，其特征在于：包括以下步骤：

S5、对该标注矩阵进行解码，输出最终的情感三元组集合；

S6、使用损失函数训练模型；

S7、保存训练模型，即可应用于方面级情感三元组抽取。

2.根据权利要求1所述的基于可学习多单词对打分器的方面级情感三元组抽取方法，其特征在于：所述S1、S2中的所有操作也可使用预训练神经网络在一步内完成。

3.根据权利要求1所述的基于可学习多单词对打分器的方面级情感三元组抽取方法，其特征在于：所述S2中加权后的每个词向量都可以对其上下文进行进一步感知。