CN117633239A

CN117633239A - 一种结合组合范畴语法的端到端方面情感识别方法

Info

Publication number: CN117633239A
Application number: CN202410090128.5A
Authority: CN
Inventors: 宋彦; 田元贺; 张勇东
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2024-01-23
Filing date: 2024-01-23
Publication date: 2024-03-01
Anticipated expiration: 2044-01-23
Also published as: CN117633239B

Abstract

本发明涉及情感识别技术领域，公开了一种结合组合范畴语法的端到端方面情感识别方法，通过完成训练的情感识别模型识别出给定的文本的情感标签；情感识别模型的训练过程包括：通过编码器提取文本的文本特征；通过词汇范畴标签解码模块对文本特征进行处理，预测得到词汇范畴标签；应用注意力模块对文本特征进行处理得到加权和向量，进而得到平衡后的文本隐藏向量；将平衡后的文本隐藏向量输入到标签预测模块，生成情感标签；基于总体损失和反向传播算法更新情感识别模型的参数。本发明利用组合范畴语法包含的句法和语义信息，明确区分并相应地利用重要的上下文信息；通过门控模块，情感识别模型可以提高对语义信息的处理能力。

Description

一种结合组合范畴语法的端到端方面情感识别方法

技术领域

本发明涉及情感识别技术领域，具体涉及一种结合组合范畴语法的端到端方面情感识别方法。

背景技术

各种文本内容中蕴含着内容发出者的态度和情感，识别内容发出者对特定主题或实体的态度和情感，在一些领域（如推荐系统、提升产品）意义重大，是一个重要而具有挑战性的任务。

现有的技术主要使用文本编码器提取上下文信息，并使用句法信息来提高模型性能，却没有提供文本语义信息的专门设计，不足以对文本进行细粒度分析并准确理解其中的对于特定主题的看法和情感。

发明内容

为解决上述技术问题，本发明提供一种结合组合范畴语法的端到端方面情感识别方法。本发明利用组合范畴语法信息，包括句法和语义信息，来提高情感识别模型对运行文本中方面术语的理解，并采用门控模块平衡对各种上下文信息的关注，使情感识别模型在识别情感方面更为准确和精细。

为解决上述技术问题，本发明采用如下技术方案：

一种结合组合范畴语法的端到端方面情感识别方法，通过完成训练的情感识别模型识别出给定的文本的情感标签/>；情感识别模型的训练过程具体包括以下步骤：

步骤一，通过编码器提取文本的文本特征/>：

；

其中，表示编码器；

步骤二，通过词汇范畴标签解码模块对文本特征进行处理，预测得到词汇范畴标签/>：

；

其中，表示词汇范畴解码中间向量，/>和/>分别代表可训练矩阵和偏置向量，表示基于/>函数的分类器；在训练中，通过比较词汇范畴标签/>和真实标签/>，计算词汇范畴标签损失/>，使编码器能够学习组合范畴语法信息，使得编码器输出的文本特征/>携带组合范畴语法信息；词汇范畴标签损失/>为：

；

其中CE表示交叉熵损失，表示批处理；

步骤三：应用注意力模块对文本特征进行处理得到加权和向量/>，将加权和向量、文本特征/>输入到门控模块，得到平衡后的文本隐藏向量/>；

步骤四：将平衡后的文本隐藏向量输入到标签预测模块，生成情感标签/>，并计算方面情感损失/>：

；

其中，和/>分别代表情感预测可训练矩阵和偏置向量，/>表示真实标签；

步骤五：基于词汇范畴标签损失和方面情感损失/>计算总体损失/>：

；

基于总体损失和反向传播算法更新情感识别模型的参数，直至情感识别模型收敛或者达到设定的停止条件。

进一步地，步骤三具体包括以下步骤：

S31，注意力模块具有两个可学习的注意力向量，表示注意力语义空间，分别为键向量和值向量；其中键向量记为，/>为第/>个键向量，值向量记为/>，为第/>个值向量，N为键向量和值向量的个数；

计算注意力权重分数：

；

表示第/>个键向量/>的注意力权重分数；

S32：将应用到相应的值向量/>，计算加权和向量/>：

；

S33：通过门控模块的复位门来控制信息流：

；

其中，表示门控向量，/>表示ReLU激活函数，/>和/>为可训练的参数矩阵，/>为偏置向量；

进而得到平衡后的文本隐藏向量：

；

其中，表示串联操作，/>表示元素方向的乘法运算，/>是一个所有元素都等于1的向量。

与现有技术相比，本发明的有益技术效果是：

本发明利用组合范畴语法包含的句法和语义信息，明确区分并相应地利用重要的上下文信息；通过门控模块，情感识别模型可以提高对语义信息的处理能力，门控模块加权上下文信息，将这些信息聚合到情感识别模型中，平衡来自各个模块的信息流，进一步提升模型性能。

附图说明

图1为本发明所采用的情感识别模型的示意图。

具体实施方式

下面结合附图对本发明的一种优选实施方式作详细的说明。

本发明中所采用的情感识别模型结构如图1所示，其任务是在给定文本的条件下，识别出情感标签/>。对于该任务，本发明利用编码器得到文本特征，并通过词汇范畴标签解码过程来学习和利用组合范畴语法信息，然后利用这些信息来指导情感识别模型通过注意机制控制所有输入词的权重，同时通过门控模块平衡各个模块获取的上下文信息的贡献，提升情感识别模型性能。

下面分步骤对本发明所采用的技术方案进行详细介绍。

步骤一，通过编码器提取文本的文本特征/>：

；

其中，表示编码器；本发明中，编码器采用Bert模型。

；

其中，和/>分别代表可训练矩阵和偏置向量，/>表示基于/>函数的分类器；在训练中，通过比较解码得到的词汇范畴标签/>和真实标签/>，计算词汇范畴标签损失/>，使编码器能够学习组合范畴语法信息，使得编码器输出的文本特征/>携带组合范畴语法信息；词汇范畴标签损失/>为：

；

其中CE表示交叉熵损失，表示批处理。

本实施例中，词汇范畴标签解码模块采用结合了注意力图卷积网络的组合类别语法的超级标记网络NeST-CCG。

步骤三，应用注意力模块对文本特征进行处理得到加权和向量/>，将加权和向量、文本特征/>输入到门控模块，得到平衡后的文本隐藏向量/>。

步骤三具体包括以下步骤：

计算注意力权重分数：

；

表示第/>个键向量/>的注意力权重分数。

S32：将应用到相应的值向量/>，计算加权和向量/>：

。

S33：通过门控模块的复位门来控制信息流：

；

其中，表示门控向量，/>表示ReLU激活函数，/>和/>为可训练的参数矩阵，/>为偏置向量。

进而得到平衡后的文本隐藏向量：

；

其中表示串联操作，/>表示元素方向的乘法运算，/>是一个所有元素都等于1的向量。

步骤四，将平衡后的文本隐藏向量输入到标签预测模块，生成情感标签/>，并计算方面情感损失/>：

；

其中，和/>分别代表情感预测可训练矩阵和偏置向量，CE表示交叉熵损失，表示批处理，/>表示真实标签。

本发明中，标签预测模块采用softmax分类器。

；

最后，通过完成训练的情感识别模型识别出给定的文本的情感标签/>。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内，不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立技术方案，说明书的这种叙述方式仅仅是为了清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种结合组合范畴语法的端到端方面情感识别方法，通过完成训练的情感识别模型识别出给定的文本的情感标签/>；情感识别模型的训练过程具体包括以下步骤：

步骤一，通过编码器提取文本的文本特征/>：

；

其中，表示编码器；

；

其中CE表示交叉熵损失，表示批处理；

步骤三：应用注意力模块对文本特征进行处理得到加权和向量/>，将加权和向量/>、文本特征/>输入到门控模块，得到平衡后的文本隐藏向量/>；

；

2.根据权利要求1所述的结合组合范畴语法的端到端方面情感识别方法，其特征在于，步骤三具体包括以下步骤：

S31，注意力模块具有两个可学习的注意力向量，表示注意力语义空间，分别为键向量和值向量；其中键向量记为，/>为第/>个键向量，值向量记为/>，/>为第/>个值向量，N为键向量和值向量的个数；

计算注意力权重分数：

；

表示第/>个键向量/>的注意力权重分数；

S32：将应用到相应的值向量/>，计算加权和向量/>：

；

S33：通过门控模块的复位门来控制信息流：

；

进而得到平衡后的文本隐藏向量：

；