CN117610562B

CN117610562B - 一种结合组合范畴语法和多任务学习的关系抽取方法

Info

Publication number: CN117610562B
Application number: CN202410090092.0A
Authority: CN
Inventors: 宋彦; 田元贺; 张勇东
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2024-01-23
Filing date: 2024-01-23
Publication date: 2024-07-05
Anticipated expiration: 2044-01-23
Also published as: CN117610562A

Abstract

本发明涉及关系抽取技术领域，公开了一种结合组合范畴语法和多任务学习的关系抽取方法，在给定文本以及两个实体的条件下，识别出关系标签；包括：利用编码器提取文本的文本特征：对文本特征进行词汇范畴标签解码，预测得到词汇范畴标签；对实体和处理后的文本特征应用注意力机制，得到强化实体表示；将强化实体表示输入到分类器，得到关系标签。本发明利用组合范畴语法为文本理解提供句法和语义知识，提升了对实体之间的关系检测能力；通过多任务学习的机制，从词汇范畴标签的解码过程中学习组合范畴语法信息，从而指导注意力机制区分关系抽取中的重要词汇，强化对文本和实体的表示学习，进一步提升了关系抽取的质量。

Description

一种结合组合范畴语法和多任务学习的关系抽取方法

技术领域

本发明涉及关系抽取技术领域，具体涉及一种结合组合范畴语法和多任务学习的关系抽取方法。

背景技术

关系抽取指的是标注两个给定实体之间的关系。

现有技术往往利用句法信息促进关系抽取过程，主要关注词语之间的依赖关系，对其他类型的句法结构的关注有限，使得模型在关系抽取任务中的表现还有待进一步提升。

本发明提出一种结合组合范畴语法和多任务学习的关系抽取方法，使用组合范畴语法词汇范畴标签生成器来注释输入文本的词汇范畴标签，并且通过一个多任务学习机制，从人工标注的关系抽取和自动注释的词汇范畴标签中学习，进一步提升模型关系抽取的质量。

发明内容

为解决上述技术问题，本发明提供一种结合组合范畴语法和多任务学习的关系抽取方法，利用组合范畴语法为文本理解提供句法和语义知识，来引导注意力机制改进关系抽取，并利用多任务学习机制使得关系抽取模型在推理中高效运行。

为解决上述技术问题，本发明采用如下技术方案：

一种结合组合范畴语法和多任务学习的关系抽取方法，将给定文本以及两个实体输入到完成训练的关系抽取模型，识别出关系标签；实体和实体统称为实体；关系抽取模型的训练过程具体包括以下步骤：

步骤一，利用编码器提取文本的文本特征：

；

其中，为编码器，表示文本第个词的文本特征，表示文本中词的总数量；

步骤二，对文本特征进行词汇范畴标签解码，预测得到词汇范畴标签，具体包括以下步骤：

S21，通过多层感知机神经网络处理，得到处理后的文本特征：；其中，表示多层感知机神经网络；

S22，通过可训练矩阵和偏置向量，将映射到词汇范畴标签解码输出空间，得到含有组合范畴语法信息的特征向量：；

S23，将输入到分类器，预测得到词汇范畴标签：；表示分类器；

S24，通过比较预测的词汇范畴标签和对应的真实标签，计算词汇范畴标签预测损失：；表示交叉熵损失，表示批处理；

步骤三，对实体和处理后的文本特征应用注意力机制，得到强化实体表示；

步骤四，将实体的强化实体表示统一记为强化实体表示，将强化实体表示输入到分类器，得到关系标签：；

步骤五，计算关系预测损失：，表示真实标签；

通过词汇范畴标签预测损失和关系预测损失计算总体损失：；

基于总体损失和反向传播算法不断更新关系抽取模型的参数，直至关系抽取模型收敛或者达到设定的停止条件。

进一步地，步骤三具体包括以下步骤：

S31，将处理后的文本特征映射到注意力语义空间，得到键向量和值向量：

；

和为注意力机制中的可学习矩阵；

S32，通过最大池化处理实体，得到实体表示特征：

其中，表示第个实体，，表示最大池化；

S33，计算注意力权重：

；

S34，将注意力权重应用到值向量，计算加权和向量：

；

S35，通过串联操作对加权和向量和实体表示特征进行连接，得到强化实体表示：

；

其中，表示串联操作。

与现有技术相比，本发明的有益技术效果是：

本发明利用组合范畴语法为文本理解提供句法和语义知识，提升了对实体之间的关系检测能力；通过多任务学习的机制，从词汇范畴标签的解码过程中学习组合范畴语法信息，从而指导注意力机制区分关系抽取中的重要词汇，强化对文本和实体的表示学习，进一步提升模型关系抽取的质量。

附图说明

图1为本发明所采用的关系抽取模型结构示意图。

具体实施方式

下面结合附图对本发明的一种优选实施方式作详细的说明。

本发明的关系抽取模型结构如图1所示，本发明的任务是在给定文本，和实体的条件下，识别出关系标签，其中表示文本中第个词，文本一共有个词。

对于上述任务，本发明利用编码器得到文本特征，并通过词汇范畴标签解码过程来学习和利用组合范畴语法信息，然后利用组合范畴语法信息来指导关系抽取模型通过注意机制加强对文本和实体的表示学习，提升关系抽取模型性能。

下面对本发明的技术方案进行详细介绍。

步骤一，利用编码器提取文本的文本特征：

；

其中，表示编码器，具体采用BERT模型，统称为文本特征，表示输入文本中第个词的文本特征。

S21，通过多层感知机神经网络处理，得到处理后的文本特征：

；

其中，表示多层感知机神经网络。

S22，通过一个可训练矩阵和偏置向量将映射到词汇范畴标签解码输出空间，得到：

。

S23，将输入分类器，得到预测的词汇范畴标签：

。

S24，通过比较预测的词汇范畴标签和对应的真实标签，计算词汇范畴标签预测损失：；表示交叉熵损失，表示批处理。

步骤三，应用注意力机制对实体和处理后的文本特征进行处理，来加强关系的预测。

步骤三具体包括以下步骤：

S31，注意力机制中有两个可学习矩阵和，能将映射到注意力语义空间，得到相对应的键向量和值向量：

；

。

S32，通过最大池化处理实体，得到实体表示特征，公式如下：

；

其中，表示第个实体，，表示最大池化。

S33，通过以下公式计算注意力权重：

。

S34，将注意力权重应用到相应的值向量，计算加权和向量：

。

S35，然后将加权和向量和实体表示特征连接起来，得到强化实体表示：

；

其中，表示串联操作。

步骤四，将得到的所有的强化实体表示，输入到分类器进行标签预测，生成实体和实体之间的关系标签：

；

其中表示分类器。

步骤五，计算关系预测损失：，表示真实标签；

将给定文本以及两个实体输入到完成训练的关系抽取模型，能够识别出实体的关系标签。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内，不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立技术方案，说明书的这种叙述方式仅仅是为了清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种结合组合范畴语法和多任务学习的关系抽取方法，将给定文本以及两个实体输入到完成训练的关系抽取模型，识别出关系标签；实体和实体统称为实体；关系抽取模型的训练过程具体包括以下步骤：

步骤一，利用编码器提取文本的文本特征：

；

步骤五，计算关系预测损失：，表示真实标签；

2.根据权利要求1所述的结合组合范畴语法和多任务学习的关系抽取方法，其特征在于，步骤三具体包括以下步骤：

；

和为注意力机制中的可学习矩阵；

S32，通过最大池化处理实体，得到实体表示特征：

其中，表示第个实体，，表示最大池化；

S33，计算注意力权重：

；

S34，将注意力权重应用到值向量，计算加权和向量：

；

其中，表示串联操作。