CN115080705B

CN115080705B - 基于双模型增强的垂直领域关系抽取方法及系统

Info

Publication number: CN115080705B
Application number: CN202210855091.1A
Authority: CN
Inventors: 朱宁; 许娟; 杨雅婷; 宋佳祥; 白焜太; 刘硕
Original assignee: Digital Health China Technologies Co Ltd
Current assignee: Digital Health China Technologies Co Ltd
Priority date: 2022-07-20
Filing date: 2022-07-20
Publication date: 2022-11-11
Anticipated expiration: 2042-07-20
Also published as: CN115080705A

Abstract

本发明涉及信息处理技术领域，且公开了基于双模型增强的垂直领域关系抽取方法及系统，本发明采用原始文本的实体信息配合设置双模型的方式，利用从垂直领域现有的知识图谱中的提取的属性信息文本进行关系抽取，最后结合双模型的关系抽取，能够在少量样本结合现有的知识图谱情况下，共同得出更准确的结果，节省大量的预训练计算资源。

Description

基于双模型增强的垂直领域关系抽取方法及系统

技术领域

本发明涉及信息处理技术领域，具体为基于双模型增强的垂直领域关系抽取方法及系统。

背景技术

关系抽取是从一段文本中抽取出（主体，关系，客体）这样的三元组。目前最主流的关系抽取模型是基于深度学习的监督学习模型，这类模型大多都是在大规模通用数据集上训练得到的（如Bert），在一些垂直领域，进行关系抽取时，采用通用数据训练的模型往往效果不佳，针对此问题，通常的方案是使用该垂直领域的数据来进行训练，得到引入该领域信息的预训练模型，问题是，预训练需要大量样本才能有好的效果，而现实基本属于低资源的情况。因此，现有采用单模型进行关系抽取在低资源的情况下往往效果不佳。

发明内容

本发明主要是提供基于双模型增强的垂直领域关系抽取方法及系统。

为了解决上述技术问题，本发明采用如下技术方案：

基于双模型增强的垂直领域关系抽取方法，包括：

采集原始文本，基于所述原始文本抽取实体信息；

基于所述实体信息嵌入所述原始文本获取第一句子输入序列；基于所述实体信息在知识图谱中提取属性信息，并将所述实体信息与属性信息拼接获取第二句子输入序列；

设置主模型和辅模型，将所述第一句子输入序列输入主模型，将所述第二句子输入序列输入辅模型，基于主模型和辅模型的输出结果加权并获取关系概率值；

基于主模型的输出结果预测主关系类型，基于辅模型的输出结果预测辅关系类型，基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。

进一步，所述采集原始文本，基于所述原始文本抽取实体信息，包括：

采集原始文本，提取所述原始文本中的实体头、实体尾和实体跨度，并基于所述实体头、实体尾和实体跨度获取实体跨度信息；

基于所述实体跨度信息获取实体类型信息。

进一步，所述基于所述实体信息嵌入所述原始文本获取第一句子输入序列；基于所述实体信息在知识图谱中提取属性信息，并将所述实体信息与属性信息拼接获取第二句子输入序列，包括：

将实体跨度信息和实体类型信息嵌入所述原始文本获取第一句子输入序列；

基于实体头和实体尾在知识图谱中提取属性信息，并将实体跨度信息、实体类型信息和属性信息拼接获取第二句子输入序列。

进一步，所述设置主模型和辅模型，将所述第一句子输入序列输入主模型，将所述第二句子输入序列输入辅模型，基于主模型和辅模型的输出结果加权并获取关系概率值，包括：

设置主模型和辅模型；

将所述第一句子输入序列输入主模型获取主实体对向量；

将所述第二句子输入序列输入辅模型获取辅实体对向量；

基于所述主实体对向量和辅实体对向量加权并获取关系概率值。

进一步，所述基于主模型的输出结果预测主关系类型，基于辅模型的输出结果预测辅关系类型，基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果，包括：

基于主实体对向量预测主关系类型，基于辅实体对向量预测辅关系类型；

基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。

基于双模型增强的垂直领域关系抽取系统，包括：

原始文本处理模块，用于采集原始文本，基于所述原始文本抽取实体信息；

句子输入序列获取模块，用于基于所述实体信息嵌入所述原始文本获取第一句子输入序列；基于所述实体信息在知识图谱中提取属性信息，并将所述实体信息与属性信息拼接获取第二句子输入序列；

关系概率值计算模块，用于设置主模型和辅模型，将所述第一句子输入序列输入主模型，将所述第二句子输入序列输入辅模型，基于主模型和辅模型的输出结果加权并获取关系概率值；

最终关系抽取模块，用于基于主模型的输出结果预测主关系类型，基于辅模型的输出结果预测辅关系类型，基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。

进一步，所述原始文本处理模块，包括：

实体跨度信息获取子模块，用于采集原始文本，提取所述原始文本中的实体头、实体尾和实体跨度，并基于所述实体头、实体尾和实体跨度获取实体跨度信息；

实体类型信息获取子模块，用于基于所述实体跨度信息获取实体类型信息。

进一步，所述句子输入序列获取模块，包括：

第一序列获取子模块，用于将实体跨度信息和实体类型信息嵌入所述原始文本获取第一句子输入序列；

第二序列获取子模块，用于基于实体头和实体尾在知识图谱中提取属性信息，并将实体跨度信息、实体类型信息和属性信息拼接获取第二句子输入序列。

进一步，所述关系概率值计算模块，包括：

双模型设置子模块，用于设置主模型和辅模型；

主实体对向量获取子模块，用于将所述第一句子输入序列输入主模型获取主实体对向量；

辅实体对向量获取子模块，用于将所述第二句子输入序列输入辅模型获取辅实体对向量；

关系概率值计算子模块，用于基于所述主实体对向量和辅实体对向量加权并获取关系概率值。

进一步，所述最终关系抽取模块，包括：

关系类型预测子模块，用于基于主实体对向量预测主关系类型，基于辅实体对向量预测辅关系类型；

最终预测结果抽取子模块，用于基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。

有益效果：本发明采用原始文本的实体信息配合设置双模型的方式，利用从垂直领域现有的知识图谱中的提取的属性信息文本进行关系抽取，最后结合双模型的关系抽取，能够在少量样本结合现有的知识图谱情况下，共同得出更准确的结果，节省大量的预训练计算资源。

附图说明

图1为本发明的基于双模型增强的垂直领域关系抽取方法流程图；

图2为本发明的基于双模型增强的垂直领域关系抽取系统框图。

具体实施方式

以下将结合实施例对本发明涉及的基于双模型增强的垂直领域关系抽取方法及系统技术方案进一步详细说明。

如图1所示，本发明的基于双模型增强的垂直领域关系抽取方法，包括：S1~S4；

S1、采集原始文本，基于所述原始文本抽取实体信息；

S2、基于所述实体信息嵌入所述原始文本获取第一句子输入序列；基于所述实体信息在知识图谱中提取属性信息，并将所述实体信息与属性信息拼接获取第二句子输入序列；

S3、设置主模型和辅模型，将所述第一句子输入序列输入主模型，将所述第二句子输入序列输入辅模型，基于主模型和辅模型的输出结果加权并获取关系概率值；

S4、基于主模型的输出结果预测主关系类型，基于辅模型的输出结果预测辅关系类型，基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。

进一步，步骤S1中所述采集原始文本，基于所述原始文本抽取实体信息，包括：

S11、采集原始文本，提取所述原始文本中的实体头、实体尾和实体跨度，并基于所述实体头、实体尾和实体跨度获取实体跨度信息；

其中，将原始文本表示为X，实体跨度信息为：

上式中，

为实体跨度

的实体头，

为实体跨度

的实体尾，

为实体跨度

的宽度特征。

S12、基于所述实体跨度信息获取实体类型信息。

其中，实体类型信息为：

上式为使用ReLU函数激活的两层前馈神经网络进行实体类型信息

的预测。

进一步，步骤S2中所述基于所述实体信息嵌入所述原始文本获取第一句子输入序列；基于所述实体信息在知识图谱中提取属性信息，并将所述实体信息与属性信息拼接获取第二句子输入序列，包括：

S21、将实体跨度信息和实体类型信息嵌入所述原始文本获取第一句子输入序列；

其中，将

、

和类型标识符

嵌入原始文本中，得到第一句子输入序列：

上式中，原始文本X由多个实体i、j等组成，S表示实体i起始，/S表示实体i结束，O表示实体j起始，/O表示实体j结束，

为实体i的类型表示符，

为实体j的类型表示符；

S22、基于实体头和实体尾在知识图谱中提取属性信息，并将实体跨度信息、实体类型信息和属性信息拼接获取第二句子输入序列。

其中，将

和

输入知识图谱中提取属性信息E，并将E作为类型标识符，进行拼接获取第二句子输入序列：

为实体i拼接的属性信息，

为实体j拼接的属性信息。

进一步，步骤S3中所述设置主模型和辅模型，将所述第一句子输入序列输入主模型，将所述第二句子输入序列输入辅模型，基于主模型和辅模型的输出结果加权并获取关系概率值，包括：

S31、设置主模型和辅模型；

其中，主模型和辅模型均采用BERT模型。

S32、将所述第一句子输入序列输入主模型获取主实体对向量；

其中，将

输入主模型，获取主实体对向量：

；

S33、将所述第二句子输入序列输入辅模型获取辅实体对向量；

；

S34、基于所述主实体对向量和辅实体对向量加权并获取关系概率值。

其中，关系概率值为：

p = σ(

*

+

*

+ b)

上式中，

为主模型的权重矩阵，

为辅模型的权重矩阵，b为偏置，σ为Sigmoid()函数用于将输出的值变成0-1之间的概率值p。

进一步，步骤S4中所述基于主模型的输出结果预测主关系类型，基于辅模型的输出结果预测辅关系类型，基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果，包括：

S41、基于主实体对向量预测主关系类型，基于辅实体对向量预测辅关系类型；

其中，主关系类型为：

，辅关系类型：

。

S42、基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。

其中，最终预测结果为：

=p*

+（1-p）*

。

如图2所示，本发明的基于双模型增强的垂直领域关系抽取系统，包括：

原始文本处理模块21，用于采集原始文本，基于所述原始文本抽取实体信息；

句子输入序列获取模块22，用于基于所述实体信息嵌入所述原始文本获取第一句子输入序列；基于所述实体信息在知识图谱中提取属性信息，并将所述实体信息与属性信息拼接获取第二句子输入序列；

关系概率值计算模块23，用于设置主模型和辅模型，将所述第一句子输入序列输入主模型，将所述第二句子输入序列输入辅模型，基于主模型和辅模型的输出结果加权并获取关系概率值；

最终关系抽取模块24，用于基于主模型的输出结果预测主关系类型，基于辅模型的输出结果预测辅关系类型，基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。

进一步，所述原始文本处理模块21，包括：

实体跨度信息获取子模块211，用于采集原始文本，提取所述原始文本中的实体头、实体尾和实体跨度，并基于所述实体头、实体尾和实体跨度获取实体跨度信息；

实体类型信息获取子模块212，用于基于所述实体跨度信息获取实体类型信息。

进一步，所述句子输入序列获取模块22，包括：

第一序列获取子模块221，用于将实体跨度信息和实体类型信息嵌入所述原始文本获取第一句子输入序列；

第二序列获取子模块222，用于基于实体头和实体尾在知识图谱中提取属性信息，并将实体跨度信息、实体类型信息和属性信息拼接获取第二句子输入序列。

进一步，所述关系概率值计算模块23，包括：

双模型设置子模块231，用于设置主模型和辅模型；

主实体对向量获取子模块232，用于将所述第一句子输入序列输入主模型获取主实体对向量；

辅实体对向量获取子模块233，用于将所述第二句子输入序列输入辅模型获取辅实体对向量；

关系概率值计算子模块234，用于基于所述主实体对向量和辅实体对向量加权并获取关系概率值。

进一步，所述最终关系抽取模块24，包括：

关系类型预测子模块241，用于基于主实体对向量预测主关系类型，基于辅实体对向量预测辅关系类型；

最终预测结果抽取子模块242，用于基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.基于双模型增强的垂直领域关系抽取方法，其特征在于，包括：

采集原始文本，基于所述原始文本抽取实体信息；

基于主模型的输出结果预测主关系类型，基于辅模型的输出结果预测辅关系类型，基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果；

所述采集原始文本，基于所述原始文本抽取实体信息，包括：

基于所述实体跨度信息获取实体类型信息；

所述基于所述实体信息嵌入所述原始文本获取第一句子输入序列；基于所述实体信息在知识图谱中提取属性信息，并将所述实体信息与属性信息拼接获取第二句子输入序列，包括：

2.根据权利要求1所述的方法，其特征在于，所述设置主模型和辅模型，将所述第一句子输入序列输入主模型，将所述第二句子输入序列输入辅模型，基于主模型和辅模型的输出结果加权并获取关系概率值，包括：

设置主模型和辅模型；

将所述第一句子输入序列输入主模型获取主实体对向量；

将所述第二句子输入序列输入辅模型获取辅实体对向量；

3.根据权利要求2所述的方法，其特征在于，所述基于主模型的输出结果预测主关系类型，基于辅模型的输出结果预测辅关系类型，基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果，包括：

4.基于双模型增强的垂直领域关系抽取系统，其特征在于，包括：

最终关系抽取模块，用于基于主模型的输出结果预测主关系类型，基于辅模型的输出结果预测辅关系类型，基于所述主关系类型、辅关系类型和关系概率值获取最终预测结果；

所述原始文本处理模块，包括：

实体类型信息获取子模块，用于基于所述实体跨度信息获取实体类型信息；

所述句子输入序列获取模块，包括：

5.根据权利要求4所述的系统，其特征在于，所述关系概率值计算模块，包括：

双模型设置子模块，用于设置主模型和辅模型；

6.根据权利要求5所述的系统，其特征在于，所述最终关系抽取模块，包括：