WO2024021334A1

WO2024021334A1 - 关系抽取方法、计算机设备及程序产品

Info

Publication number: WO2024021334A1
Application number: PCT/CN2022/127698
Authority: WO
Inventors: 宋彦; 田元贺; 李世鹏
Original assignee: 苏州思萃人工智能研究所有限公司
Priority date: 2022-07-29
Filing date: 2022-10-26
Publication date: 2024-02-01
Also published as: CN115392219A

Abstract

本文公开一种关系抽取方法，包括：获取输入文本，并对输入文本进行编码，得到输入文本中每个词的隐向量；对输入文本进行处理，得到用于表征输入句子内部不同的词与词之间连接关系所占权重的注意力矩阵；将隐向量与注意力矩阵输入预设的神经网络进行处理，得到所述神经网络的最终输出，通过预设的第一算法对所述最终输出进行计算得到整体向量；对整体向量进行分类转换处理，得到预测的关系类型。本申请还提供一种计算机设备和程序产品。

Description

关系抽取方法、计算机设备及程序产品

本申请要求在2022年07月29日提交中国专利局、申请号为202210911110.8的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请涉及自然语言处理技术领域，例如涉及关系抽取方法、计算机设备、及程序产品。

背景技术

关系抽取任务旨在根据给定的句子和两个实体中，抽取(预测)这两个给定实体之间的关系。一般的关系抽取任务是利用词与词之间的依存句法关系(dependency)，构建词图(word graph)，对词图编码，利用词图的信息提升模型的性能。然而，上述方法需要依存句法分析工具获取词与词的依存句法关系，而这一过程往往成本高昂。同时，上述方法未能动态利用词图之间词与词的连接，使得词图内潜在的噪音影响性能。

发明内容

本申请提供一种关系抽取方法、计算机设备及程序产品。

本申请提供一种关系抽取方法，包括：

获取输入文本，并对所述输入文本进行编码，得到所述输入文本中每个词的隐向量；

对所述输入文本进行处理，得到用于表征所述输入文本内部不同的词与词之间连接关系所占权重的注意力矩阵；

将所述隐向量与所述注意力矩阵输入预设的神经网络进行处理，得到所述神经网络的最终输出，通过预设的第一算法对所述最终输出进行计算得到整体向量；

对所述整体向量进行分类转换处理，得到预测的关系类型。

本申请提供一种关系抽取装置，包括：

第一模块，设置为获取输入文本，并对所述输入文本进行编码，得到所述输入文本中每个词的隐向量；

第二模块，设置为对所述输入文本进行处理，得到用于表征所述输入文本内部不同的词与词之间连接关系所占权重的注意力矩阵；

第三模块，设置为将所述隐向量与所述注意力矩阵输入预设的神经网络进行处理，得到所述神经网络的最终输出，通过预设的第一算法对所述最终输出进行计算得到整体向量；

第四模块，设置为对所述整体向量进行分类转换处理，得到预测的关系类型。

本申请提供一种计算机设备，所述计算机设备包括处理器、存储器以及存储在所述存储器上的计算机程序，所述处理器执行上述计算机程序以实现上述的关系抽取方法。

本申请提供一种计算机程序产品，包括计算机程序指令，所述计算机程序指令被执行时实现上述关系抽取方法。

本申请提供一种计算机存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现上述的关系抽取方法。

附图说明

图1是本申请实施例提供的一种关系抽取方法流程示意图；

图2是本申请实施例提供的一种关系抽取模型的模块结构示意图；

图3是本申请实施例提供的一种关系抽取模型的结构示意图；

图4是本申请实施例提供的一种获取注意力矩阵的步骤示意图；

图5是本申请实施例提供的一种词图构建的示意图；

图6是本申请实施例提供的一种关系抽取装置的结构示意图；

图7是本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

以下结合附图及实施实例，对本申请进行说明。此处所描述的具体实施例仅仅用以解释本申请。

请结合图1和图2，本申请实施例提供一种关系抽取方法，通过关系预测模型2实现，关系预测模型2包括编码器20、解码器21和注意力模块22，关系预测模型2的预测步骤如下：获取输入文本X，将输入文本X传入编码器20并编码，输出文本X中每个词的隐向量；将输入文本X传入注意力模块22，注意力模块22对输入文本X进行处理，输出用于表征输入句子内部不同的词与词之间连接关系所占权重的注意力矩阵；将隐向量与注意力矩阵输入预设的神经网络进行处理，得到神经网络的最终输出，并将神经网络的最终输出通过预设的第一算法计算得到整体向量；对整体向量通过解码器21进行分类转换处理，得到预测的关系类型。

背景技术中的方式未能够动态利用词图之间词与词的连接，使得词图内潜在的噪音影响性能。而本方法提供的注意力模块对输入文本X进行处理，输出了表征不同词之间对关系预测任务所占的不同权重的注意力矩阵，使得神经网络在对关系预测模型2进行训练以及预测实体关系时，能够依据不同权重的连接来进行更加准确的预测，减少了对关系抽取任务影响较小的连接所占用的计算资源。可见，本申请实施例提供的关系抽取方法在提升了关系预测模型2性能的同时，节省了计算成本以及时间成本。

在一些实施例中，编码器20为变形器的双向编码器表示(Bidirectional Encoder Representations from Transformers，BERT)，对输入文本X进行编码，得到了输入文本X中每个词的隐向量。其中，第i个词x _i和第j个词x _j的隐向量分别记为

和

请参阅图3，在一些实施例中，将隐向量与注意力矩阵输入预设的神经网络进行处理，得到神经网络的最终输出，通过预设的第一算法对最终输出进行计算得到整体向量包括以下步骤：对神经网络的最终输出使用MaxPooling算法计算得到第一实体向量表征h _E1、第二实体向量表征h _E2以及句子的向量表征h _X；将第一实体向量表征h _E1、第二实体向量表征h _E2以及句子的向量表征h _X串联，得到整体向量o。通过MaxPooling算法对神经网络的最终输出进行计算，得到的第一实体向量表征h _E1、第二实体向量表征h _E2以及句子的向量表征h _X作为中间变量，反映了实体或句子在关系抽取模型2中所处不同位置的向量表征，便于后续对整体向量o的计算。h _E1与h _E2是关系抽取任务针对的两个实体在模型中的表征。

在一些实施例中，神经网络包含多个处理层，即自适应图卷积网络(Adaptive Graph Convolutional Network，A-GCN)，将隐向量与注意力矩阵输入预设的神经网络进行处理包括：将隐向量

和/或

作为神经网络的输入，通过预设的第二算法对输入进行多层处理，其中，每一层A-CGN处理的输出作为下一层A-CGN处理的输入，且注意力矩阵参与指导每一处理层的运算，记第l层A-CGN输出的隐向量为

最后一层A-CGN的输出为

最后一层处理完之后得到最终输出

用于参与第一算法计算得到整体向量o。

请参阅图4，在一些实施例中，注意力模块22输出得到注意力矩阵还包括以下步骤：将输入文本转换为多个n元组，多个n元组之间按照输入文本的语序排列(输入文本包括至少两个给定的实体，每个给定的实体本身被视为一个n 元组)；基于n元组，在n元组的词与词之间创建连接，并基于连接得到最终词图；将最终词图转化为对应的邻接矩阵；对邻接矩阵通过预设的第三算法计算得到注意力矩阵。

背景技术中的方式是通过CYK(Cocke–Younger–Kasami)算法来构建词图，时间复杂度为O(N ³)，而本申请实施例提供的关系抽取方法中，是基于n元组来构建词图，其中，n元组中的n表示包含词的数量，只需对n元组中每个词遍历一遍即可，其时间复杂度为O(N)。可见，基于n元组来构建词图有效地降低了计算的时间复杂度，提高了词图构建的效率，降低了构建词图的成本。

在一些实施例中，将输入文本转换为多个n元组包含以下步骤：获取预设的n元组词表，通过n元组词表匹配输入文本中其他的n元组，得到多个n元组。通过n元组词表，将由传统意义上词与词组成的句子，转换成计算机或神经网络更容易识别或处理的，包含一个或多个词的n元组，基于n元组来构建词图，而不依赖依存句法分析工具，大幅降低了获取词图的成本。

在一些实施例中，基于连接得到最终词图包括以下步骤：基于n元组，在n元组内部的相邻词之间创建本地连接；在两个不同的n元组的首词与尾词之间两两创建全局连接；将本地连接与全局连接合并，得到最终词图。本地连接和全局连接将n元组内部的词与n元组之间的词连接起来构建了最终词图，使得后续在通过神经网络处理向量时，能够动态利用词图之间词与词的连接，从而提高了预测关系的准确性。

在一些实施例中，创建全局连接的两个n元组之间包含的n元组个数不大于1。当创建全局连接的两个n元组之间包含的n元组个数过多，会使得形成的最终词图十分复杂，而且距离较远的n元组之间如果存在连接，则这种连接往往会引入噪音，从而增加模型识别的难度。而如果仅在相邻的n元组之间创建全局连接，这样会使得词与词之间得连接不充分，没有足够地利用上下文信息，从而会使得预测的结果准确性不高。因此，将创建全局连接的两个n元组之间包含的n元组个数设为不大于1，可在降低最终词图的复杂性的同时，保证预测结果的准确度。

示例性地，请参阅图5，按以下步骤构建n元组的词图：

第一步，给定的实体(即图5所示的“信息”和“信息中心”)本身被视为一个n元组。

第二步，使用一个n元组词表，采用匹配的方式，找到输入文本中存在的其它n元组。如果匹配得到的n元组之间有重合，则把这些n元组组合成更大的n元组。例如，在图1中，有4个n元组(由方框表示)，“信息”、“两天前”、“被送到”、“信息中心”。其中，“信息”和“信息中心”由实体本身得到；“两天前”由词表匹配得到；“被送到”由匹配到的重合n元组“被送”和“送到”组合得到。

第三步，基于n元组，在词与词之间创本地连接和全局连接。本地连接在n元组内部的相邻词之间创建连接。全局连接则在两个不同n元组的首词和尾词之间两两创建连接，即包括“首词-首词”、“首词-尾词”、“尾词-首词”、“尾词-尾词”四个连接。图5展示了与“信息”相关的全局连接(为了可读性，未展示所有全局连接，例如，“两”和“信息中心”中的“信息”之间有一条未展示的全局连接)。

第四步，把本地连接和全局连接合并，得到最终的，基于n元组的词图，并得到词图对应的邻接矩阵A。

在一些实施例中，每一层A-GCN模型由输入

计算输出

的方法为：

式(1)中，W ^(l)和b ^(l)是可训练的参数矩阵和向量，式(1)即预设的第二算法。

是权重，权重的计算方法如下：

式(2)中，a _i,j为组成邻接矩阵的元素，取值为0或1，表示x _i和x _j是否有连接，n表示输入文本中词的数量。式(2)即预设的第三算法，将由a _i,j组成的邻接矩阵转换为由权重

组成的注意力矩阵。

在一些实施例中，关系抽取模型2还包括全连接层，解码器21为SoftMax分类器，将整体向量o进行分类转换处理包含以下步骤：将整体向量o经过全连接层后，送入SoftMax分类器，得到预测的关系类型。全连接层和SoftMax分类器可将整体向量中包含的不同连接的权重信息可视化并与预设的模板进行匹配，从而能够更加方便地预测出实体之间的关系类型。

本实施例也可通过F1算法来评价关系抽取模型的性能。

F1的计算方式如下。对于每一种关系类别r，记测试集中模型预测的具有该类型关系的实体对的数量为

记测试集中人工标注的具有该类型关系的实体对的数量为n _r，记测试集中，模型预测与人工标注同样具有该类型关系的实体对(即模型正确预测的属于该类型的实体对)数量为c _r，计算针对类别r的准确率(p _r)和召回率(r _r)

而后计算针对该类别的F1值，F1 _r：

F1 _r＝2×p _r×r _r/(p _r+r _r)

计算所有类别r的F1 _r，而后对这些F1 _r求平均，得到最终的评价指标F1值

其中，R为所有关系类型的标签集。|R|表示标签集中含有标签的个数。

对于上述构建n元组的词图的第三步，建立全局连接的两个n元组如果相距较远，会使得形成的词图十分复杂。如果对参与建立全局连接的n元组不加以限制的话，距离很远的n元组之间也会有连接，而这种连接往往会引入噪音，增加模型识别的难度。因此，参与建全局连接的n元组一般为相邻的n元组或者两n元组之间相隔一个n元组，即n元组之间间隔为0或间隔为1。

采用上述计算F值的算法，对不同状态下的关系抽取模型在一组相同的数据集下的平均F1分数进行计算；对于不使用本申请实施例提供的关系抽取方法的基线模型，在两个数据集上的平均F1分数为82.6％；对于“间隔为0”的关系抽取模型，在两个数据集上的平均F1分散为83.3％(相比于基线模型提升了0.4％)；对于“间隔为1”的关系抽取模型，在两个数据集上的平均F1分散为83.7％(相比于基线模型提升了1.1％)。

因此，参与建立全局连接的两个n元组之间间隔一个n元组。

请参阅图6，本申请实施例还提供一种关系抽取装置，包括：第一模块610，设置为获取输入文本，并对所述输入文本进行编码，得到所述输入文本中每个词的隐向量；第二模块620，设置为对所述输入文本进行处理，得到用于表征所述输入文本内部不同的词与词之间连接关系所占权重的注意力矩阵；第三模块630，设置为将所述隐向量与所述注意力矩阵输入预设的神经网络进行处理，得到所述神经网络的最终输出，通过预设的第一算法对所述最终输出进行计算得到整体向量；第四模块640，设置为对所述整体向量进行分类转换处理，得到预测的关系类型。

一实施例中，第三模块630设置为：

对所述神经网络的最终输出使用MaxPooling算法计算得到第一实体向量表征、第二实体向量表征以及句子的向量表征；将所述第一实体向量表征、所述第二实体向量表以及所述句子的向量表征串联，得到所述整体向量。

一实施例中，第三模块630设置为：

将所述隐向量作为所述神经网络的输入，通过预设的第二算法对所述输入进行多层处理，其中，每一层处理的输出作为下一层处理的输入，且所述注意力矩阵参与指导每一层处理的运算，最后一层处理完之后得到的输出为所述最终输出。

一实施例中，第二模块620设置为：

将所述输入文本转换为多个n元组，所述多个n元组之间按照所述输入文本的语序排列；基于所述n元组，在n元组的词与词之间创建连接，并基于所述连接得到最终词图；将所述最终词图转化为邻接矩阵；对所述邻接矩阵通过预设的第三算法计算得到所述注意力矩阵。

一实施例中，第二模块620设置为：

获取预设的n元组词表，通过所述n元组词表匹配所述输入文本中的n元组，得到所述多个n元组。

一实施例中，第二模块620设置为：

基于所述n元组，在所述n元组内部的相邻词之间创建本地连接；在两个不同的n元组的首词之间与尾词之间分别创建全局连接；将所述本地连接与所述全局连接合并，得到所述最终词图。

一实施例中，创建所述全局连接的两个n元组之间包含的n元组个数不大于1。

一实施例中，第四模块640设置为：

将所述整体向量经过预设的全连接层后，送入预设的SoftMax分类器，得到所述预测的关系类型。

请参阅图7，本申请实施例还提供一种计算机设备3，包括处理器30、存储器31以及存储在所述存储器上的计算机程序，所述处理器执行上述计算机程序以实现如上述方法。

本申请的实施例还提供一种计算机程序产品，计算机程序产品包括计算机程序指令，计算机程序指令被执行时实现上述方法。

本申请的实施例还提供一种计算机存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现上述的关系抽取方法。

在本申请所提供的实施例中，“与A对应的B”表示B与A相关联，根据 A可以确定B。根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其他信息确定B。

说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此，在整个说明书出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定特征、结构或特性可以以任意适合的方式结合在一个或多个实施例中。本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在本申请的实施例中，上述过程的序号的大小并不意味着执行顺序的必然先后，多个过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在本申请的附图中的流程图和框图，图示了按照本申请实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现方案中，方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，在此基于涉及的功能而确定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

与相关技术相比，本申请所提供的一种关系抽取方法，具有如下的效果：

1.本申请第一实施例提供一种关系抽取方法，包含：获取输入文本，并对所述输入文本进行编码，得到输入文本中中每个词的隐向量；对输入文本进行处理，得到用于表征输入句子内部不同的词与词之间连接关系所占权重的注意力矩阵；将隐向量与注意力矩阵输入预设的神经网络进行处理，得到神经网络的最终输出，通过预设的第一算法对最终输出进行计算得到整体向量；对整体向量进行分类转换处理，得到预测的关系类型。背景技术中的方法未能够动态利用词图之间词与词的连接，使得词图内潜在的噪音影响性能。而本方法提供的注意力模块对输入文本进行处理，输出了表征不同词之间对关系预测任务所占的不同权重的注意力矩阵，使得神经网络在对关系预测模型进行训练以及预测实体关系时，能够依据不同权重的连接来进行更加准确的预测，减少了对关系抽取任务影响较小的连接所占用的计算资源。可见，本申请实施例提供的关系抽取方法在提升了关系预测模型性能的同时，节省了计算成本以及时间成本。

2.本申请实施例提供的关系抽取方法中，将隐向量与注意力矩阵输入预设的神经网络进行处理，得到神经网络的最终输出，通过预设的第一算法对最终输出进行计算得到整体向量包括：对神经网络的最终输出使用MaxPooling算法计算得到第一实体向量表征、第二实体向量表征以及句子的向量表征；将第一实体向量表征、第二实体向量表征以及句子的向量表征串联，得到整体向量。通过MaxPooling算法对神经网络的最终输出进行计算，得到的第一实体向量表征、第二实体向量表征以及句子的向量表征作为中间变量，反映了实体或句子在关系抽取模型中所处不同位置的向量表征，便于后续对整体向量的计算。

3.本申请实施例提供的关系抽取方法中，将隐向量与注意力矩阵输入预设的神经网络进行处理包括：将隐向量作为神经网络的输入，通过预设的第二算法对输入进行多层处理，其中，每一层处理的输出作为下一层处理的输入的方式进行处理，且注意力矩阵参与指导每一层处理的运算，最后一层处理完之后得到的输出为最终输出，用于参与第一算法计算得到整体向量。经过神经网络的多层处理，输入文本中句法携带的上下文信息(即与当前词相连接的其他词)就增强了每个词的表征，利用了更远距离的上下文信息，使得参与第一算法的最终输出所表征的语义更加准确。

4.本申请实施例提供的关系抽取方法中，对输入文本进行处理得到注意力矩阵还包括以下步骤：将输入文本转换为多个n元组，多个n元组之间按照输入文本的语序排列；基于n元组，在n元组的词与词之间创建连接，并基于连接得到最终词图；将最终词图转化为对应的邻接矩阵；对邻接矩阵通过预设的第三算法计算得到注意力矩阵。背景技术中的方式是通过CYK算法来构建词图，时间复杂度为O(N ³)，而本申请第一实施例提供的关系抽取方法中，是基于n元组来构建词图，其中，n元组中的n表示包含词的数量，只需对n元组中每个词遍历一遍即可，其时间复杂度为O(N)。可见，基于n元组来构建词图有效地降低了计算的时间复杂度，提高了词图构建的效率，降低了构建词图的成本。

5.本申请实施例提供的关系抽取方法中，将输入文本转换为多个n元组包含以下步骤：获取预设的n元组词表，通过n元组词表匹配输入文本中其他的n元组，得到多个n元组。通过n元组词表，将由传统意义上词与词组成的句子，转换成计算机或神经网络更容易识别或处理的，包含一个或多个词的n元组，基于n元组来构建词图，而不依赖依存句法分析工具，大幅降低了获取词图的成本。

6.本申请实施例提供的关系抽取方法中，基于连接得到最终词图包括以下步骤：基于n元组，在n元组内部的相邻词之间创建本地连接；在两个不同的n元组的首词与尾词之间两两创建全局连接；将本地连接与全局连接合并，得到最终词图。本地连接和全局连接将n元组内部的词与n元组之间的词连接起来构建了最终词图，使得后续在通过神经网络处理向量时，能够动态利用词图之间词与词的连接，从而提高了预测关系的准确性。

7.本申请实施例提供的关系抽取方法中，创建全局连接的两个n元组之间包含的n元组个数不大于1。当创建全局连接的两个n元组之间包含的n元组个数过多，会使得形成的最终词图十分复杂，而且距离较远的n元组之间如果存在连接，则这种连接往往会引入噪音，从而增加模型识别的难度。而如果仅在相邻的n元组之间创建全局连接，这样会使得词与词之间得连接不充分，没有足够地利用上下文信息，从而会使得预测的结果准确性不高。因此，将创建全局连接的两个n元组之间包含的n元组个数设为不大于1，可在降低最终词图的复杂性的同时，保证预测结果的准确度。

8.本申请实施例提供的关系抽取方法中，对整体向量进行分类转换处理包含以下步骤：将整体向量经过预设的全连接层后，送入预设的SoftMax分类器，得到预测的关系类型。全连接层和SoftMax分类器可将整体向量中包含的不同连接的权重信息可视化并与预设的模板进行匹配，从而能够更加方便地预测出实体之间的关系类型。

9.本申请实施例还提供一种关系抽取装置，具有与上述一种关系抽取方法相同的效果，在此不做赘述。

10.本申请实施例还提供一种计算机设备，具有与上述一种关系抽取方法相同的效果，在此不做赘述。

11.本申请实施例还提供一种计算机程序产品，具有与上述一种关系抽取方法相同的效果，在此不做赘述。

Claims

一种关系抽取方法，包括：

获取输入文本，并对所述输入文本进行编码，得到所述输入文本中每个词的隐向量；

对所述输入文本进行处理，得到用于表征所述输入文本内部不同的词与词之间连接关系所占权重的注意力矩阵；

将所述隐向量与所述注意力矩阵输入预设的神经网络进行处理，得到所述神经网络的最终输出，通过预设的第一算法对所述最终输出进行计算得到整体向量；

对所述整体向量进行分类转换处理，得到预测的关系类型。
如权利要求1所述的方法，其中，通过预设的第一算法对所述最终输出进行计算得到整体向量，包括：

对所述神经网络的最终输出使用MaxPooling算法计算得到第一实体向量表征、第二实体向量表征以及句子的向量表征；

将所述第一实体向量表征、所述第二实体向量表以及所述句子的向量表征串联，得到所述整体向量。
如权利要求1所述的方法，其中，将每个词的隐向量与所述注意力矩阵输入预设的神经网络进行处理，包括：

将所述隐向量作为所述神经网络的输入，通过预设的第二算法对所述输入进行多层处理，其中，每一层处理的输出作为下一层处理的输入，且所述注意力矩阵参与指导每一层处理的运算，最后一层处理完之后得到的输出为所述最终输出。
如权利要求1所述的方法，其中，对所述输入文本进行处理，得到用于表征所述输入文本内部不同的词与词之间连接关系所占权重的注意力矩阵，包括：

将所述输入文本转换为多个n元组，所述多个n元组之间按照所述输入文本的语序排列；

基于所述n元组，在n元组的词与词之间创建连接，并基于所述连接得到最终词图；

将所述最终词图转化为邻接矩阵；

对所述邻接矩阵通过预设的第三算法计算得到所述注意力矩阵。
如权利要求4所述的方法，其中，将所述输入文本转换为多个n元组，包括：

获取预设的n元组词表，通过所述n元组词表匹配所述输入文本中的n元组，得到所述多个n元组。
如权利要求4所述的方法，其中，基于所述连接得到最终词图，包括：

基于所述n元组，在所述n元组内部的相邻词之间创建本地连接；

在两个不同的n元组的首词与尾词之间两两创建全局连接；

将所述本地连接与所述全局连接合并，得到所述最终词图。
如权利要求6所述的方法，其中，创建所述全局连接的两个n元组之间包含的n元组个数不大于1。
如权利要求1所述的方法，其中，对所述整体向量进行分类转换处理，得到预测的关系类型，包括：

将所述整体向量经过预设的全连接层后，送入预设的SoftMax分类器，得到所述预测的关系类型。
一种关系抽取装置，包括：

第一模块，设置为获取输入文本，并对所述输入文本进行编码，得到所述输入文本中每个词的隐向量；

第二模块，设置为对所述输入文本进行处理，得到用于表征所述输入文本内部不同的词与词之间连接关系所占权重的注意力矩阵；

第三模块，设置为将所述隐向量与所述注意力矩阵输入预设的神经网络进行处理，得到所述神经网络的最终输出，通过预设的第一算法对所述最终输出进行计算得到整体向量；

第四模块，设置为对所述整体向量进行分类转换处理，得到预测的关系类型。
一种计算机设备，包括处理器、存储器以及存储在所述存储器上的计算机程序，所述处理器执行上述计算机程序以实现权利要求1-8任一项所述的关系抽取方法。
一种计算机程序产品，包括计算机程序指令，所述计算机程序指令被执行时实现如权利要求1-8任一项所述的关系抽取方法。
一种计算机存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-8任一项所述的关系抽取方法。