WO2022178950A1

WO2022178950A1 - 预测语句实体的方法、装置和计算机设备

Info

Publication number: WO2022178950A1
Application number: PCT/CN2021/084569
Authority: WO
Inventors: 王健宗; 宋青原; 吴天博; 程宁
Original assignee: 平安科技（深圳）有限公司
Priority date: 2021-02-25
Filing date: 2021-03-31
Publication date: 2022-09-01
Also published as: CN112949307A

Abstract

预测语句实体的方法，涉及人工智能中的神经网络技术领域，包括：获取待分析语句对应的文本向量（S1）；将文本向量输入第一表编码层得到文本向量对应的第一表结构表达（S2）；将文本向量和第一表结构表达输入第一序列编码层，得到文本向量对应的第一序列表达（S3）；将第一序列表达和第一表结构表达输入第二表编码层得到文本向量对应的第二表结构表达（S4）；将第一序列表达和第二表结构表达输入第二序列编码层，得到文本向量对应的第二序列表达（S5）；根据第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果（S6）。通过联合学习缓解管道方法错误传播的问题，提高实体预测的精准度。

Description

预测语句实体的方法、装置和计算机设备

本申请要求于2021年2月25日提交中国专利局、申请号为202110212245.0，发明名称为“预测语句实体的方法、装置和计算机设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能中的神经网络技术领域，本申请特别是涉及到预测语句实体的方法、装置和计算机设备。

背景技术

随着人工智能的发展，语音识别等语言模型越来越流行于各智能设备上。现有语言模型多基于实体识别和关系提取等进行预测分析，但发明人意识到现有命名实体识别和关系提取分别通过独立的两个模型处理，无法获取它们之间的关联关系，而且某些分类任务中，实体通常不可直接用于任务，需要增加一个额外的实体识别器形成一个管道，但管道方法容易发生误传播的问题，影响对预测结果的精准判断。

技术问题

现有命名实体识别和关系提取分别通过独立的两个模型处理，无法获取它们之间的关联关系，而且某些分类任务中，实体通常不可直接用于任务，需要增加一个额外的实体识别器形成一个管道，但管道方法容易发生误传播的问题，影响对预测结果的精准判断。

技术解决方案

本申请的主要目的为提供预测语句实体的方法，旨在解决现有实体识别器容易发生误传播的的技术问题。

第一方面，本申请提出一种预测语句实体的方法，包括：

获取待分析语句对应的文本向量；

将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；

将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；

将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；

将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；

根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。

第二方面，本申请还提供了一种预测语句实体的装置，包括：

获取模块，用于获取待分析语句对应的文本向量；

第一输入模块，用于将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；

第二输入模块，用于将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；

第三输入模块，用于将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；

第四输入模块，用于将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；

得到模块，用于根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。

第三方面，本申请还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现一种预测语句实体的方法，其中，所述预测语句实体的方法包括：获取待分析语句对应的文本向量；将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。

第四方面，本申请还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现一种预测语句实体的方法，其中，所述预测语句实体的方法包括：获取待分析语句对应的文本向量；将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。

有益效果

本申请通过两种不同类型的编码器连接进行联合学习，缓解管道方法错误传播的问题，且在训练和使用中受益于利用实体关系预测结果和实体预测结果之间的相互关系，提高实体预测的精准度。

附图说明

图1本申请一实施例的预测语句实体的方法流程示意图；

图2本申请一实施例的预测语句实体的模型结构示意图；

图3本申请一实施例的预测语句实体的模型结构中表编码层和序列编码层的交互示意图；

图4本申请一实施例的预测语句实体的系统流程示意图；

图5本申请一实施例的计算机设备内部结构示意图。

本发明的最佳实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请一实施例的预测语句实体的方法，包括：

S1：获取待分析语句对应的文本向量；

S2：将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；

S3：将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；

S4：将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；

S5：将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；

S6：根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。

本申请实施例中，预测语句实体的模型由两种不同类型的编码器连接组成，组成结构如图2。一种编码器对应表结构表示的表编码器，另一种编码器对应序列表示的序列编码器。两种编码器以卷积层为单位进行相互交互，并通过多层的相互交互提高两种表达的质量，提高预测精准度。本申请通过两种表达在同一模型中同时得到命名实体识别和关系提取两种预测结果，提高实体识别的精准度。上述命名实体指语句中包括的预设实体，比如，预先指定人名、物品名、组织等为命名实体，句子“老王喜欢吃苹果”中，“老王”和“苹果”则为命名实体，“老王喜欢吃”则为实体之间的关系提取，通过关系提取可提高下次识别“老王”实体的概率。

本申请实施例的文本向量包括词嵌入、字嵌入和上下文关系词嵌入。对于包含N个单词的句子为x，x＝[x _i] _1≤i≤N，i表示句子中的第i个子，对应的词嵌入为

对应的字嵌入为

词嵌入和字嵌入由LSTM或RNNS等计算得到。上下文关系词嵌入由BERT等模型产生，表示为

上述R表示取值区间，w表示词嵌入，c表示字嵌入，d1表示词嵌入对应的维度，d2表示字嵌入对应的维度，d3表示上下文关系词嵌入对应的维度。

本申请实施例的第一表编码层、第二表编码层为预测语句实体的模型中任意相邻的两个表编码层；第一序列编码层、第二序列编码层为预测语句实体的模型中任意相邻的两个序列编码层。“第一”和“第二”仅用于区别，不用于限定，其他处的类似用语作用相同，不赘述。

本申请通过两种不同类型的编码器连接，通过对同一个输入语句进行表结构表达和序列表达的联合学习达到精准识别命名实体的目的，无需增加额外的实体识别器形成一个管道，避免了管道方法错误传播的问题，且在训练和使用中受益于利用实体关系预测结果和实体预测结果之间的相互关系，提高实体预测的精准度。

进一步地，所述第一表编码层为连接文本向量器的首个表编码层，所述将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达的步骤S2，包括：

S21：在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构；

S22：获取Bert模型的编码层输出的第一上下文关系概率；

S23：将所述第一上下文关系概率关联于所述初始表结构中，得到第一表结构表达。

本申请实施例中首个表编码层中的表结构定义为初始表结构，初始表结构为无上下文关系表结构。然后通过Bert模型的编码层输出的第一上下文关系概率，转变表结构中关联预测关系。与首个表编码层相连的Bert模型的编码层中的参量为预训练的注意力权重。

表编码器用于学习表结构表达的神经网络，结构如图3的左边所示，通过增加直接拼接层和线性投影层，加快计算效率，直接拼接层为Concat作为表。举例地，为一个N×N的向量表，其中第i行和第j列的向量分别对应语句中的第i个词和第j个词之间的向量。通过构造一个没有上下文关系的表结构，通过Bert模型的编码层输出的上下文关系概率，连接语句序列中的两个词向量，得到注意力修正后的表结构。比如修正前对于第l层的两个词向量之间的向量表达为：X _l,i,j＝ReLU(Linear(|S _l-1,i；S _l-1,j|))，X _l∈R ^N×N×N。修正后为

如图2中的虚线部分表示，利用来自BERT等预先训练的语言模型的注意力权重形式的信息，将注意力所有头部和所有层的注意力权重叠加起来形成

此处L ^l是堆叠的Transformer层数，A ^l是每一Transformer层的多头注意力的头数。本申请实施例的BERT全连接层的隐藏神经元的数量减半，提高计算速率。上述ReLu(Rectified Linear Unit,线性整流函数)为激活函数，Linear表示线性映射，X _l,i,j表示第l层中第i个词和第j个词之间的向量表达，S _l-1,i表示第l-1层第i个词对应的序列表示，S _l-1,j表示第l-1层第j个词对应的序列表示，X _l表示句子在第l层的向量表达。

进一步地，第一表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，所述在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构的步骤S21，包括：

S211：将所述文本向量通过直接拼接层进行向量拼接，得到第一拼接向量；

S212：将所述第一拼接向量通过线性投影层得到所述文本向量对应的初始序列；

S213：将所述初始序列通过迭代递归层计算得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。

本申请实施例中，上述文本向量连接到语句中的每个词，并通过直接拼接层进行向量拼接后，通过线性投影层Linear&ReLU进行线性投影来形成初始序列S ₀，表示为：S ₀＝Linear(|x ^w；x ^c；x ^l|)，S ₀∈R ^N×H，每个词都由H维向量表示。上述迭代递归层包括多维循环神经网络和/或门控循环单元，为X _l添加语境。

进一步地，所述迭代递归层为多维循环神经网络，将所述初始序列通过所述迭代递归层计算得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构的步骤S213，包括：

S2131：获取指定单元格在第一空间方向和第二空间方向上的第一门控循环数据，其中，所述第一空间方向和所述第二空间方向为第一空间维度的两个相对方向，所述指定单元格为无上下文关系的表结构中任一单元格；

S2132：获取所述指定单元格在第三空间方向和第四空间方向上的第二门控循环数据，其中，所述第三空间方向和所述第四空间方向为第二空间维度的两个相对方向，所述第二空间维度与所述第一空间维度相互垂直；

S2133：根据所述第一门控循环数据和所述第二门控循环数据，得到所述指定单元格的隐藏层状态；

S2134：根据所述指定单元格的隐藏层状态的计算方式，得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。

本申请实施例中，使用循环神经网络RNN和门控循环单元GRU(Gated Recurrent Unit)为X _l加入语境。通过迭代递归层的迭代计算上下文关系化的表结构中每个单元格的隐藏层状态，形成上下文关系化的表结构表达，表示为：T _l,i,j＝GRU(X _l,i,j,T _l-1,i,j,T _l,i-1,j,T _l,i,j-1)。

本申请为了能够从各个空间方向接触到周围的语境环境，循环神经网络为多维循环神经网络MD-RNN，且为了减少计算量，使用2D-RNN可从四个空间方面考虑RNNs。迭代计算后的表结构表达为

表示是两个RNN的隐藏层串联，如下：

a和c代表不同空间维度，比如a表示上下维度，c表示左右维度或前后维度。

进一步地，所述第一序列编码层为连接文本向量器的首个序列编码层，第一序列编码层包括表引导的注意力，所述将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达的步骤S3，包括：

S31：获取预设查询和查询对应键值对的初始赋值；

S32：根据所述初始赋值通过表引导的注意力运算所述文本向量对应的第一输出值；

S33：根据得分函数为各所述第一输出值赋予权重；

S34：将各所述第一输出值赋予权重以及所述文本向量输入前馈神经网络，得到所述文本向量对应的第一序列表达。

本申请实施例中，序列编码器用于学习序列表示，向量序列中第i个向量对应语句的第i个单词。本申请序列编码器架构类似于Transformer，如图3右边部分所示。但本申请增加了表引导的注意力，且用table-guided attention替换了scaled dotproduct attention，以便能生成新的表引导的注意力。

首先，给定表引导的注意力参数查询Q(querys)和查询Q对应的键值对K(keys)和V(values)，对于每个查询Q，输出值为加权和，赋给每个输出值的权重，由查询Q与所有键的相关性决定，上述相关性由得分函数f给出。举例地，对于每一个查询Q _i和键K _j，表示得分函数f的表达式为：f(Q _i,K _j)＝U·g(Q _i,K _j)＝U·T _l,i,j，其中U是一个可学习向量参数，模型可在预设范围内自行调节，g表示将每个查询键对映射为向量的函数，对应权重相关性。

本申请实施例中表引导的注意力为多头注意力，其中每个头具有独立参数，通过一个完全连接的层连接它们的输出并获得最终的注意力输出值。表序列编码器中的前馈神经网络FFNN带残差连接，还有层的normalization处理，输出的序列表达表示为：

进一步地，所述第二表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，所述将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达的步骤S4，包括：

S41：获取与所述第二表编码层相连的Bert模型编码层输出的第二上下文关系概率；

S42：将所述第二上下文关系概率和所述第一序列表达输入直接拼接层，通过直接拼接层进行向量拼接，得到第二拼接向量；

S43：将所述第二拼接向量通过线性投影层得到指定序列；

S44：将所述指定序列和所述第一表结构表达输入迭代递归层，通过迭代递归层计算所述第一表结构表达中的每个单元格的隐藏层状态，得到所述第二表结构表达。

本申请实施例以中间的表编码层和序列编码层的交互为例，计算过程与首个表编码层的计算原理相同，仅输入数据不同。关于计算过程解释参照上述表编码层的计算过程，不赘述。

进一步地，第二序列编码层包括表引导的注意力和前馈神经网络，所述将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达的步骤S5，包括：

S51：获取所述第二表结构表达中对应的查询以及查询对应键值对的指定赋值；

S52：根据所述指定赋值通过表引导的注意力运算所述第二表结构表达对应的第二输出值；

S53：根据得分函数为各所述第二输出值赋予权重；

S54：将各所述第二输出值赋予权重以及所述第一序列表达输入前馈神经网络，得到所述第二序列表达。

本申请实施例以中间的表编码层和序列编码层的交互为例，计算过程与首个序列编码层的计算原理相同，仅输入数据不同。关于计算过程解释参照上述序列编码层的计算过程，不赘述。

参照图4，本申请一实施例的预测语句实体的装置，包括：

获取模块1，用于获取待分析语句对应的文本向量；

第一输入模块2，用于将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；

第二输入模块3，用于将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；

第三输入模块4，用于将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；

第四输入模块5，用于将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；

得到模块6，用于根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。

本申请实施例中的装置解释同方法对应部分，不赘述。

进一步地，所述第一表编码层为连接文本向量器的首个表编码层，第一输入模块2，包括：

构建子模块，用于在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构；

第一获取子模块，用于获取Bert模型的编码层输出的第一上下文关系概率；

关联子模块，用于将所述第一上下文关系概率关联于所述初始表结构中，得到第一表结构表达。

进一步地，第一表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，构建子模块，包括：

拼接单元，用于将所述文本向量通过直接拼接层进行向量拼接，得到第一拼接向量；

线性投影单元，用于将所述第一拼接向量通过线性投影层得到所述文本向量对应的初始序列；

计算单元，用于将所述初始序列通过迭代递归层计算得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。

进一步地，所述迭代递归层为多维循环神经网络，计算单元，包括：

第一获取子单元，用于获取指定单元格在第一空间方向和第二空间方向上的第一门控循环数据，其中，所述第一空间方向和所述第二空间方向为第一空间维度的两个相对方向，所述指定单元格为无上下文关系的表结构中任一单元格；

第二获取子单元，用于获取所述指定单元格在第三空间方向和第四空间方向上的第二门控循环数据，其中，所述第三空间方向和所述第四空间方向为第二空间维度的两个相对方向，所述第二空间维度与所述第一空间维度相互垂直；

第一得到子单元，用于根据所述第一门控循环数据和所述第二门控循环数据，得到所述指定单元格的隐藏层状态；

第二得到子单元，用于根据所述指定单元格的隐藏层状态的计算方式，得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。

进一步地，所述第一序列编码层为连接文本向量器的首个序列编码层，第一序列编码层包括表引导的注意力，第二输入模块3，包括：

第二获取子模块，用于获取预设查询和查询对应键值对的初始赋值；

第一运算子模块，用于根据所述初始赋值通过表引导的注意力运算所述文本向量对应的第一输出值；

第一赋予子模块，用于根据得分函数为各所述第一输出值赋予权重；

第一输入子模块，用于将各所述第一输出值赋予权重以及所述文本向量输入前馈神经网络，得到所述文本向量对应的第一序列表达。

进一步地，所述第二表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，第三输入模块4，包括：

第三获取子模块，用于获取与所述第二表编码层相连的Bert模型编码层输出的第二上下文关系概率；

第二输入子模块，用于将所述第二上下文关系概率和所述第一序列表达输入直接拼接层，通过直接拼接层进行向量拼接，得到第二拼接向量；

投影子模块，用于将所述第二拼接向量通过线性投影层得到指定序列；

第三输入子模块，用于将所述指定序列和所述第一表结构表达输入迭代递归层，通过迭代递归层计算所述第一表结构表达中的每个单元格的隐藏层状态，得到所述第二表结构表达。

进一步地，第二序列编码层包括表引导的注意力和前馈神经网络，第四输入模块5，包括：

第四获取子模块，用于获取所述第二表结构表达中对应的查询以及查询对应键值对的指定赋值；

第二运算子模块，用于根据所述指定赋值通过表引导的注意力运算所述第二表结构表达对应的第二输出值；

第二赋予子模块，用于根据得分函数为各所述第二输出值赋予权重；

第四输入子模块，用于将各所述第二输出值赋予权重以及所述第一序列表达输入前馈神经网络，得到所述第二序列表达。

参照图5，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储预测语句实体的过程需要的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现预测语句实体的方法。

上述处理器执行上述预测语句实体的方法，包括：获取待分析语句对应的文本向量；将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。

上述计算机设备，通过两种不同类型的编码器连接进行联合学习，缓解管道方法错误传播的问题，且在训练和使用中受益于利用实体关系预测结果和实体预测结果之间的相互关系，提高实体预测的精准度。

在一个实施例中，所述第一表编码层为连接文本向量器的首个表编码层，上述处理器将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达的步骤，包括：在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构；获取Bert模型的编码层输出的第一上下文关系概率；将所述第一上下文关系概率关联于所述初始表结构中，得到第一表结构表达。

在一个实施例中，第一表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，上述处理器在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构的步骤，包括：将所述文本向量通过直接拼接层进行向量拼接，得到第一拼接向量；将所述第一拼接向量通过线性投影层得到所述文本向量对应的初始序列；将所述初始序列通过迭代递归层计算得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。

在一个实施例中，所述迭代递归层为多维循环神经网络，上述处理器将所述初始序列通过所述迭代递归层计算得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构的步骤，包括：获取指定单元格在第一空间方向和第二空间方向上的第一门控循环数据，其中，所述第一空间方向和所述第二空间方向为第一空间维度的两个相对方向，所述指定单元格为无上下文关系的表结构中任一单元格；获取所述指定单元格在第三空间方向和第四空间方向上的第二门控循环数据，其中，所述第三空间方向和所述第四空间方向为第二空间维度的两个相对方向，所述第二空间维度与所述第一空间维度相互垂直；根据所述第一门控循环数据和所述第二门控循环数据，得到所述指定单元格的隐藏层状态；根据所述指定单元格的隐藏层状态的计算方式，得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。

在一个实施例中，所述第一序列编码层为连接文本向量器的首个序列编码层，第一序列编码层包括表引导的注意力，上述处理器将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达的步骤，包括：获取预设查询和查询对应键值对的初始赋值；根据所述初始赋值通过表引导的注意力运算所述文本向量对应的第一输出值；根据得分函数为各所述第一输出值赋予权重；将各所述第一输出值赋予权重以及所述文本向量输入前馈神经网络，得到所述文本向量对应的第一序列表达。

在一个实施例中，所述第二表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，上述处理器将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达的步骤，包括：获取与所述第二表编码层相连的Bert模型编码层输出的第二上下文关系概率；将所述第二上下文关系概率和所述第一序列表达输入直接拼接层，通过直接拼接层进行向量拼接，得到第二拼接向量；将所述第二拼接向量通过线性投影层得到指定序列；将所述指定序列和所述第一表结构表达输入迭代递归层，通过迭代递归层计算所述第一表结构表达中的每个单元格的隐藏层状态，得到所述第二表结构表达。

在一个实施例中，第二序列编码层包括表引导的注意力和前馈神经网络，上述处理器将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达的步骤，包括：获取所述第二表结构表达中对应的查询以及查询对应键值对的指定赋值；根据所述指定赋值通过表引导的注意力运算所述第二表结构表达对应的第二输出值；根据得分函数为各所述第二输出值赋予权重；将各所述第二输出值赋予权重以及所述第一序列表达输入前馈神经网络，得到所述第二序列表达。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请一实施例还提供一种计算机可读存储介质，所述存储介质为易失性存储介质或非易失性存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现预测语句实体的方法，包括：获取待分析语句对应的文本向量；将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。

上述计算机可读存储介质，通过两种不同类型的编码器连接进行联合学习，缓解管道方法错误传播的问题，且在训练和使用中受益于利用实体关系预测结果和实体预测结果之间的相互关系，提高实体预测的精准度。

在一个实施例中，所述第一表编码层为连接文本向量器的首个表编码层，上述处理器将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达的步骤，包括：在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构；获取Bert模型的编码层输出的第一上下文关系概率；将所述第一上下文关系概率关联于初始表结构中，得到第一表结构表达。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，上述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

Claims

一种预测语句实体的方法，其中，包括：

获取待分析语句对应的文本向量；

将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；

将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；

将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；

将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；

根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。
根据权利要求1所述的预测语句实体的方法，其中，当所述第一表编码层为连接文本向量器的首个表编码层时，所述将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达的步骤，包括：

在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构；

获取Bert模型的编码层输出的第一上下文关系概率；

将所述第一上下文关系概率关联于所述初始表结构中，得到第一表结构表达。
根据权利要求2所述的预测语句实体的方法，其中，第一表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，所述在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构的步骤，包括：

将所述文本向量通过直接拼接层进行向量拼接，得到第一拼接向量；

将所述第一拼接向量通过线性投影层得到所述文本向量对应的初始序列；

将所述初始序列通过迭代递归层计算得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。
根据权利要求3所述的预测语句实体的方法，其中，所述迭代递归层为多维循环神经网络，将所述初始序列通过所述迭代递归层计算得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构的步骤，包括：

获取指定单元格在第一空间方向和第二空间方向上的第一门控循环数据，其中，所述第一空间方向和所述第二空间方向为第一空间维度的两个相对方向，所述指定单元格为无上下文关系的表结构中任一单元格；

获取所述指定单元格在第三空间方向和第四空间方向上的第二门控循环数据，其中，所述第三空间方向和所述第四空间方向为第二空间维度的两个相对方向，所述第二空间维度与所述第一空间维度相互垂直；

根据所述第一门控循环数据和所述第二门控循环数据，得到所述指定单元格的隐藏层状态；

根据所述指定单元格的隐藏层状态的计算方式，得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。
根据权利要求1所述的预测语句实体的方法，其中，所述第一序列编码层为连接文本向量器的首个序列编码层，第一序列编码层包括表引导的注意力，所述将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达的步骤，包括：

获取预设查询和查询对应键值对的初始赋值；

根据所述初始赋值通过表引导的注意力运算所述文本向量对应的第一输出值；

根据得分函数为各所述第一输出值赋予权重；

将各所述第一输出值赋予权重以及所述文本向量输入前馈神经网络，得到所述文本向量对应的第一序列表达。
根据权利要求1所述的预测语句实体的方法，其中，所述第二表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，所述将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达的步骤，包括：

获取与所述第二表编码层相连的Bert模型编码层输出的第二上下文关系概率；

将所述第二上下文关系概率和所述第一序列表达输入直接拼接层，通过直接拼接层进行向量拼接，得到第二拼接向量；

将所述第二拼接向量通过线性投影层得到指定序列；

将所述指定序列和所述第一表结构表达输入迭代递归层，通过迭代递归层计算所述第一表结构表达中的每个单元格的隐藏层状态，得到所述第二表结构表达。
根据权利要求1所述的预测语句实体的方法，其中，第二序列编码层包括表引导的注意力和前馈神经网络，所述将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达的步骤，包括：

获取所述第二表结构表达中对应的查询以及查询对应键值对的指定赋值；

根据所述指定赋值通过表引导的注意力运算所述第二表结构表达对应的第二输出值；

根据得分函数为各所述第二输出值赋予权重；

将各所述第二输出值赋予权重以及所述第一序列表达输入前馈神经网络，得到所述第二序列表达。
一种预测语句实体的装置，其中，包括：

获取模块，用于获取待分析语句对应的文本向量；

第一输入模块，用于将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；

第二输入模块，用于将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；

第三输入模块，用于将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；

第四输入模块，用于将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；

得到模块，用于根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其中，所述处理器执行所述计算机程序时实现一种预测语句实体的方法；其中，所述预测语句实体的方法包括：

获取待分析语句对应的文本向量；

将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；

将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；

将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；

将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；

根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。
根据权利要求9所述的计算机设备，其中，当所述第一表编码层为连接文本向量器的首个表编码层时，所述将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达的步骤，包括：

在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构；

获取Bert模型的编码层输出的第一上下文关系概率；

将所述第一上下文关系概率关联于所述初始表结构中，得到第一表结构表达。
根据权利要求10所述的计算机设备，其中，第一表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，所述在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构的步骤，包括：

将所述文本向量通过直接拼接层进行向量拼接，得到第一拼接向量；

将所述第一拼接向量通过线性投影层得到所述文本向量对应的初始序列；

将所述初始序列通过迭代递归层计算得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。
根据权利要求11所述的计算机设备，其中，所述迭代递归层为多维循环神经网络，将所述初始序列通过所述迭代递归层计算得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构的步骤，包括：

获取指定单元格在第一空间方向和第二空间方向上的第一门控循环数据，其中，所述第一空间方向和所述第二空间方向为第一空间维度的两个相对方向，所述指定单元格为无上下文关系的表结构中任一单元格；

获取所述指定单元格在第三空间方向和第四空间方向上的第二门控循环数据，其中，所述第三空间方向和所述第四空间方向为第二空间维度的两个相对方向，所述第二空间维度与所述第一空间维度相互垂直；

根据所述第一门控循环数据和所述第二门控循环数据，得到所述指定单元格的隐藏层状态；

根据所述指定单元格的隐藏层状态的计算方式，得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。
根据权利要求9所述的计算机设备，其中，所述第一序列编码层为连接文本向量器的首个序列编码层，第一序列编码层包括表引导的注意力，所述将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达的步骤，包括：

获取预设查询和查询对应键值对的初始赋值；

根据所述初始赋值通过表引导的注意力运算所述文本向量对应的第一输出值；

根据得分函数为各所述第一输出值赋予权重；

将各所述第一输出值赋予权重以及所述文本向量输入前馈神经网络，得到所述文本向量对应的第一序列表达。
根据权利要求9所述的计算机设备，其中，所述第二表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，所述将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达的步骤，包括：

获取与所述第二表编码层相连的Bert模型编码层输出的第二上下文关系概率；

将所述第二上下文关系概率和所述第一序列表达输入直接拼接层，通过直接拼接层进行向量拼接，得到第二拼接向量；

将所述第二拼接向量通过线性投影层得到指定序列；

将所述指定序列和所述第一表结构表达输入迭代递归层，通过迭代递归层计算所述第一表结构表达中的每个单元格的隐藏层状态，得到所述第二表结构表达。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现一种预测语句实体的方法；

其中，所述预测语句实体的方法包括：

获取待分析语句对应的文本向量；

将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达；

将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达；

将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达，其中，所述第二表编码层与所述第一表编码层相邻相连；

将所述第一序列表达和所述第二表结构表达输入第二序列编码层，得到所述文本向量对应的第二序列表达，其中，所述第二序列编码层于所述第一序列编码层相邻相连；

根据所述第二表结构表达的获得方式，得到末层表编码层输出的实体关系预测结果，根据所述第二序列表达的获得方式，得到末层序列编码层输出的实体预测结果。
根据权利要求15所述的计算机可读存储介质，其中，当所述第一表编码层为连接文本向量器的首个表编码层时，所述将所述文本向量输入第一表编码层得到所述文本向量对应的第一表结构表达的步骤，包括：

在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构；

获取Bert模型的编码层输出的第一上下文关系概率；

将所述第一上下文关系概率关联于所述初始表结构中，得到第一表结构表达。
根据权利要求16所述的计算机可读存储介质，其中，第一表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，所述在所述首个表编码层中根据所述文本向量构建无上下文关系的初始表结构的步骤，包括：

将所述文本向量通过直接拼接层进行向量拼接，得到第一拼接向量；

将所述第一拼接向量通过线性投影层得到所述文本向量对应的初始序列；

将所述初始序列通过迭代递归层计算得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。
根据权利要求17所述的计算机可读存储介质，其中，所述迭代递归层为多维循环神经网络，将所述初始序列通过所述迭代递归层计算得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构的步骤，包括：

获取指定单元格在第一空间方向和第二空间方向上的第一门控循环数据，其中，所述第一空间方向和所述第二空间方向为第一空间维度的两个相对方向，所述指定单元格为无上下文关系的表结构中任一单元格；

获取所述指定单元格在第三空间方向和第四空间方向上的第二门控循环数据，其中，所述第三空间方向和所述第四空间方向为第二空间维度的两个相对方向，所述第二空间维度与所述第一空间维度相互垂直；

根据所述第一门控循环数据和所述第二门控循环数据，得到所述指定单元格的隐藏层状态；

根据所述指定单元格的隐藏层状态的计算方式，得到无上下文关系的表结构中的每个单元格的隐藏层状态，得到所述文本向量对应的初始表结构。
根据权利要求15所述的计算机可读存储介质，其中，所述第一序列编码层为连接文本向量器的首个序列编码层，第一序列编码层包括表引导的注意力，所述将所述文本向量和所述第一表结构表达输入第一序列编码层，得到所述文本向量对应的第一序列表达的步骤，包括：

获取预设查询和查询对应键值对的初始赋值；

根据所述初始赋值通过表引导的注意力运算所述文本向量对应的第一输出值；

根据得分函数为各所述第一输出值赋予权重；

将各所述第一输出值赋予权重以及所述文本向量输入前馈神经网络，得到所述文本向量对应的第一序列表达。
根据权利要求15所述的计算机可读存储介质，其中，所述第二表编码层包括依次连接的直接拼接层、线性投影层和迭代递归层，所述将所述第一序列表达和所述第一表结构表达输入第二表编码层得到所述文本向量对应的第二表结构表达的步骤，包括：

获取与所述第二表编码层相连的Bert模型编码层输出的第二上下文关系概率；

将所述第二上下文关系概率和所述第一序列表达输入直接拼接层，通过直接拼接层进行向量拼接，得到第二拼接向量；

将所述第二拼接向量通过线性投影层得到指定序列；

将所述指定序列和所述第一表结构表达输入迭代递归层，通过迭代递归层计算所述第一表结构表达中的每个单元格的隐藏层状态，得到所述第二表结构表达。