WO2021164293A1

WO2021164293A1 - 基于大数据的零指代消解方法、装置、设备及介质

Info

Publication number: WO2021164293A1
Application number: PCT/CN2020/123173
Authority: WO
Inventors: 楼星雨; 许开河; 王少军
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-02-18
Filing date: 2020-10-23
Publication date: 2021-08-26
Also published as: CN111401035A

Abstract

一种基于大数据的零指代消解方法，所述方法包括：获取待消解句子及其上文信息，对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示（S101）；将所述待消解句子和所述上文信息中每个字的上下文向量表示输入双向长短期记忆网络中，以增强每个字的上下文表达和位置信息，得到每个字增强后的上下文向量表示（S102）；遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率（S103）；遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率（S104）；从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项（S105）。该方法解决了现有零指代消解技术过于依赖回指项候选集合、消解结果准确性低且不稳定的问题。

Description

基于大数据的零指代消解方法、装置、设备及介质

本申请要求于2020年2月18日提交中国专利局、申请号为202010099118.X ，发明名称为“基于大数据的零指代消解方法、装置、设备及介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及信息技术领域，尤其涉及一种基于大数据的零指代消解方法、装置、设备及介质。

背景技术

指代消解是自然语言领域中研究时间最长且应用场景十分广阔的技术之一。在客服机器人、对话机器人以及智能外呼平台中，指代消解都是最为核心的技术之一。指代消解包括零指代消解和共指消解两部分。

在形如中文等代词缺失的语言中，能够根据上下文的关系所推断出来的部分经常被省略，而被省略的部分在句子中又承担相应的句法成分，并且回指前文中的某个语言单位。其中被省略的部分就称为是零指代项。零指代消解就是要为零指代项找到前文中对应的语言单位。零指代消解任务通常又分为两个子任务——零指代位置检测和消解。

消解任务的目的是在零指代位置检测结果的基础上为具有前文回指项的零指代项识别出它的具体回指项。传统的消解模型通常是先构建回指项候选集合，然后使用分类或排序的方法从回指项候选集合中选取最可能的候选项作为最终的识别结果。回指项候选集合的构建往往是由零指代项之前两句上文中的最大名词短语和修饰性名词短语所组成的。发明人意识到，这种做法的准确性十分依赖于回指项候选集合的准确性，若集合中并不包含正确的回指项，那么必然会导致后续的识别失败。由于回指项候选集合只由简单的几个名词性短语所组成，因此这使得传统的消解方法具有较高的不稳定性和较低的准确性。

因此，寻找一种解决现有零指代消解技术过于依赖回指项候选集合、消解结果准确性低且不稳定的问题的方法成为本领域技术人员亟需解决的技术问题。

发明内容

本申请实施例提供了一种基于大数据的零指代消解方法、装置、设备及介质，以解决现有零指代消解技术过于依赖回指项候选集合、消解结果准确性低且不稳定的问题。

一种基于大数据的零指代消解方法，包括：

获取待消解句子及其上文信息，对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示；

将所述待消解句子和所述上文信息中每个字的上下文向量表示输入双向长短期记忆网络中，以增强每个字的上下文表达和位置信息，得到每个字增强后的上下文向量表示；

遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率；

遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率；

从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。

一种基于大数据的零指代消解装置，包括：

向量化模块，用于获取待消解句子及其上文信息，对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示；

增强模块，用于将所述待消解句子和所述上文信息中每个字的上下文向量表示输入双向长短期记忆网络中，以增强每个字的上下文表达和位置信息，得到每个字增强后的上下文向量表示；

预测模块，用于遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率；

构建模块，用于遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率；

选取模块，用于从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

本申请的一个或多个实施例的细节在下面的附图和描述中提出，本申请的其他特征和优点将从说明书、附图以及权利要求变得明显。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例中基于大数据的零指代消解方法的一流程图；

图2是本申请另一实施例中基于大数据的零指代消解方法中步骤S101的一流程图；

图3是本申请另一实施例中基于大数据的零指代消解方法中步骤S103的一流程图；

图4是本申请另一实施例中基于大数据的零指代消解方法中步骤S104的一流程图；

图5是本申请另一实施例中基于大数据的零指代消解方法中步骤S105的一流程图；

图6 是本申请一实施例中基于大数据的零指代消解装置的一原理框图；

图7是本申请一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供的基于大数据的零指代消解方法应用于服务器。所述服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一实施例中，如图1所示，提供一种基于大数据的零指代消解方法，包括如下步骤：

在步骤S101中，获取待消解句子及其上文信息，对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示。

在这里，所述上文信息是针对所述待消解句子所在段落之前的文本信息，可以是所述待消解句子之前的一个或多个句子。在客服机器人的应用场景下，所述待消解句子可以为客户当前进行询问和聊天时输入的文本或音转字之后的结果文本。所述上下文信息可以为所述客户进行询问和聊天的所有文本。

每个字对应一个上下文向量表示，所述上下文向量表示是指每个字的特征向量。作为本申请的一个优选示例，本申请实施例通过对所述待消解句子及其上文信息进行向量化，得到每个字的上下文向量表示，并通过word embedding方法和bert模型引入字与字之间的相关性，使得每个字的上下文向量表示更为准确，并降低每个字的上下文向量表示中的特征维度。可选地，如图2所示，步骤S101中所述的对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示包括：

在步骤S201中，对所述待消解句子及其上文信息中的每个字采用one-hot形式表征，得到所述待消解句子对应的高维离散字表示矩阵，及其上文信息对应的高维离散字表示矩阵。

在这里，本申请实施例采用one-hot形式将待消解句子及其上文信息转换成数学表示，得到所述待消解句子对应的高维离散字表示矩阵，及其上文信息对应的高维离散字表示矩阵。具体的，通过预先构建字典，所述字典中至少包含待消解句子中的所有字，且每个字分配一个编号，在对所述待消解句子进行编码时，将所述待消解句子包含的每一个字转换成字典里面所述字的编号对应位置为1的one-hot形式。对于上文信息的处理逻辑相同，此处不再赘述。One-hot表示方式非常直观，每一个字的one-hot形式的长度都是字典的长度，如字典包含10000个字，那么每个字对应的one-hot形式就是1*10000的向量，而这个向量只有一个位置为1，其余都是0，浪费空间，不利于计算；此外，每个字之间的关系无法通过one-hot形式体现出来。

鉴于此，本申请实施例进一步对所述待消解句子对应的高维离散字表示矩阵，及其上文信息对应的高维离散字表示矩阵进行降维和引入字与字之间的相关性。

在步骤S202中，采用word embedding的方法分别将所述待消解句子对应的高维离散字表示矩阵以及将所述上文信息对应的高维离散字表示矩阵嵌入到低维稠密表征矩阵。

可选地，本申请实施例采用word embedding方法中的word2vec方法。具体地，训练预设的浅层神经网络，通过所述浅层神经网络学习每个字的稠密特征向量，获得能够反映任意两个字之间关系的字向量表示。然后遍历待消解句子中的每个字的one-hot形式，通过训练好的浅层神经网络将待消解句子中的字转化为成对应的稠密特征向量，组合所有字的稠密特征向量，得到所述待消解句子对应的低维稠密表征矩阵。对于上下文信息的处理逻辑相同，此处不再赘述。

在这里，稠密特征向量为每个字分配了一个固定长度的向量表示，所述固定长度可以自行设定，比如300，远小于one-hot形式中的字典长度；而且两个字之间的关系可以通过两个字之间的夹角值表示，具体可通过简单的余弦函数表示。可见，本实施例通过稠密特征向量引入了字与字之间的相关性，并且降低了待消解句子及其上文信息中的特征维度。

在步骤S203中，将所述待消解句子及其上文信息对应的低维稠密表征矩阵输入预设的bert模型进行双向编码，得到所述待消解句子及其上文信息中每个字的上下文向量表示。

在这里，所述上下文向量表示是指包含上文和下文信息的特征向量。bert模型可将每个字向量表示进行深层的双向编码，将原来不包含上下文信息的字向量变成引入了该字上文和下文信息的上下文向量。具体地，bert模型通过24层的转换模块Transformer-block将输入的低维稠密表征矩阵映射到隐空间。其中，每个Transformer-block依次由多头注意力模块、残差网络、层标准化以及前馈式神经网络等模块组成。在多头注意力模块中，低维稠密表征矩阵可以学习到上下文之间的交互信息，并且加入位置编码，从而使得bert模型得到的隐空间中的每个字向量是基于上下文的向量表示。每个字对应于一个上下文向量表示，从而使得每个字的向量表示更为准确。

在步骤S102中，将所述待消解句子和所述上文信息中每个字的上下文向量表示输入双向长短期记忆网络中，以增强每个字的上下文表达和位置信息，得到每个字增强后的上下文向量表示。

如前所述，bert模型是通过多头注意力模块来使低维稠密表征矩阵学习上下文之间的交互信息，只在输入时候加入了位置编码的信息，在经过24层Transformer-block运算后，最终输出的结果在位置信息上会有所不足，上下文表达和位置信息较弱。为了解决上述问题，本申请实施例通过将所述待消解句子和所述上文信息中每个字的上下文向量表示输入双向LSTM网络，由所述双向LSTM网络直接学习字与字之间的依赖关系。当每个字的上下文向量表示按照在待消解句子中的顺序输入时，每个字的上下文向量表示具有很强的位置信息编码能力，从而可以进一步增强每个字的上下文表达和位置信息，得到增强后的上下文向量表示。

在步骤S103中，遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率。

在上述步骤S203中，bert模型通过建立两个待学习的参数向量来得到所述待消解句子及其上文信息中每个字的上下文向量表示。该两个待学习的参数向量分别为头字参数向量和尾字参数向量，是bert模型中的参数向量。本申请实施例进一步利用所述bert模型中的参数向量，来预测每个字的回指项头字概率和回指项尾字概率。可选地，如图3所示，步骤S103所述的遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率包括：

在步骤S301中，获取bert模型中的头字参数向量和尾字参数向量。

在这里，所述头字参数向量和所述尾字参数向量均为bert模型中随机初始化的两个向量，可以通过优化目标函数不断的学习。

在步骤S302中，将每个字增强后的上下文向量表示与所述头字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项头字概率。

在得到头字参数向量之后，遍历每个字，计算所述字增强后的上下文向量表示与所述头字参数向量的点积。在所述bert模型中，头字参数向量有多个，每一个头字参数向量对应一个点积，从而得到每个字对应的多个点积。本实施例进一步通过Softmax函数对所述多个点积进行数值处理，将所述多个点积转化为相对概率，并选择其中的最大值作为所述字的回指项头字概率。

在步骤S303中，将每个字增强后的上下文向量表示与所述尾字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项尾字概率。

尾字概率的计算过程与头字概率的计算过程相同。在得到尾字向量参数之后，遍历每个字，计算所述字增强后的上下文向量表示与所述尾字参数向量的点积。在所述bert模型中，尾字参数向量有多个，每一个尾字参数向量对应一个点积，从而得到每个字对应的多个点积。本实施例进一步通过Softmax函数对所述多个点积进行数值处理，将所述多个点积转化为相对概率，并选择其中的最大值作为所述字的回指项尾字概率。

在步骤S104中，遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率。

在这里，对于每个字，连续文本片段为所述字作为回指项头字与作为回指项尾字的其他字之间的连续片段。所述连续文本片段的回指项概率是指作为回指项头字的所述字的回指项头字概率与作为回指项尾字的其他字的回指项尾字概率的乘积。可选地，如图4所示，步骤S104所述的遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率包括：

在步骤S401中，遍历每个字，以所述字作为回指项头字，以所述字及之后的字作为回指项尾字，构建连续文本片段。

在这里，所述连续文本片段可以是单个字，也可以是一个词、一个句子、一个文段，从而提供了一种新的回指项候选集合的创建方式，可以将待消解句子的上文信息中的任意片段作为回指项候选项，且无需手动创建回指项候选集，有效地扩展了回指项候选项的范围。

在步骤S402中，计算所述连续文本片段中头字的回指项头字概率和尾字的回指项尾字概率的乘积，得到所述连续文本片段的回指项概率。

对于每一个连续片段，本实施例根据该连续文本片段中的头字和尾字，计算所述连续文本片段的回指项概率。回指项概率的值为所述连续片段中头字的回指项头字概率和尾字的回指项尾字概率的乘积。其中，所述连续片段中头字的回指项头字概率和尾字的回指项尾字概率的乘积越大，所述连续片段的回指项概率越大，反之则越小。

在步骤S105中，从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。

可选地，如图5所示，步骤S105所述的从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项包括：

在步骤S501中，从所述连续文本片段中过滤掉与待消解句子有交集的连续文本片段。

在这里，若连续文本片段中的任意部分与待消解句子有重叠时，删除所述连续文本片段，以完成对所述连续文本片段的过滤。具体地，可以通过判断连续文本片段的头字和/或尾字是否落在所述待消解句子内，删除头字和/或尾字落在所述待消解句子内的连续文本片段，保证保留下来的连续文本片段的头字和尾字均不在当前待消解句子。由于连续文本片段的数量非常大，而回指项通常不会与待消解句子重叠，本实施例通过删除与待消解句子有交集的连续文本片段，过滤掉明确为非回指项的连续文本片段，以减少作为候选项的连续文本片段，提高选取所述待消解句子的回指项的效率，进而提高零指代消解的效率。

在步骤S502中，从过滤后的连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。

然后根据步骤S104计算得到的回指项概率，从保留下来的连续文本片段中选择回指项概率最大的连续文本片段，作为所述待消解句子的回指项。

本申请实施例提供了一种新的回指项确定方法，基于抽取式的阅读理解模型，可将前文中所有连续片段作为候选回指项，无需使用规则预先构建回指项候选集合，候选回指项的数量和覆盖程度更大，有效地避免了现有技术中回指项候选集合不包含正确的回指项时导致的识别失败的问题，以及解决了现有零指代消解方法过于依赖回指项候选集合的问题，提高了零指代消解结果的准确性和可靠性。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在一实施例中，提供一种基于大数据的零指代消解装置，该基于大数据的零指代消解装置与上述实施例中基于大数据的零指代消解方法一一对应。如图6所示，该基于大数据的零指代消解装置包括向量化模块61、增强模块62、预测模块63、构建模块64、选取模块65。各功能模块详细说明如下：

向量化模块61，用于获取待消解句子及其上文信息，对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示；

增强模块62，用于将所述待消解句子和所述上文信息中每个字的上下文向量表示输入双向长短期记忆网络中，以增强每个字的上下文表达和位置信息，得到每个字增强后的上下文向量表示；

预测模块63，用于遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率；

构建模块64，用于遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率；

选取模块65，用于从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。

可选地，所述向量化模块61包括：

表征单元，用于对所述待消解句子及其上文信息中的每个字采用one-hot形式表征，得到所述待消解句子对应的高维离散字表示矩阵，及其上文信息对应的高维离散字表示矩阵；

嵌入单元，用于采用word embedding的方法分别将所述待消解句子对应的高维离散字表示矩阵以及将所述上文信息对应的高维离散字表示矩阵嵌入到低维稠密表征矩阵；

编码单元，用于将所述待消解句子及其上文信息对应的低维稠密表征矩阵输入预设的bert模型进行双向编码，得到所述待消解句子及其上文信息中每个字的上下文向量表示。

可选地，所述预测模块63包括：

获取单元，用于获取bert模型中的头字参数向量和尾字参数向量；

头字概率计算单元，用于将每个字增强后的上下文向量表示与所述头字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项头字概率；

尾字概率计算单元，用于将每个字增强后的上下文向量表示与所述尾字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项尾字概率。

可选地，所述构建模块64包括：

构建单元，用于遍历每个字，以所述字作为回指项头字，以所述字及之后的字作为回指项尾字，构建连续文本片段；

计算单元，用于计算所述连续文本片段中头字的回指项头字概率和尾字的回指项尾字概率的乘积，得到所述连续文本片段的回指项概率。

可选地，所述选取模块65包括：

过滤单元，用于从所述连续文本片段中过滤掉与待消解句子有交集的连续文本片段；

选取单元，用于从过滤后的连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。

关于基于大数据的零指代消解装置的具体限定可以参见上文中对于基于大数据的零指代消解方法的限定，在此不再赘述。上述基于大数据的零指代消解装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种基于大数据的零指代消解方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，处理器执行计算机可读指令时实现以下步骤：

在一个实施例中，提供了一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

所述计算机可读存储介质可以是非易失性，也可以是易失性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器（ROM）、可编程ROM（PROM）、电可编程ROM（EPROM）、电可擦除可编程ROM（EEPROM）或闪存。易失性存储器可包括随机存取存储器（RAM）或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM（SRAM）、动态RAM（DRAM）、同步DRAM（SDRAM）、双数据率SDRAM（DDRSDRAM）、增强型SDRAM（ESDRAM）、同步链路（Synchlink） DRAM（SLDRAM）、存储器总线（Rambus）直接RAM（RDRAM）、直接存储器总线动态RAM（DRDRAM）、以及存储器总线动态RAM（RDRAM）等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种基于大数据的零指代消解方法，包括：

获取待消解句子及其上文信息，对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示；

将所述待消解句子和所述上文信息中每个字的上下文向量表示输入双向长短期记忆网络中，以增强每个字的上下文表达和位置信息，得到每个字增强后的上下文向量表示；

遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率；

遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率；

从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。
如权利要求1所述的基于大数据的零指代消解方法，其中，所述对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示包括：

对所述待消解句子及其上文信息中的每个字采用one-hot形式表征，得到所述待消解句子对应的高维离散字表示矩阵，及其上文信息对应的高维离散字表示矩阵；

采用word embedding的方法分别将所述待消解句子对应的高维离散字表示矩阵以及将所述上文信息对应的高维离散字表示矩阵嵌入到低维稠密表征矩阵；

将所述待消解句子及其上文信息对应的低维稠密表征矩阵输入预设的bert模型进行双向编码，得到所述待消解句子及其上文信息中每个字的上下文向量表示。
如权利要求1或2所述的基于大数据的零指代消解方法，其中，所述遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率包括：

获取bert模型中的头字参数向量和尾字参数向量；

将每个字增强后的上下文向量表示与所述头字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项头字概率；

将每个字增强后的上下文向量表示与所述尾字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项尾字概率。
如权利要求3所述的基于大数据的零指代消解方法，其中，所述遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率包括：

遍历每个字，以所述字作为回指项头字，以所述字及之后的字作为回指项尾字，构建连续文本片段；

计算所述连续文本片段中头字的回指项头字概率和尾字的回指项尾字概率的乘积，得到所述连续文本片段的回指项概率。
如权利要求4所述的基于大数据零指代消解方法，其中，所述从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项包括：

从所述连续文本片段中过滤掉与待消解句子有交集的连续文本片段；

从过滤后的连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。
一种基于大数据的零指代消解装置，包括：

向量化模块，用于获取待消解句子及其上文信息，对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示；

增强模块，用于将所述待消解句子和所述上文信息中每个字的上下文向量表示输入双向长短期记忆网络中，以增强每个字的上下文表达和位置信息，得到每个字增强后的上下文向量表示；

预测模块，用于遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率；

构建模块，用于遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率；

选取模块，用于从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。
如权利要求6所述的基于大数据的零指代消解装置，其中，所述向量化模块包括：

表征单元，用于对所述待消解句子及其上文信息中的每个字采用one-hot形式表征，得到所述待消解句子对应的高维离散字表示矩阵，及其上文信息对应的高维离散字表示矩阵；

嵌入单元，用于采用word embedding的方法分别将所述待消解句子对应的高维离散字表示矩阵以及将所述上文信息对应的高维离散字表示矩阵嵌入到低维稠密表征矩阵；

编码单元，用于将所述待消解句子及其上文信息对应的低维稠密表征矩阵输入预设的bert模型进行双向编码，得到所述待消解句子及其上文信息中每个字的上下文向量表示。
如权利要求6或7所述的基于大数据的零指代消解装置，其中，所述预测模块包括：

获取单元，用于获取bert模型中的头字参数向量和尾字参数向量；

头字概率计算单元，用于将每个字增强后的上下文向量表示与所述头字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项头字概率；

尾字概率计算单元，用于将每个字增强后的上下文向量表示与所述尾字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项尾字概率。
如权利要求8所述的基于大数据的零指代消解装置，其中，所述构建模块包括：

构建单元，用于遍历每个字，以所述字作为回指项头字，以所述字及之后的字作为回指项尾字，构建连续文本片段；

计算单元，用于计算所述连续文本片段中头字的回指项头字概率和尾字的回指项尾字概率的乘积，得到所述连续文本片段的回指项概率。
如权利要求9所述的基于大数据的零指代消解装置，其中，所述选取模块包括：

过滤单元，用于从所述连续文本片段中过滤掉与待消解句子有交集的连续文本片段；

选取单元，用于从过滤后的连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。
一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

获取待消解句子及其上文信息，对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示；

将所述待消解句子和所述上文信息中每个字的上下文向量表示输入双向长短期记忆网络中，以增强每个字的上下文表达和位置信息，得到每个字增强后的上下文向量表示；

遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率；

遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率；

从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。
如权利要求11所述的计算机设备，其中，所述对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示包括：

对所述待消解句子及其上文信息中的每个字采用one-hot形式表征，得到所述待消解句子对应的高维离散字表示矩阵，及其上文信息对应的高维离散字表示矩阵；

采用word embedding的方法分别将所述待消解句子对应的高维离散字表示矩阵以及将所述上文信息对应的高维离散字表示矩阵嵌入到低维稠密表征矩阵；

将所述待消解句子及其上文信息对应的低维稠密表征矩阵输入预设的bert模型进行双向编码，得到所述待消解句子及其上文信息中每个字的上下文向量表示。
如权利要求11或12所述的计算机设备，其中，所述遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率包括：

获取bert模型中的头字参数向量和尾字参数向量；

将每个字增强后的上下文向量表示与所述头字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项头字概率；

将每个字增强后的上下文向量表示与所述尾字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项尾字概率。
如权利要求13所述的计算机设备，其中，所述遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率包括：

遍历每个字，以所述字作为回指项头字，以所述字及之后的字作为回指项尾字，构建连续文本片段；

计算所述连续文本片段中头字的回指项头字概率和尾字的回指项尾字概率的乘积，得到所述连续文本片段的回指项概率。
如权利要求14所述的计算机设备，其中，所述从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项包括：

从所述连续文本片段中过滤掉与待消解句子有交集的连续文本片段；

从过滤后的连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。
一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

获取待消解句子及其上文信息，对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示；

将所述待消解句子和所述上文信息中每个字的上下文向量表示输入双向长短期记忆网络中，以增强每个字的上下文表达和位置信息，得到每个字增强后的上下文向量表示；

遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率；

遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率；

从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。
如权利要求16所述的非易失性可读存储介质，其中，所述对所述待消解句子及其上文信息执行向量化处理，得到所述待消解句子中每个字的上下文向量表示，以及所述上文信息中每个字的上下文向量表示包括：

对所述待消解句子及其上文信息中的每个字采用one-hot形式表征，得到所述待消解句子对应的高维离散字表示矩阵，及其上文信息对应的高维离散字表示矩阵；

采用word embedding的方法分别将所述待消解句子对应的高维离散字表示矩阵以及将所述上文信息对应的高维离散字表示矩阵嵌入到低维稠密表征矩阵；

将所述待消解句子及其上文信息对应的低维稠密表征矩阵输入预设的bert模型进行双向编码，得到所述待消解句子及其上文信息中每个字的上下文向量表示。
如权利要求16或17所述的非易失性可读存储介质，其中，所述遍历每个字增强后的上下文向量表示，根据bert模型中的参数向量预测每个字的回指项头字概率和回指项尾字概率包括：

获取bert模型中的头字参数向量和尾字参数向量；

将每个字增强后的上下文向量表示与所述头字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项头字概率；

将每个字增强后的上下文向量表示与所述尾字参数向量进行点积运算，对点积运算结果进行softmax处理得到每个字的回指项尾字概率。
如权利要求18所述的非易失性可读存储介质，其中，所述遍历每个字，构建连续文本片段，并根据每个字的回指项头字概率和回指项尾字概率计算所述连续文本片段的回指项概率包括：

遍历每个字，以所述字作为回指项头字，以所述字及之后的字作为回指项尾字，构建连续文本片段；

计算所述连续文本片段中头字的回指项头字概率和尾字的回指项尾字概率的乘积，得到所述连续文本片段的回指项概率。
如权利要求19所述的非易失性可读存储介质，其中，所述从所述连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项包括：

从所述连续文本片段中过滤掉与待消解句子有交集的连续文本片段；

从过滤后的连续文本片段中选取回指项概率最大的连续文本片段作为所述待消解句子的回指项。