CN114117001A

CN114117001A - 指代消解方法、指代消解模型的训练方法及装置

Info

Publication number: CN114117001A
Application number: CN202111383634.6A
Authority: CN
Inventors: 王炳乾
Original assignee: BOE Technology Group Co Ltd
Current assignee: BOE Technology Group Co Ltd
Priority date: 2021-11-22
Filing date: 2021-11-22
Publication date: 2022-03-01
Also published as: WO2023087935A1

Abstract

本公开提供一种指代消解方法、指代消解模型的训练方法及装置，该指代消解方法包括：获取待处理的当前话语；将所述当前话语输入至指代消解模型的指代消解检测子模型中，得到所述当前话语的存在语义缺失的预测插入位置和/或需要被替换字词的预测删除位置；将所述当前话语的预测插入位置和/或预测删除位置，以及，所述当前话语对应的历史对话，输入至所述指代消解模型的消解补全子模型中，得到所述预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置。本公开可以解决指代消解方案在多轮对话中表现效果欠佳的问题。

Description

指代消解方法、指代消解模型的训练方法及装置

技术领域

本公开实施例涉及人工智能技术领域，尤其涉及一种指代消解方法、指代消解模型的训练方法及装置。

背景技术

人机对话是人工智能领域的重要研究方向，近年来在学术界和产业界都备受关注，在算法技术上取得了令人瞩目的进展，广泛的应用到智能音箱、客服机器人等产品中。

在当前话语系统中(如智能客服机器人、智能音箱等)，由于人类口语化的表达方式，存在信息不完整的模糊语句。一种解决方法是，通过对话上下文信息，对当前不完整的模糊语句进行信息补全和指代消解，实现模糊问题澄清，又称为对话改写，然而，现有的指代消解方案在单轮对话语句的处理中效果很好，而在多轮对话中则表现效果欠佳。

发明内容

本公开实施例提供一种指代消解方法、指代消解模型的训练方法及装置，用于解决现有的指代消解方案在多轮对话中表现效果欠佳的问题。

为了解决上述技术问题，本公开是这样实现的：

第一方面，本公开实施例提供了一种指代消解方法，包括：

获取待处理的当前话语；

将所述当前话语输入至指代消解模型的指代消解检测子模型中，得到所述当前话语的存在语义缺失的预测插入位置和/或需要被替换字词的预测删除位置；

将所述当前话语的预测插入位置和/或预测删除位置，以及，所述当前话语对应的历史对话，输入至所述指代消解模型的消解补全子模型中，得到所述预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置。

可选的，所述指代消解检测子模型包括两组二分类网络，其中，一组二分类网络的输入为所述当前话语，输出为用于指示所述当前话语中的每一个字的位置是否为预测插入位置的起始位置或结束位置的01序列，另一组二分类网络的输入为所述当前话语，输出为用于指示所述当前话语中的每一个字的位置是否为预测删除位置的起始位置或结束位置的01序列。

可选的，所述二分类网络采用如下公式确定所述当前话语中的每一个字的位置是否为预测插入位置或预测删除位置的起始位置或结束位置：

其中，l用于表示是预测插入位置还是预测删除位置，

表示起始位置，

表示结束位置，h_l[i]为所述当前话语中的第i个字经过transformer编码器后的编码向量表示，

和

表示权重向量，

和

表示偏置项，σ为sigmoid激活函数。

可选的，将所述当前话语的预测插入位置和/或预测删除位置，以及，所述当前话语对应的历史对话，输入至所述指代消解模型的消解补全子模型中，得到所述预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置，包括：

计算所述当前话语的预测插入位置的起始位置和结束位置的平均向量和/或预测删除位置的起始位置和结束位置的平均向量；

以所述平均向量作为条件，采用条件层规范化对采用transformer编码器对所述当前话语进行编码后得到的编码向量进行语义处理，得到条件层规范化后的语义输出变量；

将所述语义输出变量和所述当前话语的历史话语输入至所述消解补全子模型中，得到预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置。

可选的，所述语义输出变量可以表示为：

H_cln＝λ×(h_l-1-μ_h)/(σ_h+ε)+β

其中，H_cln为所述语义输出变量；

j_l-1为采用transformer编码器对所述当前话语进行编码后得到的编码向量；

H_c为所述平均向量；

为两个变换矩阵，作用是将输入的平均向量维度转化为与λ和β的维度一致；

H_c＝avg(h_l[s],h_l[e])，avg()表示求平均值函数，s表示起始位置，e表示结束位置，h_l为采用transformer编码器对输入进行编码后得到的编码向量；

μ_h、σ_h分别为所述当前话语对应的编码向量在当前层不同维度特征向量的均值和方差,

H为隐藏层维度，k等于1～H；

ε是一个极小值。

可选的，所述消解补全子模型采用如下公式确定所述历史话语中的预测位置：

p_s＝softmax(W_sH_cln+b_s)

p_e＝softmax(W_eH_cln+b_e)

其中，p_s为所述历史话语中的预测位置的起始位置，p_e为所述历史话语中的预测位置的结束位置，softmax为归一化指数函数，W_s和W_e表示权重向量，b_s和b_e表示偏置项，H_cln为所述语义输出变量。

第二方面，本公开实施例提供了一种指代消解模型的训练方法，包括：

获取多个对话样本，每个所述对话样本包括历史话语、当前话语和所述当前话语的参考话语，所述参考话句为对所述当前话语进行了语义缺失补全和/或指代消解后的话语；

获取所述对话样本的标注数据，所述标注数据包括：所述当前话语中的存在语义缺失的真实插入位置和/或需要被替换字词的真实删除位置，以及，所述真实插入位置处语义缺失的字词在所述历史话语中的真实位置和/或所述真实删除位置处的需要被替换字词在所述历史话语中对应的替换字词的真实位置；

根据所述对话样本的当前话语和标注数据，对待训练的指代消解模型的指代消解检测子模型进行训练，得到训练后的指代消解检测子模型，所述训练后的指代消解检测子模型的输入为一话语，输出为输入的话语中的存在语义缺失的预测插入位置和/或需要被替换字词的预测删除位置；

根据所述对话样本的所述标注数据以及所述对话样本的当前话语的预测插入位置和/或预测删除位置，对待训练的指代消解模型的消解补全子模型进行训练，得到训练后的消解补全子模型，所述训练后的消解补全子模型的输入为话语的预测插入位置和/或预测删除位置，输出为所述预测插入位置处语义缺失的字词在输入话语的历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在输入话语的历史话语中的替换字词的预测位置。

可选的，获取所述对话样本的标注数据包括：

将所述对话样本的当前话语中的子串与参考话语中的子串进行匹配，得到匹配结果；

若所述匹配结果为一子串仅存在于所述当前话语中，确定所述子串为需要被替换字词，以及，所述当前话语中的需要被替换字词的真实删除位置，并在所述参考话语中找到所述需要被替换字词对应的替换字体，以及，在历史话语中标记所述真实删除位置处的需要被替换字词在所述历史话语中对应的替换字词的真实位置；

若所述匹配结果为一子串仅存在于所述参考话语中，确定当前话语存在语义缺失，并确定所述当前话语中的存在语义缺失的真实插入位置。

可选的，根据所述对话样本的当前话语和标注数据，对待训练的指代消解模型的指代消解检测子模型进行训练包括：

输入步骤：将所述对话样本的当前话语输入至所述指代消解检测子模型中，得到所述当前话语的存在语义缺失的预测插入位置和/或需要被替换字词的预测删除位置；

将根据所述指代消解检测子模型输出的所述预测插入位置和/或预测删除位置，以及，与所述当前话语的真实插入位置和/或真实删除位置，确定第一目标函数的取值；

若所述第一目标函数的取值未满足第一条件，调整所述指代消解检测子模型的参数，并返回所述输入步骤，直至所述第一目标函数的取值满足所述第一条件，得到训练后的所述指代消解检测子模型。

其中，l用于表示是预测插入位置还是预测删除位置，

表示起始位置，

和

表示待训练的权重向量，

和

表示待训练的偏置项，σ为sigmoid激活函数。

可选的，所述第一目标函数采用如下公式表示：

其中，loss_tag为所述第一目标函数，n为所述当前话语的长度，

表示预测插入位置或预测删除位置的起始位置，

表示所述当前话语的预测插入位置或预测删除位置的结束位置，

表示所述当前话语真实插入位置或真实删除位置的起始位置，

表示所述当前话语真实插入位置或真实删除位置的结束位置，i表示所述当前话语中的第i个字，j表示所述当前话语中的第j个字。

可选的，根据所述对话样本的所述标注数据以及所述对话样本的当前话语的预测插入位置和/或预测删除位置，对待训练的指代消解模型的消解补全子模型进行训练包括：

预处理步骤：计算所述当前话语的预测插入位置的起始位置和结束位置的平均向量和/或预测删除位置的起始位置和结束位置的平均向量；以所述平均向量作为条件，采用条件层规范化对采用transformer编码器对所述当前话语进行编码后得到的编码向量进行语义处理，得到条件层规范化后的语义输出变量；

输入步骤：将所述语义输出变量和所述对话样本的历史话语输入至所述消解补全子模型中，得到预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置；根据所述历史话语中的预测位置和真实位置，确定第二目标函数的取值；

若所述第二目标函数的取值未满足第二条件，调整所述消解补全子模型的参数，并返回所述输入步骤，直至所述第二目标函数的取值满足所述第二条件，得到训练后的所述消解补全子模型。

可选的，所述语义输出变量可以表示为：

H_cln＝λ×(h_l-1-μ_h)/(σ_h+ε)+β

其中，H_cln为所述语义输出变量；

h_l-1为采用transformer编码器对所述当前话语进行编码后得到的编码向量；

H_c为所述平均向量；

H_c＝avg(h_l[s],h_l[e])，avg()表示求平均值函数，s表示起始位置，e表示结束位置，j_l为采用transformer编码器对输入进行编码后得到的编码向量；

H为隐藏层维度，k等于1～H；

ε是一个极小值。

p_s＝softmax(W_sH_cln+b_s)

p_e＝softmax(W_eH_cln+b_e)

其中，p_s为所述历史话语中的预测位置的起始位置，p_e为所述历史话语中的预测位置的结束位置，softmax为归一化指数函数，W_s和W_e表示待训练的权重向量，b_s和b_e表示待训练的偏置项，H_cln为所述语义输出变量。

可选的，所述第二目标函数采用如下公式表示：

其中，loss_mrc为所述第二目标函数，n为所述历史话语的长度，p_s表示所述历史话语的预测位置的起始位置，p_e表示所述历史话语的预测位置的结束位置，y_s表示所述历史话语的真实位置的起始位置，y_e表示所述历史话语的真实位置的结束位置，i表示所述历史话语中的第i个字，j表示所述历史话语中的第j个字。

第三方面，本公开实施例提供了一种指代消解装置，包括：

第一获取模块，用于获取待处理的当前话语；

第一处理模块，用于将所述当前话语输入至指代消解模型的指代消解检测子模型中，得到所述当前话语的存在语义缺失的预测插入位置和/或需要被替换字词的预测删除位置；

第二处理模块，用于将所述当前话语的预测插入位置和/或预测删除位置，以及，所述当前话语对应的历史对话，输入至所述指代消解模型的消解补全子模型中，得到所述预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置。

第四方面，本公开实施例提供了一种指代消解模型的训练装置，包括：

第一获取模块，用于获取多个对话样本，每个所述对话样本包括历史话语、当前话语和所述当前话语的参考话语，所述参考话句为对所述当前话语进行了语义缺失补全和/或指代消解后的话语；

第二获取模块，用于获取所述对话样本的标注数据，所述标注数据包括：所述当前话语中的存在语义缺失的真实插入位置和/或需要被替换字词的真实删除位置，以及，所述真实插入位置处语义缺失的字词在所述历史话语中的真实位置和/或所述真实删除位置处的需要被替换字词在所述历史话语中对应的替换字词的真实位置；

第一训练模块，用于根据所述对话样本的当前话语和标注数据，对待训练的指代消解模型的指代消解检测子模型进行训练，得到训练后的指代消解检测子模型，所述训练后的指代消解检测子模型的输入为一话语，输出为输入的话语中的存在语义缺失的预测插入位置和/或需要被替换字词的预测删除位置；

第二训练模块，用于根据所述对话样本的所述标注数据以及所述对话样本的当前话语的预测插入位置和/或预测删除位置，对待训练的指代消解模型的消解补全子模型进行训练，得到训练后的消解补全子模型，所述训练后的消解补全子模型的输入为话语的预测插入位置和/或预测删除位置，输出为所述预测插入位置处语义缺失的字词在输入话语的历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在输入话语的历史话语中的替换字词的预测位置。

第五方面，本公开实施例提供了一种电子设备，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现上述第一方面所述的指代消解方法的步骤，或者，所述程序或指令被所述处理器执行时实现上述第二方面所述的指代消解模型的训练方法的步骤。

第六方面，本公开实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现上述第一方面所述的指代消解方法，或者实现上述第二方面所述的指代消解模型的训练方法的步骤。

在本公开实施例中，在指代消解方案中，考虑需要处理的当前话语的历史话语，可以解决指代消解方案在多轮对话中表现效果欠佳的问题。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本公开的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本公开实施例的指代消解方法的流程示意图；

图2为本公开实施例的指代消解检测子模型的输出结果示意图；

图3为本公开实施例的transformer编码器的结构示意图；

图4为本公开实施例的指代消解模型的训练方法的流程示意图；

图5为本公开实施例的指代消解模型进行指代消解的一具体使用场景的示意图；

图6为本公开实施例的指代消解装置的结构示意图；

图7为本公开实施例的指代消解模型的训练装置的结构示意图；

图8为本公开实施例的电子设备的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

首先，简单介绍下“指代”的含义：一般在语言学及日常用语当中，在下文采用简称或代称来代替上文已经出现的某一词语，语言学中把这种情况称为“指代现象”，也即是指代。形式上，将代表同一实体(Entity)的不同指称(Mention)划分到一个等价集合的过程称为指代消解。实体(Entity)：客观存在于现实世界的物体。指称(Mention)指代某一实体的表述。

请参考图1，本公开还提供一种指代消解方法，包括：

步骤11：获取待处理的当前话语(current utterance)；

步骤12：将所述当前话语输入至指代消解模型的指代消解检测子模型中，得到所述当前话语的存在语义缺失的预测插入位置和/或需要被替换字词的预测删除位置；

步骤13：将所述当前话语的预测插入位置和/或预测删除位置，以及，所述当前话语对应的历史对话，输入至所述指代消解模型的消解补全子模型中，得到所述预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置。

本公开实施例中，在指代消解方案中，考虑需要处理的当前话语的历史话语，可以解决指代消解方案在多轮对话中表现效果欠佳的问题。

下面分别对指代消解检测子模型和消解补全子模型的实现方法进行说明。

(1)指代消解检测子模型

指代消解检测子模型用于检测输入的当前话语的存在语义缺失的预测插入位置和需要被替换字词的预测删除位置。

举例来说，多轮对话包括以下内容：

Utterance A：是什么电影评分挺高啊？

Utterance B：名字叫贫民窟的百万富翁，是洛夫琳坦丹导演的作品

Current Utterance：还是算了吧，不喜欢这位导演。

其中，“还是算了吧，不喜欢这位导演”为当前话语(Current Utterance)，前两句为历史话语。将当前话语输入至指代消解检测子模型之后，可以得到如图2所示的两个序列，其中一个序列为detetion序列，包括两行序列，一行序列用于指示当前话语中的每一个字的位置是否为预测删除位置的起始位置(start)，另一方序列用于指示当前话语中的每一个字的位置是否为预测删除位置的结束位置(end)，从图2中可以看出，detetion序列的第一行序列中，“这”对应的位置为1，表示“这”对应的位置为预测删除位置的起始位置，第二行序列中，“演”对应的位置为1，表示“演”对应的位置为预测删除位置的结束位置。其中另一个序列为Inertaion序列，包括两行序列，一行序列用于指示当前话语中的每一个字的位置是否为预测插入位置的起始位置(start)，另一方序列用于指示当前话语中的每一个字的位置是否为预测插入位置的结束位置(end)，从图2中可以看出，Inertaion序列的第一行序列中，“还”对应的位置为1，表示“还”对应的位置为预测插入位置的起始位置，第二行序列中，“还”对应的位置为1，表示“还”对应的位置为预测插入位置的结束位置，“还”同时为起始位置和结束位置，表示需要在“还”之前插入语义缺失的字词。

当然，在本公开的其他一些实施例中，01序列中，0和1所指示的含义也可以互换。

本公开实施例中，可选的，所述二分类网络采用如下公式确定所述当前话语中的每一个字的位置是否为预测插入位置或预测删除位置的起始位置或结束位置：

其中，l用于表示是预测插入位置还是预测删除位置，

表示起始位置，

和

表示权重向量，

和

表示偏置项，σ为sigmoid激活函数。

需要说明的是，所述当前话语中的每一个字的位置是否为预测插入位置的起始位置，以及，所述当前话语中的每一个字的位置是否为预测插入位置的起始位置，均采用公式

但是，两者在使用公式时，公式中的权重向量

和/或偏置项

可以不同。

同样的，所述当前话语中的每一个字的位置是否为预测插入位置的结束位置，以及，所述当前话语中的每一个字的位置是否为预测插入位置的结束位置，均采用公式

但是，两者在使用公式时，公式中的权重向量

和/或偏置项

可以不同。本公开实施例中，transformer编码器可以采用如下方式实现：

h₀＝XW_t+W_p+W_s

h_l＝Transformer(h_n-1),n∈[1,2,3,..,N]

其中，W_t、W_p、W_s分别为字嵌入矩阵、位置嵌入矩阵和段落嵌入矩阵，n表示transformer编码器的层数，以上述内容中的对话为例，X表示输入的当前话语，包含Utterance A,Utterance B,Current Utterance三个部分，本公开实施例中，在将X输入到transformer编码器时，可以将Utterance A和Utterance B用“，”进行连接，然后用[CLS]Utterance A,Utterance B[SEP]Current Utterance[SEP]的方式输入到transformer编码器。

请参考图3，图3为本公开实施例的transformer编码器的结构示意图，transformer编码器可以包括至少一个如图3所示的transformer block，每个transformerblock包括：Multi-Head Attention(多头注意力机制)层和Feed Forward(前馈网络)，其中，Multi-Head Attention层将注意力的计算分散到不同的子空间进行，以期能从多方面进行注意力的学习。Multi-Head Attention和Feed Forward之后均连接一Add&Norm层，该Add&Norm层包含残差结构以及层归一化。

(2)消解补全子模型

消解补全子模型用于从历史话语中确定指代消解检测子模型检测出的预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置。

本公开实施例中，在消解补全上，可以利用检测出的当前话语的预测插入位置和/或预测删除位置的起始位置或结束位置的平均向量作为条件，通过条件层规范化(Conditional Layer Normalization，CLN)对经过transformer编码器编码处理过的当前话语进行语义处理，然后利用机器阅读理解(Machine Reading Comprehension，MRC)的方式进行消解补全文本预测。

本公开实施例中，可选的，将所述当前话语的预测插入位置和/或预测删除位置，以及，所述当前话语对应的历史对话，输入至所述指代消解模型的消解补全子模型中，得到所述预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置，包括：

步骤131：计算所述当前话语的预测插入位置的起始位置和结束位置的平均向量和/或预测删除位置的起始位置和结束位置的平均向量；

步骤132：以所述平均向量作为条件，采用条件层规范化对采用transformer编码器对所述当前话语进行编码后得到的编码向量进行语义处理，得到条件层规范化后的语义输出变量；

步骤133：将所述语义输出变量和所述当前话语的历史话语输入至所述消解补全子模型中，得到预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置。

即，若检测出当前话语中存在语义缺失的预设插入位置，计算预测插入位置的起始位置和结束位置的平均向量，然后以所述平均向量作为条件，采用条件层规范化对采用transformer编码器对所述当前话语进行编码后得到的编码向量进行语义处理，得到条件层规范化后的语义输出变量，将所述语义输出变量和所述当前话语的历史话语输入至所述消解补全子模型中，得到预测插入位置处语义缺失的字词在所述历史话语中的预测位置。

若检测出当前话语中存在需要被替换字词的预设删除位置，计算预测删除位置的起始位置和结束位置的平均向量，然后以所述平均向量作为条件，采用条件层规范化对采用transformer编码器对所述当前话语进行编码后得到的编码向量进行语义处理，得到条件层规范化后的语义输出变量，将所述语义输出变量和所述当前话语的历史话语输入至所述消解补全子模型中，得到预测删除位置处需要被替换字词在所述历史话语中的替换字词的预测位置。

可选的，所述语义输出变量可以表示为：

H_cln＝λ×(h_l-1-μ_h)/(σ_h+ε)+β

其中，H_cln为所述语义输出变量；

H_c为所述平均向量；其中，公式中的前一个λ对后一个λ而言相当于增加了一个偏移量

在训练好的消解补全子模型中，后一个λ为一个固定值；

为两个变换矩阵，作用是将输入的平均向量维度转化为与λ和β的维度一致；同样的，其中，公式中的前一个β对后一个β而言相当于增加了一个偏移量

在训练好的消解补全子模型中，后一个β为一个固定值；

H为隐藏层维度，k等于1～H；

ε是一个极小值(防止分母为0)。

p_s＝softmax(W_sH_cln+b_s)

p_e＝softmax(W_eH_cln+b_e)

需要说明的是，所述预测插入位置处语义缺失的字词在所述历史话语中的预测位置的起始位置，以及，所述预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置的起始位置，均采用公式

p_s＝softmax(W_sH_cln+b_s)，但是，两者在使用公式时，公式中的权重向量W_s和/或偏置项b_s，可以不同。

同样的，所述预测插入位置处语义缺失的字词在所述历史话语中的预测位置的结束位置，以及，所述预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置的结束位置，均采用公式p_e＝softmax(W_eH_cln+b_e)，但是，两者在使用公式时，公式中的权重向量W_e和/或偏置项b_e，可以不同。

请参考图4，本公开实施例还提供一种指代消解模型的训练方法，包括：

步骤41：获取多个对话样本，每个所述对话样本包括历史话语、当前话语(currentutterance)和所述当前话语的参考话语(reference utterance)，所述参考话句为对所述当前话语进行了语义缺失补全和/或指代消解后的话语；

步骤42：获取所述对话样本的标注数据，所述标注数据包括：所述当前话语中的存在语义缺失的真实插入位置和/或需要被替换字词的真实删除位置，以及，所述真实插入位置处语义缺失的字词在所述历史话语中的真实位置和/或所述真实删除位置处的需要被替换字词在所述历史话语中对应的替换字词的真实位置；

步骤43：根据所述对话样本的当前话语和标注数据，对待训练的指代消解模型的指代消解检测子模型进行训练，得到训练后的指代消解检测子模型，所述训练后的指代消解检测子模型的输入为一话语，输出为输入的话语中的存在语义缺失的预测插入位置和/或需要被替换字词的预测删除位置；

步骤44：根据所述对话样本的所述标注数据以及所述对话样本的当前话语的预测插入位置和/或预测删除位置，对待训练的指代消解模型的消解补全子模型进行训练，得到训练后的消解补全子模型，所述训练后的消解补全子模型的输入为话语的预测插入位置和/或预测删除位置，输出为所述预测插入位置处语义缺失的字词在输入话语的历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在输入话语的历史话语中的替换字词的预测位置。

本公开实施例中，在指代消解模型的训练中，考虑需要处理的当前话语的历史话语，可以使得训练得到的指代消解模型在多轮对话中表现效果较好。

本公开实施例中，可选的，获取所述对话样本的标注数据包括：

步骤421：将所述对话样本的当前话语中的子串与参考话语中的子串进行匹配，得到匹配结果；

步骤422：若所述匹配结果为一子串仅存在于所述当前话语中，确定所述子串为需要被替换字词，以及，所述当前话语中的需要被替换字词的真实删除位置，并在所述参考话语中找到所述需要被替换字词对应的替换字体，以及，在历史话语中标记所述真实删除位置处的需要被替换字词在所述历史话语中对应的替换字词的真实位置；

步骤423：若所述匹配结果为一子串仅存在于所述参考话语中，确定当前话语存在语义缺失，并确定所述当前话语中的存在语义缺失的真实插入位置。

举例来说，一对话样本可以如下：

A：是什么电影评分挺高啊？

B：名字叫贫民窟的百万富翁，是洛夫琳坦丹导演的作品

A：还是算了吧，不喜欢这位导演。

A+:贫民窟的百万富翁还是算了吧，不喜欢洛夫琳坦丹。

其中，前两句为历史话语，第三句为当前话语，第四句为参考话语。

以上述对话样本为例，将所述对话样本的当前话语(还是算了吧，不喜欢这位导演)中的子串与参考话语中的子串(贫民窟的百万富翁还是算了吧，不喜欢洛夫琳坦丹)进行匹配。

(1)若所述匹配结果为一子串同时存在于当前话语和参考话语中，该部分子串保持不变，例如“还是算了吧不喜欢”；

(2)若所述匹配结果为一子串仅存在于所述当前话语中，确定所述子串为需要被替换字词，以及，所述当前话语中的需要被替换字词的真实删除位置，并在所述参考话语中找到所述需要被替换字词对应的替换字体，以及，在历史话语中标记所述真实删除位置处的需要被替换字词在所述历史话语中对应的替换字词的真实位置，例如“这位导演”应该被替换成“洛夫琳坦丹”；

(3)若所述匹配结果为一子串仅存在于所述参考话语中，确定当前话语存在语义缺失，并确定所述当前话语中的存在语义缺失的真实插入位置，如需要在“还是”前插入“贫民窟的百万富翁”。

通过以上操作，即可获取用于训练模型的标注数据。

下面分别对指代消解检测子模型和消解补全子模型的训练方法进行说明。

(1)指代消解检测子模型的训练方法

本公开实施例中，可选的，所述指代消解检测子模型包括两组二分类网络，其中，一组二分类网络的输入为所述当前话语，输出为用于指示所述当前话语中的每一个字的位置是否为预测插入位置的起始位置或结束位置的01序列，另一组二分类网络的输入为所述当前话语，输出为用于指示所述当前话语中的每一个字的位置是否为预测删除位置的起始位置或结束位置的01序列。

其中，l用于表示是预测插入位置还是预测删除位置，

表示起始位置，

和

表示待训练的权重向量，

和

表示待训练的偏置项，σ为sigmoid激活函数。

本公开实施例中，可选的，所述第一目标函数采用如下公式表示：

表示预测插入位置或预测删除位置的起始位置，

公式中n+2是指输入方式采用“[CLS]Utterance A,Utterance B[SEP]CurrentUtterance[SEP]”的方式输入到transformer时，额外输入的CLS和SEP占据的长度。

当然，本申请实施例中，如果采用其他方式输入，公式中的n+2的也可以随之更新。

(2)消解补全子模型的训练方法

本公开实施例中，可选的，根据所述对话样本的所述标注数据以及所述对话样本的当前话语的预测插入位置和/或预测删除位置，对待训练的指代消解模型的消解补全子模型进行训练包括：

本公开实施例中，可选的，所述语义输出变量可以表示为：

H_cln＝λ×(h_l-1-μ_h)/(σ_h+ε)+β

其中，H_cln为所述语义输出变量；

h_l-1为采用transformer编码器对所述当前话语进行编码后得到的编码向量；h的下标的索引值的起始值为0，h_l-1表示l层网络的最后一层索引值为l-1。

后一个λ具有一个初始值，在消解补全子模型的训练过程中，后一个λ不断更新；

为两个变换矩阵，作用是将输入的平均向量维度转化为与λ和β的维度一致；其中，公式中的前一个β对后一个β而言相当于增加了一个偏移量

后一个β具有一个初始值，在消解补全子模型的训练过程中，后一个β不断更新。

H为隐藏层维度，k等于1～H；μ_h、σ_h中h是指网络隐藏层的维度；

ε是一个极小值。

本公开实施例中，可选的，所述消解补全子模型采用如下公式确定所述历史话语中的预测位置：

p_s＝softmax(W_sH_cln+b_s)

p_e＝softmax(W_eH_cln+b_e)

本公开实施例中，可选的，所述第二目标函数采用如下公式表示：

本公开实施例中，将两个任务(指代消解检测和消解补全)以级联结构的方式进行多任务学习，即在第一级任务中，进行指代消解检测任务，在第二级任务中，进行消解补全任务，两级任务可以共享同一个编码层(Transformer Encoder)(请参考图5)，同时进行训练和优化，训练优化目标为两个任务的优化目标之和，即：

loss＝loss_tag+loss_mrc

通过指代消解检测任务，得到当前话语中的需要进行指代消解或者语义补全词的位置，然后依次通过条件Layer Normalization(层规划化)，将指代消解词的语义信息融入到消解补全的文本预测任务中，利用机器阅读理解(Machine Reading Comprehension，MRC)的方式进行消解补全文本预测。

请参考图6，本公开实施例还提供了一种指代消解装置60，包括：

第一获取模块61，用于获取待处理的当前话语；

第一处理模块62，用于将所述当前话语输入至指代消解模型的指代消解检测子模型中，得到所述当前话语的存在语义缺失的预测插入位置和/或需要被替换字词的预测删除位置；

第二处理模块63，用于将所述当前话语的预测插入位置和/或预测删除位置，以及，所述当前话语对应的历史对话，输入至所述指代消解模型的消解补全子模型中，得到所述预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置。

其中，l用于表示是预测插入位置还是预测删除位置，

表示起始位置，

和

表示权重向量，

和

表示偏置项，σ为sigmoid激活函数。

可选的，所述第二处理模块63包括：

计算子模块631，用于计算所述当前话语的预测插入位置的起始位置和结束位置的平均向量和/或预测删除位置的起始位置和结束位置的平均向量；

第一处理子模块，用于以所述平均向量作为条件，采用条件层规范化对采用transformer编码器对所述当前话语进行编码后得到的编码向量进行语义处理，得到条件层规范化后的语义输出变量；

第二处理子模块，用于将所述语义输出变量和所述当前话语的历史话语输入至所述消解补全子模型中，得到预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置。

可选的，所述语义输出变量可以表示为：

H_cln＝λ×(h_l-1-μ_h)/(σ_h+ε)+β

其中，H_cln为所述语义输出变量；

H_c为所述平均向量；

H为隐藏层维度，k等于1～H；

ε是一个极小值。

p_s＝softmax(W_sH_cln+b_s)

p_e＝softmax(W_eH_cln+b_e)

请参考图7，本公开实施例还提供了一种指代消解模型的训练装置70，包括：

第一获取模块71，用于获取多个对话样本，每个所述对话样本包括历史话语、当前话语和所述当前话语的参考话语，所述参考话句为对所述当前话语进行了语义缺失补全和/或指代消解后的话语；

第二获取模块72，用于获取所述对话样本的标注数据，所述标注数据包括：所述当前话语中的存在语义缺失的真实插入位置和/或需要被替换字词的真实删除位置，以及，所述真实插入位置处语义缺失的字词在所述历史话语中的真实位置和/或所述真实删除位置处的需要被替换字词在所述历史话语中对应的替换字词的真实位置；

第一训练模块73，用于根据所述对话样本的当前话语和标注数据，对待训练的指代消解模型的指代消解检测子模型进行训练，得到训练后的指代消解检测子模型，所述训练后的指代消解检测子模型的输入为一话语，输出为输入的话语中的存在语义缺失的预测插入位置和/或需要被替换字词的预测删除位置；

第二训练模块74，用于根据所述对话样本的所述标注数据以及所述对话样本的当前话语的预测插入位置和/或预测删除位置，对待训练的指代消解模型的消解补全子模型进行训练，得到训练后的消解补全子模型，所述训练后的消解补全子模型的输入为话语的预测插入位置和/或预测删除位置，输出为所述预测插入位置处语义缺失的字词在输入话语的历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在输入话语的历史话语中的替换字词的预测位置。

可选的，所述第二获取模块72，用于将所述对话样本的当前话语中的子串与参考话语中的子串进行匹配，得到匹配结果；若所述匹配结果为一子串仅存在于所述当前话语中，确定所述子串为需要被替换字词，以及，所述当前话语中的需要被替换字词的真实删除位置，并在所述参考话语中找到所述需要被替换字词对应的替换字体，以及，在历史话语中标记所述真实删除位置处的需要被替换字词在所述历史话语中对应的替换字词的真实位置；若所述匹配结果为一子串仅存在于所述参考话语中，确定当前话语存在语义缺失，并确定所述当前话语中的存在语义缺失的真实插入位置。

可选的，所述第一训练模块73，用于执行以下操作：

其中，l用于表示是预测插入位置还是预测删除位置，

表示起始位置，

和

表示待训练的权重向量，

和

表示待训练的偏置项，σ为sigmoid激活函数。

可选的，所述第一目标函数采用如下公式表示：

表示预测插入位置或预测删除位置的起始位置，

可选的，所述第二训练模块74，用于执行以下操作：

可选的，所述语义输出变量可以表示为：

H_cln＝λ×(h_l-1-μ_h)/(σ_h+ε)+β

其中，H_cln为所述语义输出变量；

H_c为所述平均向量；

H为隐藏层维度，k等于1～H；

ε是一个极小值。

p_s＝softmax(W_sH_cln+b_s)

p_e＝softmax(W_eH_cln+b_e)

可选的，所述第二目标函数采用如下公式表示：

请参考图8，本公开实施例还提供了一种电子设备80，包括处理器81，存储器82及存储在所述存储器82上并可在所述处理器81上运行的程序或指令，所述程序或指令被所述处理器81执行时实现上述指代消解方法的步骤，或者，所述程序或指令被所述处理器81执行时实现上述指代消解模型的训练方法的步骤。

本公开实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现上述指代消解方法，或者实现上述指代消解模型的训练方法的步骤。

所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本公开的实施例进行了描述，但是本公开并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本公开的启示下，在不脱离本公开宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本公开的保护之内。

Claims

1.一种指代消解方法，其特征在于，包括：

获取待处理的当前话语；

2.根据权利要求1所述的方法，其特征在于，所述指代消解检测子模型包括两组二分类网络，其中，一组二分类网络的输入为所述当前话语，输出为用于指示所述当前话语中的每一个字的位置是否为预测插入位置的起始位置或结束位置的01序列，另一组二分类网络的输入为所述当前话语，输出为用于指示所述当前话语中的每一个字的位置是否为预测删除位置的起始位置或结束位置的01序列。

3.根据权利要求2所述的方法，其特征在于，所述二分类网络采用如下公式确定所述当前话语中的每一个字的位置是否为预测插入位置或预测删除位置的起始位置或结束位置：

其中，l用于表示是预测插入位置还是预测删除位置，

表示起始位置，

和

表示权重向量，

和

表示偏置项，σ为sigmoid激活函数。

4.根据权利要求1所述的方法，其特征在于，将所述当前话语的预测插入位置和/或预测删除位置，以及，所述当前话语对应的历史对话，输入至所述指代消解模型的消解补全子模型中，得到所述预测插入位置处语义缺失的字词在所述历史话语中的预测位置和/或所述预测删除位置处需要被替换字词在所述历史话语中对应的替换字词的预测位置，包括：

5.根据权利要求4所述的方法，其特征在于，所述语义输出变量可以表示为：

H_cln＝λ×(h_l-1-μ_h)/(σ_h+ε)+β

其中，H_cln为所述语义输出变量；

H_c为所述平均向量；

μ_h、σ_h分别为所述当前话语对应的编码向量在当前层不同维度特征向量的均值和方差，

H为隐藏层维度，k等于1～H；

ε是一个极小值。

6.根据权利要求4所述的方法，其特征在于，所述消解补全子模型采用如下公式确定所述历史话语中的预测位置：

p_s＝softmax(W_sH_cln+b_s)

p_e＝softmax(W_eH_cln+b_e)

7.一种指代消解模型的训练方法，其特征在于，包括：

8.根据权利要求7所述的方法，其特征在于，获取所述对话样本的标注数据包括：

9.根据权利要求7所述的方法，其特征在于，根据所述对话样本的当前话语和标注数据，对待训练的指代消解模型的指代消解检测子模型进行训练包括：

10.根据权利要求9所述的方法，其特征在于，所述指代消解检测子模型包括两组二分类网络，其中，一组二分类网络的输入为所述当前话语，输出为用于指示所述当前话语中的每一个字的位置是否为预测插入位置的起始位置或结束位置的01序列，另一组二分类网络的输入为所述当前话语，输出为用于指示所述当前话语中的每一个字的位置是否为预测删除位置的起始位置或结束位置的01序列。

11.根据权利要求10所述的方法，其特征在于，所述二分类网络采用如下公式确定所述当前话语中的每一个字的位置是否为预测插入位置或预测删除位置的起始位置或结束位置：