CN111737990A

CN111737990A - 一种词槽填充方法、装置、设备及存储介质

Info

Publication number: CN111737990A
Application number: CN202010592685.9A
Authority: CN
Inventors: 周楠楠; 汤耀华; 杨海军; 徐倩
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2020-06-24
Filing date: 2020-06-24
Publication date: 2020-10-02
Anticipated expiration: 2040-06-24
Also published as: CN111737990B

Abstract

本发明公开了一种词槽填充方法、装置、设备及存储介质，所述方法包括：在获取输出的目标问题文本和接收的相应目标输入响应文本后，确定目标输入响应文本的用户意图和用户意图对应的第一词槽；基于目标问题文本和目标输入响应文本，识别出目标输入响应文本的第二词槽；根据目标输入响应文本对应的第二词槽和所述用户意图对应的第一词槽，确定符合用户意图的待填充词槽并进行填充。本发明该可以准确的获取到各个语义单元的词槽标签，解决了词槽歧义的问题。

Description

一种词槽填充方法、装置、设备及存储介质

技术领域

本发明涉及金融科技(Fintech)领域中的人工智能领域，尤其涉及一种词槽填充方法、装置、设备及存储介质。

背景技术

随着计算机技术的发展，越来越多的技术(互联网，大数据、分布式、区块链Blockchain、等)应用在金融领域，传统金融业正在逐步向金融科技(Fintech)转变，在人工智能领域中智能服务机器人是一种以人工智能技术为基础的产品，通过对话的形式和使用者进行交互，该智能服务机器人的后台服务器可以对接多种网络功能服务，从对话交互中收集必要的信息，以在交互中为使用者提供丰富的服务，包括天气查询、预订酒店、路线导航等。使用者的一次服务请求被智能服务机器人识别为一个意图，同时该意图对应存在不同的词槽。例如，天气查询的功能服务的意图对应时间和地点两个词槽。当使用者输入“北京今天天气怎么样？”时，智能服务机器人将识别服务请求为天气查询请求，以及完成词槽填充(slot filling)的过程，即识别时间词槽的值为今天、地点词槽的值为北京，然后调用对应的后台功能服务查询天气并返回结果。

词槽填充(slot filling)是任务型机器人的重要组成模块，其主要作用为从用户的语句中抽取出完成任务所需要的实体。词槽填充问题主要利用机器学习模型端到端地去预测，例如用深度学习技术来解决一个序列标注的问题，直接预测出用户语句中哪个字或词对应哪个词槽，词槽填充的填充效率与填充正确率直接关系到用户体验。

目前的词槽填充主要是根据回复内容识别词槽进行填充，然而，若对于某一实际场景同一回复内容的意图可能存在两个或者多个词槽的可选值，两个或者多个词槽，在进行词槽填充时会造成词槽歧义，即无法确定填充哪个词槽，例如，对于“查询还款失败原因”意图，有“银行卡状态是否正常”和“是否更换手机号”两个词槽；对于词槽的可选值“是”，在不考虑上下文的情况下，无法确定是用来填充哪个词槽，导致不能正确填充词槽，降低了填充准确率。

发明内容

本发明的主要目的在于提供一种词槽填充方法、装置、设备及存储介质，与现有技术相比，旨在解决词槽歧义的问题。

为实现上述目的，本发明提供一种词槽填充方法，所述词槽填充方法包括：

获取输出的目标问题文本和接收的相应目标输入响应文本；

对所述目标输入响应文本进行意图识别，得到相应用户意图，并确定所述用户意图对应的第一词槽；

基于所述目标问题文本和所述目标输入响应文本，识别出所述目标输入响应文本对应的第二词槽；

根据所述目标输入响应文本对应的第二词槽和所述用户意图对应的第一词槽，确定符合所述用户意图的待填充词槽并进行填充。

在一个可选的实现中，所述基于所述目标问题文本和所述目标输入响应文本，识别出所述目标输入响应文本对应的第二词槽，包括：

分别对所述目标问题文本和所述目标输入响应文本进行语义分析，得到所述目标问题文本中各个语义单元的语义向量和所述目标输入响应文本中各个语义单元的语义向量；

将获取的各个语义单元的语义向量输入训练的词槽标签分类模型，获得所述目标输入响应文本中各个语义单元的词槽标签；

根据所述目标输入响应文本中各个语义单元的词槽标签，获取所述目标输入响应文本对应的第二词槽。

在一个可选的实现中，所述分别对所述目标问题文本和所述目标输入响应文本进行语义分析，得到所述目标问题文本中各个语义单元的语义向量和所述目标输入响应文本中各个语义单元的语义向量，包括：

将所述目标问题文本和所述目标输入响应文本分别输入语义向量识别模型，得到所述目标问题文本中各个语义单元的语义向量和所述目标输入响应文本中各个语义单元的语义向量。

在一个可选的实现中，所述将所述目标问题文本和所述目标输入响应文本分别输入语义向量识别模型，得到所述目标问题文本中各个语义单元的语义向量和所述目标输入响应文本中各个语义单元的语义向量，包括：

通过所述语义向量识别模型中的语义特征提取网络，对所述目标问题文本中的各个语义单元和所述目标输入响应文本中的各个语义单元进行语义特征提取并组合，得到所述目标问题文本和所述目标输入响应文本的全文语义信息；其中，所述全文语义信息为所述各个语义单元的语义特征的集合；

将所述全文语义信息输入所述语义特征提取网络中的网络输出层，得到所述目标问题文本中各个语义单元的语义向量和所述目标输入响应文本中各个语义单元的语义向量。

在一个可选的实现中，所述根据所述目标输入响应文本对应的第二词槽和所述用户意图对应的第一词槽，确定符合所述用户意图的待填充词槽并进行填充，包括：

将所述第二词槽和所述第一词槽进行匹配；

若所述第二词槽中的第二目标词槽与所述第一词槽中的第一目标词槽相匹配，则将所述第一目标词槽确定为待填充词槽，并利用所述第二目标词槽的词槽标签对应的语义单元，对所述待填充词槽进行填充。

在一个可选的实现中，所述语义向量识别模型通过如下方式进行训练：

获取人机交互的历史对话记录中的第一待训练文本；

对所述第一待训练文本中的各个语义单元进行标注，得到所述各个语义单元的向量标注信息；

将所述第一待训练文本输入到待训练语义向量识别模型，得到所述第一待训练文本中各个语义单元的语义向量，并确定得到的语义单元的语义向量与标注的相应向量标注信息之间的误差；

根据所述误差，对所述待训练语义向量识别模型进行迭代训练；

将训练结束时的所述待训练语义向量识别模型，作为所述语义向量识别模型。

在一个可选的实现中，所述词槽标签分类模型通过如下方式进行训练：

获取人机交互的历史对话记录中的第二待训练文本；

对所述第二待训练文本中的各个语义单元进行标注，得到所述各个语义单元的标签标注信息；

将所述第二待训练文本输入到待训练词槽标签分类模型，得到所述第二待训练文本中各个语义单元的词槽标签，并确定得到的语义单元的词槽标签与标注的相应标签标注信息之间的标签误差；

根据所述标签误差，对所述待训练词槽标签分类模型进行迭代训练；

将训练结束时的所述待训练词槽标签分类模型，作为所述词槽标签分类模型。

第二方面，本发明提供了一种词槽填充装置，所述词槽填充装置包括：获取单元、确定单元和识别单元；

所述获取单元，用于获取输出的目标问题文本和接收的相应目标输入响应文本；

所述确定单元，用于对所述目标输入响应文本进行意图识别，得到相应用户意图，并确定所述用户意图对应的第一词槽；

所述识别单元，用于基于所述目标问题文本和所述目标输入响应文本，识别出所述目标输入响应文本对应的第二词槽；

所述确定单元，还用于根据所述目标输入响应文本对应的第二词槽和所述用户意图对应的第一词槽，确定符合所述用户意图的待填充词槽并进行填充。

在一个可选的实现中，所述识别单元，具体用于分别对所述目标问题文本和所述目标输入响应文本进行语义分析，得到所述目标问题文本中各个语义单元的语义向量和所述目标输入响应文本中各个语义单元的语义向量；将获取的各个语义单元的语义向量输入训练的词槽标签分类模型，获得所述目标输入响应文本中各个语义单元的词槽标签；根据所述目标输入响应文本中各个语义单元的词槽标签，获取所述目标输入响应文本对应的第二词槽。

在一个可选的实现中，所述获取单元，还用于将所述目标问题文本和所述目标输入响应文本分别输入语义向量识别模型，得到所述目标问题文本中各个语义单元的语义向量和所述目标输入响应文本中各个语义单元的语义向量。

在一个可选的实现中，所述获取单元，具体用于通过所述语义向量识别模型中的语义特征提取网络，对所述目标问题文本中的各个语义单元和所述目标输入响应文本中的各个语义单元进行语义特征提取并组合，得到所述目标问题文本和所述目标输入响应文本的全文语义信息；其中，所述全文语义信息为所述各个语义单元的语义特征的集合；

在一个可选的实现中，所述确定单元，具体用于将所述第二词槽和所述第一词槽进行匹配；若所述第二词槽中的第二目标词槽与所述第一词槽中的第一目标词槽相匹配，则将所述第一目标词槽确定为待填充词槽，并利用所述第二目标词槽的词槽标签对应的语义单元，对所述待填充词槽进行填充。

在一个可选的实现中，所述装置还包括第一训练单元；

所述第一训练单元，用于执行以下步骤：

获取人机交互的历史对话记录中的第一待训练文本；

在一个可选的实现中，所述装置还包括第二训练单元；

所述第二训练单元，用于执行以下步骤：

获取人机交互的历史对话记录中的第二待训练文本；

第三方面，提供了一种词槽填充设备，该词槽填充设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的词槽填充程序，所述词槽填充程序被所述处理器执行时实现上述第一方面中任一所述的方法步骤。

第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质内存储有词槽填充程序，所述词槽填充程序被处理器执行时实现上述第一方面中任一所述的方法步骤。

本发明中，词槽填充方法中获取输出的目标问题文本和接收的相应目标输入响应文本后，得到目标输入响应文本的用户意图，并确定用户意图对应的第一词槽，结合目标问题文本，对目标输入响应文本进行识别，得到目标输入响应文本的第二词槽，之后根据所述目标输入响应文本对应的第二词槽和用户意图对应的第一词槽，能够准确的确定符合用户意图的待填充词槽并进行填充。可见，该方法通过将问题文本和相应输入响应文本进行结合分析，可以准确的识别出输入响应文本对应的第二词槽，并在根据第二词槽确定第一词槽中的待填充词槽后，对待填充词槽进行填充，克服了现有技术不考虑上下文情况而出现的词槽歧义导致的填充不准确的问题，提高了填充准确率。

附图说明

图1是本发明实施例提供的一种词槽填充方法的流程示意图；

图2是本发明实施例提供的一种词槽填充装置的结构示意图；

图3是本发明实施例提供的一种词槽填充设备的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输入、输出设备，以有效的方式实现人与计算机对话的技术。

槽填充(Slot Filling)是指从大规模的语料库中抽取给定实体(query)的被明确定义的属性(slot types)的值(slot fillers)。

其中，利用用户回复中的关键词填写的槽称为词槽；词槽由词槽类型(或称“属性”)和值两部分组成，词槽类型主要用于对限定条件，如关键词的分类，值是指词槽类型对应的具体信息。

例如，打车信息为：出发地点为A地点，目的地为B地点，出发时间为早8点。此时出发地槽、目的地槽和出发时间槽的词槽类型分别指是“出发地”、“目的地”和“出发时间”；出发地词槽的值为“A地点”，目的地词槽的值为“B地点”，出发时间词槽的值为“早8点”。

本发明实施例提供的词槽填充方法可以应用在词槽填充装置中，词槽填充装置可以位于智能设备中，也可以位于服务器中。

若词槽填充装置位于服务器中，且在执行该方法时，需要智能设备将人机交互中智能设备，如机器人输出的目标问题文本和相应的目标输入响应文本发送至服务器，以使服务器获取智能设备输出的目标问题文本和相应的目标输入响应文本，服务器依照本发明实施例提供的词槽填充方法对获取的目标问题文本和接收的相应目标输入响应文本进行处理，以获取目标输入响应文本中各个语义单元的词槽标签，并根据获取的词槽标签对应的语义单元，完成词槽填充。其中，语义单元为构成文本的语义单位。若目标问题文本和相应目标输入响应文本均为中文文本，则语义单元是文本中的字；若目标问题文本和相应目标输入响应文本均为英文文本，则语义单元是文本中的单词。

进一步的，目标输入响应文本可以是语音数据，也可以是文本；

若输入信息是语音数据，则智能设备将该语音数据和相应的目标问题文本发送至服务器，服务器可以对该语音数据进行语音识别，得到相应的目标输入响应文本后，依照本发明实施例提供的词槽填充方法对获取的目标问题文本和相应目标输入响应文本进行处理。

或者，智能设备可以对该语音数据进行语音识别，得到目标输入响应文本后，将得到的目标输入响应文本和相应目标问题文本发送至服务器，服务器依照本发明实施例提供的词槽填充方法对获取的目标问题文本和相应目标输入响应文本进行处理。

若输入信息是文本，则智能设备将目标问题文本和相应目标输入响应文本发送至服务器，服务器直接依照本发明实施例提供的词槽填充方法对目标问题文本和相应目标输入响应文本进行处理。

其中，智能设备可以是智能音箱、智能机器人等，还可以是移动电话、智能电话、笔记本电脑、数字广播接收器、个人数字助理(PDA)、平板电脑(PAD)等用户设备(UserEquipment，UE)、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备、移动台(Mobile station，MS)、移动终端(Mobile Terminal)等。服务器可以是与智能设备通信的应用服务器或云服务器。

以下结合说明书附图对本申请的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明，并且在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

图1是本发明实施例提供的一种词槽填充方法的流程示意图。如图1所示，该方法可以包括：

步骤110、获取输出的目标问题文本和接收的相应目标输入响应文本。

词槽填充装置可以获取智能设备输出的目标问题文本和接收的相应目标输入响应文本。其中，该目标输入响应文本可以是用户通过可操作界面输入的，也可以是服务器或智能设备采用语音识别算法对用户当前输入的语音信号进行语音识别后得到的。

步骤120、对目标输入响应文本进行意图识别，得到相应用户意图，并确定用户意图对应的第一词槽。

词槽填充装置可以对该目标输入响应文本进行意图分析，得到目标输入响应文本对应的用户意图信息，以及确定用户意图对应的第一词槽。

例如，目标输入响应文本为：预定今天北京到上海的机票。

词槽填充装置对目标输入响应文本进行意图分析，得到的用户意图为订机票意图，订机票意图对应的第一词槽可以包括订票日期的第一词槽、起始地点的第一词槽和目的地点的第一词槽。

可选地，词槽填充装置可以将目标输入响应文本输入预设的意图识别模型，以获取目标输入响应文本对应的用户意图。其中，预设的意图识别模型可以包括机器学习模型、深度学习模型、相似度模型、规则模型等，本发明实施例在此不做限定。

步骤130、基于目标问题文本和目标输入响应文本，识别出目标输入响应文本的第二词槽。

词槽填充装置可以分别对目标问题文本和目标输入响应文本进行语义分析，得到目标问题文本中各个语义单元的语义向量和目标输入响应文本中各个语义单元的语义向量。

具体的，词槽填充装置可以将目标问题文本和目标输入响应文本输入语义向量识别模型，得到目标问题文本中各个语义单元的语义向量和目标输入响应文本中各个语义单元的语义向量。其中，语义向量识别模型可以是预先训练的基于转换器的双向编码器表征(Bidirectional Encoder Representations from Transformers，BERT)模型。

具体实施中，首先，在将目标问题文本和目标输入响应文本输入语义向量识别模型前，需要分别对目标问题文本和目标输入响应文本进行预处理，可以通过如下方式得到预处理后的目标问题文本和目标输入响应文本：

分别对目标问题文本和相应目标输入响应文本进行语义单元级切分，得到切分后的目标问题文本和切分后的目标输入响应文本。

按照预设文本拼接规则，采用拼接标识对切分后的目标问题文本和切分后的目标输入响应文本进行标识拼接，得到预处理后的目标问题文本和相应目标输入响应文本的拼接文本。

其中，预设文本拼接规则可以是指采用拼接标识的方式，对目标问题文本和目标输入响应文本进行拼接与标识：

对目标问题文本和目标输入响应文本的文本首部用第一拼接标识，如[CLS]标签进行标识，文本尾部用第二拼接标识，如[SEP]标签进行标识，同时再采用第二拼接标识，将目标问题文本和目标输入响应文本分隔拼接。例如，若A为目标输入响应文本，B为目标问题文本，则目标问题文本B和目标输入响应文本A的拼接文本可以表示为：[CLS]A[SEP]B[SEP]的文本形式，或者，可以表示为：[CLS]B[SEP]A[SEP]的文本形式。

可选地，若目标问题文本和目标输入响应文本的长度未达到预设长度，则可以采用补零的方式，将目标问题文本和目标输入响应文本的长度达到预设长度。也就是说，此时在目标问题文本和目标输入响应文本的尾部通过添加若干个0，使添加若干个0后的目标问题文本和目标输入响应文本的长度到预设长度。若目标问题文本和目标输入响应文本的长度达到预设长度，则在目标问题文本和目标输入响应文本中将超出的部分截断。

在一个例子中，以语种为中文为例。首先，词槽填充装置获取到的目标问题文本为“请问您要查询哪里的天气”；目标输入响应文本为“北京的天气”。

切分后的目标输入响应文本可以表示为：北京的天气；

切分后的目标问题可以表示为：请问您要查询哪里的天气”。

按照预设文本拼接规则，得到的目标问题文本和目标输入响应文本可以表示为：[CLS]北京的天气[SEP]请问您要查询哪里的天气[SEP]。

其次，词槽填充装置可以将预处理后的目标问题文本和目标输入响应文本输入预先训练的语义向量识别模型(如BERT模型)中的语义特征提取网络，对目标问题文本中的各个语义单元和目标输入响应文本中的各个语义单元进行语义特征提取并组合，得到目标问题文本和目标输入响应文本的全文语义信息；其中，全文语义信息为各个语义单元的语义特征的集合；

并将全文语义信息输入语义特征提取网络中的网络输出层，得到目标问题文本中各个语义单元的语义向量和目标输入响应文本中各个语义单元的语义向量。也就是说，目标问题文本中各个语义单元的语义向量和目标输入响应文本中各个语义单元的语义向量是相应语义单元结合上下文信息后的向量表示。

然后，从目标问题文本中各个语义单元的语义向量和目标输入响应文本中各个语义单元的语义向量中，提取目标输入响应文本中各个语义单元的语义向量；

例如，若目标问题文本B和目标输入响应文本A的拼接文本为[CLS]A[SEP]B[SEP]的文本形式，则提取[CLS]标签与第一个[SEP]标签内A文本中各个语义单元的语义向量；若目标问题文本B和目标输入响应文本A的拼接文本为[CLS]B[SEP]A[SEP]的文本形式，则预设的语义向量提取规则为提取第一个[SEP]标签与第二个[SEP]标签内A文本中各个语义单元的语义向量。

进一步的，将提取到的目标输入响应文本中各个语义单元的语义向量，按照目标输入响应文本的文本顺序，依次将各个语义单元的语义向量输入训练的词槽标签分类模型，获得按照目标输入响应文本的文本顺序的目标输入响应文本中各个语义单元的词槽标签。

其中，词槽标签分类模型可以支持BIO分类规则、BIEO分类规则等，其中，BIO分类规则中B表示实体开始，I表示实体非开始部分，O表示不是实体的部分。BIESO分类规则中B表示实体开始，I表示实体中间，E表示实体结尾，S表示单个语义单元，如中文文本中的单一字，O表示不是实体的部分，即无关语义单元，由此可知，分类得到的各个语义单元的词槽标签可以用于表示所属词槽的类型以及相应语义单元在该词槽中的位置；

可选地，词槽标签分类模型可以是softmax分类模型。具体为：

将目标输入响应文本中各个语义单元的语义向量输入预先训练的softmax分类模型，softmax分类模型根据语义向量与词槽标签的概率分布，获取目标输入响应文本中各个语义单元的语义向量对应的概率最大的词槽标签，并将概率最大的词槽标签确定为相应语义单元的词槽标签。

在一个例子中，输入的中文文本为“北京今天的天气”，且词槽标签分类模型按照BIO分类规则进行分类，获取的每个字的词槽标签可以表示为：B_地点，I_地点，B_时间，I_时间，O，O，O。

本发明实施例的词槽填充方法中采用的模型包括BERT模型和softmax分类模型，与现有技术的双向循环神经网络(BiLSTM或者BiGRU)模型相比，对于各个语义单元的词槽标签的获取，不依赖前一个语义单元的词槽标签的获取，即没有获取词槽标签的时序要求，故获取词槽标签的速度较快，提高了词槽填充效率。

步骤140、根据目标输入响应文本对应的第二词槽和用户意图对应的第一词槽，确定符合用户意图的待填充词槽并进行填充。

将第二词槽和第一词槽进行匹配；

若第二词槽中的第二目标词槽与第一词槽中的第一目标词槽相匹配，则将第一目标词槽确定为待填充词槽，并利用第二目标词槽的词槽标签对应的语义单元，对待填充词槽进行填充。

若不存在相匹配的第二目标词槽与第一目标词槽，则结束本次填充流程。

例如，用户意图对应的第一词槽包括词槽X和词槽Y，目标输入响应文本对应的第二词槽包括词槽X和词槽Z，故存在相匹配的第二目标词槽X和第一目标词槽X，将第二目标词槽X的词槽标签对应的语义单元，对第一目标词槽X进行填充，而符合用户意图的词槽Y不进行填充。

在一种可能的实施方式中，可以通过以下方式训练得到语义向量识别模型和词槽标签分类模型：

方式一，分别训练得到语义向量识别模型和词槽标签分类模型：

(1)对于语义向量识别模型的训练：

获取人机交互的历史对话记录中的第一待训练文本；

对第一待训练文本中的各个语义单元进行标注，得到各个语义单元的向量标注信息；

将第一待训练文本输入到待训练语义向量识别模型，得到第一待训练文本中各个语义单元的语义向量，并确定得到的语义单元的语义向量与标注的相应向量标注信息之间的误差；

根据误差，对待训练语义向量识别模型进行迭代训练；

将训练结束时的待训练语义向量识别模型，作为语义向量识别模型。

(2)对于词槽标签分类模型的训练：

获取人机交互的历史对话记录中的第二待训练文本；

对第二待训练文本中的各个语义单元进行标注，得到各个语义单元的标签标注信息；

将第二待训练文本输入到待训练词槽标签分类模型，得到第二待训练文本中各个语义单元的词槽标签，并确定得到的语义单元的词槽标签与标注的相应标签标注信息之间的标签误差；

根据标签误差，对待训练词槽标签分类模型进行迭代训练；

将训练结束时的待训练词槽标签分类模型，作为词槽标签分类模型。

方式二，同时训练得到语义向量识别模型和词槽标签分类模型：

获取人机交互的历史对话记录中的第三待训练文本；

对第三待训练文本中的各个语义单元进行标注，得到各个语义单元的标签标注信息；

将第三待训练文本输入待训练语义向量识别模型，得到第三待训练文本中各个语义单元的语义向量；

将第三待训练文本中各个语义单元的语义向量输入待训练词槽标签分类模型，得到第三待训练文本中各个语义单元的词槽标签，并确定得到的语义单元的词槽标签与标注的相应标签标注信息之间的标签误差；

根据标签误差，同时对待训练语义向量识别模型和待训练词槽标签分类模型进行迭代训练；

将训练结束时的待训练语义向量识别模型和待训练词槽标签分类模型，作为语义向量识别模型和词槽标签分类模型。

其中，待训练语义向量识别模型和待训练词槽标签分类模型均为预训练模型(pre-trained model)。预训练模型是指预先为了解决类似问题所创造出来的模型，该预训练模型包括解决该类似问题所生成的模型参数。

需要说明的是，训练结束的条件可以包括迭代更新次数达到预设次数阈值，或相邻两次得到的词槽标签误差不变，或相邻两次得到的词槽标签误差的差值小于预设误差阈值，也可以根据实际情况自定义训练结束的条件，本发明实施例在此不做限定。

本发明实施例提供的词槽填充方法在获取输出的目标问题文本和接收的相应目标输入响应文本后，得到目标输入响应文本的用户意图，并确定用户意图对应的第一词槽，结合目标问题文本，对目标输入响应文本进行识别，得到目标输入响应文本的第二词槽，之后根据所述目标输入响应文本对应的第二词槽和用户意图对应的第一词槽，能够准确的确定符合用户意图的待填充词槽并进行填充。可见，该方法通过将问题文本和相应输入响应文本进行结合分析，可以准确的识别出输入响应文本对应的第二词槽，并在根据第二词槽确定第一词槽中的待填充词槽后，对待填充词槽进行填充，克服了现有技术不考虑上下文情况而出现的词槽歧义导致的填充不准确的问题，提高了填充准确率。

与上述方法对应的，本发明实施例还提供一种词槽填充装置，如图2所示，该词槽填充装置包括：获取单元210、确定单元220和识别单元230；

获取单元210，用于获取输出的目标问题文本和接收的相应目标输入响应文本；

确定单元220，用于对所述目标输入响应文本进行意图识别，得到相应用户意图，并确定所述用户意图对应的第一词槽；

识别单元230，用于基于所述目标问题文本和所述目标输入响应文本，识别出所述目标输入响应文本对应的第二词槽；

确定单元220，还用于根据所述目标输入响应文本对应的第二词槽和所述用户意图对应的第一词槽，确定符合所述用户意图的待填充词槽并进行填充。

在一个可选的实现中，识别单元230，具体用于分别对所述目标问题文本和所述目标输入响应文本进行语义分析，得到所述目标问题文本中各个语义单元的语义向量和所述目标输入响应文本中各个语义单元的语义向量；将获取的各个语义单元的语义向量输入训练的词槽标签分类模型，获得所述目标输入响应文本中各个语义单元的词槽标签；根据所述目标输入响应文本中各个语义单元的词槽标签，获取所述目标输入响应文本对应的第二词槽。

在一个可选的实现中，获取单元210，还用于将所述目标问题文本和所述目标输入响应文本分别输入语义向量识别模型，得到所述目标问题文本中各个语义单元的语义向量和所述目标输入响应文本中各个语义单元的语义向量。

在一个可选的实现中，获取单元210，具体用于通过所述语义向量识别模型中的语义特征提取网络，对所述目标问题文本中的各个语义单元和所述目标输入响应文本中的各个语义单元进行语义特征提取并组合，得到所述目标问题文本和所述目标输入响应文本的全文语义信息；其中，所述全文语义信息为所述各个语义单元的语义特征的集合；

在一个可选的实现中，确定单元220，具体用于将所述第二词槽和所述第一词槽进行匹配；若所述第二词槽中的第二目标词槽与所述第一词槽中的第一目标词槽相匹配，则将所述第一目标词槽确定为待填充词槽，并利用所述第二目标词槽的词槽标签对应的语义单元，对所述待填充词槽进行填充。

在一个可选的实现中，所述装置还包括第一训练单元240；

第一训练单元240，用于执行以下步骤：

获取人机交互的历史对话记录中的第一待训练文本；

在一个可选的实现中，所述装置还包括第二训练单元250；

第二训练单元250，用于执行以下步骤：

获取人机交互的历史对话记录中的第二待训练文本；

本发明上述实施例提供的词槽填充装置的各功能单元的功能，可以通过上述各方法步骤来实现，因此，本发明实施例提供的词槽填充装置中的各个单元的具体工作过程和有益效果，在此不复赘述。

本发明实施例还提供了一种词槽填充设备，如图3所示，包括处理器310、通信接口320、存储器330和通信总线340，其中，处理器310，通信接口320，存储器330通过通信总线340完成相互间的通信。

存储器330，用于存放计算机程序；

处理器310，用于执行存储器330上所存放的程序时，实现如下步骤：

获取输出的目标问题文本和接收的相应目标输入响应文本；

将所述第二词槽和所述第一词槽进行匹配；

获取人机交互的历史对话记录中的第一待训练文本；

获取人机交互的历史对话记录中的第二待训练文本；

上述提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

由于上述实施例中电子设备的各器件解决问题的实施方式以及有益效果可以参见图1所示的实施例中的各步骤来实现，因此，本发明实施例提供的电子设备的具体工作过程和有益效果，在此不复赘述。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的词槽填充方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的词槽填充方法。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种词槽填充方法，其特征在于，包括：

获取输出的目标问题文本和接收的相应目标输入响应文本；

2.如权利要求1所述的方法，其特征在于，所述基于所述目标问题文本和所述目标输入响应文本，识别出所述目标输入响应文本对应的第二词槽，包括：

3.如权利要求2所述的方法，其特征在于，所述分别对所述目标问题文本和所述目标输入响应文本进行语义分析，得到所述目标问题文本中各个语义单元的语义向量和所述目标输入响应文本中各个语义单元的语义向量，包括：

4.如权利要求3所述的方法，其特征在于，所述将所述目标问题文本和所述目标输入响应文本分别输入语义向量识别模型，得到所述目标问题文本中各个语义单元的语义向量和所述目标输入响应文本中各个语义单元的语义向量，包括：

5.如权利要求1-4任一项所述的方法，其特征在于，所述根据所述目标输入响应文本对应的第二词槽和所述用户意图对应的第一词槽，确定符合所述用户意图的待填充词槽并进行填充，包括：

将所述第二词槽和所述第一词槽进行匹配；

6.如权利要求3-5任一项所述的方法，其特征在于，所述语义向量识别模型通过如下方式进行训练：

获取人机交互的历史对话记录中的第一待训练文本；

7.如权利要求2-5任一项所述的方法，其特征在于，所述词槽标签分类模型通过如下方式进行训练：

获取人机交互的历史对话记录中的第二待训练文本；

8.一种词槽填充装置，其特征在于，包括：获取单元、确定单元和识别单元；

9.一种词槽填充设备，其特征在于，所述词槽填充设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的词槽填充程序，所述词槽填充程序被所述处理器执行时实现如权利要求1至7中任一项所述的词槽填充方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有词槽填充程序，所述词槽填充程序被处理器执行时实现如权利要求1至7中任一项所述的词槽填充方法的步骤。