CN110990555B

CN110990555B - 端到端检索式对话方法与系统及计算机设备

Info

Publication number: CN110990555B
Application number: CN202010145309.5A
Authority: CN
Inventors: 潘伟; 金聪; 廖健; 祝大裕
Original assignee: China Post Consumer Finance Co Ltd
Current assignee: China Post Consumer Finance Co Ltd
Priority date: 2020-03-05
Filing date: 2020-03-05
Publication date: 2020-06-12
Anticipated expiration: 2040-03-05
Also published as: CN110990555A

Abstract

本发明涉及一种端到端检索式对话方法与系统及计算机设备。所述端到端检索式对话系统将当前对话流程的上下文信息进行连接得到查询长文本，使查询长文本与候选系统回复通过编码层、双向LSTM层、交叉注意力层、点积层、双卷积神经网络层以及全连接层，得到文本相似度评分，并选择相似度评分最高的候选系统回复作为最终的系统回复。本发明实施例的端到端检索式对话方法与系统及计算机设备，具有很强的文本语义理解能力，能够有效的利用对话过程中的上下文信息进行语义推理，大大的提高了系统回复选择的正确率，从而提升了通话效率。当其被应用于机器人催收场景中时，在增加客户体验的同时，可以提升催收回款率。

Description

端到端检索式对话方法与系统及计算机设备

技术领域

本发明涉及人机交互技术领域，特别涉及一种端到端检索式对话方法与系统及计算机设备。

背景技术

近年来，随着人工智能技术的发展，特别是深度学习技术在自然语言处理问题上取得的巨大成功，对话系统越来越引起人们的注意，在智能催收、智能客服以及智能电核等领域得到了长足的发展。对话系统根据不同的任务类型大致可以分为两类：任务型对话系统和非任务型（闲聊型）对话系统。任务型对话系统指在特定条件下提供信息或服务的系统，通常情况下是为了满足带有明确目的的用户，例如咨询、查账、催收等任务型场景。

构建任务型对话系统主要有基于管道的方法和端到端的方法。基于管道的方法将对话流程视为一条管道，主要包括四个关键组件部分：自然语言理解（NLU）、对话状态跟踪（DST）、对话状态学习（DPL）和自然语言生成（NLG）。自然语言理解组件主要通过分词、词性标注、命名实体识别、句法分析、指代消解等自然语言处理技术对用户输入查询（query）进行处理客户意图识别，提取用户的对话意图以及预定义的语义槽，完成语义表示。主要利用CFR、RNN或者LSTM等方法进行客户意图识别和槽值填充；对话状态跟踪管理每个回合的输入和对话历史，输出当前对话状态；对话状态学习根据状态跟踪器的状态表示，对话策略学习是生成下一个可用的系统操作；自然语言生成将上一步的系统操作进行映射并生成回复。与基于管道的方法不同，端到端的方法只有一个模块，输入的是原始数据，输出是最后的结果。具体对话系统来说，就是学习对话历史到系统回复的映射问题。

对话系统根据回复文本生成策略的不同，又可以分为生成式方法和检索式方法。生成式方法基于序列到序列模型框架给出答案。检索式方法训练模型对给定的候选答案进行相似度评分并进行排序，选择评分最大的候选答案作为最终答案。

由于传统的基于管道的方法主要存在过程依赖问题，下一个组件的输入依赖于上一个组件的输出，系统缺乏整体连贯性，且管道式的对话缺乏领域迁移性。而生成式方法又容易出现语法错误，或者生成一些没有意义的回复，因此针对特定任务型场景，端到端的检索式方法成为研究的热点。但是，目前基于深度学习的端到端检索式方法基本都是根据用户的输入来与候选答案进行匹配，没有考虑到对话的上下文信息，导致系统回答的正确率低。

发明内容

基于此，有必要提供一种系统回复正确率高的端到端检索式对话方法与系统及计算机设备。

本发明实施例一方面提供一种端到端检索式对话方法，其包括如下步骤：

S1：将当前对话流程的上下文信息进行连接得到查询长文本；

S2：对查询长文本和候选系统回复进行编码，获得查询长文本词向量和候选系统回复词向量；

S3：将查询长文本词向量和候选系统回复词向量通过双向LSTM层，得到双向查询长文本词向量和双向候选系统回复词向量；

S4：使双向查询长文本词向量和双向候选系统回复词向量通过注意力机制，得到查询长文本对偶编码词向量和候选系统回复对偶编码词向量，并将查询长文本对偶编码词向量和候选系统回复对偶编码词向量分别与对应的查询长文本词向量和候选系统回复词向量进行拼接，得到查询长文本拼接词向量和候选系统回复拼接词向量；

S5：将查询长文本拼接词向量和候选系统回复拼接词向量通过双向LSTM层，得到双向查询长文本拼接词向量和双向候选系统回复拼接词向量；

S6：将双向查询长文本拼接词向量和双向候选系统回复拼接词向量进行张量点积，得到词相似度矩阵；

S7：将词相似度矩阵进行卷积操作，输出短语级别语义特征图；

S8：在短语级别语义特征图上进行卷积操作，输出句子级别语义特征图；

S9：将句子级别语义特征图输入全连接层，得到文本相似度评分；

S10：选择相似度评分最高的候选系统回复作为最终的系统回复。

作为上述实施例的进一步改进，在步骤S1中，将当前对话流程的上下文信息依次首尾相接，得到查询长文本，在步骤S2中，采用Bert预训练模型的编码模块对查询长文本和候选系统回复进行编码。

作为上述实施例的进一步改进，在步骤S4中，在使双向查询长文本词向量和双向候选系统回复词向量通过注意力机制得到查询长文本对偶编码词向量和候选系统回复对偶编码词向量时，记

表示当前双向查询长文本词向量，

表示当前双向候选系统回复词向量，计算注意力权重及对偶编码词向量的公式如下：

其中，（2）式和（3）式分别对应双向查询长文本词向量

对所有的双向候选系统回复词向量

做注意力和双向候选系统回复词向量

对所有的双向查询长文本词向量

做注意力，

和

分别表示查询长文本对偶编码词向量和候选系统回复对偶编码词向量。

作为上述实施例的进一步改进，在步骤S9中，在全连接层，使用sigmoid函数作为激活函数。

作为上述实施例的进一步改进，在步骤S3和步骤S5中，分别在双向LSTM层上进一步进行Layer Normalization操作，在步骤S7和步骤S8中，进行卷积操作后进一步进行Batch Normalization操作。

本发明实施例另一方面提供一种端到端检索式对话系统，其包括：

查询长文本生成组件，用于将当前对话流程的上下文信息进行连接得到查询长文本；

系统回复评分组件，用于根据模型文件对候选系统回复进行评分；

系统回复选择组件，用于选择相似度评分最高的候选系统回复作为最终的系统回复；

多轮对话模型训练组件，用于从所述系统回复选择组件获得训练集，对对话模型进行训练，并输出模型文件给所述系统回复评分组件；

所述多轮对话模型训练组件进一步包括：

编码模块，用于对查询长文本和候选系统回复进行编码，获得查询长文本词向量和候选系统回复词向量；

第一双向LSTM层，用于将查询长文本词向量和候选系统回复词向量通过双向LSTM层，得到双向查询长文本词向量和双向候选系统回复词向量；

交叉注意力层，用于使双向查询长文本词向量和双向候选系统回复词向量通过交叉注意力层，得到查询长文本对偶编码词向量和候选系统回复对偶编码词向量，并将查询长文本对偶编码词向量和候选系统回复对偶编码词向量分别与对应的查询长文本词向量和候选系统回复词向量进行拼接，得到查询长文本拼接词向量和候选系统回复拼接词向量；

第二双向LSTM层，用于将查询长文本拼接词向量和候选系统回复拼接词向量通过双向LSTM层，得到双向查询长文本拼接词向量和双向候选系统回复拼接词向量；

点积层，用于将双向查询长文本拼接词向量和双向候选系统回复拼接词向量进行张量点积，得到词相似度矩阵；

第一卷积神经网络层，用于将词相似度矩阵进行卷积操作，输出短语级别语义特征图；

第二卷积神经网络层，用于在短语级别语义特征图上进行卷积操作，输出句子级别语义特征图；

全连接层，将句子级别语义特征图输入全连接层，得到文本相似度评分。

作为上述实施例的进一步改进，所述查询长文本生成组件将当前对话流程的上下文信息依次首尾相接，得到所述查询长文本。

作为上述实施例的进一步改进，所述编码模块为Bert预训练模型的编码模块。

作为上述实施例的进一步改进，所述全连接层使用sigmoid函数作为激活函数。

作为上述实施例的进一步改进，在使双向查询长文本词向量和双向候选系统回复词向量通过交叉注意力层得到查询长文本对偶编码词向量和候选系统回复对偶编码词向量时，记

表示当前双向查询长文本词向量，

其中，（2）式和（3）式分别对应双向查询长文本词向量

对所有的双向候选系统回复词向量

做注意力和双向候选系统回复词向量

对所有的双向查询长文本词向量

做注意力，

和

作为上述实施例的进一步改进，在所述第一双向LSTM层和第二双向LSTM层上分别进行Layer Normalization操作，在第一卷积神经网络层和第二卷积神经网络层上分别进行Batch Normalization操作。

本发明实施例再一方面提供一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一实施例所述方法的步骤。

本发明实施例的端到端检索式对话方法与系统及计算机设备，具有很强的文本语义理解能力，能够有效的利用对话过程中的上下文信息进行语义推理，大大的提高了系统回复选择的正确率，从而提升了通话效率。当其被应用于机器人催收场景中时，在增加客户体验的同时，可以提升催收回款率。

附图说明

通过附图中所示的本发明优选实施例更具体说明，本发明上述及其它目的、特征和优势将变得更加清晰。在全部附图中相同的附图标记指示相同的部分，且并未刻意按实际尺寸等比例缩放绘制附图，重点在于示出本的主旨。

图1为本发明实施例的端到端检索式对话系统的结构示意图；

图2为本发明实施例的端到端检索式对话系统的网络结构图；

图3为本发明实施例的端到端检索式对话系统的工作流程示意图。

具体实施方式

下面结合附图和具体实施例对本发明技术方案作进一步的详细描述，以使本领域的技术人员可以更好地理解本发明并能予以实施，但所举实施例不作为对本发明的限定。

如图1-3所示，本发明实施例提供一种端到端检索式对话方法，其包括如下步骤：

S3：将查询长文本词向量和候选系统回复词向量通过双向LSTM层（双向长短期记忆网络层，BiLSTM），得到双向查询长文本词向量和双向候选系统回复词向量；

S4：使双向查询长文本词向量和双向候选系统回复词向量通过注意力机制，得到查询长文本对偶编码词向量和候选系统回复对偶编码词向量。记

表示当前双向查询长文本词向量，

表示当前双向候选系统回复词向量。计算注意力权重及对偶编码词向量的公式如下：

其中，（2）式和（3）式分别对应双向查询长文本词向量

对所有的双向候选系统回复词向量

做注意力和双向候选系统回复词向量

对所有的双向查询长文本词向量

做注意力。

和

分别表示查询长文本对偶编码词向量和候选系统回复对偶编码词向量。然后将查询长文本对偶编码词向量和候选系统回复对偶编码词向量分别与对应的查询长文本词向量和候选系统回复词向量进行拼接，得到查询长文本拼接词向量和候选系统回复拼接词向量；

S7：将词相似度矩阵进行卷积神经网络操作，也即对词相似度矩阵进行卷积，输出短语级别语义特征图；

S8：在短语级别语义特征图上进行卷积神经网络操作，也即对短语级别语义特征图进行卷积，输出句子级别语义特征图；

在步骤S3中，查询长文本词向量通过双向LSTM层时，得到查询长文本向前输入向量和查询长文本向后输入向量，双向查询长文本词向量由查询长文本向前输入向量和查询长文本向后输入向量组合而成。类似地，双向候选系统回复词向量、双向查询长文本拼接词向量和双向候选系统回复拼接词向量也是由对应的向前输入向量和向后输入向量组合而成。

在步骤S4中，在双向查询长文本词向量和双向候选系统回复词向量通过交叉注意力层的注意力机制时，其所得到的查询长文本对偶编码词向量和候选系统回复对偶编码词向量带有查询长文本与候选系统回复的交互信息，从而使得回复的准确率更加高。

在优选实施例中，在步骤S1中，将当前对话流程的上下文信息依次首尾相接，得到查询长文本，在步骤S2中，采用Bert预训练模型的编码模块对查询长文本和候选系统回复进行编码。在其他实施例中，查询长文本词向量和候选系统回复词向量也可以通过word2vec模型得到。

在优选实施例中，在步骤S9中，在全连接层，使用sigmoid函数作为激活函数。激活函数（activation function）运行时激活神经网络中某一部分神经元，将激活信息向后传入下一层的神经网络。sigmoid 函数的优点在于，它的输出映射在(0,1)内，单调连续，非常适合用作输出层，并且求导比较容易。

在优选实施例中，在步骤S3和步骤S5中，分别在双向LSTM层上进一步进行LayerNormalization操作，在步骤S7和步骤S8中，在卷积神经网络层上进行卷积操作后，进一步进行Batch Normalization操作。Batch Normalization是纵向归一化，在batch的方向上对同一层每一个神经元进行归一化，即同一层每个神经元具有不同的均值和方差。LayerNormalization 是横向归一化，即同一层的所有神经元具有相同的均值和方差。样本经过多层神经网络后，输出值往往变得很大或者很小，即向两个极端偏移，导致神经网络训练速度变慢。经过归一化后再输入到激活函数，得到的值大部分会落入非线性函数的线性区，导数远离导数饱和区，避免了梯度消失，这样来加速训练收敛过程，从而改进多轮对话模型文本相似度的评分效果。

请参考图1-3，本发明实施例还提供一种端到端检索式对话系统，其包括：

查询长文本生成组件，用于将当前对话流程的上下文信息进行连接得到查询长文本，在一些实施例中，查询长文本生成组件即为输入组件；

系统回复选择组件，用于选择相似度评分最高的候选系统回复作为最终的系统回复；具体来说，对候选系统回复按其相似度评分进行排序，然后选择相似度评分最高的候选系统回复作为最终的系统回复；

多轮对话模型训练组件，用于从系统回复选择组件获得训练集，对对话模型进行训练，并输出模型文件给系统回复评分组件。多轮对话模型训练组件针对每次通话记录，从第二轮对话开始，依次将当前客户输入和上文多轮对话进行拼接得到查询长文本，选择当前系统回复作为正确的回复，随机选择其它系统回复作为错误的回复，将查询长文本与正确的回复组合在一起构成正训练样本，将查询长文本与错误的回复组合在一起构成负训练样本，然后进行多轮对话模型训练。

多轮对话模型训练组件进一步包括：

编码模块，用于对查询长文本和候选系统回复的文本进行编码，获得查询长文本词向量和候选系统回复词向量。

第一双向LSTM层，用于将查询长文本词向量和候选系统回复词向量通过双向LSTM层，得到双向查询长文本词向量和双向候选系统回复词向量，该第一双向LSTM层是在上一层输出的词编码向量的基础上对查询长文本和候选系统回复进行语义编码，输出相同结构的词编码向量。

交叉注意力层，用于使双向查询长文本词向量和双向候选系统回复词向量通过交叉注意力层，得到查询长文本对偶编码词向量和候选系统回复对偶编码词向量，并将查询长文本对偶编码词向量和候选系统回复对偶编码词向量分别与对应的查询长文本词向量和候选系统回复词向量进行拼接，得到查询长文本拼接词向量和候选系统回复拼接词向量。

记

表示当前双向查询长文本词向量，

其中，（2）式和（3）式分别对应双向查询长文本词向量

对所有的双向候选系统回复词向量

做注意力和双向候选系统回复词向量

对所有的双向查询长文本词向量

做注意力。

和

第二双向LSTM层，用于将查询长文本拼接词向量和候选系统回复拼接词向量通过双向LSTM层，得到双向查询长文本拼接词向量和双向候选系统回复拼接词向量；第二双向LSTM层的作用跟第一双向LSTM层一样，是在交叉注意力层输出的词编码向量的基础上进行语义编码，输出相同结构的词向量。

点积层，用于将双向查询长文本拼接词向量和双向候选系统回复拼接词向量进行张量点积，得到词相似度矩阵。

第一卷积神经网络层，用于将词相似度矩阵进行卷积操作，输出短语级别语义特征图。

第二卷积神经网络层，用于在短语级别语义特征图上进行卷积操作，输出句子级别语义特征图。

在优选实施例中，查询长文本生成组件将当前对话流程的上下文信息依次首尾相接，得到查询长文本。

在优选实施例中，编码模块为Bert预训练模型的编码模块。在其他实施例中，查询长文本词向量和候选系统回复词向量也可以通过word2vec模型得到。

在优选实施例中，全连接层使用sigmoid函数作为激活函数。激活函数运行时激活神经网络中某一部分神经元，将激活信息向后传入下一层的神经网络。sigmoid 函数的优点在于，它的输出映射在(0,1)内，单调连续，非常适合用作输出层，并且求导比较容易。

在优选实施例中，在第一双向LSTM层和第二双向LSTM层上分别进行LayerNormalization操作，在第一卷积神经网络层和第二卷积神经网络层上分别进行BatchNormalization操作。Batch Normalization是纵向归一化，在batch的方向上对同一层每一个神经元进行归一化，即同一层每个神经元具有不同的均值和方差。Layer Normalization是横向归一化，即同一层的所有神经元具有相同的均值和方差。样本经过多层神经网络后，输出值往往变得很大或者很小，即向两个极端偏移，导致神经网络训练速度变慢。经过归一化后再输入到激活函数，得到的值大部分会落入非线性函数的线性区，导数远离导数饱和区，避免了梯度消失，这样来加速训练收敛过程，从而改进多轮对话模型文本相似度的评分效果。

本发明实施例还提供一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述任一实施例的方法的步骤。该计算机设备可以是可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。本实施例的计算机设备至少包括但不限于：可通过系统总线相互通信连接的存储器、处理器。

本实施例中，存储器(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器可以是计算机设备的内部存储单元，例如该计算机设备的硬盘或内存。在另一些实施例中，存储器也可以是计算机设备的外部存储设备，例如该计算机设备上配备的插接式硬盘，智能存储卡(Smart Media Card ,SMC)，安全数字(Secure Digital ,SD)卡，闪存卡(Flash Card)等。当然，存储器还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中，存储器通常用于存储安装于计算机设备的操作系统和各类应用软件等。此外，存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器通常用于控制计算机设备的总体操作。本实施例中，处理器用于运行存储器中存储的程序代码或者处理数据，以实现上述实施例的端到端检索式对话方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种端到端检索式对话方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的端到端检索式对话方法，其特征在于，在步骤S1中，将当前对话流程的上下文信息依次首尾相接，得到查询长文本，在步骤S2中，采用Bert预训练模型的编码模块对查询长文本和候选系统回复进行编码。

3.根据权利要求1所述的端到端检索式对话方法，其特征在于，在步骤S4中，在使双向查询长文本词向量和双向候选系统回复词向量通过注意力机制得到查询长文本对偶编码词向量和候选系统回复对偶编码词向量时，记

表示当前双向查询长文本词向量，

其中，（2）式和（3）式分别对应双向查询长文本词向量

对所有的双向候选系统回复词向量

做注意力和双向候选系统回复词向量

对所有的双向查询长文本词向量

做注意力，

和

4.根据权利要求1所述的端到端检索式对话方法，其特征在于，在步骤S3和步骤S5中，分别在双向LSTM层上进一步进行Layer Normalization操作，在步骤S7和步骤S8中，进行卷积操作后进一步进行Batch Normalization操作，在步骤S9中，在全连接层，使用sigmoid函数作为激活函数。

5.一种端到端检索式对话系统，其特征在于，包括：

所述多轮对话模型训练组件进一步包括：

6.根据权利要求5所述的端到端检索式对话系统，其特征在于，所述查询长文本生成组件将当前对话流程的上下文信息依次首尾相接，得到所述查询长文本。

7.根据权利要求5所述的端到端检索式对话系统，其特征在于，所述编码模块为Bert预训练模型的编码模块。

8.根据权利要求5所述的端到端检索式对话系统，其特征在于，在使双向查询长文本词向量和双向候选系统回复词向量通过交叉注意力层得到查询长文本对偶编码词向量和候选系统回复对偶编码词向量时，记