CN111199149A

CN111199149A - 一种对话系统的语句智能澄清方法及系统

Info

Publication number: CN111199149A
Application number: CN201911301662.1A
Authority: CN
Inventors: 王亚平; 王志刚; 杨硕; 刘振宇; 王芳; 刘雅婷; 王泽皓
Original assignee: Aisino Corp
Current assignee: Aisino Corp
Priority date: 2019-12-17
Filing date: 2019-12-17
Publication date: 2020-05-26
Anticipated expiration: 2039-12-17
Also published as: CN111199149B

Abstract

本发明公开了一种对话系统的语句智能澄清方法及系统，包括：对获取的用户句子序列进行分词处理，以获取所述用户句子序列中的多个单词；将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配，以确定所述用户句子序列是否为歧义句子；当所述用户句子序列为歧义句子时，以中文的结束标点符号为切分依据，对所述用户句子序列进行分句处理，以获取切分子句；计算切分子句的向量与预设的意图语料库中每个意图类别的加权平均向量的相似度，根据所述相似度确定切分子句的意图。本发明得到方法能够识别歧义句子，对歧义句子进行多意图的分类，给出对应的澄清话术，帮助用户尽快完成相关任务需求，提升了用户体验。

Description

一种对话系统的语句智能澄清方法及系统

技术领域

本发明涉及智能语义分析技术领域，并且更具体地，涉及一种对话系统的语句智能澄清方法及系统。

背景技术

对话系统的主要目标是实现人和机器的无障碍交流，可以用于闲聊，订餐馆，订票等任何机器可以代替人做的任务。然而，多数情况下用户的话带有歧义性，通过对对话数据的分析总结，可分为两种：(1)用户说的话包含多种意图，如图1左；(2)用户在表达一种意图之前，做了较长的铺垫(说了较多无用的话)，如图1右。目前已有的对话机器人，对于用户带有歧义的话，一般采用拒识，或者给予不准确的回复，让用户觉得机器人不能理解自己的话，大大降低了用户的对话体验感。

在话系统中，依据机器人的理解力，可将用户的回答分为三种：(1)机器理解用户说的话，对话继续；(2)机器完全不理解用户说的话，采用兜底话术，比如“抱歉，我没听明白”；(3)机器部分理解，但用户的话带有歧义性，需进一步澄清，给出推荐选项。针对后两种情况，是目前对话系统技术急需要解决的难题。

因此，需要一种对话系统的语句智能澄清方法及系统，以解决如何快速准确地识别歧义句子，并理解及澄清的问题。

发明内容

本发明提出一种对话系统的语句智能澄清方法及系统，以解决如何快速准确地识别歧义句子，并理解及澄清的问题。

为了解决上述问题，根据本发明的一个方面，提供了一种对话系统的语句智能澄清方法，所述方法包括：

对获取的用户句子序列进行分词处理，以获取所述用户句子序列中的多个单词；

将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配，以确定所述用户句子序列是否为歧义句子；

当所述用户句子序列为歧义句子时，以中文的结束标点符号为切分依据，对所述用户句子序列进行分句处理，以获取切分子句；

计算切分子句的向量与预设的意图语料库中每个意图类别的加权平均向量的相似度，根据所述相似度确定切分子句的意图。

优选地，其中所述将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配，以确定所述用户句子序列是否为歧义句子，包括：

利用SeqGAN模型获取用户句子序列中每个单词的embedding特征，并经过隐含层函数的映射，得到隐含层状态序列；

所述隐含层状态序列经过softmax层处理，输出每个单词的概率分布；

根据每个单词的概率分布和预设的歧义句子语料库中的数据，采用卷积神经网络进行匹配，以确定所述用户句子序列是否为歧义句子。

优选地，其中所述SeqGAN模型，包括：一个生成器G和一个判别器D，利用如下方式确定所述SeqGAN模型，包括：

收集对话数据中，将用户带歧义的句子语料作为模型的训练集{s₁,s₂,...,s_n},其中每个s_i为句子序列，表示s_i＝{x_1:T},x_j表示句子中的单个词；

使用训练集对G进行预训练，以最大似然估计作为优化目标；

使用预训练的G生成多个负样本，结合真实的歧义句子对D进行预训练，D训练以交叉熵作为优化目标；

G和D相互博弈进行优化，直至SeqGAN达到收敛，确定所述SeqGAN模型。

优选地，其中所述方法还包括：

基于BERT训练模型确定预设的意图语料库中每个意图类别的加权平均向量，包括：

其中，

为多个文本

的加权平均向量；

表示第i类意图的第j个用户表达，BERT

为文本

对应的相量；i∈{1,2,...m},j∈{1,2,...n}。

优选地，其中所述根据所述相似度确定切分子句的意图，包括：

其中，BERT(x_p)为切分子句x_p使用BERT预训练模型获得对应的向量；thre为预设的相似度阈值；当切分子句的向量与某个意图类别的加权平均向量的相似度大于所述相似度阈值时，确定最大的相似度对应的意图类别，即为所述切分子句对应的要表达的意图。

根据本发明的另一个方面，提供了一种对话系统的语句智能澄清系统，所述系统包括：

分词单元，用于对获取的用户句子序列进行分词处理，以获取所述用户句子序列中的多个单词；

歧义句子确定单元，用于将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配，以确定所述用户句子序列是否为歧义句子；

切分子句获取单元，用于当所述用户句子序列为歧义句子时，以中文的结束标点符号为切分依据，对所述用户句子序列进行分句处理，以获取切分子句；

意图确定单元，用于计算切分子句的向量与预设的意图语料库中每个意图类别的加权平均向量的相似度，根据所述相似度确定切分子句的意图。

优选地，其中所述歧义句子确定单元，将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配，以确定所述用户句子序列是否为歧义句子，包括：

使用训练集对G进行预训练，以最大似然估计作为优化目标；

优选地，其中所述系统还包括：

加权平均向量确定单元，用于基于BERT训练模型确定预设的意图语料库中每个意图类别的加权平均向量，包括：

其中，

为多个文本

的加权平均向量；

表示第i类意图的第j个用户表达，BERT

为文本

对应的相量；i∈{1,2,...m},j∈{1,2,...n}。

优选地，其中所述意图确定单元，根据所述相似度确定切分子句的意图，包括：

本发明提供了一种对话系统的语句智能澄清方法及系统，旨在解决两个主要问题，一是机器如何识别用户带歧义的句子；二是对于带歧义的句子，如何理解以及澄清的方法。针对第一个问题，采用适用于文本领域的SeqGAN生成模型，可同时学习到表示文本概率分布的生成器和识别歧义句子的判别器，其中生成器可用于产生更多的训练数据，而判别器则可以准确识别带歧义的句子，解决了第一个问题；针对第二个问题，通过构建意图分类语料库，歧义句子切分，BERT模型向量化，计算句子相似度的方式，理解用户多意图的表达，当用户输入的文本表达多种意图，含有歧义时，智能澄清并能给出对应的澄清话术，帮助用户尽快完成相关任务需求，提升了用户体验。

附图说明

通过参考下面的附图，可以更为完整地理解本发明的示例性实施方式：

图1为带歧义句子对话示例；

图2为根据本发明实施方式的对话系统的语句智能澄清方法200的流程图；

图3为根据本发明实施方式的对话系统的智能澄清模型的算法结构图；

图4为根据本发明实施方式的智能澄清模型的总体流程图；

图5为根据本发明实施方式的智能澄清的效果图；以及

图6为根据本发明实施方式的对话系统的语句智能澄清系统600的结构示意图。

具体实施方式

现在参考附图介绍本发明的示例性实施方式，然而，本发明可以用许多不同的形式来实施，并且不局限于此处描述的实施例，提供这些实施例是为了详尽地且完全地公开本发明，并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中，相同的单元/元件使用相同的附图标记。

除非另有说明，此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外，可以理解的是，以通常使用的词典限定的术语，应当被理解为与其相关领域的语境具有一致的含义，而不应该被理解为理想化的或过于正式的意义。

图2为根据本发明实施方式的对话系统的语句智能澄清方法200的流程图。如图2所示，本发明实施方式提供的对话系统的语句智能澄清方法，采用适用于文本领域的SeqGAN生成模型，可同时学习到表示文本概率分布的生成器和识别歧义句子的判别器，其中生成器可用于产生更多的训练数据，而判别器则可以准确识别带歧义的句子；通过构建意图分类语料库，歧义句子切分，BERT模型向量化，计算句子相似度的方式，理解用户多意图的表达，当用户输入的文本表达多种意图，含有歧义时，智能澄清并能给出对应的澄清话术，帮助用户尽快完成相关任务需求，提升了用户体验。本发明实施方式提供的对话系统的语句智能澄清方法200从步骤201处开始，在步骤201对获取的用户句子序列进行分词处理，以获取所述用户句子序列中的多个单词。

在步骤202，将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配，以确定所述用户句子序列是否为歧义句子。

使用训练集对G进行预训练，以最大似然估计作为优化目标；

图3为根据本发明实施方式的对话系统的智能澄清模型的算法结构图。如图3所示，本发明实施方式提供的智能澄清模型的算法，包括两部分：歧义句子识别和多意图识别及澄清方面。其中，对于歧义句子的识别部分，采用适用于文本领域的SeqGAN生成模型，它的主要结构包括一个生成器(Generator，G)和一个判别器D(Discriminator，D)，在网络的训练过程中，G和D处在对抗博弈中，G的作用是生成歧义句子，使得生成的句子和真实的句子相似，D的作用则是找到生成句子和真实句子之间的差异，反过来再优化G，最终的目标是学习到可以生成目标句子的生成器G，以及识别目标句子的判别器D。最终的目标是生成具有判别歧义句子能力的判别器D和学习到歧义句子概率分布的生成器G。

在本发明的实施方式中，SeqGAN主要由生成器G和判别器D构成，生成器一般选择循环神经网络，采用LSTM作为基础单元结构。对于输入的文本序列，首先得到序列中单词的embedding表示(x₁,x₂,...x_T)，经过隐含层函数g的映射(可包含多个隐含层)，得到隐含层状态序列(h₁,h₂,...h_T)，其中，h_t＝g(h_t-1,x_t)。更进一步，在得到隐含层状态序列后，加上softmax层，输出关于预测词y_t的概率分布p(y_t|x₁,...,x_t)＝z(h_t)＝softmax(c+Vh_t)。对于判别器D，可采用卷积神经网络(Convolutional neural network,CNN)来做文本句子的分类。

具体地，在SeqGAN模型的训练过程中，G和D以相互博弈的方式进行互相提升模型效果。训练步骤如下：

S1,收集对话数据中，用户带歧义的句子语料作为模型的训练集{s₁,s₂,...,s_n},其中每个s_i为句子序列，表示s_i＝{x_1:T},x_j表示句子中的单个词；

S2,使用训练集对G进行预训练，以最大似然估计作为优化目标；

S3,使用预训练的G生成一堆负样本，结合真实的歧义句子对D进行预训练，D训练以交叉熵作为优化目标；

S4,G和D相互博弈优化阶段，直到SeqGAN达到收敛。

本发明实施方式提供的SeqGAN模型和通用的生成对抗网络(GenerativeAdversarial Networks,GAN)主要的区别在于，后者只能用来处理连续数据，如图像，而文本的向量是离散数据则不能适用。SeqGAN相比于GAN，通过使用强化学习中的优化方法来更新梯度，解决了GAN不能处理离散数据的问题。

在对获取的用户句子序列后，通过训练好的SeqGAN模型即可获取单词，并通过将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配，即可确定所述用户句子序列是否为歧义句子。

在步骤203，当所述用户句子序列为歧义句子时，以中文的结束标点符号为切分依据，对所述用户句子序列进行分句处理，以获取切分子句。

在步骤204，计算切分子句的向量与预设的意图语料库中每个意图类别的加权平均向量的相似度，根据所述相似度确定切分子句的意图。

优选地，其中所述方法还包括：

其中，

为多个文本

的加权平均向量；

表示第i类意图的第j个用户表达，BERT

为文本

对应的相量；i∈{1,2,...m},j∈{1,2,...n}。

图3中的第二部分是意图的识别及澄清方法。在此过程中，首先需要建立一个意图分类语料库，里面存贮着每种意图下，用户常见的表达如表1所示。

表1意图分类语料库示例

表1中列举了两种意图，分别是找餐馆和打印机报修意图下用户常用的表达语句。可由此扩展为多种意图下，收集对应意图下的用户常用语句。

表示第i类意图的第j个用户表达，其中i∈{1,2,...m},j∈{1,2,...n}。

在本发明的实施方式中，对于文本

的向量表示，采用2018年Google新提出的BERT预训练模型，该模型在大量的文本语料上进行无监督学习，可学习到不同语境下句子的向量表示。针对每种意图，可以利用如下公式确定求出对应的加权平均向量

为：

当第一部分识别出带歧义的用户句子，传送到第二部分时，需对句子进行意图的识别。设待识别的歧义句子为S,使用python中的split()函数，切分依据为中文的结束标点符号,主要包括逗号，句号，问好，感叹号等。

如图5所示，对于左边的例子：“走路走的好累啊，这会肚子咕咕叫，等会想去看个电影？”。这句话可得到三个切分子句，分别是：x₁＝“走路走的好累啊”(意图为打车)；x₂＝“这会肚子咕咕叫”(意图为订餐馆)；以及x₃＝“等会去看个电影？”(意图为订电影票)。

然后，对于每个切分子句x_p，使用BERT预训练模型获得对应的向量BERT(x_p)，计算气氛子句的向量与语料库中每个意图类别的平均向量求相似度，设定预设阈值thre。最后根据公式

确定切分子句的意图。其中，对于相似度simi大于阈值的意图，取最大相似度对应的意图种类，确定为子句对应要表达的意图。

图4为根据本发明实施方式的智能澄清模型的总体流程图。如图4所示，本发明提出的智能澄清模型，主要包括两部分的核心算法，首先是用户输入文本，经过歧义句子识别模型，目标是在人机对话中识别出歧义句子；然后，进入多意图识别及澄清，就是对歧义句子进行多意图的分类，给出对应的澄清话术，可进一步提升用户的满意度。图5为本发明实施方式的智能澄清的效果图。如图5所示，图5左边表明本发明能够对用户句子包含的多意图进行澄清，图5右边表明本发明能够对用户表达真实意图时，说的较多无用话进行澄清。

图6为根据本发明实施方式的对话系统的语句智能澄清系统600的结构示意图。如图6所示，本发明实施方式提供的对话系统的语句智能澄清系统600，包括：分词单元601、歧义句子确定单元602、切分子句获取单元603和意图确定单元604。

优选地，所述分词单元601，用于对获取的用户句子序列进行分词处理，以获取所述用户句子序列中的多个单词。

优选地，所述歧义句子确定单元602，用于将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配，以确定所述用户句子序列是否为歧义句子。

优选地，其中所述歧义句子确定单元602，将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配，以确定所述用户句子序列是否为歧义句子，包括：

使用训练集对G进行预训练，以最大似然估计作为优化目标；

优选地，所述切分子句获取单元603，用于当所述用户句子序列为歧义句子时，以中文的结束标点符号为切分依据，对所述用户句子序列进行分句处理，以获取切分子句。

优选地，所述意图确定单元604，用于计算切分子句的向量与预设的意图语料库中每个意图类别的加权平均向量的相似度，根据所述相似度确定切分子句的意图。

优选地，其中所述系统还包括：加权平均向量确定单元，用于基于BERT训练模型确定预设的意图语料库中每个意图类别的加权平均向量，包括：

其中，

为多个文本

的加权平均向量；

表示第i类意图的第j个用户表达，BERT

为文本

对应的相量；i∈{1,2,...m},j∈{1,2,...n}。

优选地，其中所述意图确定单元604，根据所述相似度确定切分子句的意图，包括：

本发明的实施例的对话系统的语句智能澄清系统600与本发明的另一个实施例的对话系统的语句智能澄清方法100相对应，在此不再赘述。

已经通过参考少量实施方式描述了本发明。然而，本领域技术人员所公知的，正如附带的专利权利要求所限定的，除了本发明以上公开的其他的实施例等同地落在本发明的范围内。

通常地，在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释，除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例，除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行，除非明确地说明。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。