CN112100328B

CN112100328B - 一种基于多轮对话的意向判断方法

Info

Publication number: CN112100328B
Application number: CN202010898841.4A
Authority: CN
Inventors: 陈开冉; 黎展; 周捷光
Original assignee: Guangzhou Tungee Technology Co ltd
Current assignee: Guangzhou Tungee Technology Co ltd
Priority date: 2020-08-31
Filing date: 2020-08-31
Publication date: 2023-05-30
Anticipated expiration: 2040-08-31
Also published as: CN112100328A

Abstract

本发明实施例提供了一种基于多轮对话的意向判断方法、装置、可读存储介质及计算设备，基于深度学习的二阶transformer的方法进行对话的意向判断，不依赖于人为制定的特征以及系统中其他上游模型、决策系统的特征，能有效减少系统累计错误，提高特征抽取能力，并且提高了样本利用率。方法包括：将对话输入训练后的模型；所述模型包括transformer‑A结构、transformer‑B结构和第一二分类网络；所述模型的transformer‑A结构获取所述对话的单句特征；所述模型的transformer‑B结构根据所述对话的单句特征，提取所述对话的多轮对话特征；所述模型的第一二分类网络根据所述对话的多轮对话特征，输出所述用户的意向判断结果；其中，所述意向判断结果包括有意向或者没有意向。

Description

一种基于多轮对话的意向判断方法

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于多轮对话的意向判断方法、装置、可读存储介质及计算设备。

背景技术

客服对话机器人帮助人类接待客户，语音机器人帮助销售寻找线索等售前类对话机器人的应用已经越来越普遍，通过对意向客户进行判别，可以减少人力成本，提高人类的工作效率。

当前的意向判断方案一般是根据人为先验知识定义规则，来检测对话中特定的显性或隐形特征，并通过一套组合规则来将符合条件的对话作为意向对话。

更进一步地，也可以通过标注对话的真实意向，由工程师定义特征，来训练一个机器学习模型对对话进行意向判断。

现有技术存在如下缺点：

1、人工规则的制定难以标准化，导致判断精度下降，召回较低。

2、特征的制定依赖于上游模型和系统上游决策信息的表现，导致错误累计。

3、不同行业和领域间迁移成本较大，样本利用率过低。

发明内容

为此，本发明提供了一种基于多轮对话的意向判断方法、装置、可读存储介质及计算设备，以力图解决或者至少缓解上面存在的至少一个问题。

根据本发明实施例的一个方面，提供了一种基于多轮对话的意向判断方法，包括：

将用户与智能机器人的对话输入训练后的模型；所述模型包括transformer-A结构、transformer-B结构和第一二分类网络；

所述模型的transformer-A结构获取所述用户与智能机器人的对话的单句特征；

所述模型的transformer-B结构根据所述用户与智能机器人的对话的单句特征，提取所述用户与智能机器人的对话的多轮对话特征；

所述模型的第一二分类网络根据所述用户与智能机器人的对话的多轮对话特征，输出所述用户的意向判断结果；其中，所述意向判断结果包括有意向或者没有意向。

可选地，对所述模型进行训练，包括：

获取预设第一组数的多个行业领域的对话；所述多个行业领域的对话被标注为有意向或者没有意向；

根据所述多个行业领域的对话，对预训练后的所述模型进行训练。

可选地，对预训练后的所述模型进行训练之后，还包括：

获取预设第二组数的指定行业领域的对话；所述指定行业领域的对话被标注为有意向或者没有意向；

根据所述指定行业领域的对话，对预训练后的所述模型进行微调；

所述第二组数少于所述第一组数。

可选地，对预训练后的所述模型进行微调，包括：

固定预训练后的所述模型的transformer-A结构和transformer-B结构，对预训练后的所述模型的第一二分类网络进行微调。

可选地，对所述模型进行预训练，包括：

对所述模型的transformer-A结构进行预训练；

以及，对所述模型的transformer-B结构进行预训练。

可选地，对所述模型的transformer-A结构进行预训练，包括：

获取无标注的对话数据；

根据所述无标注的对话数据，对所述模型的transformer-A结构进行预训练。

可选地，对所述模型的transformer-B结构进行预训练，包括：

获取历史记录中的规则系统的标签数据；

获取历史记录中的用户与智能机器人的对话的人工跟进结果；

根据所述规则系统的标签数据，对第二二分类网络进行训练；

根据所述人工跟进结果，对第三二分类网络进行训练；

根据所述第二二分类网络和所述第三二分类网络，对所述模型的transformer-B结构进行预训练。

根据本发明的又一方面，提供一种基于多轮对话的意向判断装置，包括：

对话提取单元，用于将用户与智能机器人的对话输入训练后的模型；所述模型包括transformer-A结构、transformer-B结构和第一二分类网络；

模型分析单元，用于通过所述transformer-A结构获取所述用户与智能机器人的对话的单句特征；通过所述transformer-B结构，根据所述用户与智能机器人的对话的单句特征，提取所述用户与智能机器人的对话的多轮对话特征；通过所述第一二分类网络，根据所述用户与智能机器人的对话的多轮对话特征，输出所述用户的意向判断结果；其中，所述意向判断结果包括有意向或者没有意向。

根据本发明的又一方面，提供一种可读存储介质，其上具有可执行指令，当可执行指令被执行时，使得计算机执行上述的对话的意向判断方法。

根据本发明的又一方面，提供一种计算设备，包括：一个或多个处理器；存储器；以及一个或多个程序，其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行上述的对话的意向判断方法。

本发明提供的技术方案，将用户与智能机器人的对话输入训练后的模型；所述模型包括transformer-A结构、transformer-B结构和第一二分类网络，所述模型的transformer-A结构获取所述用户与智能机器人的对话的单句特征，所述模型的transformer-B结构根据所述用户与智能机器人的对话的单句特征，提取所述用户与智能机器人的对话的多轮对话特征，所述模型的第一二分类网络根据所述用户与智能机器人的对话的多轮对话特征，输出所述用户的意向判断结果；其中，所述意向判断结果包括有意向或者没有意向。本发明基于深度学习的二阶transformer的方法，对人机交互中的句子和多轮对话进行建模，不依赖于人为制定的特征以及系统中其他上游模型、决策系统的特征，通过深度学习的强大的特征抽取能力进行模型训练，能够有效利用历史数据中的大量无标注数据，达到很好的意向判断效果。

附图说明

附图示出了本发明的示例性实施方式，并与其说明一起用于解释本发明的原理，其中包括了这些附图以提供对本发明的进一步理解，并且附图包括在本说明书中并构成本说明书的一部分。

图1是示例性的计算设备的结构框图；

图2是根据本发明实施例的一种基于多轮对话的意向判断方法的流程示意图；

图3是根据本发明实施例的模型架构示意图；

图4是根据本发明实施例的一种基于多轮对话的意向判断装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本发明，并且能够将本发明的范围完整的传达给本领域的技术人员。

图1是布置为实现根据本发明的一种基于多轮对话的意向判断方法的示例计算设备100的框图。在基本的配置102中，计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。

取决于期望的配置，处理器104可以是任何类型的处理，包括但不限于：微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用，或者在一些实现中，存储器控制器118可以是处理器104的一个内部部分。

取决于期望的配置，系统存储器106可以是任意类型的存储器，包括但不限于：易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个程序122以及程序数据124。在一些实施方式中，程序122可以被配置为在操作系统上由一个或者多个处理器104利用程序数据124执行指令。

计算设备100还可以包括有助于从各种接口设备(例如，输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示终端或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156，它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如，键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160，其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块，并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号，它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例，通信介质可以包括诸如有线网络或者专线网络之类的有线介质，以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。

计算设备100可以实现为小尺寸便携(或者移动)电子设备的一部分，这些电子设备可以是诸如蜂窝电话、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机、服务器、由多台计算机组成的集群中的虚拟计算设备。

其中，计算设备100的一个或多个程序122包括用于执行根据本发明的一种基于多轮对话的意向判断方法的指令。

图1示例性示出根据本发明的一种基于多轮对话的意向判断方法的流程图，方法始于步骤S210。

在步骤S210中，将用户与智能机器人的对话输入训练后的模型；模型包括transformer-A结构、transformer-B结构和第一二分类网络。

本发明实施例提供了一个三层模型，包括transformer-A结构、transformer-B结构和第一二分类网络。针对该三层模型的训练包括预训练和训练两个步骤。

其中，模型的预训练的步骤包括：对模型的transformer-A结构进行预训练；以及，对模型的transformer-B结构进行预训练。

具体地，对模型的transformer-A结构进行预训练，包括：获取无标注的对话数据；根据无标注的对话数据，对模型的transformer-A结构进行预训练。

无标注的对话数据比较容易获得，数据量也很大，通过使用大量的无标注的对话数据对transformer-A结构进行预训练，可以提高模型对句子内的特征抽取能力。

具体地，对模型的transformer-B结构进行预训练，包括：获取历史记录中的规则系统的标签数据；获取历史记录中的用户与智能机器人的对话的人工跟进结果；根据规则系统的标签数据，对第二二分类网络进行训练；根据人工跟进结果，对第三二分类网络进行训练；根据第二二分类网络和第三二分类网络，对模型的transformer-B结构进行预训练。

通过构建两个二分类网络，充分利用历史规则和历史人工跟进结果对transformer-B结构进行预训练，从而提高了模型对对话的多轮对话特征的抽取能力。

此外，模型的训练步骤包括：获取预设第一组数的多个行业领域的对话；多个行业领域的对话被标注为有意向或者没有意向；根据多个行业领域的对话，对预训练后的模型进行训练。

由于各个行业领域的带标注的对话数据是有限的，因此，需要先利用大量的公开对话数据和语料数据进行预训练，再进行训练，从而提高最终训练的效果。又由于各个行业内的对话具有其行业特点，因此在模型训练时需要同时使用各个行业的对话数据进行训练，提高模型在各个行业的适用性。

进一步地，对预训练后的模型进行训练之后，还包括：获取预设第二组数的指定行业领域的对话；指定行业领域的对话被标注为有意向或者没有意向；根据指定行业领域的对话，对预训练后的模型进行微调。

如前文所述，在模型训练时是使用了各个行业的对话数据进行训练，以提高模型在各个行业的适用性。进而，模型在某个行业进行应用之前，还要使用该行业的对话数据对模型进行微调，微调过程中使用少量有标注的垂直领域对话数据即可。

本发明实施例提供的模型的微调方法包括：固定预训练后的模型的transformer-A结构和transformer-B结构，对预训练后的模型的第一二分类网络进行微调。

随后，在步骤S220中，模型的transformer-A结构获取用户与智能机器人的对话的单句特征。

随后，在步骤S230中，模型的transformer-B结构根据用户与智能机器人的对话的单句特征，提取用户与智能机器人的对话的多轮对话特征。

随后，在步骤S240中，模型的第一二分类网络根据用户与智能机器人的对话的多轮对话特征，输出用户的意向判断结果；其中，意向判断结果包括有意向或者没有意向。

图3是本发明实施例提供的模型架构示意图，其中，TA表示transformer-A，TB表示transformer-B，S[i]表示对话中的第i个句子，vec[i]表示S[i]经过TA之后的句子向量。

根据本发明又一实施例，提供了一种对话的意向判断方法，包括：

步骤1、模型预训练：

带意向标注的数据非常稀缺，因此将使用transformer原预训练方法结合一种弱标签的方法对模型进行预训练。

步骤1.1、对于句子表征的transformer-A结构：使用维基百科的语料和历史大量的不带标签的对话数据进行模型预训练。

步骤1.2、对于对话表征的transformer-B结构的预训练:在transformer后面接上两个二分类分类网络。一个分类网络使用历史规则系统的标签进行训练，判断模型是否有意向；另外一个分类网络使用历史人工跟进结果进行训练,判断对话跟进后的反馈是否值得跟进。

步骤2、模型训练：

步骤2.1、随机抽取10000组不同行业领域的对话，对其进行标注，标注为有意向或者无意向。

步骤2.2、在对话表征的transformer-B层后面接上一个二分类网络构成新的模型(为transformer-A+transformer-B+二分类网络)。然后使用标注好的数据对模型进行训练即可。

步骤3、模型微调(fine-tune)：

在步骤2.2中训练好的模型虽然已经可以作为最终的版本使用，但是为了模型能够在更多的领域行业中表现更好，会标注少量的数据(100条)进行模型微调。

具体为固定住transformer-A+transformer-B，只对二分类网络进行微调。

本发明实施例中，使用二阶transformer结构分别对句子层面和多轮对话层面分别进行表征，能有效减少系统累计错误，提高特征抽取能力。使用了弱标签方法的训练能够有效利用历史中大量无标签数据。并且最后基于特定领域的模型fine-tune能够进一步提高模型在特定领域的效果。

参见图4，本发明实施例还提供了一种基于多轮对话的意向判断装置，包括：

对话提取单元410，用于将用户与智能机器人的对话输入训练后的模型；模型包括transformer-A结构、transformer-B结构和第一二分类网络；

模型分析单元420，用于通过transformer-A结构获取用户与智能机器人的对话的单句特征；通过transformer-B结构，根据用户与智能机器人的对话的单句特征，提取用户与智能机器人的对话的多轮对话特征；通过第一二分类网络，根据用户与智能机器人的对话的多轮对话特征，输出用户的意向判断结果；其中，意向判断结果包括有意向或者没有意向。

可选地，装置还包括：模型训练单元，用于获取预设第一组数的多个行业领域的对话；多个行业领域的对话被标注为有意向或者没有意向；根据多个行业领域的对话，对预训练后的模型进行训练。

可选地，模型训练单元还用于：获取预设第二组数的指定行业领域的对话；指定行业领域的对话被标注为有意向或者没有意向；根据指定行业领域的对话，对预训练后的模型进行微调。

模型训练单元用于对预训练后的模型进行微调时，具体用于：固定预训练后的模型的transformer-A结构和transformer-B结构，对预训练后的模型的第一二分类网络进行微调。

可选地，装置还包括：模型预训练单元，用于对模型的transformer-A结构进行预训练；以及，对模型的transformer-B结构进行预训练。

可选地，模型预训练单元用于对模型的transformer-A结构进行预训练时，具体用于：获取无标注的对话数据；根据无标注的对话数据，对模型的transformer-A结构进行预训练。

可选地，模型预训练单元用于对模型的transformer-B结构进行预训练时，具体用于：获取历史记录中的规则系统的标签数据；获取历史记录中的用户与智能机器人的对话的人工跟进结果；根据规则系统的标签数据，对第二二分类网络进行训练；根据人工跟进结果，对第三二分类网络进行训练；根据第二二分类网络和第三二分类网络，对模型的transformer-B结构进行预训练。

应当理解，这里描述的各种技术可结合硬件或软件，或者它们的组合一起实现。从而，本发明的方法和设备，或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介，例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式，其中当程序被载入诸如计算机之类的机器，并被该机器执行时，该机器变成实践本发明的设备。

在程序代码在可编程计算机上执行的情况下，计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件)，至少一个输入装置，和至少一个输出装置。其中，存储器被配置用于存储程序代码；处理器被配置用于根据该存储器中存储的该程序代码中的指令，执行本发明的各种方法。

以示例而非限制的方式，计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据，并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。

应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该发明的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面发明的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所发明的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中，或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中发明的所有特征以及如此发明的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中发明的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

此外，所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此，具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外，装置实施例的在此所述的元素是如下装置的例子：该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样，除非另行规定，使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例，并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。此外，应当注意，本说明书中使用的语言主要是为了可读性和教导的目的而选择的，而不是为了解释或者限定本发明的主题而选择的。因此，在不偏离所附权利要求书的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围，对本发明所做的发明是说明性的，而非限制性的，本发明的范围由所附权利要求书限定。

Claims

1.一种基于多轮对话的意向判断方法，其特征在于，包括：

获取无标注的对话数据；根据所述无标注的对话数据，对模型的transformer-A结构进行预训练；

获取历史记录中的规则系统的标签数据；获取历史记录中的用户与智能机器人的对话的人工跟进结果；根据所述规则系统的标签数据，对第二二分类网络进行训练；根据所述人工跟进结果，对第三二分类网络进行训练；根据所述第二二分类网络和所述第三二分类网络，对所述模型的transformer-B结构进行预训练；

2.如权利要求1所述的方法，其特征在于，对所述模型进行训练，包括：

3.如权利要求2所述的方法，其特征在于，对预训练后的所述模型进行训练之后，还包括：

所述第二组数少于所述第一组数。

4.如权利要求3所述的方法，其特征在于，对预训练后的所述模型进行微调，包括：

5.一种基于多轮对话的意向判断装置，其特征在于，包括：

对话提取单元，用于获取无标注的对话数据；根据所述无标注的对话数据，对模型的transformer-A结构进行预训练；获取历史记录中的规则系统的标签数据；获取历史记录中的用户与智能机器人的对话的人工跟进结果；根据所述规则系统的标签数据，对第二二分类网络进行训练；根据所述人工跟进结果，对第三二分类网络进行训练；根据所述第二二分类网络和所述第三二分类网络，对所述模型的transformer-B结构进行预训练；将用户与智能机器人的对话输入训练后的模型；所述模型包括transformer-A结构、transformer-B结构和第一二分类网络；

6.一种可读存储介质，其特征在于，其上具有可执行指令，当可执行指令被执行时，使得计算机执行如权利要求1-4中的任一项所述的方法。

7.一种计算设备，其特征在于，包括：

一个或多个处理器；存储器；以及一个或多个程序，其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行如权利要求1-4中的任一项所述的方法。