CN106649694A

CN106649694A - 语音交互中确定用户意图的方法及装置

Info

Publication number: CN106649694A
Application number: CN201611178869.0A
Authority: CN
Inventors: 崇伟峰
Original assignee: Beijing Yunzhisheng Information Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2016-12-19
Filing date: 2016-12-19
Publication date: 2017-05-10
Anticipated expiration: 2036-12-19
Also published as: CN106649694B

Abstract

本发明是关于一种语音交互中确定用户意图的方法及装置，其中，方法包括：接收用户当前输入的语音数据信息；对所述语音数据信息进行识别，得到所述语音数据信息对应的文本数据信息；获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵；根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别；在所述目标意图类别对应的数据库中查找与所述文本数据信息对应的应答信息。通过该技术方案，不但可以为用户提供更准确的应答信息，还可以减少查找时间，提高查找效率，提升用户的使用体验。

Description

语音交互中确定用户意图的方法及装置

技术领域

本发明涉及数据分类技术领域，尤其涉及一种语音交互中确定用户意图的方法及装置。

背景技术

相关技术中，当终端等设备接收到用户输入的语音查询请求时，会根据该查询请求从预设数据库中查找与该请求对应的答案或者回复，但在整个预设数据库中进行查找，不但不能保证查找到的答案或者回复的准确性，而且查找时间也相对较长。

发明内容

本发明实施例提供一种语音交互中确定用户意图的方法及装置，用以实现在保证查找的答案或者回复的准确率的基础上，提高查找效率，从而提升用户的使用体验。

根据本发明实施例的第一方面，提供一种语音交互中确定用户意图的方法，包括：

接收用户当前输入的语音数据信息；

对所述语音数据信息进行识别，得到所述语音数据信息对应的文本数据信息；

获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵；

根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别；

在所述目标意图类别对应的数据库中查找与所述文本数据信息对应的应答信息。

在该实施例中，在接收到用户当前输入的语音数据信息后，先确定语音数据信息对应的文本数据信息所属的目标意图类别，进而在目标意图类别对应的数据中查找与其对应的应答信息，这样，不但可以为用户提供更准确的应答信息，还可以减少查找时间，提高查找效率，提升用户的使用体验。

在一个实施例中，所述获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵，包括：

获取预设的卷积神经网络模型和预设的转移概率矩阵；

根据预设的文本模板从所述日志记录中提取出意图分类训练语料；

利用所述意图分类训练语料和所述预设的卷积神经网络模型进行训练，得到所述用户意图分类模型；

利用预设上下文训练语料和预设的转移概率矩阵进行训练，得到初始转移概率矩阵；

利用所述日志记录修正所述初始概率矩阵，得到所述目标转移概率矩阵。

在该实施例中，利用所述意图分类训练语料和所述预设的卷积神经网络模型进行训练，得到所述用户意图分类模型，利用预设上下文训练语料和预设的转移概率矩阵进行训练，得到初始转移概率矩阵，并根据用户意图历史日志记录修正初始转移概率矩阵得到目标转移概率矩阵，这样，根据用户意图分类模型和目标转移概率矩阵进行意图分类，可以保证分类结果的准确性。

在一个实施例中，所述文本数据信息包括以下至少一项：文本信息和拼音信息；

所述意图分类训练语料包括以下至少一种形式：

文本语料和拼音预料。

在该实施例中，在进行卷积神经网络训练时，不但可以采用训练语料的文本形式进行训练，还可以采用训练语料的拼音形式进行训练，这样，可以有效的过滤噪音，避免错误累积。

在一个实施例中，所述根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别，包括：

将所述文本数据信息作为所述用户意图分类模型的输入，得到所述文本数据信息对应的第一分类结果；

获取所述文本数据信息对应的上一句文本数据信息所属的意图类别；

根据所述上一句文本数据信息所属的意图类别和所述目标转移概率矩阵，确定所述文本数据信息对应的第二分类结果；

根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类。

在一个实施例中，所述根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类，包括：

根据所述第一分类结果和所述第二分类结果的乘积，确定所述文本数据信息所属的目标意图分类。

在该实施例中，将文本数据信息作为用户意图分类模型的输入，得到文本数据信息对应的第一分类结果，该第一分类结果表明文本数据信息属于各个意图分类的概率，其是一个1*N维的特征向量，并根据上一句文本数据信息和目标转移概率矩阵计算出文本数据信息属于每个意图类别的概率矩阵，该矩阵可以是N*N维的，进而根据两者的乘积得到文本数据信息属于每个意图类别的总概率，进而将总概率值最高对应的意图类别确定为目标意图类别。

根据本发明实施例的第二方面，提供一种语音交互中确定用户意图的装置，包括：

接收模块，用于接收用户当前输入的语音数据信息；

识别模块，用于对所述语音数据信息进行识别，得到所述语音数据信息对应的文本数据信息；

获取模块，用于获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵；

确定模块，用于根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别；

查找模块，用于在所述目标意图类别对应的数据库中查找与所述文本数据信息对应的应答信息。

在一个实施例中，所述获取模块包括：

第一获取子模块，用于获取预设的卷积神经网络模型和预设的转移概率矩阵；

提取子模块，用于根据预设的文本模板从所述日志记录中提取出意图分类训练语料；

第一训练子模块，用于利用所述意图分类训练语料和所述预设的卷积神经网络模型进行训练，得到所述用户意图分类模型；

第二训练子模块，用于利用预设上下文训练语料和预设的转移概率矩阵进行训练，得到初始转移概率矩阵；

修正子模块，用于利用所述日志记录修正所述初始概率矩阵，得到所述目标转移概率矩阵。

所述意图分类训练语料包括以下至少一种形式：

文本语料和拼音预料。

在一个实施例中，所述确定模块包括：

处理子模块，用于将所述文本数据信息作为所述用户意图分类模型的输入，得到所述文本数据信息对应的第一分类结果；

第二获取子模块，用于获取所述文本数据信息对应的上一句文本数据信息所属的意图类别；

第一确定子模块，用于根据所述上一句文本数据信息所属的意图类别和所述目标转移概率矩阵，确定所述文本数据信息对应的第二分类结果；

第二确定子模块，用于根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类。

在一个实施例中，所述第二确定子模块用于：

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种语音交互中确定用户意图的方法的流程图。

图2是根据一示例性实施例示出的一种语音交互中确定用户意图的方法中步骤S103的流程图。

图3是根据一示例性实施例示出的一种语音交互中确定用户意图的方法中步骤S104的流程图。

图4是根据一示例性实施例示出的一种语音交互中确定用户意图的装置的框图。

图5是根据一示例性实施例示出的一种语音交互中确定用户意图的装置中获取模块的框图。

图6是根据一示例性实施例示出的一种语音交互中确定用户意图的装置中确定模块的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种语音交互中确定用户意图的方法的流程图。该语音交互中确定用户意图的方法应用于终端设备中，该终端设备可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等任一具有语音识别功能的设备。如图1所示，该方法包括步骤S101-S105：

在步骤S101中，接收用户当前输入的语音数据信息；

在步骤S102中，对语音数据信息进行识别，得到语音数据信息对应的文本数据信息；

在步骤S103中，获取根据用户的日志记录得到的用户意图分类模型和目标转移概率矩阵；

其中，用户的日志记录可以是之前对语音数据信息进行意图分类的历史记录。而目标转移概率矩阵是根据语音数据信息的上文确定该语音数据信息属于某个意图类别的概率。即目标转移概率矩阵不关心当前的语音数据信息属于哪个意图类别，只获取上一个语音数据信息属于哪个意图类别。根据上一个语音数据信息的意图类别，预测当前的语音数据信息属于各个意图类别的概率。

在步骤S104中，根据用户意图分类模型和目标转移概率矩阵确定文本数据信息所属的目标意图类别；

在步骤S105中，在目标意图类别对应的数据库中查找与文本数据信息对应的应答信息。

如图2所示，在一个实施例中，上述步骤S103包括步骤S201-S205：

在步骤S201中，获取预设的卷积神经网络模型和预设的转移概率矩阵；

在步骤S202中，根据预设的文本模板从日志记录中提取出意图分类训练语料；

预设的文本模板是一类语言规范。利用模板从日志中提取出规范的语言，作为意图分类训练语料。一类模板提取出的语言用于训练相应的分类，因此，可以预设多类模板。

在步骤S203中，利用意图分类训练语料和预设的卷积神经网络模型进行训练，得到用户意图分类模型；

意图可以分层级的，如歌曲的意图，下面分搜歌曲、搜歌手、播放等意图，因此，意图分类训练语料是有层级的，训练出的用户意图分类模型也是有层级的。先训练出最下层的分类，逐层向上抽取，得到上层分类。每层训练时输入的语料是相同的，但是训练的目标是不同的，训练的参数和不变的参数是不同的。

在步骤S204中，利用预设上下文训练语料和预设的转移概率矩阵进行训练，得到初始转移概率矩阵；

在步骤S205中，利用日志记录修正初始概率矩阵，得到目标转移概率矩阵。

其中，可以先人为的用一些语料训练得到初始转移概率矩阵，后期针对每个用户的日志，可以不断的修正该用户的转移概率矩阵，得到与用户对应的目标转移概率矩阵。

在该实施例中，利用意图分类训练语料和预设的卷积神经网络模型进行训练，得到用户意图分类模型，利用预设上下文训练语料和预设的转移概率矩阵进行训练，得到初始转移概率矩阵，并根据用户意图历史日志记录修正初始转移概率矩阵得到目标转移概率矩阵，这样，根据用户意图分类模型和目标转移概率矩阵进行意图分类，可以保证分类结果的准确性。

意图分类训练语料包括以下至少一种形式：

文本语料和拼音预料。

如图3所示，在一个实施例中，上述步骤S104包括步骤S301-S304：

在步骤S301中，将文本数据信息作为用户意图分类模型的输入，得到文本数据信息对应的第一分类结果；

在步骤S302中，获取文本数据信息对应的上一句文本数据信息所属的意图类别；

在步骤S303中，根据上一句文本数据信息所属的意图类别和目标转移概率矩阵，确定文本数据信息对应的第二分类结果；

在步骤S304中，根据第一分类结果和第二分类结果确定文本数据信息所属的目标意图分类。

在一个实施例中，上述步骤S304可以包括：

根据第一分类结果和第二分类结果的乘积，确定文本数据信息所属的目标意图分类。

下述为本发明装置实施例，可以用于执行本发明方法实施例。

图4是根据一示例性实施例示出的一种语音交互中确定用户意图的装置的框图，该装置可以通过软件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图4所示，该语音交互中确定用户意图的装置包括：

接收模块41，用于接收用户当前输入的语音数据信息；

识别模块42，用于对所述语音数据信息进行识别，得到所述语音数据信息对应的文本数据信息；

获取模块43，用于获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵；

确定模块44，用于根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别；

查找模块45，用于在所述目标意图类别对应的数据库中查找与所述文本数据信息对应的应答信息。

如图5所示，在一个实施例中，所述获取模块43包括：

第一获取子模块51，用于获取预设的卷积神经网络模型和预设的转移概率矩阵；

提取子模块52，用于根据预设的文本模板从所述日志记录中提取出意图分类训练语料；

第一训练子模块53，用于利用所述意图分类训练语料和所述预设的卷积神经网络模型进行训练，得到所述用户意图分类模型；

第二训练子模块54，用于利用预设上下文训练语料和预设的转移概率矩阵进行训练，得到初始转移概率矩阵；

修正子模块55，用于利用所述日志记录修正所述初始概率矩阵，得到所述目标转移概率矩阵。

所述意图分类训练语料包括以下至少一种形式：

文本语料和拼音预料。

如图6所示，在一个实施例中，所述确定模块44包括：

处理子模块61，用于将所述文本数据信息作为所述用户意图分类模型的输入，得到所述文本数据信息对应的第一分类结果；

第二获取子模块62，用于获取所述文本数据信息对应的上一句文本数据信息所属的意图类别；

第一确定子模块63，用于根据所述上一句文本数据信息所属的意图类别和所述目标转移概率矩阵，确定所述文本数据信息对应的第二分类结果；

第二确定子模块64，用于根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类。

在一个实施例中，所述第二确定子模块62用于：

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种语音交互中确定用户意图的方法，其特征在于，包括：

接收用户当前输入的语音数据信息；

2.根据权利要求1所述的方法，其特征在于，所述获取根据所述用户的日志记录得到的用户意图分类模型和目标转移概率矩阵，包括：

获取预设的卷积神经网络模型和预设的转移概率矩阵；

3.根据权利要求1所述的方法，其特征在于，所述文本数据信息包括以下至少一项：文本信息和拼音信息；

所述意图分类训练语料包括以下至少一种形式：

文本语料和拼音预料。

4.根据权利要求1所述的方法，其特征在于，所述根据所述用户意图分类模型和所述目标转移概率矩阵确定所述文本数据信息所属的目标意图类别，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述第一分类结果和所述第二分类结果确定所述文本数据信息所属的目标意图分类，包括：

6.一种语音交互中确定用户意图的装置，其特征在于，包括：

接收模块，用于接收用户当前输入的语音数据信息；

7.根据权利要求6所述的装置，其特征在于，所述获取模块包括：

8.根据权利要求6所述的装置，其特征在于，所述文本数据信息包括以下至少一项：文本信息和拼音信息；

所述意图分类训练语料包括以下至少一种形式：

文本语料和拼音预料。

9.根据权利要求6所述的装置，其特征在于，所述确定模块包括：

10.根据权利要求9所述的装置，其特征在于，所述第二确定子模块用于：