CN112836025A

CN112836025A - 一种意图识别方法及装置

Info

Publication number: CN112836025A
Application number: CN201911158972.2A
Authority: CN
Inventors: 王芳; 程志飞; 林文辉; 王志刚; 孙科武; 杨硕; 赖新明; 王亚平
Original assignee: Aisino Corp
Current assignee: Aisino Corp
Priority date: 2019-11-22
Filing date: 2019-11-22
Publication date: 2021-05-25

Abstract

本申请涉及计算机技术领域，尤其涉及一种意图识别方法及装置，获取待识别对象的对话咨询信息；将所述对话咨询信息的文本输入到预先训练的意图识别模型中，获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值，其中，所述意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络；根据所述对应于各预设意图类别的概率值，确定所述待识别对象的意图类别，这样，能提升意图识别效率和准确性。

Description

一种意图识别方法及装置

技术领域

本申请涉及计算机技术领域，尤其涉及一种意图识别方法及装置。

背景技术

随着人工智能技术的飞速发展，纳税服务步入“互联网+税务”的智能化时代，通过人工智能和机器学习分析所有数据，在税务领域智能客服问答系统中，能够识别出用户的意图对于理解用户提出的问题以及欲求得到的帮助具有重要的意义，现有技术中，用户意图识别主要使用规则匹配和基于特征的机器学习，但现有技术中的这种方法机器学习采用的网络结构单一，准确性不高，并且扩展性较差。

发明内容

本申请实施例提供一种意图识别方法及装置，以提升用户意图识别准确性。

本申请实施例提供的具体技术方案如下：

一种意图识别方法，包括：

获取待识别对象的对话咨询信息；

将所述对话咨询信息的文本输入到预先训练的意图识别模型中，获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值，其中，所述意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络；

根据所述对应于各预设意图类别的概率值，确定所述待识别对象的意图类别。

可选的，所述卷积神经网络包括输入层、卷积层、池化层，则获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值，具体包括：

通过所述输入层将所述对话咨询信息的文本进行分词处理，并生成各分词对应的词向量；

通过所述卷积层对生成的各词向量进行特征提取，获得与所述各词向量对应的各卷积特征向量；

通过所述池化层将所述各卷积特征向量中各维度按照分词顺序进行组合，获得各重组后的卷积特征向量；

通过所述长短期记忆网络层将所述各重组后的卷积特征向量进行特征提取，并通过所述分类网络映射为一维向量，根据所述一维向量，确定所述对话咨询信息对应于各预设意图类别的概率值。

可选的，获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值，具体包括：

将所述对话咨询信息的文本进行分词处理，并生成各分词对应的词向量；

分别通过所述卷积神经网络和所述长短期记忆网络对生成的各词向量进行特征提取，获得各卷积特征向量和各全局特征向量；

将所述各卷积特征向量和所述各全局特征向量进行连接，并通过所述分类网络映射为一维向量，根据所述一维向量，确定所述对话咨询信息对应于各预设意图类别的概率值。

可选的，根据所述对应于各预设意图类别的概率值，确定所述待识别对象的意图类别，具体包括：

将所述对应于各预设意图类别的概率值中的最大值对应的意图类别，确定为所述待识别对象的意图类别。

可选的，所述各预设意图类别至少包括金融业务知识类、物联网业务知识类、金税业务知识类和其他业务知识类。

可选的，确定所述待识别对象的意图类别之后，进一步包括：

根据所述待识别对象的意图类别，确定对应的业务知识数据库；

从所述对应的业务知识数据库中确定与所述对话咨询信息对应的对话咨询答案；或，

根据所述对应的业务知识数据库，推荐与所述对话咨询信息关联的业务知识。

一种意图识别装置，包括：

获取模块，用于获取待识别对象的对话咨询信息；

处理模块，用于将所述对话咨询信息的文本输入到预先训练的意图识别模型中，获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值，其中，所述意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络；

第一确定模块，用于根据所述对应于各预设意图类别的概率值，确定所述待识别对象的意图类别。

可选的，所述卷积神经网络包括输入层、卷积层、池化层，则获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值时，处理模块具体用于：

可选的，获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值时，处理模块具体用于：

可选的，第一确定模块具体用于：

第二确定模块，用于根据所述待识别对象的意图类别，确定对应的业务知识数据库；

第三确定模块，用于从所述对应的业务知识数据库中确定与所述对话咨询信息对应的对话咨询答案；或，

一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述意图识别方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述意图识别方法的步骤。

本申请实施例中，获取待识别对象的对话咨询信息后，通过将对话咨询信息输入到预先训练的包括卷积神经网络、长短期记忆网络和分类网络的意图识别模型中，获得对话咨询信息对应与各预设意图类别的概率值，进而根据对应于各预设意图类别的概率值，确定待识别对象的意图类别，通过使用这种结合卷积神经网络、长短期记忆网络和分类网络的意图识别模型，不仅能够保证语序性，而且还能够增加意图识别的准确性。

附图说明

图1为本申请实施例中现有技术中人工神经网络的工作原理；

图2为本申请实施例中一种意图识别方法的流程图；

图3为本申请实施例中意图识别模型结构示意图；

图4为本申请实施例中另一种意图识别方法流程图；

图5为本申请实施例中意图识别装置结构示意图；

图6为本申请实施例中电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，并不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

随着人工智能技术的飞速发展，纳税服务步入“互联网+税务”的智能化时代，在这个智能化时代中，智能机器人对智能化起到了很大的作用，智能机器人不仅能够实时分析用户信息的数据，例如，能够实时分析用户身份信息数据、反馈信息数据、日期信息数据、时间信息数据、位置信息数据和其它信息的数据，还能够通过结合实时用户信息数据和存储在客户关系管理(Customer Relationship Management，CRM)系统中的客户关系信息数据，获知更多的客户需求。

并且通过人工智能和机器学习分析获取到的实时数据和本地客户信息数据，智能机器人还可以预测客户的更多的需求，例如，预测用户的“下一个问题”，也就是说，智能机器人不仅能够获知到用户实时信息数据，而且还能够预测到下一个最可能出现的用户实时数据需求，例如，如果纳税人已经咨询增值税办税步骤，并且咨询附近的办税厅，则智能机器人可以主动地提供办税厅的详细地址及营业时间及联系电话等信息，如果智能机器人遇到解决不了的问题，还可以将用户实时信息数据发送给指定的人工客服进行服务。

在现有技术的税务领域中，智能客服意图识别算法是基于规则分类和基于模型(机器学习或深度学习)进行意图识别的，例如，聊天机器人的一个基本机制是利用文本分类器进行意图识别的，参阅图1所示，为现有技术中人工神经网络(Artificial NeuralNetwork，ANN)的工作原理。人工神经网络使用2 层神经元(1个隐层)和词袋(bag ofwords)方法来组织训练数据。文本分类的方法有三种：模式匹配，传统算法和神经网络。虽然使用多项朴素贝叶斯 (Multinomial Naive Bayes，MNB)的算法是有效的，但现有技术中的这种方法，存在着一些问题，例如MNB算法的输出是一个分值，但是当输出一个分值时，有可能会忽略低于某个阈值的预测，这样，会导致意图识别的准确性大大降低，并且，MNB算法只能从分类的正例样本中学习模式，也就是说，通过MNB算法只能通过同一类别的样本得到用户意图，然而从分类的负例样本中得到用户意图，即无法根据不属于同一类别的样本中训练出用户意图，这样不平衡的训练数据会导致MNB分类器的分值扭曲，迫使算法按照不同分类的数据集的大小来调整分值，并且与朴素相对应，文本分类器并不是试图理解一个句子的意思，而只是进行分类，使用现有技术中的这种MNB算法也会降低意图识别的准确性。

本申请实施例中，提供了一种意图识别方法，获取待识别对象的对话咨询信息，并将待识别对象的对话咨询信息的文本输入到预先训练的包括卷积神经网络、长短期记忆网络和分类网络的意图识别模型中，然后意图识别模型能够将对话咨询信息的文本中的特征进行提取，并根据提取的特征确定对话咨询信息对应于各预设意图类别的概率值，进而能够根据对应于各预设意图类别的概率值，确定待识别对象的意图类别，通过这种方法，不仅能够文本的语序性，还可以根据输出的概率值确定最接近的意图类别，能够提高意图识别的准确性。

基于上述实施例，参阅图2所示，为本申请实施例中一种意图识别方法的流程图，具体包括：

步骤200：获取待识别对象的对话咨询信息。

本申请实施例中，在获取待识别对象的对话咨询信息时，可以通过用户输入的文本进而获取待识别对象的对话咨询信息，也可以通过例如录音功能获取待识别对象的对话咨询信息，本申请实施例中对获取待识别对象的对话咨询信息的方式并不进行限制。

进一步地，本申请实施例中在获取待识别对象的对话咨询信息时，可以为获取待识别对象的对话咨询信息设置时间区域值，例如，将时间区域值设置为 5秒，也就是说，获取待识别对象在5秒内输入的对话咨询信息，本申请实施例中对此并不进行限制。

步骤210：对对话咨询信息进行语义识别，确定对话咨询信息对应于各预设意图类别的概率值。

其中，各预设意图类别至少包括金融业务知识类、物联网业务知识类、金税业务知识类和其他业务知识类。

具体地，执行步骤210时，包括：

S1：将对话咨询信息的文本输入到预先训练的意图识别模型中。

其中，预先训练的意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络，卷积神经网络包括输入层、卷积层、池化层。

本申请实施例中，对话咨询信息的文本可以是待识别对象输入的问题，当接收到待识别对象输入的问题后，则将该问题输入到预先训练的意图识别模型中，本申请实施例中对此并不进行限制。

其中，待识别对象输入的问题可以是，例如，“POS机交易时密码键盘发出“嘀嘀嘀”的响声，导致交易无法完成，需要怎么处理”，本申请实施例中对此并不进行限制。

S2：获得意图识别模型对对话咨询信息的文本进行特征提取后，确定的对话咨询信息对应于各预设意图类别的概率值。

具体地，执行步骤S2时，提供了以下两种实施方式：

第一种实施方式：执行步骤S2时具体包括：

A1、通过输入层将对话咨询信息的文本进行分词处理，并生成各分词对应的词向量。

本申请实施例中，输入层包括一个向量空间模型，即word2vec，该word2vec 是用一个一层的神经网络把one-hot形式的稀疏词向量映射称为一个n维(n 一般为几百)的稠密向量的向量空间模型，因此，word2vec能够完成词向量表示，即将实际的文本内容变成计算机能识别的表示形式，即n维的词向量。

也就是说，在本申请实施例中，输入层将对话咨询信息的文本进行分词处理，将完整的对话咨询信息的文本分为一个一个分词，然后将分词经过 word2vec向量空间模型进行转换，将各分词转换为与其一一对应的各分词对应的词向量。

A2、通过卷积层对生成的各词向量进行特征提取，获得与各词向量对应的各卷积特征向量。

A3、通过池化层将各卷积特征向量中各维度按照分词顺序进行组合，获得各重组后的卷积特征向量。

本申请实施例中，经过卷积层后可以获得多个卷积结果，即各卷积特征向量，进而能够通过池化层对经过卷积层后得到的各卷积特征向量进行采样。

A4、通过长短期记忆网络层将各重组后的卷积特征向量进行特征提取，并通过分类网络映射为一维向量，根据一维向量，确定对话咨询信息对应于各预设意图类别的概率值。

其中，本申请实施例中的分类网络可以为softmax网络，softmax网络能够进行意图识别分类，完成意图识别。

本申请实施例中，首先长短期记忆网络层能够将各重组后的卷积特征向量进行特征提取，获得经由长短期记忆网络层输出的特征向量。

然后将经由长短期记忆网络层输出的特征向量经由全连接层映射得到输出向量，即一维向量，并根据一维向量，确定对话咨询信息对应于各预设意图类别的概率值。

例如，当输入的问题为“POS机交易时密码键盘发出“嘀嘀嘀”的响声，导致交易无法完成，需要怎么处理”时，该输入的问题经过特征提取和映射，确定出该输入的问题对应与各预设意图类别的概率值，即，金融业务知识类的概率值为60％，物联网业务知识类20％、金税业务知识类10％和其他业务知识类10％，本申请实施例中对此并不进行限制。

第二种实施方式：本申请实施例中，在执行步骤S2时，还可以具体包括：

A1、将对话咨询信息的文本进行分词处理，并生成各分词对应的词向量。

A2、分别通过卷积神经网络和长短期记忆网络对生成的各词向量进行特征提取，获得各卷积特征向量和各全局特征向量。

其中，长短期记忆网络能够捕捉时序信息。

A3、将各卷积特征向量和各全局特征向量进行连接，并通过分类网络映射为一维向量，根据一维向量，确定对话咨询信息对应于各预设意图类别的概率值。

步骤220：根据对应于各预设意图类别的概率值，确定待识别对象的意图类别。

执行步骤220时，具体包括：将对应于各预设意图类别的概率值中的最大值对应的意图类别，确定为待识别对象的意图类别。

本申请实施例中，可以将意图类别分为金融业务知识类、物联网业务知识类、金税业务知识类和其他业务知识类，本申请实施例中对意图类别的分类方式和种类并不进行限制。

例如，当输入的问题为“POS机交易时密码键盘发出“嘀嘀嘀”的响声，导致交易无法完成，需要怎么处理”，金融业务知识类的概率值为60％，物联网业务知识类20％、金税业务知识类10％和其他业务知识类10％，因此，概率值中的最大值为金融业务知识类，则能够确定待识别对象的意图类别为金融业务知识类，本申请实施例中对此并不进行限制。

本申请实施例中，执行步骤220后，即可以根据其意图类别，准确针对性地回复用户或推荐相关信息，具体地，本申请实施例中提供了几种可能的实施方式：

第一种方式：S1：根据待识别对象的意图类别，确定对应的业务知识数据库。

例如，确定待识别对象的意图类别为金融业务知识类，则能够确定对应的业务知识数据库为金融业务知识数据库，本申请实施例中对此并不进行限制。

S2：从对应的业务知识数据库中确定与对话咨询信息对应的对话咨询答案。

本申请实施例中的这种方法，当识别出意图后，到对应的意图识别库中查找答案，能够在一定程度上减少搜索时间。

例如，当确定为，则根据问题，确定对应的答案，根据问题“POS机交易时密码键盘发出“嘀嘀嘀”的响声，导致交易无法完成，需要怎么处理”对应的答案为“可能是POS机密码键盘故障，可联系服务热线进行报修”，本申请实施例中对此并不进行限制。

第二种方式：当确定出对应的业务知识数据库后，本申请实施例中还提供了另一种可能的实施方式，具体地，根据所对应的业务知识数据库，推荐与对话咨询信息关联的业务知识。

本申请实施例中，将获取到的待识别对象的对话咨询信息输入到预先训练的意图识别模型中，该意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络，通过结合卷积神经网络和长短期记忆网络结构，进而生成对话咨询信息对应与各预设意图类别的概率值，并确定待识别对象的意图类别，不仅能保证输入的对话咨询信息的文本的语序性，还能够提升意图识别的准确性。

基于上述实施例，参阅图3所示，为本申请实施例中意图识别模型结构示意图，该意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络。

其中，卷积神经网络结构中至少包括输入层、卷积层和池化连接层，长短期记忆网络结构中至少包括双向Bi-LSTM隐藏层、双向Bi-LSTM输出层、平均池化层和输出层。

本申请实施例中，意图识别模型中的卷积神经网络在提取卷积特征向量和关系抽取方法中占有很大的优势，并且，卷积神经网络是一种分层递归的网络结构。

输入层：用于将获取到的对话咨询信息的文本进行特征进行分词处理，并生成各分词对应的词向量。

本申请实施例中，利用向量空间模型word2vec训练方法完成词向量表示过程，即，将实际的文本内容变成计算机能识别的表示形式，在本申请实施例中，表现为将实际接收到的各分词转换为各分词向量。

具体地，本申请实施例中，提供了一种可能的实施方式，即对于给定各分词长度为n的对话咨询信息，生成各分词对应的词向量，则对话咨询信息可以表示为S＝x₁x₂,...,x_n，其中x_i代表对话咨询信息中第i个分词的词向量，本申请实施例中对此并不进行限制。

卷积层：用于对生成的各词向量进行特征提取，获得与各词向量对应的各卷积特征向量。

本申请实施例中，卷积层的作用是对输入的矩阵向量进行特征的提取，也就是说，卷积层是对生成的各词向量进行特征提取，本申请实施例中提供了一种可能的实施方式，即利用不同大小的过滤窗口提取各分词向量的特征，本申请实施例中对此并不进行限制。

具体地，假设通过滤波器将窗口大小设为m以及可加偏置进行卷积，而后由卷积核提取对话咨询信息的特征，则提取后的各卷积特征向量可以表示为：

c_i＝f(w·x_i:i+m-1+b)。

其中，c_i为经过卷积操作后对应的第i个特征值，f(·)为本层卷积核函数的选择，w为滤波器里的权重矩阵，其中w∈R^h*m，h*m为选取的滤波器的大小， b∈R为偏置矩阵，x_i:i+m-1为由对话咨询信息的文本中的第i个词到i+m-1个词的长度，采用多个滤波器来进行学习。经过卷积层后，得到特征矩阵c表示为： c＝[c₁,c₂,...,c_n-h+1]^T其中，c∈R^n-h+1。

池化连接层：用于将各卷积特征向量中各维度按照分词顺序进行组合，获得各重组后的卷积特征向量。

具体地，在通过卷积层的卷积操作后可以获得多个卷积结果，因此需要通过池化层对经过卷积层后得到的各卷积特征向量进行采样，本申请实施例中可以使用最大池化(max-pooling)的方法，并按照

取最大值，过滤出特征值中的最优特征进行卷积结果的合并处理。

池化连接层主要用来将局部的上下文特征向量映射成固定长度的全局特征向量，使得仅保留具备特征向量中最具代表性的特征。这样就能将多个特征合并为一个特征，实现了特征的聚合统计，降低了特征的维度，减少了优化的参数，从而利用输入数据提取出最优局部特征。

本申请实施例中，输入层、卷积层和池化连接层为CNN的结构部分，这三部分能够对对话咨询信息的文本进行深层特征提取并得到各卷积特征向量，利用的是CNN在关系抽取方法中的优势，但是若仅使用CNN，那么在特征提取过程中就无法能够很好地考虑输入的对话咨询信息的文本的语序问题，例如智能客服机器人输入的对话咨询信息，当智能客服机器人输入的对话咨询信息被转换为各词向量时，由于对话咨询信息的文本可能较短，且文本中的词语的先后语序关系对文本的实际含义影响较大，因此，当仅使用CNN确定意图类别时，可能会降低意图识别的准确性。

因此，为了更好地对文本语序关系建模，并且考虑到对话咨询信息的文本中的上下文语序关系会对语义的造成一定的影响，例如:“税盘一直用的很好，但是最近会报一个错误：...”这个对话咨询信息首先提到税盘的这个关键词，但是其实说的是软件报了一个错误，语义的重点是报错信息处。类似这种对话咨询信息在智能客服问答系统中有一定的占比，本申请实施例中结合了双向长短时记忆(Bi-directional Long Short-TermMemory，Bi-LSTM)网络，此网络考虑文本特性、用户的表达方式和特点等特征，符合意图识别的需求。Bi-LSTM 模型能有效解决长时依赖的问题，并且该Bi-LSTM模型能同时利用上下文对目标进行预测，Bi-LSTM模型不仅对文本的语序关系具有良好的建模能力，而且当用户输入的文本较长时，可以有效处理文本的长期依赖问题，并且，双向长短时记忆Bi-LSTM能访问过去的信息同时，访问未来的信息，可以从正向、反向两个方向提取句子中的词汇，予以信息得到更丰富、更深入的信息，对于用户识别意图是非常有益的，同时充分考虑后向语料对当前语料的语义影响性，进而能够使对话咨询信息更丰富，意图识别更准确。

本申请实施例中意图识别模型的长短期记忆网络具体包括：长短期记忆网络层。

进一步地，该长短期记忆网络中还可以包括输入层，该输入层与CNN中的输入层不同的是，生成的词向量是按照顺序依次送入到对应的Cell中，以保证用户文本的语序性。

长短期记忆网络层：用于将各重组后的卷积特征向量进行特征提取。

本申请实施例中，由双向Bi-LSTM隐藏层和双向Bi-LSTM输出层共同组成长短期记忆网络层。

进一步地，本申请实施例中，在长短期记忆网络层前，还可以包括Bi-LSTM 模型的输入层，该模型输入层与CNN中不同的是，词向量按照顺序依次送入到对应的Cell中，以保证用户文本的语序性。

本申请实施例中，长短期记忆网络层由一系列重复的记忆Cell组成，每一个Cell接收上一时刻隐层h_t-1的输出以及当前时刻的外部输入x_t。每一个Cell 由输入门i_t，遗忘门f_t和输出门o_t组成。其工作流程具体如下：

输入门选择需要记忆的信息，即控制当前输入x_t以及前一时刻隐层输出h_t-1进入新的Cell的信息量，公式i_t＝σ(w_i·x_t+w_i·h_t-1+b_i)，其中σ代表激活函数sigmoid，其通过非线性变化将结果映射到(0,1)区间内。

遗忘门选择需要遗忘的信息，公式f_t＝σ(w_f·x_t+w_f·h_t-1+b_f)。

Cell变换更新：变换输入和前一状态到最新状态，其中tanh代表双曲线正切函数。

q_t＝tanh(w_q·x_t+w_q·h_t-1+b_q)

输出门用来控制输出的信息量。

o_t＝σ(w_o·x_t+w_o·h_t-1+b_o)。

计算下一个时间戳的状态，如公式，其中

数组元素一起相乘运算。

最终的隐层输出：使用一个对当前状态的tanh变换进行重变换

Bi-LSTM模型是由t时刻的输入词x_t，细胞状态C_t，临时细胞状态

隐层状态h_t，遗忘门f_t，输入门i_t，输出门o_t组成。通过对细胞状态中信息遗忘和记忆新的信息使得对后续时刻计算有用的信息得以传递，而无用的信息被丢弃，并在每个时间步都会输出隐层状态h_t，其中遗忘，记忆与输出由通过上个时刻的隐层状态h_t-1和当前输入x_t计算出来的遗忘门f_t，输入门i_t，输出门o_t来控制。

当前单元状态C_t的生成是由通过计算之前单元状态的权重和由这个单元所生成的当前信息决定。对于很多对话咨询信息的文本的处理任务，考虑上下文信息是十分有必要的，由于Bi-LSTM网络通过引入第二层网络结构来扩展单向的LSTM网络，而隐藏的连接在相反的时间顺序流动。所以，Bi-LSTM可以利用前后文的对话咨询信息文本，保证了在时间序列上过去和未来的信息都能考虑，也就是说Bi-LSTM能访问过去的信息同时，访问未来的信息，可以从正向、反向两个方向提取对话咨询信息的文本中的各分词，能够得到更丰富、更深入的信息，这对于提升意图识别的准确性是非常有益的。

联合CNN及Bi-LSTM，利用CNN捕捉局部特征的优势以及Bi-LSTM能够捕捉时序信息的特点，其中，池化层将每个特征向量通过将卷积后的每个向量C_i，通过将卷积后的每个feature map第i维对应的元素顺序相连得到，如

得到n-h+1个卷积特征向量，每个特征向量根据卷积的先后顺序进行重新组合，保证文本的语序性。进而将特征向量依次送入Bi-LSTM 的Cell中，得到最后一个隐层h_t的输出作为最终的句子表示，交由Sogtmax层得到识别结果。

进一步地，本申请实施例中的意图识别模型还有平均池化层，能够将提取的各卷积特征向量进行采样。

输出层：即全连接层，将通过长短期记忆网络层将各重组后的卷积特征向量进行特征提取后的特征映射为一维向量，并根据一维向量，确定对话咨询信息对应于各预设意图类别的概率值。

在税务领域智能客服问答系统中，能够识别出用户的意图对于理解用户的提出的问题及欲求得到的帮助具有重要的意义，但是现有技术中的意图识别方法主要使用规则匹配和基于特征的机器学习，这种方法不仅费时费力，并且扩展性也较差。本申请实施例中采用的意图识别方法依旧将意图识别看成一个分类任务，意图识别库中对应的分类金融、金税、物联网及其他等专业知识分类。基于专业知识库分类管理方法，将意图识别看成为一个4分类的问题，使用本申请实施例中的这种方法，可以根据用户的意图类别，采取相应的场景或者业务的回复推荐策略，增强智能客服回复问答推荐的精度，识别出用户潜在的意图，针对性回复用户，推荐相关性较高的回复给用户，用户的满意度一定程度上得到提升，准确识别纳税人意图有助于了解纳税人潜在的需求，辅助事件预测以及判断事件走向，并且还可以提升意图识别的有效性和识别率。

通过本申请实施例中的这种方法将模型进行训练，能够获得意图识别库，该意图识别库中至少包括对应的问题、答案和意图类别，在使用的过程中，可以将获取到的对话咨询信息输入意图识别模型中，获得意图识别模型对对话咨询信息的文本进行特征提取后，确定对话咨询信息对应与各预设意图类别的概率值，并根据概率值中的最大值对应的意图类别，确定待识别对象的意图类别，即通过本申请实施例中的这种意图识别模型，能够根据纳税人咨询问答的过程中予以信息确定纳税人想咨询哪类知识，即判断纳税人在表达咨询的意图。表 1为本申请实施例中的意图识别库数据信息(现已存在相关知识7000余条、拓展问题11000多个)，本申请实施例中对意图识别库中的数据信息并不进行限制。

表1.

本申请实施例中的这种意图识别模型，是联合CNN及Bi-LSTM结合而成的，利用CNN捕捉局部特征的优势以及Bi-LSTM能够捕捉时序信息的优点，该模型包含了输入层、卷积层、池化连接层、双向Bi-LSTM隐藏层、双向 Bi-LSTM输出层、平均池化层和输出层，将该模型应用在获取到的对话咨询信息的文本上，由于CNN卷积层的卷积核的宽度和词向量维度相同，通过CNN 对对话咨询信息的文本信息特征提取，因用户的意图识别需要由前面若干输入和后面若干输入共同决定，因此将提取后的特征输入到Bi-LSTM模型双向 Bi-LSTM隐藏层和双向Bi-LSTM输出层进行特征提取，并将各卷积词向量根据卷积的先后顺序进行重新组合，保证文本的语序性，进而将向量依次送入 Bi-LSTM的Cell中，得到最后一个隐层h_t的输出作为最终的特征向量，并通过平均池化层和输出层映射为一维向量，根据一维向量，确定对话咨询信息对应于各预设意图类别的概率值，不仅提高了意图识别效率，还能够进一步提升对话咨询信息回复的精确度。

基于上述实施例，参阅图4所示，为本申请实施例中另一种意图识别方法流程图。

相较于目前税务领域智能客服用户意图识别问题，本申请实施例中的这种方法，利用智能客服税务知识库咨询的大数据问题作为对话咨询信息的文本，对其进行局部特征信息抽取以获取深层文本信息，然后通过不同卷积核卷积后生成特征向量进行维度组合，并且同时将生成的词向量输入Bi-LSTM进行表示学习，获得全局特征向量，该特征向量保留了文本卷积后的上下文关系，通过对不同特征向量的相同位置元素进行组合，生成新的向量集合代替原有的词向量输入，利用Bi-LSTM的循环输入结构以及上下文信息保留和传递机制，得到最终的文本向量表示，分别结合了CNN在特征提取和LSTM在语义理解方面的优势，在用户意图识别中可以达到比较满意的效果，并且能够提升意图识别的准确性，下面对本申请实施例中的这种意图识别方法进行详细阐述。

步骤400：开始。

步骤401：获取待识别对象的对话咨询信息。

步骤402：将对话咨询信息的文本进行分词处理，并生成各分词对应的词向量。

步骤403：通过卷积神经网络对生成的各词向量进行特征提取，获得各卷积特征向量。

步骤404：通过长短期记忆网络对生成的各词向量进行特征提取，获得各全局特征向量。

其中，步骤403和步骤404是同时进行的，也就是说，将各分词对应的词向量输入到卷积神经网络的同时，也将各分词对应的词向量输入到长短期记忆网络中。

步骤405：将各卷积特征向量和各全局特征向量进行连接，并通过分类网络映射为一维向量，根据一维向量，确定对话咨询信息对应于各预设意图类别的概率值。

步骤406：结束。

本申请实施例中，利用CNN提取词向量的各卷积特征向量，利用BiLSTM 提取词向量中与文本，上下文相关的全局特征向量，能够保证文本的语序性，增加了模型的准确性然后通过池化层将各卷积特征向量和全局特征向量进行采样，获得最终特征向量，最后通过全连接层将最终特征向量映射为一维向量，并确定对话咨询信息对应于各预设意图类别的概率值，进而确定意图类别，这样，能够提高意图识别效率。

基于同一发明构思，本申请实施例中还提供了一种意图识别装置，该意图识别装置可以是硬件结构、软件模块、或硬件结构加软件模块。基于上述实施例，参阅图5所示，为本申请实施例中意图识别装置结构示意图，具体包括：

获取模块500，用于获取待识别对象的对话咨询信息；

处理模块510，用于将所述对话咨询信息的文本输入到预先训练的意图识别模型中，获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值，其中，所述意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络；

第一确定模块520，用于根据所述对应于各预设意图类别的概率值，确定所述待识别对象的意图类别。

可选的，所述卷积神经网络包括输入层、卷积层、池化层，则获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值时，处理模块510具体用于：

可选的，获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值时，处理模块510 具体用于：

可选的，第一确定模块520具体用于：

第二确定模块530，用于根据所述待识别对象的意图类别，确定对应的业务知识数据库；

第三确定模块540，用于从所述对应的业务知识数据库中确定与所述对话咨询信息对应的对话咨询答案；或，

基于上述实施例，参阅图6所示为本申请实施例中电子设备的结构示意图。

本申请实施例提供了一种电子设备，该电子设备可以包括处理器610 (CenterProcessing Unit，CPU)、存储器620、输入设备630和输出设备640 等，输入设备630可以包括键盘、鼠标、触摸屏等，输出设备640可以包括显示设备，如液晶显示器(Liquid CrystalDisplay，LCD)、阴极射线管(Cathode Ray Tube，CRT)等。

存储器620可以包括只读存储器(ROM)和随机存取存储器(RAM)，并向处理器610提供存储器620中存储的程序指令和数据。在本申请实施例中，存储器620可以用于存储本申请实施例中任一种意图识别方法的程序。

处理器610通过调用存储器620存储的程序指令，处理器610用于按照获得的程序指令执行本申请实施例中任一种意图识别方法。

基于上述实施例，本申请实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任意方法实施例中的意图识别方法。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种意图识别方法，其特征在于，包括：

获取待识别对象的对话咨询信息；

2.如权利要求1所述的方法，其特征在于，所述卷积神经网络包括输入层、卷积层、池化层，则获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值，具体包括：

3.如权利要求1所述的方法，其特征在于，获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值，具体包括：

4.如权利要求1所述的方法，其特征在于，根据所述对应于各预设意图类别的概率值，确定所述待识别对象的意图类别，具体包括：

5.如权利要求1所述的方法，其特征在于，所述各预设意图类别至少包括金融业务知识类、物联网业务知识类、金税业务知识类和其他业务知识类。

6.如权利要求1-5任一项所述的方法，其特征在于，确定所述待识别对象的意图类别之后，进一步包括：

7.一种意图识别装置，其特征在于，包括：

获取模块，用于获取待识别对象的对话咨询信息；

8.如权利要求7所述的装置，其特征在于，所述卷积神经网络包括输入层、卷积层、池化层，则获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值时，处理模块具体用于：

9.如权利要求7所述的装置，其特征在于，获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后，确定的所述对话咨询信息对应于各预设意图类别的概率值时，处理模块具体用于：

10.如权利要求7所述的装置，其特征在于，第一确定模块具体用于：

11.如权利要求7所述的装置，其特征在于，所述各预设意图类别至少包括金融业务知识类、物联网业务知识类、金税业务知识类和其他业务知识类。

12.如权利要求7-11任一项所述的装置，其特征在于，确定所述待识别对象的意图类别之后，进一步包括：

13.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1-6任一项所述方法的步骤。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于：所述计算机程序被处理器执行时实现权利要求1-6任一项所述方法的步骤。