CN111639152A

CN111639152A - 意图识别方法

Info

Publication number: CN111639152A
Application number: CN201910808616.4A
Authority: CN
Inventors: 陈怡�; 李小华; 张琦; 郭冬
Original assignee: Shanghai Zhuofan Information Technology Co ltd
Current assignee: Shanghai Zhuofan Information Technology Co ltd
Priority date: 2019-08-29
Filing date: 2019-08-29
Publication date: 2020-09-08
Anticipated expiration: 2039-08-29
Also published as: CN111639152B

Abstract

一种意图识别方法包括：对去停用词后的待识别文本按照词级分割，分别利用两种量化模型对待识别文本进行文本量化；将待识别文本按照行拼接得到词向量；计算词向量以得到位置向量，将位置向量与词向量相加得到中间向量；中间向量作为第一层神经网络输入，第一层神经网络输出和中间向量作为第二层神经网络输入，第二和第一层神经网络输出及中间向量作为第三层神经网络输入，得到第三层神经网络最后时刻输出向量；最后时刻输出向量与每一个时刻的输出向量匹配计算得到每一个时刻的权重并将权重归一化，加权求和得到最终输出向量；最终输出向量作为全连接层的输入以输出数字向量；数字向量作为分类器的输入以获得分类数字向量分析出待识别文本的意图。

Description

意图识别方法

技术领域

本发明涉及意图识别技术领域，特别是涉及一种意图识别方法。

背景技术

在人机对话领域，用户意图识别有着重要的作用。现有的意图分类方法主要是基于传统的规则方法和深度学习两种，前者对文本特征提取过多的依赖人为的经验，而后者由于其在较好的表现，在自然语言处理领域有着广泛引用。在意图识别中，具有代表性的有基于rnn和cnn结构的意图分类模型，这些模型的因为其特征提取不全，导致用户意图识别效果欠佳。

发明内容

本发明针对现有技术存在的问题和不足，提供一种新型的意图识别方法。

本发明是通过下述技术方案来解决上述技术问题的：

本发明提供一种意图识别方法，其特点在于，其包括以下步骤：

S1、对作为训练语料的去停用词后的待识别文本按照词级进行分割，分别利用两种量化模型对待识别文本进行文本量化；

S2、将分别量化后的待识别文本按照行拼接的方式得到更高维度的词向量；

S3、通过位置向量计算公式计算词向量以得到位置向量，将得到的位置向量与词向量相加得到中间向量；

S4、将中间向量作为编码器的第一层神经网络的输入，将第一层神经网络的输出和中间向量作为编码器的第二层神经网络的输入，将第二层神经网络的输出、第一层神经网络的输出和中间向量作为编码器的第三层神经网络的输入，得到第三层神经网络的最后时刻的输出向量；

S5、将第三层神经网络的最后时刻的输出向量与第三层神经网络的每一个时刻的输出向量做匹配计算得到每一个时刻的权重并将权重归一化，按照加权求和方式得到编码器的最终输出向量；

S6、将最终输出向量作为全连接层的输入以输出一行多列的数字向量；

S7、将数字向量作为分类器的输入以获得分类数字向量，从而分析出待识别文本的意图。

较佳地，在步骤S1中，两种量化模型为CBOW模型和TF-IDF模型。

较佳地，在步骤S3中，位置向量计算公式为：

在i表示偶数时

在i表示奇数时

其中，i表示词向量位置，d_model表示词向量的维度大小，pos表示待识别文本的句子长度，PE表示位置向量。

较佳地，步骤S5中采用的公式为：

e_t＝a(s_t-1，h_t)

其中，t_i-1表示i-1时刻的状态，h_i表示i时刻的隐藏层的输出，c_i表示i时刻的输出向量，1≤t≤T，T表示正整数。

较佳地，在步骤S7中，分类数字向量中的行列表示的是待识别文本与行列对应的类别意图的概率，并选取概率值最大的行列对应的类别意图作为待识别文本的意图。

较佳地，编码器采用biGRU编码器。

较佳地，分类器采用softmax分类器。

在符合本领域常识的基础上，上述各优选条件，可任意组合，即得本发明各较佳实例。

本发明的积极进步效果在于：

本发明通过模型判断用户输入语句的属于什么意图，在人机对话中，根据用户问话，判断用户意图，根据用户意图，提高人机对话的用户体验度。

附图说明

图1为本发明较佳实施例的意图识别方法的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本实施例提供一种意图识别方法，其包括以下步骤：

步骤101、对作为训练语料的去停用词后的待识别文本按照词级进行分割，分别利用CBOW模型和TF-IDF模型对待识别文本进行文本量化。

步骤102、将分别量化后的待识别文本按照行拼接的方式得到更高维度的词向量。

步骤103、通过位置向量计算公式计算词向量以得到位置向量，将得到的位置向量与词向量相加得到中间向量。

其中，在步骤103中，位置向量计算公式为：

在i表示偶数时

在i表示奇数时

其中，i表示词向量位置，比如词向量一百维(0，1，...99)，dmodel表示词向量的维度大小，如100，pos表示待识别文本的句子长度，PE表示位置向量。

步骤104、将中间向量作为biGRU编码器的第一层神经网络的输入，将第一层神经网络的输出和中间向量作为编码器的第二层神经网络的输入，将第二层神经网络的输出、第一层神经网络的输出和中间向量作为编码器的第三层神经网络的输入，得到第三层神经网络的最后时刻的输出向量。

步骤105、将第三层神经网络的最后时刻的输出向量与第三层神经网络的每一个时刻的输出向量做匹配计算得到每一个时刻的权重并将权重归一化，按照加权求和方式得到编码器的最终输出向量。

其中，步骤105中采用的公式为：

e_t＝a(s_t-1，h_t)

步骤106、将最终输出向量作为全连接层的输入以输出一行多列的数字向量。

步骤107、将数字向量作为softmax分类器的输入以获得分类数字向量，从而分析出待识别文本的意图。

其中，分类数字向量中的行列表示的是待识别文本与行列对应的类别意图的概率，并选取概率值最大的行列对应的类别意图作为待识别文本的意图。

虽然以上描述了本发明的具体实施方式，但是本领域的技术人员应当理解，这些仅是举例说明，本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下，可以对这些实施方式做出多种变更或修改，但这些变更和修改均落入本发明的保护范围。