CN111221961A

CN111221961A - 一种基于s-lstm模型与槽值门的说话人意图识别系统及方法

Info

Publication number: CN111221961A
Application number: CN201911055765.4A
Authority: CN
Inventors: 邵曦; 王子岳; 袁梦奇
Original assignee: Nanjing Nanyou Institute Of Information Teachnovation Co ltd; Nanjing University of Posts and Telecommunications
Current assignee: Nanjing Nanyou Institute Of Information Teachnovation Co ltd; Nanjing University of Posts and Telecommunications
Priority date: 2019-10-31
Filing date: 2019-10-31
Publication date: 2020-06-02

Abstract

本发明提出了一种基于S‑LSTM模型与槽值门的说话人意图识别系统及方法，系统包括词语嵌入模块：用于对用户提供的文本信息进行嵌入，将其转化为对应的词汇向量；特征提取模块：将得到的词汇嵌入进行处理，提取出其中蕴含的语义信息，以及一个句子整体的语义信息；意图判别模块：根据提取出的语义信息，对用户意图做出识别，并完成槽填充，为之后的行为提供保障。基于上述系统的说话人意图识别方法通过步骤S1‑S4更好的挖掘了意图与其所对应槽值之间的关系，从而得到更好的准确率效果。

Description

一种基于S-LSTM模型与槽值门的说话人意图识别系统及方法

技术领域

本发明属于自动问答领域，具体涉及一种基于S-LSTM模型与槽值门的意图识别方法。

背景技术

在自然语言的问答系统中，SLU(Spoken Language Understanding)是必不可少的一环，它指引着后续对话的内容。SLU的目的是形成一个语义框架，以获取用户话语或查询的语义，它通常包括两个任务：意图检测(Intention detection)以及槽填充(Slotfilling)。

在问答系统，尤其是任务型问答系统中，当用户提出要求时，系统首先需要分辨出用户想要做什么，这便是意图检测的目的。意图检测任务可以被看作是一种分类任务，将一句话按照它包含的语义将其分类到不同的意图类别中。之后，系统需要分辨出完成用户要求所必须的要素，例如当用户需要预定机票时，系统需要分辨出所要预定的航班的行程以及具体的时间，这就是槽填充任务所要解决的问题。槽填充任务可以被看作是一种序列标记任务，它将单词的嵌入表示映射为与之对应的输出向量，据此为每一个单词打上不同的标签，这个标签取决于当前单词是否包含上述完成用户要求的要素以及是哪一种要素。

学者们常常将意图检测和槽填充单独考虑，而没有将两者间的联系进行探究。但随着研究的推进，人们发现同时实现意图检测以及槽填充的联合模型往往能够取得更好的效果，这一现象预示着说话人的意图与槽值之间的相关性对意图识别结果的提升有着至关重要的效用。但这些工作都没有清晰地建模意图与槽值之间的关系，而S-LSTM模型为这种建模提供了可能，它很好地将句子中每个单词的信息与句子整体的信息进行融合。但将S-LSTM模型同时运用在槽填充和意图检测任务时，能够最详尽且最清晰地呈现句子所蕴含时序语义信息的最新时刻句子状态信息并没有得到充分利用，这造成了严重的资源浪费也对结果的准确性造成了影响。

对说话人意图的识别极大地推进了自然语言理解任务的发展。之前的工作大多采用Bi-LSTM即双向LSTM模型进行词汇特征与词汇之间语义关系的提取，但这并不能很好地使句子整体和构成句子的词汇个体之间的信息进行交流。而S-LSTM(Sentence-stateLSTM)模型即句子状态LSTM模型可以很好地将自然语言中句子整体与词汇个体的信息相结合，以便于我们挖掘与利用意图检测与槽值填充之间的关系成立联合模型来更好地理解应答系统中蕴含的语义。

发明内容

为了解决现有技术的不足，本发明提供了一种基于S-LSTM模型与槽值门的意图识别方法，为了解决这一问题本发明开创式地引入了‘槽值门’机制，在进行槽填充任务时，将最新迭代时刻的句子状态信息作为监督信息加以运用。

本发明的目的通过以下技术方案来实现：

一种基于S-LSTM模型与槽值门的意图识别系统，包括

词语嵌入模块：用于对用户提供的文本信息进行嵌入，将其转化为对应的词汇向量；

特征提取模块：将得到的词汇嵌入进行处理，提取出其中蕴含的语义信息，以及一个句子整体的语义信息；

意图判别模块：根据提取出的语义信息，对用户意图做出识别，并完成槽填充，为之后的行为提供保障。

一种基于S-LSTM模型与槽值门的意图识别方法，包括如下步骤：

S1、在接受到用户发出的文本请求或查询后，对其中的每一个单词通过查询预训练单词库得到其对应的词语嵌入，根据不同的文本需求，可以加入模型中的词语训练系统，使得所得的嵌入更加符合具体文本的特征；

S2、将词语嵌入输入S-LSTM加槽值门的模型中获取富有价值的语义信息，将所得的词语嵌入输入到S-LSTM模型中得到初步的特征提取结果，再输入到槽值门当中，槽值门将句子整体信息作为一种监督信息，为一个单词信息赋予不同的权值，从而得到更加全面的单词信息；

S3、将所得的单词信息输入到条件随机场中之后再输入到softmax中进行分类，从而将每个单词分到其所属于的槽值种类中，而对于意图识别的结果则是将每个单词的单词信息进行加权平均之后作为句子的整体信息直接输入到softmax分类器中从而得到对应的分类结果；

S4、若意图分类的结果所对应的槽值在槽填充中并没有全部得到填充，则意图识别所服务的对话系统应当做出信息缺失的指示，提示对话系统通过询问用户等方式，补齐所需的槽值。

优选地，所述S1中对于英文的对话系统，我们采用Glove预训练单词集中300维的单词向量作为我们的初始词语嵌入。对于中文则采用百度百科的300维中文预训练词向量。

优选地，所述S1中可能加入的词语嵌入训练方法是word2vec方法。

优选地，所述S2中S-LSTM模型的参数包括但不限于循环次数，单词窗口长度，句子状态个数。

优选地，所述循环次数为6次，句子状态个数为1个，单词窗口长度为2。

本发明的有益效果体现在：1、本发明将S-LSTM作为信息提取的方式引入到意图检测与槽填充的任务之上，更好的挖掘了意图与其所对应槽值之间的关系，从而得到更好的准确率效果。

2、本发明在使用S-LSTM模型的过程中引入了槽值门机制作为解决S-LSTM模型中最后一个时刻句子整体状态信息浪费的问题，既解决了资源浪费的问题，也进一步地提高了准确率。

本发明引入了‘槽值门’机制解决S-LSTM应用于说话人意图检测与槽填充的联合任务时最新迭代时刻的句子状态信息没有得到充分利用问题。在说话人意图检测中取得了很好的效果。

附图说明

图1为基于S-LSTM模型与槽值门的意图识别系统的意图识别方法流程简图；

图2为S-LSTM模型结构图；

图3为槽值门机制结构图。

具体实施方式

本发明揭示了一种基于S-LSTM模型与槽值门的意图识别系统，结合图1-图3所示，所述意图识别方法包括用于将用户的文本输入转化为嵌入表达的词语嵌入模块，与所述词语嵌入模块直接连接的特征提取模块，以及在所述特征提取模块基础上进行意图检测和槽填充的意图判别模块。所述特征提取模块将蕴含在文本表示之间的信息提取出来，同时兼顾单词个体与句子整体之间的信息交流。

如图1所示的说话人意图识别方法流程，基于以上所述的一种基于S-LSTM模型与槽值门的意图识别系统的说话人意图识别方法，包括如下步骤：

S1、词语嵌入，在接受到用户发出的文本请求或查询后，对其中的每一个单词通过查询预训练单词库得到其对应的词语嵌入，根据不同的文本需求，可以加入模型中的词语训练系统，使得所得的嵌入更加符合具体文本的特征。在进行英文文本处理时，我们选择Glove预训练数据集预训练单词库，对于正文文本我们选择百度百科中文预训练词库作为预训练词库。

S2、将词语嵌入输入S-LSTM加槽值门的模型中获取富有价值的语义信息，将所得的词语嵌入输入到S-LSTM模型中得到初步的特征提取结果，再输入到槽值门当中，槽值门将句子整体信息作为一种监督信息，为一个单词信息赋予不同的权值，从而得到更加全面的单词信息。将所得的词语嵌入输入到S-LSTM模型中得到初步的特征提取结果，再输入到槽值门当中，将句子整体信息作为一种监督信息，监督每一个单词的单词信息，从而得到更加全面的单词信息。具体的，在进行S-LSTM模型的部署时，我们选择6次迭代，句子整体状态监督数为1，单词窗的长度为2。因为S-LSTM将句子整体作为输入输入到网络中，每一次迭代都会使单词的表示中包含距离次单词更远的单词的信息，因此经过不断的迭代每一个单词中就会包含整个句子中每一个单词的语义信息。但迭代次数也不宜过多，因为在此类迭代中，位置信息是通过由远及近的一层层传导得来的，一味地增大迭代次数会造成资源的浪费且迭代次数过多会淡化单词间位置关系的反而有可能会降低模型的表现。

如图3所示，最后加入的槽值门机制，将最后一个句子整体状态作为权重对每一个单词的状态进行加权之后进行槽填充的任务，W为一个矩阵将句子状态信息与单词信息变换到同一向量空间，相加后通过tanh函数进行激活，之后再通过V矩阵进行最后的向量空间变换，经过求和得出最后的权重g。但经过不断的循环，单词状态本身就已经蕴含了很多的句子信息，不宜对其做出过多的改变，因此最终的输出为

式中

为最终输出的单词状态，

为t时刻第i个单词的S-LSTM输出单词状态，g为根据句子状态计算出的权值由

计算得出，n为我们自行设定的权重，此处我们定为2。

S3、将提取出的语义信息经过处理得出最终的分类结果。将所得的单词信息输入到条件随机场中之后再输入到softmax中进行分类，从而将每个单词分到其所属于的槽值种类中，而对于意图识别的结果则是将每个单词的单词信息进行加权平均之后作为句子的整体信息直接输入到softmax分类器中从而得到对应的分类结果。具体来说

其中

为权重系数，此处是引用了加性注意力机制计算得出。

S4、按照意图识别的结果确定用户意图之后，若意图分类的结果所对应的必须槽值在槽填充中并没有全部得到填充，则意图识别所服务的对话系统应当做出信息缺失的指示，提示对话系统通过询问用户等方式，补齐所需的信息，从而进行槽填充。若无法补齐则提示无法识别用户意图，防止做出不符合用户意图的行为造成不必要的损失。最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于S-LSTM模型与槽值门的说话人意图识别系统，其特征在于，包括：

2.基于权利要求1的说话人意图识别系统的意图识别方法，其特征在于：包括如下步骤：

S1、词语嵌入，在接受到用户发出的文本请求或查询后，对其中的每一个单词通过查询预训练单词库得到其对应的词语嵌入，根据不同的文本需求，可以加入模型中的词语训练系统，使得所得的嵌入更加符合具体文本的特征；

S3、将提取出的语义信息经过处理得出最终的分类结果，将所得的单词信息经过槽值门处理得到对应的分类结果，将所得的单词信息输入到条件随机场中之后再输入到softmax中进行分类，从而将每个单词分到其所属于的槽值种类中；然而对于意图识别的结果则是将每个单词的单词信息进行加权平均之后，作为句子的整体信息直接输入到softmax分类器中从而得到对应的分类结果；

S4、按照意图识别的结果确定用户意图之后，若意图识别分类的结果所对应的槽值在槽填充中并没有全部得到填充，则意图识别所服务的对话系统做出信息缺失的指示，提示对话系统通过询问用户，进一步完善信息，从而进行槽填充。

3.如权利要求2所述的意图识别方法，其特征在于：S1中对于英文的对话系统，采用Glove预训练单词集中300维的单词向量作为初始词语嵌入；对于中文对话系统，则采用百度百科的300维中文预训练词向量。

4.如权利要求2所述的意图识别方法，其特征在于：所述S1中加入词语嵌入的训练方法是word2vec方法。

5.如权利要求2所述的意图识别方法，其特征在于：所述S2中S-LSTM模型的参数包括但不限于循环次数、单词窗口长度以及句子状态个数。

6.如权利要求5所述的一种基于S-LSTM模型与槽值门的意图识别方法，其特征在于：所述循环次数为6次，句子状态个数为1个，单词窗口长度为2。

7.如权利要求2-6任意一项所述的一种基于S-LSTM模型与槽值门的意图识别方法，其特征在于：所述S3中所述条件随机场将提取出的信息进行关联的推测，从而提升最终的结果表现。