CN109960733A

CN109960733A - 一种端到端任务型对话系统

Info

Publication number: CN109960733A
Application number: CN201910256179.XA
Authority: CN
Inventors: 王诗俊; 吴粤
Original assignee: Shanghai Fire Merchants Intelligent Technology Co Ltd
Current assignee: Shanghai Fire Merchants Intelligent Technology Co Ltd
Priority date: 2019-04-01
Filing date: 2019-04-01
Publication date: 2019-07-02

Abstract

本发明公开了一种端到端任务型对话系统，包括：预处理模块，用于将用户输入数据转换为词向量，并给所述词向量嵌入位置信息；命名体抽取模块，用于标识用户输入数据中的命名体；编译模块，用于接收所述预处理模块和所述命名体抽取模块传输的数据，并输出概率分布；对话历史编码器模块，用于将对话历史输入所述编译模块；解码输出模块，用于输出自然语言句子作为系统对用户输入的回复。本发明能够实现端到端的对话系统，减少繁琐的人工规则，训练所需数据量小，训练速度快，可通过API调用模块进行人工干预。

Description

一种端到端任务型对话系统

技术领域

本发明涉及语音识别领域，具体为一种端到端任务型对话系统。

背景技术

随着现代语音识别技术和对话控制系统的发展，采用问答形式的自然语言对话系统是当前对话系统领域的研究热点，其包括了自然语言理解、对话管理、信息抽取和自然语言生成等技术。

对话控制可以应用在公众场合，如机场、车站、银行等的信息查询系统，移动信息查询终端，在线应答服务等。目前，许多网站都提供了在线应答服务，但其系统需要较多训练数据，学习复杂性高，准确性却较低。

发明内容

本发明的目的在于提供一种端到端任务型对话系统，以解决上述背景技术中存在的问题。

为实现上述目的，本发明提供如下技术方案：一种端到端任务型对话系统，包括：

预处理模块，用于将用户输入数据转换为词向量，并给所述词向量嵌入位置信息；

命名体抽取模块，用于标识用户输入数据中的命名体；

编译模块，用于接收所述预处理模块和所述命名体抽取模块传输的数据，并输出概率分布；

对话历史编码器模块，用于将对话历史输入所述编译模块；

解码输出模块，用于输出自然语言句子作为系统对用户输入的回复。

进一步地，所述给所述词向量嵌入位置信息，具体为：将位置嵌入p＝(p1,p2...pn)拼接到词嵌入e＝(e1,…en)中，位置嵌入的初始化如下:

其中pos是词的位置，i是维度，d_model是嵌入层的维度。

进一步地，所述编译模块采用缩放点乘方法，所述编译模块获得h个不同表单表示，并拼接这些表征，计算如下：

SA(q，k，v)＝MH(q，k，v)W^o；

MH(q，k，v)＝[H₁(q，k，v)，…，H_h(q，k，v)]；

其中MH(.)表示多头注意力模型函数，Hi(.)表示单头的输出，其中h是头的个数，Att(.)为注意力机制函数，注意力机制函数中，d_s是q的维度，W^o，W_i ^q，W_i ^j，W_i ^u是参数矩阵。

进一步地，所述编译模块将输出归一化回概率分布，使非允许的动作采用概率零；从所得到的分布选择动作；当强化学习活动时，从分布中采样动作；当强化学习不活动时，选择具有最高概率的动作。

进一步地，还包括API调用模块，用于人工干预所述编译模块的输出。

进一步地，所述解码输出模块的输出为所述API调用模块的输出与所述编译模块的输出之乘积。

与现有技术相比，本发明的有益效果是：本发明能够实现端到端的对话系统，减少繁琐的人工规则，训练所需数据量小，训练速度快，可通过API调用模块进行人工干预。

附图说明

图1为本发明端到端任务型对话系统的流程图；

图2为本发明端到端任务型对话系统第一实施例的模块图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供一种端到端任务型对话系统，包括：

预处理模块100，用于将用户输入数据转换为词向量，并给所述词向量嵌入位置信息；

命名体抽取模块200，用于标识用户输入数据中的命名体；

编译模块300，用于接收所述预处理模块100和所述命名体抽取模块200传输的数据，并输出概率分布；

对话历史编码器模块400，用于将对话历史输入所述编译模块300；

解码输出模块500，用于输出自然语言句子作为系统对用户输入的回复。

其中pos是词的位置，i是维度，d_model是嵌入层的维度。

进一步地，所述编译模块300采用缩放点乘方法，所述编译模块300获得h个不同表单表示，并拼接这些表征，计算如下：

SA(q，k，v)＝MH(q，k，v)W^o；

MH(q，k，v)＝[H₁(q，k，v)，…，H_h(q，k，v)]；

其中MH(.)表示多头注意力模型函数，Hi(.)表示单头的输出，其中h是头的个数，Att(.)为注意力机制函数，注意力机制函数中，d_s是q的维度，W^o,W_i ^q,W_i ^j,W_i ^u是参数矩阵。

进一步地，所述编译模块300将输出归一化回概率分布，使非允许的动作采用概率零；从所得到的分布选择动作；当强化学习活动时，从分布中采样动作；当强化学习不活动时，选择具有最高概率的动作。

如图2所示，进一步地，本系统还包括API调用模块600，用于人工干预所述编译模块300的输出。

进一步地，所述解码输出模块500的输出为所述API调用模块600的输出与所述编译模块300的输出之乘积。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种端到端任务型对话系统，其特征在于，包括：

命名体抽取模块，用于标识用户输入数据中的命名体；

对话历史编码器模块，用于将对话历史输入所述编译模块；

2.根据权利要求1所述的系统，其特征在于，所述给所述词向量嵌入位置信息，具体为：将位置嵌入p＝(p1,p2...pn)拼接到词嵌入e＝(e1,…en)中，位置嵌入的初始化如下:

其中pos是词的位置，i是维度，d_model是嵌入层的维度。

3.根据权利要求1所述的系统，其特征在于，所述编译模块采用缩放点乘方法，所述编译模块获得h个不同表单表示，并拼接这些表征，计算如下：

SA(q，k，v)＝MH(q，k，v)W^o；

MH(q，k，v)＝[H₁(q，k，v)，…，H_h(q，k，v)]；

4.根据权利要求1所述的系统，其特征在于，所述编译模块将输出归一化回概率分布，使非允许的动作采用概率零；从所得到的分布选择动作；当强化学习活动时，从分布中采样动作；当强化学习不活动时，选择具有最高概率的动作。

5.根据权利要求1所述的系统，其特征在于，还包括API调用模块，用于人工干预所述编译模块的输出。

6.根据权利要求5所述的系统，其特征在于，所述解码输出模块的输出为所述API调用模块的输出与所述编译模块的输出之乘积。