CN114860914B

CN114860914B - 一种基于知识库增强的端到端多领域任务型对话生成方法

Info

Publication number: CN114860914B
Application number: CN202210578769.6A
Authority: CN
Inventors: 马廷淮; 何旭可; 荣欢
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2022-05-26
Filing date: 2022-05-26
Publication date: 2023-06-16
Anticipated expiration: 2042-05-26
Also published as: CN114860914A

Abstract

本发明公开了一种基于知识库增强的端到端多领域任务型对话生成方法，涉及自然语言处理领域。首先将对话数据进行编码，获得向量表示；再通过计算各向量之间的注意力权重，并通过对话状态解码器获得当前对话状态；最后将得到的当前对话状态、知识库信息和对话历史传入解码端，通过行为解码器与响应解码器进行交互生成系统响应。通过多编码器的方式分开编码各类对话数据，使用堆叠注意力层计算各数据向量之间的注意力，能够获得当前完整的对话状态信息，大大提高了任务型对话系统在多领域对话时对用户请求的理解，也提高了系统响应生成的准确度。在解码阶段同时考虑对话行为和对话响应，并引入知识库信息，增加了系统响应内容的丰富性。

Description

一种基于知识库增强的端到端多领域任务型对话生成方法

技术领域

本发明涉及一种基于知识库增强的端到端多领域任务型对话生成方法，属于自然语言处理技术领域。

背景技术

自然语言处理领域中，对话系统根据应用场景的不同可以分为开放域对话系统和封闭域对话系统。开放域对话系统也称为闲聊型对话系统，其没有任何限定的主题或者明确的目的，用户与系统之间的交互是自由且可以进行任何话题的对话。封闭域对话系统也称为任务型对话系统，任务型对话系统具有明确的目标以及限定的知识范围，旨在为用户提供完成特定任务工作，如购买车票、预订酒店和导航助理等服务。任务型对话系统在工业界也已经进入了应用阶段，如苹果公司的Siri、亚马逊的Echo、谷歌的Allo和微软的Cortana等。这些系统都可以给其用户提供帮助，用户可以方便快捷地处理复杂的任务，大大地减轻了人工负担。

任务型多轮对话系统最广泛应用的方法是将对话过程视为一条管道，包含语音识别(ASR,automaticspeechrecognition)、自然语言理解(NLU,naturallanguageunderstanding)、对话管理器(DM,dialoguemanager)、语言生成(NLG,naturallanguagegeneration)、语音合成(TTS,texttospeech)等独立模块。但是管道方法的问题也很明显：(1)领域相关性强。针对每个领域都需要人工设计语义槽、动作空间和决策，导致系统的设计和领域非常相关，难以扩展到新的领域。(2)模块之间独立。各个模块之间相互独立，需要为每个模块提供大量的领域相关的标注数据。(3)模块处理相互依赖。上游模块的错误会级联到下游模块，下游模块的反馈难以传到上游模块，使其很难识别错误来源。

随着深度神经网络模型的发展，研究人员提出了端到端的人机对话系统架构。与管道式架构不同，端到端模型根据误差的反向传播共同调整和优化模型内部的网络结构和参数，直到模型收敛或达到预期的效果，中间所有的操作都包含在神经网络内部，不再分成多个独立模块分别处理。目前，大多数任务型对话系统的研究通常只针对某一个特定的领域，对多领域任务的支持并不是很好。多领域对话任务是指系统通过对话完成不同领域的对话任务，并且构建这样的系统往往与实际任务更加相符合。

现有的任务对话系统普遍存在以下几个问题：

1.大多数任务型对话只适用于单个领域，在用户提出跨领域对话时不能有效做出系统回应；

2.多领域对话时，对话状态难以跟踪，包括用户的意图和当前对话领域等信息；

3.现有的模型没有有效地融入外部知识信息，难以生成内容丰富的系统响应；

4.现有工作在系统响应生成过程中，没有考虑到对话行为和系统响应之间的联系，缺少对对话行为的建模。

发明内容

本发明的目的在于克服现有技术中的不足，提供一种基于知识库的端到端多领域任务型对话生成方法，解决现有任务型对话系统在多领域任务对话中生成响应耗时耗力，效率差，准确率低的问题。

为达到上述目的，本发明是采用下述技术方案实现的：

第一方面，一种基于知识库增强的端到端多领域任务型对话生成方法，所述对话生成方法采用深度神经网络模型，模型包括编码端、堆叠注意力层和解码端，编码端包括多个独立的编码器，解码端包括对话状态解码器、行为解码器和响应解码器；多个独立编码器并联后同时与堆叠注意力层和解码端的行为解码器连接，堆叠注意力层与解码端的对话状态解码器连接，行为解码器与响应解码器中连接；

所述任务型对话生成方法包括：

将对话数据进行编码处理，得到对话数据的编码向量，所述对话数据包括对话插槽、对话状态、对话历史、用户语句、知识库、对话领域以及对话行为；

对对话数据的编码向量进行注意力计算，获得堆叠注意力权重；

对堆叠注意力权重进行第一数据融合，并对第一数据融合后得到的融合注意力权重进行对话状态解码计算，获得当前对话状态；以当前对话状态为约束查询知识库，获得知识库查询结果；

将对话历史和知识库查询结果进行第二数据融合，并对结果进行编码计算，获得融合隐藏状态；

对所述融合注意力权重和融合隐藏状态进行行为解码计算，获得行为隐藏状态；

将行为隐藏状态进行响应解码计算，获得生成词概率分布，输出任务型对话响应序列。

进一步的，其特征在于，所述将对话数据进行编码处理，得到对话数据的编码向量具体包括：

将各类对话数据Z编码表示记为X，并将文本的词嵌入和位置嵌入通过归一化进行编码，分别得到对话数据中的对话插槽的编码向量X_S、对话状态的编码向量X_st、用户语句的编码向量X_user、对话历史的编码向量X_his和对话领域的编码向量X_d；t时刻对话行为的编码向量

编码计算公式为：

X＝LayerNorm(X_emb+PEmb(Z))

式中，X_emb为文本词嵌入，记为X_emb＝Emb(Z)，Emb()为词嵌入函数；PEmb()为位置嵌入函数。

进一步的，所述对对话数据的编码向量进行注意力计算，获得堆叠注意力权重；具体包括：

计算对话插槽X_s的自注意力，再将其结果与用户语句X_user进行计算，然后将结果与对话历史X_his进行计算，最后结果与上一时间步时的对话状态

进行计算；最终经过N次循环的得到第一堆叠注意力权重/>

循环的计算公式包括：

式中，Att(,)为Transformer的注意力计算函数；

为对话插槽X_s的自注意力权重；/>

为/>

与用户语句X_user的注意力权重；/>

为/>

与对话历史X_his的注意力权重；/>

为/>

与上一时间步时的对话状态/>

的注意力权重。

计算对话领域X_d的自注意力，再将其结果与用户语句X_user进行计算，最后将结果与对话历史X_his进行计算；最后经过N次循环得到第二堆叠注意力权重

循环的计算公式包括：

式中，

为对话领域X_d的自注意力权重；/>

为/>

与用户语句X_user的注意力权重；/>

为/>

与对话历史X_his的注意力权重。

进一步的，所述对堆叠注意力权重进行第一数据融合，并对第一数据融合后得到的融合注意力权重进行对话状态解码计算，获得当前对话状态；具体包括：

通过哈达玛积运算规则将的第一堆叠注意力权重

和第二堆叠注意力权重

进行融合，计算公式包括：

式中，

符号表示哈达玛积运算规则；/>

为融合注意力权重；

将融合注意力权重

作为对话状态解码时的初始隐藏状态h₀进行对话状态解码计算，得到当前对话状态，所述当前对话状态包括通知槽概率分布和请求槽概率分布，计算公式包括：

式中，p^inf为通知槽概率分布；p^req为请求槽概率分布；h_t表示对话状态解码过程中时间步t的隐藏状态，初始时将融合后的注意力权重

作为对话状态解码时的初始隐藏状态h₀；W_inf和W_req为在对话状态解码RNN神经网络中使用到的训练参数；以当前对话状态为约束查询知识库，获得知识库查询结果。

进一步的，所述将对话历史和知识库查询结果进行第二数据融合，并对结果进行编码计算，获得融合隐藏状态；具体包括：

第二数据融合的计算公式包括：

X_n:B＝Emb([H；B])

式中，Emb()为词嵌入函数；H为对话历史，B为知识库查询结果信息，即以对话状态解码器获得的对话状态表示为约束条件查询知识库得到的查询结果。

对结果进行编码计算：

H^e＝Transf(X_H；B，X_H；B，X_H；B)

＝X_H；B+FeedForward(MultiHead(X_H；B，X_H；B，X_H；B))

式中，Transf()表示Transformer编码计算函数；MultiHead(，，)为多头注意力计算函数；FeedForward()为前馈神经网络计算函数；H^e为融合隐藏状态。

进一步的，所述融合注意力权重和融合隐藏状态进行行为解码计算，获得行为隐藏状态；解码计算公式包括：

X^st＝Emb(X_state)

式中，X_state为融合注意力权重

X^st为当前对话状态；W^st为神经网络使用到的线性层中的可训练参数；/>

为行为解码时的初始向量；/>

为/>

的自注意力权重；H^act为行为隐藏状态。

进一步的，所述将行为隐藏状态进行响应解码计算，获得生成词概率分布，输出任务型对话响应序列；具体包括：

在每一时间步t中，首先通过响应解码计算上一时间步t-1生成词的自注意力

式中，

表示在时间步第t-1时的生成词yt-1的词嵌入；/>

是/>

到/>

的词嵌入矩阵；

根据融合隐藏状态H^e计算当前时间步t的交叉注意力

根据行为隐藏状态H^act计算当前时间步t的动态注意力

根据上述的三个注意力结果

和/>

计算当前时间步t的生成词y_t的概率值p(y_t)：

其中，W_res为神经网络使用到的线性层中的可训练参数；

最后根据当前时间步t的生成词y_t的概率值p(y_t)生成任务型对话响应序列R＝y₁，y₂，…，y_t-1，y_t。

进一步的，还包括对生成的任务型对话响应序列进行质量判断，所述质量判断通过深度神经网络模型对响应序列进行循环训练，直至损失函数稳定后完成训练，输出最终的任务型对话响应序列，损失函数的计算公式包括：

式中，L_inf为对话状态解码时对话状态的通知槽的损失函数；L_req对话状态解码时对话状态的请求槽的损失函数；L_act为行为解码的损失函数；L_res为响应解码时的损失函数；

其中各个损失函数采用交叉熵进行计算，采用softmax()函数为激活函数时的损失函数的计算公式包括：

式中，y_i为对话数据中数据x属于第i类的真实概率，p_i为对话数据中数据x属于第i类的预测概率；

和/或，采用以sigmoid()函数为激活函数时，损失函数的计算公式为：

L(p，q)＝-(plogq+(1-p)log(1-q))

其中，p为对话数据中训练样本x₁的真实概率；1-p为对话数据中训练样本x₂的真实概率；q为预测出x₁的概率值；1-q为预测出x₂的概率值。

第二方面，一种基于知识库增强的端到端多领域任务型对话生成系统，包括：

编码端模块：包括多个独立的编码器；用于将对话数据进行编码处理，得到对话数据的编码向量；以及将对话历史和知识库进行第二数据融合，并对结果进行编码计算，获得融合隐藏状态；

堆叠注意力层计算模块：用于对对话数据的编码向量进行注意力计算，获得堆叠注意力权重；

解码端模块：包括对话状态解码器、行为解码器和响应解码器；对话状态解码器用于对堆叠注意力权重进行第一数据融合，并对第一数据融合后得到的融合注意力权重进行对话状态解码计算，获得当前对话状态；以当前对话状态为约束查询知识库，获得知识库查询结果；行为解码器用于对所述融合注意力权重和融合隐藏状态进行行为解码计算，获得行为隐藏状态；响应解码器用于对将行为隐藏状态进行响应解码计算，获得生成词概率分布，输出任务型对话响应序列。

第三方面，一种基于知识库增强的端到端多领域任务型对话生成装置，其特征在于，包括处理器及存储介质；

所述存储介质用于存储指令；

所述处理器用于根据所述指令进行操作以执行根据上述任一项所述方法的步骤。

与现有技术相比，本发明所达到的有益效果：

本发明通过多编码器的方式分开编码各类数据，使用堆叠注意力层计算各数据向量之间的注意力，能够获得当前完整的对话状态信息，大大提高了任务型对话系统在多领域对话时对用户请求的理解，也提高了系统响应生成的准确度。本发明在解码阶段同时考虑对话行为和对话响应，将二者进行有效的交互，并引入知识库信息，增加了系统响应内容的丰富性。

附图说明

图1为本发明提供的一种基于知识库的端到端多领域任务型对话生成方法的步骤图；

图2为本发明提供的一种基于知识库的端到端多领域任务型对话生成方法使用的深度神经网络模型结构图；

图3为本发明提供的一种基于知识库的端到端多领域任务型对话生成方法的对话数据中涉及到火车(train)和旅馆(hotel)两个领域的对话示例图；

图4为Transformer的模型结构图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

目前，大多数任务型对话系统的研究通常只针对某一个特定的领域，对多领域任务的支持并不是很好。多领域对话任务是指系统通过对话完成不同领域的对话任务，并且构建这样的系统往往与实际任务更加相符合。因为实际上用户与系统的对话过程中，用户所提出的问题，往往涉及到多个领域，如图3所示，对话数据中涉及到火车(train)和旅馆(hotel)两个领域。如图3所示，对话行为与系统响应存在着一定的联系，如果没有考虑到对话行为的建模，那么生成的响应语句的准确性就比较低。

实施例一：

本实施例提供了一种基于知识库增强的端到端多领域任务型对话生成方法，方法基于深度神经网络模型实现在多领域对话中引入知识信息提升系统响应内容的丰富性，同时提高生成系统响应的质量。方法包括以下几个阶段：

第一阶段，构建深度神经网络模型；

第二阶段，应用阶段；

第三阶段，优化训练阶段。

接下来通过这三个阶段对任务型对话生成方法进行介绍。

一、构建深度神经网络模型

如图2所示，该一种基于知识库增强的端到端多领域任务型对话生成方法采用的深度神经网络模型包括编码端、堆叠注意力层和解码端，编码端包括多个独立的编码器，解码端包括对话状态解码器、行为解码器和响应解码器。其中多个独立编码器并联后同时与堆叠注意力层和解码端的行为解码器连接，堆叠注意力层与解码端的对话状态解码器连接，行为解码器与响应解码器交互连接。

如图4所示，本实施例中模型的编码端中使用Transformer模型的编码方式，堆叠注意力层以及解码端中的注意力计算使用Transformer模型的注意力计算方式。

Transformer模型中编码方式的位置嵌入函数为：

PE_(pos，2i)＝sin(pos/10000^2i/d)

PE_(pos，2i+1)＝cos(pos/10000^2i/d)

式中，pos为位置索引，i为维度索引，d为输入的对话数据中每个词token的位置嵌入向量维度。Transformer模型中的多头注意力计算过程核心公式为：

head_i＝Attention(QW_i ^Q，KW_i ^K，VW_i ^V)

MultiHead(Q,K,V)＝Concat(head₁,...,head_h)W^O

Trasf(Q，K，V)＝V+FFN(MyltiHead(Q，K，V)

其中，Q，K，V分别为查询向量(query)，键向量(key)，值向量(value)；d_k为比例因子数值；W^Q，W^K，W^V分别为注意力计算过程中Q，K，V进行线性变换时的可训练参数；在后面步骤中，使用Att()表示Transformer模型中的注意力计算，例如Att(A，B)表示A和B之间的注意力计算；使用Transd()表示Transformer模型的编码部分的计算过程，包含多头注意力计算(Multi-Head Attention)以及前馈神经网络(FeedForwardNeuralNetwork)等神经网络。

二、应用阶段

根据上述的深度神经网络模型进行端到端多领域任务型对话生成，具体方法包括：

S1，将对话数据进行编码处理，得到对话数据的编码向量，所述对话数据包括对话插槽、对话状态、对话历史、用户语句、知识库、对话领域以及对话行为；本发明所使用的对话数据为已经公开的MultiWOZ2.0数据集；

S2，对对话数据的编码向量进行注意力计算，获得堆叠注意力权重；

S3，对堆叠注意力权重进行第一数据融合，并对第一数据融合后得到的融合注意力权重进行对话状态解码计算，获得当前对话状态；以当前对话状态为约束查询知识库，获得知识库查询结果；

S4，将对话历史和知识库查询结果进行第二数据融合，并对结果进行编码计算，获得融合隐藏状态；

S5，对融合注意力权重和融合隐藏状态进行行为解码计算，获得行为隐藏状态；

S6，将行为隐藏状态进行响应解码计算，获得生成词概率分布，输出任务型对话响应序列。

需要说明的是，步骤S1和S4均在编码器中进行数据处理，理论上同时进行部分先后，如图1所示。

其中对于步骤S1，具体包括：

将各类对话数据Z编码表示记为X，其中各类对话数据Z除了包括历史H＝{U₁，R₁，...，U_t-1，R_t-1，U_t}和知识库为B＝{b₁，b₂，...，b_n}，还包括对话插槽Z_S、对话状态Z_st、用户语句Z_user、对话历史Z_his、对话领域Z_d以及对话行为Z_act，并将文本的词嵌入和位置嵌入通过归一化进行编码，分别得到对话数据中的对话插槽的编码向量X_S、对话状态的编码向量X_st、用户语句的编码向量X_user、对话历史的编码向量X_his和对话领域的编码向量X_d；t时刻对话行为的编码向量

编码计算公式为：

X＝LayerNorm(X_emb+PEmb(Z))

对于步骤S2，具体包括：

计算对话插槽X_s的自注意力，再将其结果与用户语句H_user进行计算，然后将结果与对话历史X_his进行计算，最后结果与上一时间步时的对话状态

进行计算；最终经过3次循环的得到第一堆叠注意力权重/>

循环次数不限于3次，大于3次的循环能是的最终获得的第一堆叠注意力权重的计算结果更加准确，循环的计算公式包括：

式中，Att(,)为Transformer的注意力计算函数；

为对话插槽X_s的自注意力权重；/>

为/>

与用户语句X_user的注意力权重；/>

为/>

与对话历史X_his的注意力权重；/>

为/>

与上一时间步时的对话状态/>

的注意力权重。

计算对话领域X_d的自注意力，再将其结果与用户语句X_user进行计算，最后将结果与对话历史X_his进行计算；最后经过3次循环得到第二堆叠注意力权重

循环次数不限于3次，大于3次的循环能是的最终获得的第二堆叠注意力权重的计算结果更加准确，循环的计算公式包括：

式中，

为对话领域X_d的自注意力权重；/>

为/>

与用户语句X_user的注意力权重；/>

为/>

与对话历史X_his的注意力权重。

对于步骤S3，具体包括：

通过哈达玛积运算规则将的第一堆叠注意力权重

和第二堆叠注意力权重

进行融合，计算公式包括：

式中，

符号表示哈达玛积运算规则；/>

为融合注意力权重；

其中哈达玛积运算规则为：

若

且A＝{a_ij}，B＝[b_ij]，则

将融合注意力权重

作为对话状态解码时的初始隐藏状态h₀；W_inf和W_req为在对话状态解码RNN神经网络中使用到的训练参数。

对于步骤S4，具体包括：

第二数据融合的计算公式包括：

X_n:B＝Emb([H；B])

式中，Emb()为词嵌入函数；H为对话历史；B为知识库查询结果信息，即以对话状态解码器获得的对话状态表示为约束条件查询知识库得到的查询结果。对结果进行编码计算：

H^e＝Transf(X_H；B，X_H；B，X_H；B)

＝X_H；B+FeedForward(MultiHead(X_H；B，X_H；B，X_H；B))

对于步骤S5，具体包括：

对于该步骤，首先将步骤S4中的融合隐藏状态H^e和S3中的融合注意力权重

传入解码端的行为解码器中；

在行为解码器解码过程中，首先将步骤S3中对话状态跟踪得到的融合注意力权重

记为X_state，再对其进行编码表示为X^st＝Emb(X_state)，同时与步骤S1中所描述的对话数据中对话行为的词嵌入向量表示/>

进行相加，可以得到行为解码器的输入为/>

这一步的公式表示为：

其中，W_st为神经网络使用到的线性层中的可训练参数；X_state为融合后的注意力权重

X^st为当前对话状态。

然后在每一个时间步t，行为解码器根据输入

生成对话行为词并获得其隐藏状态H^act，这一步的核心公式为：

式中，

为行为解码时的初始向量；/>

为/>

的自注意力权重；H^act为行为隐藏状态。行为解码器与编码器进行交互获得行为隐藏状态H^act之后，还会与响应解码器进行交互，这种交互设计大大提高了系统响应生成的准确度。

对于步骤S6，具体包括：

式中，

表示在时间步第t-1时的生成词y_t-1的词嵌入；/>

是/>

到/>

的词嵌入矩阵；

根据融合隐藏状态H^e计算当前时间步t的交叉注意力

根据行为隐藏状态H^act计算当前时间步t的动态注意力

根据上述的三个注意力结果

和/>

计算当前时间步t的生成词y_t的概率值p(y_t)：

其中，W_res为神经网络使用到的线性层中的可训练参数；

最后根据当前时间步t的生成词y_t的概率值p(y_t)，取概率值最大的生成词，生成任务型对话响应序列R＝y₁，y₂，...，y_t-1，y_t。

三、优化训练阶段

在通过上述步骤得到任务型对话响应序列后，为了进一步的生成高质量的系统响应，还需要对生成的任务型对话响应序列进行质量判断，所述质量判断通过深度神经网络模型对响应序列进行循环训练，直至损失函数稳定后完成训练，输出最终的任务型对话响应序列，损失函数的计算公式包括：

L＝L_inf+L_req+L_act+L_res

式中，L_inf为对话状态解码时对话状态的通知槽的损失函数；L_req对话状态解码时对话状态的请求槽的损失函数；L_act为行为解码的损失函数；L_res为响应解码时的损失函数。

其中模型的损失函数采用交叉熵损失函数进行计算，具体为：

以softmax()函数为激活函数时，交叉熵损失函数的计算公式为：

其中，y_i为对话数据中数据x属于第i类的真实概率，p_i为对话数据中数据x属于第i类的预测概率。

以sigmoid()函数为激活函数时，二分类交叉熵损失函数的计算公式为：

L(p，q)＝-(plogq+(1-p)log(1-q))

其中，p为对话数据中训练样本x₁的真实概率，1-p为对话数据中训练样本x₂的真实概率；q为预测出x₁的概率值，1-q为预测出x₂的概率值。

在本实施例中，模型通过epoch＝50次循环训练，总损失函数L对模型优化稳定，生成高质量的系统响应，也即得到了质量优化后的任务型对话响应序列。训练次数不限于50次，在条件允许的情况下，更多的循环训练，也能得到优化质量较高的任务型对话响应序列。

本发明通过多编码器的方式分开编码各类数据，使用计算过程简单且高效的堆叠注意力层计算各数据向量之间的注意力，堆叠注意力层和对话状态解码器交互，可以获得当前对话完整的对话状态，提高在解码过程中响应序列生成的速度和效率。同时能够获得当前完整的对话状态信息，大大提高了任务型对话系统在多领域对话时对用户请求的理解，也提高了系统响应生成的准确度。本发明在解码阶段同时考虑对话行为和对话响应，将二者进行有效的交互，并引入知识库信息，增加了系统响应内容的丰富性。

实施例二：

本实施例提供了基于知识库增强的端到端多领域任务型对话生成系统，包括：

解码端模块：包括对话状态解码器、行为解码器和响应解码器；对话状态解码器用于对堆叠注意力权重进行第一数据融合，并对第一数据融合后的注意力权重进行对话状态解码计算，获得当前对话状态；行为解码器用于对当前对话状态和融合隐藏状态进行行为解码计算，获得行为隐藏状态；响应解码器用于对将行为隐藏状态进行响应解码计算，获得生成词概率分布，输出任务型对话响应序列。

实施例三：

一种基于知识库增强的端到端多领域任务型对话生成装置，其特征在于，包括处理器及存储介质；

所述存储介质用于存储指令；

所述处理器用于根据所述指令进行操作以执行下述方法的步骤：

对融合注意力权重和融合隐藏状态进行行为解码计算，获得行为隐藏状态；

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于知识库增强的端到端多领域任务型对话生成方法，其特征在于，所述对话生成方法采用深度神经网络模型，模型包括编码端、堆叠注意力层和解码端，

编码端包括多个独立的编码器，解码端包括对话状态解码器、行为解码器和响应解码器；多个独立编码器并联后同时与堆叠注意力层和解码端的行为解码器连接，堆叠注意力层与解码端的对话状态解码器连接，行为解码器与响应解码器连接；

所述任务型对话生成方法包括：

将对话数据进行编码处理，得到对话数据的编码向量，所述对话数据包括对话插槽、对话状态、对话历史、用户语句、知识库、对话领域以及对话行为；对对话数据的编码向量进行注意力计算，获得堆叠注意力权重；

对堆叠注意力权重进行第一数据融合，得到融合注意力权重；对融合注意力权重进行对话状态解码计算，得到当前对话状态；所述当前对话状态包括通知槽概率分布和请求槽概率分布；以所述当前对话状态为约束查询知识库，获得知识库查询结果；

将行为隐藏状态进行响应解码计算，获得生成词概率分布，输出任务型对话响应序列；

其中，所述将对话数据进行编码处理，得到对话数据的编码向量具体包括：

编码计算公式为：

X＝LayerNorm(X_emb+PEmb(Z))

式中，X_emb为文本词嵌入，记为X_emb＝Emb(Z)，Emb()为词嵌入函数；PEmb()为位置嵌入函数；

所述对对话数据的编码向量进行注意力计算，获得堆叠注意力权重；具体包括：

进行计算；最终经过N次循环的得到第一堆叠注意力权重/>

N≥3，循环的计算公式包括：

式中，Att(,)为Transformer的注意力计算函数；

为对话插槽X_s的自注意力权重；

为/>

与用户语句X_user的注意力权重；/>

为/>

与对话历史X_his的注意力权重；/>

为/>

与上一时间步时的对话状态/>

的注意力权重；

N≥3，循环的计算公式包括：

式中，

为对话领域X_d的自注意力权重；/>

为/>

与用户语句X_user的注意力权重；/>

为/>

与对话历史X_his的注意力权重。

2.根据权利要求1所述的基于知识库增强的端到端多领域任务型对话生成方法，其特征在于，所述对堆叠注意力权重进行第一数据融合，得到融合注意力权重；具体包括：

通过哈达玛积运算规则将的第一堆叠注意力权重

和第二堆叠注意力权重/>

进行融合，计算公式包括：

式中，

符号表示哈达玛积运算规则；/>

为融合注意力权重。

3.根据权利要求2所述的基于知识库增强的端到端多领域任务型对话生成方法，其特征在于，所述将对话历史和知识库查询结果进行第二数据融合，并对结果进行编码计算，获得融合隐藏状态；具体包括：

第二数据融合的计算公式包括：

X_H；B＝Emb([H；B])

式中，Emb()为词嵌入函数；H为对话历史，B为知识库查询结果信息，即以对话状态解码器获得的对话状态表示为约束条件查询知识库得到的查询结果；

对结果进行编码计算：

H^e＝Transf(X_H；B，X_H；B，X_H；B)

＝X_H；B+FeedForward(MultiHead(X_H；B，X_H；B，X_H；B))

4.根据权利要求3所述的基于知识库增强的端到端多领域任务型对话生成方法，其特征在于，所述对融合注意力权重和融合隐藏状态进行行为解码计算，获得行为隐藏状态；解码计算公式包括：

X^st＝Emb(X_state)

式中，X_state为融合注意力权重

X^st为当前对话状态；W_st为神经网络使用到的线性层中的可训练参数；/>

为行为解码时的初始向量；/>

为/>

的自注意力权重；H^act为行为隐藏状态。

5.根据权利要求4所述的基于知识库增强的端到端多领域任务型对话生成方法，其特征在于，所述将行为隐藏状态进行响应解码计算，获得生成词概率分布，输出任务型对话响应序列；具体包括：

式中，

表示在时间步第t-1时的生成词y_t-1的词嵌入；/>

是/>

到/>

的词嵌入矩阵；

根据融合隐藏状态H^e计算当前时间步t的交叉注意力

根据行为隐藏状态H^act计算当前时间步t的动态注意力

根据上述的三个注意力结果

和/>

计算当前时间步t的生成词y_t的概率值P(y_t)：

其中，W_res为神经网络使用到的线性层中的可训练参数；

最后根据当前时间步t的生成词y_t的概率值p(y_t)生成任务型对话响应序列R＝y₁，y₂，...，y_t-1，y_t。

6.根据权利要求1所述的基于知识库增强的端到端多领域任务型对话生成方法，还包括对生成的任务型对话响应序列进行质量判断，所述质量判断通过深度神经网络模型对响应序列进行循环训练，直至损失函数稳定后完成训练，输出最终的任务型对话响应序列，损失函数的计算公式包括：

L＝L_inf+L_req+L_act+L_res

L(p，q)＝(plogq+(1-p)log(1-q))

7.一种基于知识库增强的端到端多领域任务型对话生成系统，其特征在于，包括：

编码端模块：包括多个独立的编码器；用于将对话数据进行编码处理，得到对话数据的编码向量；以及将对话历史和知识库查询结果进行第二数据融合，并对结果进行编码计算，获得融合隐藏状态；

解码端模块：包括对话状态解码器、行为解码器和响应解码器；

对话状态解码器：用于对堆叠注意力权重进行第一数据融合，并对第一数据融合后得到的融合注意力权重进行对话状态解码计算，获得当前对话状态；以所述当前对话状态为约束查询知识库，获得知识库查询结果；

行为解码器：用于对所述融合注意力权重和融合隐藏状态进行行为解码计算，获得行为隐藏状态；

响应解码器：用于对将行为隐藏状态进行响应解码计算，获得生成词概率分布，输出任务型对话响应序列，其中，所述将对话数据进行编码处理，得到对话数据的编码向量，具体包括：

编码计算公式为：

X＝LayerNorm(X_emb+PEmb(Z))

进行计算；最终经过N次循环的得到第一堆叠注意力权重/>

N≥3，循环的计算公式包括：

式中，Att(,)为Transformer的注意力计算函数；

为对话插槽X_s的自注意力权重；

为/>

与用户语句X_user的注意力权重；/>

为/>

与对话历史X_his的注意力权重；/>

为/>

与上一时间步时的对话状态/>

的注意力权重；

N≥3，循环的计算公式包括：

式中，

为对话领域X_d的自注意力权重；/>

为/>

与用户语句X_user的注意力权重；/>

为/>

与对话历史X_his的注意力权重。