CN113326367B

CN113326367B - 基于端到端文本生成的任务型对话方法和系统

Info

Publication number: CN113326367B
Application number: CN202110739806.2A
Authority: CN
Inventors: 饶璐; 谭斌; 周兴发; 杨兰; 孙锐; 展华益; 方凡; 李焕
Original assignee: Sichuan Qiruike Technology Co Ltd
Current assignee: Sichuan Qiruike Technology Co Ltd
Priority date: 2021-06-30
Filing date: 2021-06-30
Publication date: 2023-06-16
Anticipated expiration: 2041-06-30
Also published as: CN113326367A

Abstract

本发明公开了一种基于端到端文本生成的任务型对话方法，包括：获取用户当前对话话术，并更新历史对话语料库；将历史对话语料转换为语义向量；将语义向量输入文本生成模型，得到不包含实体信息的回复话术，回复话术中的具体实体信息由槽位标签指代；将槽位标签的特征向量与外部知识库和历史对话语料库中的信息进行匹配，将匹配度最高的信息作为槽位标签具体指代的实体信息；将回复话术中的槽位标签替换为实体信息，并将替换了实体信息的回复话术输入文本校正模块，得到最终的回复话术；本发明还公开了一种基于端到端文本生成的任务型对话系统，本发明解决了耗费大量的人力和时间来标注数据、生成的回复话术语义不明确、缺乏上下文联系等问题。

Description

基于端到端文本生成的任务型对话方法和系统

技术领域

本发明涉及自然语言处理和深度学习技术领域，特别是一种基于端到端文本生成的任务型对话方法和系统。

背景技术

近年来，随着信息技术和自然语言处理技术的不断发展，自动问答系统逐渐成为人们的研究重点。其主要包含自然语言理解，对话管理以及自然语言生成三个模块。自然语言理解技术由早期的序列标注或基于统计的方法逐渐发展为基于深度学习的方法，对话管理框架也由基于规则的方法发展为基于强化学习的方法，而自然语言生成技术也由当初的基于模板的方法发展为端到端的深度学习模型。早期的自动问答系统主要采用流水线方法，将三个主要模块依次拼接，这样的系统稳定性高，但需要大量人工对各模块数据进行标注，费时费力，且存在错误传递问题，一旦前一个模块生成的结果错误，将对后续模块的预测结果造成负面影响。端到端的自动对话技术就很好的缓解了上述问题，它直接利用了对话两端的源数据来构建对话模型的参数，减少了大量的人工标注和模板设计的时间，也避免了错误传递问题。

自动问答系统按照目的的不同可以分为开放领域的对话系统和任务型对话系统。开放领域的特点是用户语义意图不明确，通常期望的是语义相关性和渐进性的娱乐性质聊天，主要起到拉进距离、建立信任关系、顺滑过渡对话过程和提高用户粘性的作用，对生成回复的准确率要求较低。而任务型对话是以任务为驱动的对话过程，用户一般都带有明显的意图参与对话，并期望对话系统能够满足或完成自身需求。任务型对话通常需要借助外部数据库获取额外知识来达成用户的目的，比如查询天气、订购机票等。与传统的基于流水线的任务型对话方法相比，近几年比较受关注的端到端的任务型对话系统虽然在一定程度上缓解了耗费人工、避免错误传递等问题，但这种端到端的模型结构很难将外部知识库信息全面地融入答案生成的过程中，同时生成的文本也存在语义不明，上下文关联度不强等问题。

现有技术中，CN112541060A提出了一种基于对抗训练的端到端任务型对话学习框架和方法，该方法采用了三种网络分别用于实体抽取、从知识库中检索相关实体和学习语言模型，并训练生成了对抗网络来完成模块之间的知识迁移，该发明虽然有效利用了外部知识库信息，但整个系统流程复杂，包含多个网络模块，需要比较繁重的数据标注工作，耗费人力。

CN111462750A提出了一种语义与知识增强的端到端任务型对话系统及方法，其中包括对话历史语义信息编码模块、外部数据库访问模块和对话回复解码模块，该发明利用这三个模块设计出高效快速的端到端对话信息编码模型，实现了历史文本到回复生成映射的过程，具有较高的迁移性。但是该方法仍然存在端到端模型的常见问题，就是无法保证生成文本的内容具有明确的含义和较高的可读性。

综上所述，现有任务型对话系统存在以下几点问题：

1)流水线模式的任务型对话系统对数据标注工作依赖性较高，需要耗费大量人力对各个子模块进行数据标注，且存在错误传递问题，一旦上一个环节的模型预测结果错误，将直接影响其下游模型的准确性。

2)任务型对话系统对外部数据库依赖性较高，但端到端的深度学习模型无法将外部知识库信息有效应用到答案生成过程当中。

3)一些端到端的任务型对话系统包含多个子任务模块，系统流程复杂，仍然需要比较繁重的数据标注工作，并且包含了语义理解模块，语义理解的不稳定性将对最终的答案生成产生影响。

4)常见的端到端生成式模型，都存在生成文本语义不明确，上下文联系不紧密的问题。

发明内容

为解决现有技术中存在的问题，本发明的目的是提供一种基于端到端文本生成的任务型对话方法和系统，本发明解决了耗费大量的人力和时间来标注数据、传统流水线模型带来的错误传递问题以及生成文本语义不清晰、上下文缺乏联系等问题。

为实现上述目的，本发明采用的技术方案是：一种基于端到端文本生成的任务型对话方法，包括：

获取用户当前对话话术，并更新历史对话语料库；

将所述历史对话语料转换为语义向量；

将所述语义向量输入文本生成模型，得到不包含实体信息的回复话术，回复话术中的具体实体信息由槽位标签指代；

将所述槽位标签的特征向量与外部知识库和历史对话语料库中的信息进行匹配，将匹配度最高的信息作为槽位标签具体指代的实体信息；

将回复话术中的槽位标签替换为所述实体信息，并将替换了实体信息的回复话术输入文本校正模块，得到最终的回复话术。

作为本发明的进一步改进，在更新历史对话语料库之前，还包括：构建用于存储历史对话语料和外部知识库的模块，制定对话语料和外部知识库的存储形式。

作为本发明的进一步改进，在将所述历史对话语料转换为语义向量之前，还包括构建预训练语言模型，所述预训练语言模型为单向特征表示的自回归预训练语言模型、双向特征表示的自编码预训练语言模型或双向特征表示的自回归预训练语言模型。

作为本发明的进一步改进，构建预训练语言模型之后，还包括获取当前用户对话话术的情感特征，将所述用户对话话术输入预训练语言模型之后得到的向量表示与所述情感特征向量进行融合，得到包含上下文信息和情感信息的语义向量。

作为本发明的进一步改进，采用Seq2Seq模型或采用Pointer-GeneratorNetworks模型构建所述文本生成模型。

作为本发明的进一步改进，构建所述文本生成模型后，还包括设定损失函数，以及设定迭代更新所述文本生成模型的参数。

作为本发明的进一步改进，构建所述文本生成模型后，对其进行训练，具体包括：获取语料数据，根据实际需求对语料中的文本进行处理，将处理后的文本转换为语义向量，将所述语义向量输入文本生成模型进行训练，得到训练好的文本生成模型。

作为本发明的进一步改进，所述将所述槽位标签的特征向量与外部知识库和历史对话语料库中的信息进行匹配具体包括：采用基于记忆力网络的指针筛查方式，找到与所述槽位标签特征向量最相关的知识条目，并从所述知识条目中选择出符合要求的实体信息。

作为本发明的进一步改进，所述文本校正模块通过语义通顺度计算方法给所述回复话术打分，若得分高于预设阈值，所述回复话术即为最终输出回答，若得分低于预设阈值，对回复话术中的非实体信息进行语义增强操作并重新打分，直到所述回复话术得分高于预设阈值时，停止语义增强操作，所述语义增强后的回复话术作为最终输出回答。

本发明还公开了一种基于端到端文本生成的任务型对话系统，包括：

对话更新单元，用于获取用户当前对话话术，并更新历史对话语料库；

向量转换单元，用于将所述历史对话语料转换为语义向量；

文本生成单元，用于将所述语义向量输入文本生成模型，得到不包含实体信息的回复话术，回复话术中的具体实体信息由槽位标签指代；

信息匹配单元，用于将所述槽位标签的特征向量与外部知识库和历史对话语料库中的信息进行匹配，将匹配度最高的信息作为槽位标签具体指代的实体信息；

文本校正单元，用于将回复话术中的槽位标签替换为所述实体信息，并将替换了实体信息的回复话术输入文本校正模块，得到最终的回复话术。

本发明的有益效果是：

1、本发明提供的基于端到端文本生成的任务型对话方法和系统流程简洁，无需意图识别和实体抽取等语义理解环节，避免了流水线方法所带来的的错误传递问题；

2、本发明提供的基于端到端文本生成的任务型对话方法和系统通过预训练模型引入了对话话术的上下文信息和情感信息，使得生成的回复话术内容更加丰富，满足了情感的一致性，有效提高人机交互过程中的用户体验感；

3、本发明提供的基于端到端文本生成的任务型对话方法和系统将历史对话信息和外部知识库信息巧妙引入回复生成阶段，使得生成的回复话术与历史对话更具有相关性；

4、本发明提供的基于端到端文本生成的任务型对话方法和系统采用了文本校正技术，对生成的回复话术进行修正，解决了端到端文本生成模型普遍存在的语法不通顺的问题。

附图说明

图1为本发明实施例1基于端到端文本生成的任务型对话方法的流程示意图；

图2为本发明实施例2基于端到端文本生成的任务型对话系统的系统架构图。

具体实施方式

下面结合附图对本发明的实施例进行详细说明。

实施例1

如图1所示，一种基于端到端文本生成的任务型对话方法，包括：

步骤1、获取用户当前对话话术，并更新历史对话语料库。

具体实施例中，更新历史对话语料库之前，还包括：构建用于存储历史对话语料和外部知识库的模块，制定对话语料和外部知识库的存储形式。

所述构建用于存储历史对话语料和外部知识库模块的方法，包括：采用记忆网络队历史对话语料和外部知识库的信息进行存储。

所述制定对话语料和外部知识库的存储形式的方法，包括：采用三元组的形式来存储历史对话语料和外部知识库信息，其中，历史对话语料采用(speaker，turn，word)形式来存储，如：(用户，轮数1，今天)，(用户，轮数1，的)；外部知识库信息采用(subject，relation/attribute，object)形式来存储，如：(加油站，距离，三公里)。

步骤2、将所述历史对话语料转换为语义向量。

具体实施例中，在将所述历史对话语料转换为语义向量之前，还包括构建预训练语言模型。

所述构建预训练语言模型的方法，包括：单向特征表示的自回归预训练语言模型，这样的模型单方向抽取预训练语料文本的特征，如ELMO模型和ULMFiT模型等。

所述构建预训练语言模型的方法，还包括：双向特征表示的自编码预训练语言模型，以BERT预训练语言模型为主，其衍生模型还有ERINE模型、RoBERTa模型和spanBERT模型。

所述构建预训练语言模型的方法，还包括：双向特征表示的自回归预训练语言模型，引入了双注意力流和transformer机制，代表模型有XLNet。

具体实施例中，构建预训练语言模型之后，还包括获取当前用户对话话术的情感特征，将所述用户对话话术输入预训练语言模型之后得到的向量表示与所述情感特征向量进行融合，得到包含上下文信息和情感信息的语义向量。

所述获取当前用户对话话术情感特征的方法，包括：基于深度学习的分类模型方法，如RNN模型，LSTM模型，GRU模型等。

所述获取当前用户对话话术情感特征的方法，还包括：基于情感字典的规则模板方法。

步骤3、将所述语义向量输入文本生成模型，得到不包含实体信息的回复话术，回复话术中的具体实体信息由槽位标签指代。

具体实施例中，将所述语义向量输入文本生成模型之前，还包括构建文本生成模型的方法。

所述构建文本生成模型的方法，包括：采用Seq2Seq模型，包含Encoder、Decoder以及连接两者的中间状态向量C，Encoder将输入序列通过学习编码成一个固定大小的状态向量C，继而将C传递给Decoder，Decoder再通过对状态向量C的学习输出对应的序列。

所述构建文本生成模型的方法，还包括：采用Pointer-generator网络，在Seq2Seq模型的基础上加入注意力机制，使用Encoder阶段上一个时刻的隐藏状态来计算attention，得到上下文向量，再将其作为该时刻单元的输入。

具体实施例中，所述构建文本生成模型的方法之后，还包括：损失函数的设定，以及迭代更新所述文本生成模型参数的方法的设定。

所述损失函数的设定方法，包括：采用最大间隔损失函数来计算真实值与预测值之间的差值。

所述迭代更新文本生成模型参数的方法，包括：采用Adam优化器，或采用AdaGrad优化器。

具体实施例中，所述构建文本生成模型的方法之后，还包括：文本生成模型的训练方法。包含获取语料数据，根据实际需求对语料中的文本进行特殊处理，将所述处理后的文本转换为语义向量，将所述语义向量输入文本生成模型进行训练，得到训练好的文本生成模型。

步骤4、将所述槽位标签的特征向量与外部知识库和历史对话语料库中的信息进行匹配，将匹配度最高的信息作为槽位标签具体指代的实体信息。

所述将所述槽位标签的特征向量与外部知识库和历史对话语料库中的信息进行匹配的方法，包括：采用基于记忆力网络的指针筛查方式，找到与所述槽位标签特征向量最相关的知识条目，并从所述知识条目中选择出符合要求的实体信息。

从所述知识条目中选择出符合要求的实体信息的方法，包括：在选择出与所述槽位标签特征向量最相关的知识条目之后，由于外部知识库和历史对话信息都是以三元组形式存储，所以抽取三元组中第三个位置的实体作为符合要求的实体信息，即(subject，relation/attribute，object)三元组中object位置的信息或(speaker，turn，word)三元组中word位置的信息。

步骤5、将回复话术中的槽位标签替换为所述实体信息，并将替换了实体信息的回复话术输入文本校正模块，得到最终的回复话术。

具体实施例中，所述将替换了实体信息的回复话术输入文本校正模块之前，还包括构建文本校正模块：通过语义通顺度计算方法给所述回复话术打分，若得分高于预设阈值，所述回复话术即为最终输出回答，若得分低于预设阈值，对回复话术中的非实体信息进行语义增强操作并重新打分，直到所述回复话术得分高于预设阈值时，停止语义增强操作，所述语义增强后的回复话术作为最终输出回答。

所述语义通顺度的计算方法，包括：基于依存句法分析的语义通顺度计算方法，或基于神经网络模型的语义通顺度计算方法。

根据本发明提供的方法，简化了任务型对话处理流程，避免了传统流水线方法带来的错误传递问题，有效引入外部知识库、历史对话信息以及丰富的语义信息，使得生成的回答话术更具有多样性和情感一致性。同时，本发明提供的文本校正模块，有效解决了端到端文本生成模型普遍存在的语法不通顺的问题。

实施例2

如图2所示，一种基于端到端文本生成的任务型对话系统，包括：

对话更新单元，获取用户当前对话话术，并更新历史对话语料库；

向量转换单元，将所述历史对话语料转换为语义向量；

文本生成单元，将所述语义向量输入文本生成模型，得到不包含实体信息的回复话术，回复话术中的具体实体信息由槽位标签指代；

信息匹配单元，将所述槽位标签的特征向量与外部知识库和历史对话语料库中的信息进行匹配，将匹配度最高的信息作为槽位标签具体指代的实体信息；

文本校正单元，将回复话术中的槽位标签替换为所述实体信息，并将替换了实体信息的回复话术输入文本校正模块，得到最终的回复话术。

需要说明的是，本实施例中的各个单元是逻辑意义上的，在具体实施过程中，一个单元可拆分成多个单元，多个单元也可以合并成一个单元。

该系统能够让任务型对话系统流程更加简明，避免了传统流水线方法带来的错误传递问题，有效引入外部知识库、历史对话信息以及丰富的语义信息，让生成的回复话术语义更加明确，更具有多样性和情感一致性。

以上所述实施例仅表达了本发明的具体实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

Claims

1.一种基于端到端文本生成的任务型对话方法，其特征在于，包括：

获取用户当前对话话术，并更新历史对话语料库；

将所述历史对话语料转换为语义向量；

在将所述历史对话语料转换为语义向量之前，还包括构建预训练语言模型，所述预训练语言模型为单向特征表示的自回归预训练语言模型、双向特征表示的自编码预训练语言模型或双向特征表示的自回归预训练语言模型；

构建预训练语言模型之后，还包括获取当前用户对话话术的情感特征向量，将所述用户对话话术输入预训练语言模型之后得到的向量表示与所述情感特征向量进行融合，得到包含上下文信息和情感信息的语义向量；

将所述槽位标签的特征向量与外部知识库和历史对话语料库中的信息进行匹配，将匹配度最高的信息作为槽位标签具体指代的实体信息；所述将所述槽位标签的特征向量与外部知识库和历史对话语料库中的信息进行匹配具体包括：采用基于记忆力网络的指针筛查方式，找到与所述槽位标签特征向量最相关的知识条目，并从所述知识条目中选择出符合要求的实体信息；

2.根据权利要求1所述的基于端到端文本生成的任务型对话方法，其特征在于，在更新历史对话语料库之前，还包括：构建用于存储历史对话语料和外部知识库的模块，制定对话语料和外部知识库的存储形式。

3.根据权利要求1所述的基于端到端文本生成的任务型对话方法，其特征在于，采用Seq2Seq模型或采用Pointer-Generator Networks模型构建所述文本生成模型。

4.根据权利要求3所述的基于端到端文本生成的任务型对话方法，其特征在于，构建所述文本生成模型后，还包括设定损失函数，以及设定迭代更新所述文本生成模型的参数。

5.根据权利要求1或3或4所述的基于端到端文本生成的任务型对话方法，其特征在于，构建所述文本生成模型后，对其进行训练，具体包括：获取语料数据，根据实际需求对语料中的文本进行处理，将处理后的文本转换为语义向量，将所述语义向量输入文本生成模型进行训练，得到训练好的文本生成模型。

6.根据权利要求1所述的基于端到端文本生成的任务型对话方法，其特征在于，所述文本校正模块通过语义通顺度计算方法给所述回复话术打分，若得分高于预设阈值，所述回复话术即为最终输出回答，若得分低于预设阈值，对回复话术中的非实体信息进行语义增强操作并重新打分，直到所述回复话术得分高于预设阈值时，停止语义增强操作，所述语义增强后的回复话术作为最终输出回答。

7.一种基于端到端文本生成的任务型对话系统，其特征在于，包括：

向量转换单元，用于将所述历史对话语料转换为语义向量；

信息匹配单元，用于将所述槽位标签的特征向量与外部知识库和历史对话语料库中的信息进行匹配，将匹配度最高的信息作为槽位标签具体指代的实体信息；所述将所述槽位标签的特征向量与外部知识库和历史对话语料库中的信息进行匹配具体包括：采用基于记忆力网络的指针筛查方式，找到与所述槽位标签特征向量最相关的知识条目，并从所述知识条目中选择出符合要求的实体信息；