CN114118101B

CN114118101B - 对话数据生成方法及装置、设备和介质

Info

Publication number: CN114118101B
Application number: CN202111419074.5A
Authority: CN
Inventors: 田昕; 何东峰; 黄炼楷; 林英展; 黄世维
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-11-26
Filing date: 2021-11-26
Publication date: 2022-12-09
Anticipated expiration: 2041-11-26
Also published as: JP2023015233A; CN114118101A; EP4116864A2; EP4116864A3; US20230085458A1

Abstract

本公开提供了一种对话数据生成方法及装置、设备和介质，涉及人工智能领域，尤其涉及自然语言处理和深度学习技术领域。实现方案为：获取目标对话数据模板，所述目标对话数据模板包括一个或多个目标单轮对话数据模板，并且每个目标单轮对话数据模板包括一个或多个关键词槽位以及每个关键词槽位的相关信息，每个关键词槽位的相关信息包括位置信息和属性信息；针对每个关键词槽位，至少基于该关键词槽位的属性信息，从关键词数据集中确定与该关键词槽位匹配的一个或多个目标关键词；以及针对每个目标单轮对话数据模板，基于所述一个或多个关键词槽位的位置信息，将所述一个或多个目标关键词相应填充到该目标单轮对话数据模板中，以得到目标对话数据。

Description

对话数据生成方法及装置、设备和介质

技术领域

本公开涉及人工智能领域，尤其涉及自然语言处理和深度学习技术领域，具体涉及一种对话数据生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

背景技术

人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

任务式对话(Task-Oriented Dialogue，TOD)系统面向垂直领域，目的是使用尽可能少的对话轮数帮助用户完成预定的任务或动作，例如预定机票、播放音乐和路线导航等。大多数任务式对话应用场景中数据规模较小，无法获得大量对话数据，因此难以通过大量数据进行模型训练，限制了任务式对话在各领域的使用。

在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

发明内容

本公开提供了一种对话数据生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

根据本公开的一方面，提供了一种对话数据生成方法，包括：获取目标对话数据模板，所述目标对话数据模板包括一个或多个目标单轮对话数据模板，并且每个目标单轮对话数据模板包括一个或多个关键词槽位以及每个关键词槽位的相关信息，每个关键词槽位的相关信息包括位置信息和属性信息；针对所述一个或多个关键词槽位中的每个关键词槽位，至少基于该关键词槽位的属性信息，从关键词数据集中确定与该关键词槽位匹配的一个或多个目标关键词，所述关键词数据集包括多个关键词以及每个关键词的属性信息；以及针对所述目标对话数据模板的所述每个目标单轮对话数据模板，基于所述一个或多个关键词槽位的位置信息，将所述一个或多个目标关键词相应填充到该目标单轮对话数据模板中，以得到目标对话数据。

根据本公开的一方面，提供了一种神经网络模型的训练方法，包括：采用上述对话数据生成方法生成样本对话数据；以及至少利用所述样本对话数据对所述神经网络模型进行训练。

根据本公开的另一方面，提供了一种对话数据生成装置，包括：获取单元，被配置用于获取目标对话数据模板，所述目标对话数据模板包括一个或多个目标单轮对话数据模板，并且每个目标单轮对话数据模板包括一个或多个关键词槽位以及每个关键词槽位的相关信息，所述每个关键词槽位的相关信息包括位置信息和属性信息；确定单元，被配置用于针对所述一个或多个关键词槽位中的每个关键词槽位，至少基于该关键词槽位的属性信息，从关键词数据集中确定与该关键词槽位匹配的一个或多个目标关键词，所述关键词数据集包括多个关键词以及每个关键词的属性信息；以及填充单元，被配置用于针对所述目标对话数据模板的所述每个目标单轮对话数据模板，基于所述一个或多个关键词槽位的位置信息，将所述一个或多个目标关键词相应填充到该目标单轮对话数据模板中，以得到目标对话数据。

根据本公开的另一方面，提供了一种对话数据生成装置，包括：上述对话数据生成装置，被配置用于生成样本对话数据；以及训练模块，被配置用于至少利用所述样本对话数据对所述神经网络模型进行训练。

根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述对话数据生成方法或神经网络模型的训练方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行上述对话数据生成方法或神经网络模型的训练方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，其中，计算机程序在被处理器执行时能够实现上述对话数据生成方法或神经网络模型的训练方法。

根据本公开的一个或多个实施例，可以高效地生成大量的对话数据，满足实际应用的需求。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图示例性地示出了实施例并且构成说明书的一部分，与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的，并不限制权利要求的范围。在所有附图中，相同的附图标记指代类似但不一定相同的要素。

图1示出了根据本公开示例性实施例的对话数据生成方法的流程图；

图2示出了根据本公开示例性实施例的获取目标对话数据模板的流程图；

图3示出了根据本公开示例性实施例的对话数据生成过程的示意图；

图4示出了根据本公开示例性实施例的神经网络模型的训练方法的流程图；

图5示出了根据本公开示例性实施例的对话数据生成装置的结构框图；

图6示出了根据本公开示例性实施例的神经网络模型的训练装置的结构框图；

图7示出了能够用于实现本公开实施例的示例性电子设备的结构框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在本公开中，除非另有说明，否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系，这种术语只是用于将一个元件与另一元件区分开。在一些示例中，第一要素和第二要素可以指向该要素的同一实例，而在某些情况下，基于上下文的描述，它们也可以指代不同实例。

在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的，而并非旨在进行限制。除非上下文另外明确地表明，如果不特意限定要素的数量，则该要素可以是一个也可以是多个。此外，本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。

大多数任务式对话应用场景中数据规模较小，无法获得大量对话数据，因此难以通过大量数据进行模型训练，限制了任务式对话在各领域的使用。相关技术中，通过人工构造并标注的方式来获得对话数据，这种方式的效率较低，成本较高，所能获得的对话数据多样性有限。

为解决上述问题，本公开提供了一种对话数据生成方法，通过获取或构造包括关键词槽位及其相关信息的对话数据模板，基于关键词槽位的相关信息填充对话数据模板，从而得到对话数据。所述方法能够高效地生成大量的对话数据，满足实际的应用需求。

下面将结合附图详细描述本公开的实施例。

图1示出了根据本公开示例性实施例的对话数据生成方法的流程图。如图1所示，所述方法包括：步骤S101、获取目标对话数据模板，所述目标对话数据模板包括一个或多个目标单轮对话数据模板，并且每个目标单轮对话数据模板包括一个或多个关键词槽位以及每个关键词槽位的相关信息，每个关键词槽位的相关信息包括位置信息和属性信息；步骤S102、针对所述一个或多个关键词槽位中的每个关键词槽位，至少基于该关键词槽位的属性信息，从关键词数据集中确定与该关键词槽位匹配的一个或多个目标关键词，所述关键词数据集包括多个关键词以及每个关键词的属性信息；步骤S103、针对所述目标对话数据模板的所述每个目标单轮对话数据模板，基于所述一个或多个关键词槽位的位置信息，将所述一个或多个目标关键词相应填充到该目标单轮对话数据模板中，以得到目标对话数据。由此，能够基于对话数据模板中关键词槽位的相关信息来自动匹配相应的关键词并填充，从而获得目标对话数据。所述方法能够充分利用对话数据模板中的信息，实现对话数据的自动生成，从而能够以较低的成本高效地获得大量对话数据，满足实际的应用需求。

根据一些实施例，所述每个关键词槽位的属性信息包括该关键词槽位所填充的关键词的词性信息和/或类别信息。由此，能够通过词性信息和/或类别信息匹配关键词槽位中填充的关键词，增强对话数据的多样性。

根据一些实施例，所述步骤S101、获取目标对话数据模板包括：获取历史对话数据，其中，所述历史对话数据包括一个或多个历史单轮对话数据，并且每个历史单轮对话数据包括至少一个关键词；以及基于每个历史单轮对话数据所包括的至少一个关键词，确定相应的一个或多个关键词槽位以及每个关键词槽位的相关信息，以得到该历史单轮对数数据相应的目标单轮对话数据模板。由此，能够充分利用现有的历史对话数据，基于历史对话数据中所包括的关键词的信息构建对话数据模板，从而生成更贴近真实场景的对话数据，降低对话数据生成的成本。

根据一些实施例，每个历史单轮对话数据还包括相应的意图信息，并且所述步骤S101、获取目标对话数据模板还包括：将每个历史单轮对话数据的意图信息确定为相应的目标单轮对话数据模板的意图信息。所述意图信息用于指示单轮对话的意图，由此，能够生成带有意图信息的对话数据，充分满足实际应用的需求。

图2示出了根据本公开示例性实施例的获取目标对话数据模板的流程图。如图2所示，根据一些实施例，所述目标对话数据模板包括多个单轮对话数据模板，并且所述步骤S101、获取目标对话数据模板包括：步骤S1011、基于对话动作标签，利用预设规则对对话数据集进行采样，以得到包括多个目标对话动作标签的目标对话动作标签序列，所述对话数据集包括多个对话动作标签以及每个对话动作标签相应的至少一个单轮对话数据模板；步骤S1012、基于所述目标对话动作标签序列中的每个目标对话动作标签，确定该目标对话动作标签相应的目标单轮对话数据模板；以及步骤S1013、基于所述目标对话动作标签序列和相应的多个目标单轮对话数据模板，构建包括多个目标单轮对话数据模板的目标对话数据模板。所述对话动作标签用于表示单轮对话数据的目的，通过随机采样对话动作标签，再根据对话动作标签得到目标单轮对话数据模板，能够生成多样性更强的目标对话数据模板。由此，能够不受限于历史对话数据的形式，通过人工构造一定数量的单轮对话数据模板，就能够获得多种形式的目标对话数据模板，从而生成更具多样性的对话数据。可以理解的，通过增加人工构造的单轮对话数据模板的数量，就能够进一步增加所生成的对话数据的多样性，所述方法具有较强的灵活性。

示例性的，对话动作标签可以包括“用户请求”、“系统回复”等，用于表示单轮对话数据的目的。在一个示例中，目标对话数据应用于酒店信息查询与预定领域，“用户请求”对话动作标签可以对应单轮对话数据模板“我需要一个[位置信息][星级信息]酒店”，该对话动作标签可以表示用户的酒店信息查询请求。相应的，“系统回复”对话动作标签可以对应单轮对话数据模板“我为你找到了一家[价格信息][酒店名称]酒店”，该对话动作标签可以表示系统对用户请求的回复。

根据一些实施例，所述步骤S1011、基于对话动作标签，利用预设规则对所述对话数据集进行采样包括：针对目标对话动作标签序列中的每个目标对话动作标签，至少基于该目标对话动作标签的前序目标对话动作标签，确定多个对话动作标签各自相应的采样概率；以及基于所述多个对话动作标签相应的采样概率，对所述对话数据集进行采样，以得到该目标对话动作标签。由此，能够得到更贴近真实场景的对话数据，充分满足实际应用的需求。

根据一些实施例，所述目标对话数据模板中的每个目标单轮对话数据模板还包括相应的意图信息，每个目标单轮对话数据模板相应的意图信息是基于该目标单轮对话数据模板相应的对话动作标签来确定的。所述意图信息用于指示单轮对话的意图，由此，能够生成带有意图信息的对话数据，充分满足实际应用的需求。

根据一些实施例，所述每个关键词槽位的相关信息还包括该关键词槽位的表述信息，并且所述对话数据生成方法还包括：获取关键词槽位的表述信息集，所述表述信息集包括多个关键词槽位的表述信息和属性信息之间的映射关系，并且所述步骤S103、将所述一个或多个目标关键词相应填充到该目标单轮对话数据模板中，以得到目标对话数据包括：基于该目标单轮对话数据模板所包括的每一个关键词槽位的属性信息，从所述关键词槽位的表述信息集中确定该关键词槽位的表述信息；以及基于所述一个或多个关键词槽位的位置信息和表述信息，将所述一个或多个目标关键词相应填充到该目标单轮对话数据模板中，以得到目标对话数据。所述表述信息用于表示关键词槽位中填充的词句表达方式，由此，能够增强对话数据的多样性。

在一个示例中，目标对话数据应用于酒店信息查询与预定领域。例如，目标单轮对话数据模板可以是“我需要一个[位置信息][星级信息]酒店”，该单轮对话数据模板中包括[位置信息]和[星级信息]两个关键词槽位，则[位置信息]这一关键词槽位对应的表述信息可以是“位于[酒店位置]的”，其中[酒店位置]对应的目标关键词可以是“市中心”，[星级信息]这一关键词槽位对应的表述信息可以是“[酒店星级]星级的”，其中[酒店星级]对应的目标关键词可以是“四”，则可以基于关键词槽位的位置信息和表述信息将目标关键词填充到目标单轮对话数据模板中，得到目标单轮对话数据“我需要一个位于市中心的四星级的酒店”。再例如，单轮对话数据模板还可以是“我为你找到了一家[价格信息][酒店名称]酒店”，该单轮对话数据模板中包括[价格信息]和[酒店名称]两个关键词槽位，则[价格信息]这一关键词槽位对应的表述信息可以是“价格[价格形容词]的”，其中[价格形容词]对应的目标关键词可以是“便宜”，[酒店名称]这一关键词槽位对应的表述信息可以是“叫做[酒店名称]的”，其中[酒店名称]对应的目标关键词可以是“世外桃源”，则可以基于关键词槽位的位置信息和表述信息将目标关键词填充到目标单轮对话数据模板中，得到目标单轮对话数据“我为你找到了一家价格便宜的叫做世外桃源的酒店”。

以下将结合附图，进一步描述本公开示例性实施例。

图3示出了根据本公开示例性实施例的对话数据生成过程的示意图。如图3所示，历史对话数据例如为“帮我找一下歌手A的歌曲B”，其中包括的关键词为“歌手A”和“歌曲B”。基于这两个关键词信息，能够确定该历史对话数据中的两个关键词槽位及其相关信息，从而得到目标对话数据模板“帮我找一下[人物]的[作品]”，其中包括[人物]和[作品]两个关键词槽位。基于这两个关键词槽位信息，能够从关键词数据集中确定与[人物]匹配的关键词“演员C”，以及与[作品]匹配的关键词“电影D”，基于关键词槽位的位置信息将所确定的关键词相应填充到目标对话数据模板中，则能得到目标对话数据“帮我找一下演员C的电影D”。

上述示例中，目标对话数据模板是通过获取历史对话数据及其中包括的关键词来获取的。根据本公开所述的对话数据生成方法，目标对话数据模板也可以是通过对对话数据集进行采样来获取的。

在另一个示例中，目标对话数据应用于智能旅行信息查询与预定领域，相应的对话数据集中包含的对话动作标签包括“用户请求”、“用户更多细节需求”、“用户预定请求”、“系统回复”、“系统预定确认”、“通用再见语句”等，每个对话动作标签可以对应一个或多个单轮对话数据模板。根据本公开所述的对话数据生成方法，首先基于对话动作标签，利用预设规则对对话数据集进行采样来得到目标对话动作标签序列，所得到的目标对话动作标签序列例如是“用户请求-系统回复”。基于该目标对话动作标签序列中的每个目标对话动作标签，可以确定该目标对话动作标签对应的目标单轮对话数据模板。例如基于“用户请求”确定相应的目标单轮对话数据模板“请帮我找一家[位置信息]的酒店”，基于“系统回复”确定相应的目标单轮对话数据模板“已帮您找到[位置信息]的[酒店名称]”。所述目标单轮对话数据模板中包括[位置信息]这一关键词槽位，则可根据该关键词槽位的属性信息从关键词槽位的表述信息集中确定该关键词槽位的表述信息，例如该关键词槽位的表述信息是“位于[地点]附近”。进一步地，根据该关键词槽位的属性信息，可以从关键词数据集中确定与其匹配的目标关键词，例如该目标关键词为“地点A”。根据另一个关键词槽位[酒店名称]的属性信息，例如可以从关键词数据集中确定预期匹配的目标关键词“酒店B”。基于所述关键词槽位的位置信息和表述信息将所述目标关键词填充到相应的目标单轮对话数据模板中，则可得到目标单轮对话数据“请帮我找一家位于地点A附近的酒店”以及“已帮您找到位于地点A附近的酒店B”，所述两个目标单轮对话数据即构成目标对话数据。

可以理解的，每个对话动作标签可以对应多个单轮对话数据模板，上述示例中也可以根据目标对话动作标签序列确定其他的单轮对话数据模板，从而生成与上述示例不同的目标对话数据，由此提升对话数据的多样性。每个关键词槽位的属性信息可以对应多个表述信息，上述示例中也可以根据关键词槽位的属性信息确定其他的表述信息，从而生成与上述示例不同的目标对话数据，由此提升对话数据的多样性。

根据本公开的另一方面，还提供一种神经网络模型的训练方法。图4示出了根据本公开示例性实施例的神经网络模型的训练方法的流程图。如图4所示，所述方法包括：步骤S401、生成样本对话数据；以及步骤S402、至少利用所述样本对话数据对所述神经网络模型进行训练，示例性的，步骤S401中可以是利用上文所述的对话数据生成方法来生成样本对话数据的。由此，能够利用生成的大量对话数据训练神经网络模型，从而提升模型的性能。

根据一些实施例，所述神经网络模型为预训练模型，并且步骤S402、至少利用所述样本对话数据对所述神经网络模型进行训练包括：利用所述样本对话数据对所述神经网络模型进行微调。由此，能够在缺乏领域数据的情况下，利用本案所述的方法生成新领域的对话数据，对预训练模型进行微调，提升模型在对应领域下的性能。

根据本公开的另一方面，还提供一种对话数据生成装置。图5示出了根据本公开示例性实施例的对话数据生成装置的结构框图，如图5所示，所述对话数据生成装置500包括：获取单元501，被配置用于获取目标对话数据模板，所述目标对话数据模板包括一个或多个目标单轮对话数据模板，并且每个目标单轮对话数据模板包括一个或多个关键词槽位以及每个关键词槽位的相关信息，所述每个关键词槽位的相关信息包括位置信息和属性信息；确定单元502，被配置用于针对所述一个或多个关键词槽位中的每个关键词槽位，至少基于该关键词槽位的属性信息，从关键词数据集中确定与该关键词槽位匹配的一个或多个目标关键词，所述关键词数据集包括多个关键词以及每个关键词的属性信息；以及填充单元503，被配置用于针对所述目标对话数据模板的所述每个目标单轮对话数据模板，基于所述一个或多个关键词槽位的位置信息，将所述一个或多个目标关键词相应填充到该目标单轮对话数据模板中，以得到目标对话数据。对话数据生成装置500的单元501-单元503的操作与前面描述的步骤S101-步骤S103的操作类似，在此不作赘述。

根据本公开的另一方面，还提供一种神经网络模型的训练装置。图6示出了根据本公开示例性实施例的神经网络模型的训练装置的结构框图，如图6所示，所述神经网络模型的训练装置600包括：对话数据生成装置601，被配置用于生成样本对话数据；以及训练模块602，被配置用于至少利用所述样本对话数据对所述神经网络模型进行训练。神经网络模型的训练装置600的单元601-单元602的操作与前面描述的步骤S401-步骤S402的操作类似，在此不作赘述。

根据本公开的另一方面，还提供一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的对话数据生成方法或神经网络模型的训练方法。

根据本公开的另一方面，还提供一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行上述的对话数据生成方法或神经网络模型的训练方法。

根据本公开的另一方面，还提供一种计算机程序产品，包括计算机程序，其中，所述计算机程序再被处理器执行时实现上述的对话数据生成方法或神经网络模型的训练方法。

参考图7，现将描述可以作为本公开的服务器或客户端的电子设备700的结构框图，其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示，设备700包括计算单元701，其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序，来执行各种适当的动作和处理。在RAM 703中，还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705，包括：输入单元706、输出单元707、存储单元708以及通信单元709。输入单元706可以是能向设备700输入信息的任何类型的设备，输入单元706可以接收输入的数字或字符信息，以及产生与电子设备的用户设置和/或功能控制有关的键信号输入，并且可以包括但不限于鼠标、键盘、触摸屏、轨迹板、轨迹球、操作杆、麦克风和/或遥控器。输出单元707可以是能呈现信息的任何类型的设备，并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元708可以包括但不限于磁盘、光盘。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据，并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组，例如蓝牙TM设备、802.11设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理，例如对话数据生成方法或神经网络模型的训练方法。例如，在一些实施例中，对话数据生成方法或神经网络模型的训练方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时，可以执行上文描述的对话数据生成方法或神经网络模型的训练方法的一个或多个步骤。备选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行上述对话数据生成方法或神经网络模型的训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行、也可以顺序地或以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

虽然已经参照附图描述了本公开的实施例或示例，但应理解，上述的方法、系统和设备仅仅是示例性的实施例或示例，本发明的范围并不由这些实施例或示例限制，而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外，可以通过不同于本公开中描述的次序来执行各步骤。进一步地，可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进，在此描述的很多要素可以由本公开之后出现的等同要素进行替换。

Claims

1.一种对话数据生成方法，包括：

获取目标对话数据模板，所述目标对话数据模板包括一个或多个目标单轮对话数据模板，并且每个目标单轮对话数据模板包括一个或多个关键词槽位以及每个关键词槽位的相关信息，每个关键词槽位的相关信息包括位置信息和属性信息；

针对所述一个或多个关键词槽位中的每个关键词槽位，至少基于该关键词槽位的属性信息，从关键词数据集中确定与该关键词槽位匹配的一个或多个目标关键词，所述关键词数据集包括多个关键词以及每个关键词的属性信息；以及

针对所述目标对话数据模板的所述每个目标单轮对话数据模板，基于所述一个或多个关键词槽位的位置信息，将所述一个或多个目标关键词相应填充到该目标单轮对话数据模板中，以得到目标对话数据，

其中，所述目标对话数据模板包括多个单轮对话数据模板，并且所述获取目标对话数据模板包括：

基于对话动作标签，利用预设规则对对话数据集进行采样，以得到包括多个目标对话动作标签的目标对话动作标签序列，所述对话数据集包括多个对话动作标签以及每个对话动作标签相应的至少一个单轮对话数据模板；

基于所述目标对话动作标签序列中的每个目标对话动作标签，确定该目标对话动作标签相应的目标单轮对话数据模板；以及

基于所述目标对话动作标签序列和相应的多个目标单轮对话数据模板，构建包括多个目标单轮对话数据模板的目标对话数据模板。

2.根据权利要求1所述的方法，其中，所述获取目标对话数据模板包括：

获取历史对话数据，其中，所述历史对话数据包括一个或多个历史单轮对话数据，并且每个历史单轮对话数据包括至少一个关键词；以及

基于每个历史单轮对话数据所包括的至少一个关键词，确定相应的一个或多个关键词槽位以及每个关键词槽位的相关信息，以得到该历史单轮对数数据相应的目标单轮对话数据模板。

3.根据权利要求2所述的方法，其中，每个历史单轮对话数据还包括相应的意图信息，并且其中，所述获取目标对话数据模板还包括：

将每个历史单轮对话数据的意图信息确定为相应的目标单轮对话数据模板的意图信息。

4.根据权利要求1所述的方法，其中，所述基于对话动作标签，利用预设规则对所述对话数据集进行采样包括：

针对目标对话动作标签序列中的每个目标对话动作标签，

至少基于该目标对话动作标签的前序目标对话动作标签，确定多个对话动作标签各自相应的采样概率；以及

基于所述多个对话动作标签相应的采样概率，对所述对话数据集进行采样，以得到该目标对话动作标签。

5.根据权利要求1所述的方法，所述目标对话数据模板中的每个目标单轮对话数据模板还包括相应的意图信息，每个目标单轮对话数据模板相应的意图信息是基于该目标单轮对话数据模板相应的对话动作标签来确定的。

6.根据权利要求1-5中任一项所述的方法，所述每个关键词槽位的相关信息还包括该关键词槽位的表述信息，并且所述方法还包括：

获取关键词槽位的表述信息集，所述表述信息集包括多个关键词槽位的表述信息和属性信息之间的映射关系，

其中，所述将所述一个或多个目标关键词相应填充到该目标单轮对话数据模板中，以得到目标对话数据包括：

基于该目标单轮对话数据模板所包括的每一个关键词槽位的属性信息，从所述关键词槽位的表述信息集中确定该关键词槽位的表述信息；以及

基于所述一个或多个关键词槽位的位置信息和表述信息，将所述一个或多个目标关键词相应填充到该目标单轮对话数据模板中，以得到目标对话数据。

7.根据权利要求1-5中任一项所述的方法，所述每个关键词槽位的属性信息包括该关键词槽位所填充的关键词的词性信息和/或类别信息。

8.一种神经网络模型的训练方法，包括：

采用权利要求1-7中任一项所述的方法生成样本对话数据；以及

至少利用所述样本对话数据对所述神经网络模型进行训练。

9.根据权利要求8所述的方法，其中，所述神经网络模型为预训练模型，并且其中至少利用所述样本对话数据对所述神经网络模型进行训练包括：

利用所述样本对话数据对所述神经网络模型进行微调。

10.一种对话数据生成装置，包括：

获取单元，被配置用于获取目标对话数据模板，所述目标对话数据模板包括一个或多个目标单轮对话数据模板，并且每个目标单轮对话数据模板包括一个或多个关键词槽位以及每个关键词槽位的相关信息，所述每个关键词槽位的相关信息包括位置信息和属性信息；

确定单元，被配置用于针对所述一个或多个关键词槽位中的每个关键词槽位，至少基于该关键词槽位的属性信息，从关键词数据集中确定与该关键词槽位匹配的一个或多个目标关键词，所述关键词数据集包括多个关键词以及每个关键词的属性信息；以及

填充单元，被配置用于针对所述目标对话数据模板的所述每个目标单轮对话数据模板，基于所述一个或多个关键词槽位的位置信息，将所述一个或多个目标关键词相应填充到该目标单轮对话数据模板中，以得到目标对话数据，

其中，所述目标对话数据模板包括多个单轮对话数据模板，并且所述获取单元被配置用于：

11.一种神经网络模型的训练装置，包括：

如权利要求10所述的对话数据生成装置，被配置用于生成样本对话数据；以及

训练模块，被配置用于至少利用所述样本对话数据对所述神经网络模型进行训练。

12.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至9中任一项所述的方法。

13.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使计算机执行根据权利要求1至9中任一项所述的方法。