CN117556026A

CN117556026A - 数据生成方法、电子设备及存储介质

Info

Publication number: CN117556026A
Application number: CN202410048903.0A
Authority: CN
Inventors: 王睿; 黎航宇; 武玉川; 黄非; 李永彬
Original assignee: Alibaba Cloud Computing Ltd
Current assignee: Alibaba Cloud Computing Ltd
Priority date: 2024-01-11
Filing date: 2024-01-11
Publication date: 2024-02-13
Anticipated expiration: 2044-01-11
Also published as: CN117556026B

Abstract

本申请公开了一种数据生成方法、电子设备及存储介质，涉及数据处理技术、文本生成技术、大模型技术领域。其中，该方法包括：获取用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出反馈数据。本申请解决了相关技术中用于训练模型的训练对话数据多样性较差，导致训练出的模型泛化性较低的技术问题。

Description

数据生成方法、电子设备及存储介质

技术领域

本申请涉及数据处理技术、文本生成技术、大模型技术领域，具体而言，涉及一种数据生成方法、电子设备及存储介质。

背景技术

大语言模型可以利用外部知识和外部工具，解答用户问题或实现用户需求，在智能客服、智能助手、企业模型等多种场景存在广泛的应用需求。大语言模型通常是利用预先构建好的训练对话数据进行训练得到的，但是，目前训练对话数据往往是整体构建的，难以实现较好的多样性，导致大语言模型的泛化性较低，无法应用于多种应用场景。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种数据生成方法、电子设备及存储介质，以至少解决相关技术中用于训练模型的训练对话数据多样性较差，导致训练出的模型泛化性较低的技术问题。

根据本申请实施例的一个方面，提供了一种数据生成方法，包括：获取用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出反馈数据。

根据本申请实施例的另一方面，还提供了一种数据生成方法，包括：构建多个智能体，其中，不同智能体用于生成不同对话角色的发言数据；通过多个智能体进行交互，生成训练对话数据，其中，训练对话数据用于对数据生成模型进行训练，数据生成模型用于生成用户数据对应的反馈数据。

根据本申请实施例的另一方面，还提供了一种数据生成方法，包括：响应作用于操作界面上的输入指令，在操作界面上显示用户数据；响应作用于操作界面上的反馈指令，在操作界面上显示用户数据对应的反馈数据，其中，反馈数据是利用数据生成模型处理用户数据所生成的数据，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据。

根据本申请实施例的另一方面，还提供了一种数据生成方法，包括：通过调用第一接口获取用户数据，其中，第一接口包括第一参数，第一参数的参数值包括用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；通过调用第二接口输出反馈数据，其中，第二接口包括第二参数，第二参数的参数值包括反馈数据。

根据本申请实施例的另一方面，还提供了一种数据生成装置，包括：获取模块，用于获取用户数据；生成模块，用于利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出模块，用于输出反馈数据。

根据本申请实施例的另一方面，还提供了一种数据生成装置，包括：构建模块，用于构建多个智能体，其中，不同智能体用于生成不同对话角色的发言数据；生成模块，用于通过多个智能体进行交互，生成训练对话数据，其中，训练对话数据用于对数据生成模型进行训练，数据生成模型用于生成用户数据对应的反馈数据。

根据本申请实施例的另一方面，还提供了一种数据生成装置，包括：第一显示模块，用于响应作用于操作界面上的输入指令，在操作界面上显示用户数据；第二显示模块，用于响应作用于操作界面上的反馈指令，在操作界面上显示用户数据对应的反馈数据，其中，反馈数据是利用数据生成模型处理用户数据所生成的数据，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据。

根据本申请实施例的另一方面，还提供了一种数据生成装置，包括：获取模块，用于通过调用第一接口获取用户数据，其中，第一接口包括第一参数，第一参数的参数值包括用户数据；生成模块，用于利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出模块，用于通过调用第二接口输出反馈数据，其中，第二接口包括第二参数，第二参数的参数值包括反馈数据。

根据本申请实施例的另一方面，还提供了一种电子设备，包括：存储器，存储有可执行程序；处理器，用于运行程序，其中，程序运行时执行上述任意一项的方法。

根据本申请实施例的另一方面，还提供了一种计算机可读存储介质，计算机可读存储介质包括存储的可执行程序，其中，在可执行程序运行时控制计算机可读存储介质所在设备执行上述任意一项的方法。

在本申请实施例中，采用获取用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出反馈数据的方式。容易注意到的是，通过多个智能体的交互构建，能够构建更加真实、多样的训练对话数据，基于更加真实、多样的对话数据对模型进行训练，达到了增强模型的泛化性的目的，从而实现了对模型训练时，可以使训练后的模型泛化性较强的技术效果，进而解决了相关技术中用于训练模型的训练对话数据多样性较差，导致训练出的模型泛化性较低的技术问题。

容易注意到的是，上面的通用描述和后面的详细描述仅仅是为了对本申请进行举例和解释，并不构成对本申请的限定。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种数据生成方法的应用场景的示意图；

图2是根据本申请实施例1的一种数据生成方法的流程图；

图3是根据本申请实施例1的一种可选的多个智能体交互的示意图；

图4是根据本申请实施例2的一种数据生成方法的流程图；

图5是根据本申请实施例3的一种数据生成方法的流程图；

图6是根据本申请实施例3的一种可选的操作界面的示意图；

图7是根据本申请实施例4的一种数据生成方法的流程图；

图8是根据本申请实施例5的一种数据生成装置的示意图；

图9是根据本申请实施例6的一种数据生成装置的示意图；

图10是根据本申请实施例7的一种数据生成装置的示意图；

图11是根据本申请实施例8的一种数据生成装置的示意图；

图12是根据本申请实施例的一种计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请提供的技术方案主要采用大模型技术实现，此处的大模型是指具有大规模模型参数的深度学习模型，通常可以包含上亿、上百亿、上千亿、上万亿甚至十万亿以上的模型参数。大模型又可以称为基石模型/基础模型（Foundation Model），通过大规模无标注的语料进行大模型的预训练，产出亿级以上参数的预训练模型，这种模型能适应广泛的下游任务，模型具有较好的泛化能力，例如大规模语言模型（Large Language Model，LLM）、多模态预训练模型（multi-modal pre-training model）等。

需要说明的是，大模型在实际应用时，可以通过少量样本对预训练模型进行微调，使得大模型可以应用于不同的任务中。例如，大模型可以广泛应用于自然语言处理（Natural Language Processing，简称NLP）、计算机视觉、语音处理等领域，具体可以应用于如视觉问答（Visual Question Answering，简称VQA）、图像描述（Image Caption，简称IC）、图像生成等计算机视觉领域任务，也可以广泛应用于基于文本的情感分类、文本摘要生成、机器翻译等自然语言处理领域任务。因此，大模型主要的应用场景包括但不限于数字助理、智能机器人、搜索、在线教育、办公软件、电子商务、智能设计等。在本申请实施例中，以多个智能体对话场景下通过大语言模型进行数据处理为例进行解释说明，

首先，在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释：

不对称信息（Asymmetric Information）：不同智能体可见的信息不同，不同的信息为不对称信息。

智能体（Agent）：具有一定的目标和行为模式，能够与其他智能体进行交互。

大语言模型（Large Language Models，LLMs）：简称大模型，通过大量数据和参数训练得到的语言模型。

预训练（Pre-train）：通过大量无标注数据训练语言模型。

监督微调（Supervised Fine-Tuning，SFT）：在预训练之后，使用少量监督数据对语言模型进行训练。

智能助理（intelligent assistant）：通过大模型等技术实现的个人助理，具有解答问题等功能。

API（application programming interface）：应用程序接口，按照规定要求传入请求参数后，执行一定的功能。

实施例1

根据本申请实施例，提供了一种数据生成方法，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

考虑到大模型的模型参数量庞大，且移动终端的运算资源有限，本申请实施例提供的上述数据生成方法可以应用于如图1所示的应用场景，但不仅限于此。图1是根据本申请实施例的一种数据生成方法的应用场景的示意图，如图1所示，大模型部署在服务器10中，服务器10可以通过局域网连接、广域网连接、因特网连接，或者其他类型的数据网络，连接一个或多个客户端设备20，此处的客户端设备20可以包括但不限于：智能手机、平板电脑、笔记本电脑、掌上电脑、个人计算机、智能家居设备、车载设备等。客户端设备20可以通过图形用户界面与用户进行交互，实现对大模型的调用，进而实现本申请实施例所提供的方法。

在本申请实施例中，客户端设备和服务器构成的系统可以执行如下步骤：客户端设备执行发送用户数据至服务器，其次接收服务器发送的反馈数据，并显示在图形用户界面上。服务器执行获取用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的对话数据；输出反馈数据。需要说明的是，在客户端设备的运行资源能够满足大模型的部署和运行条件的情况下，本申请实施例可以在客户端设备中进行。

在上述运行环境下，本申请提供了如图2所示的数据生成方法。图2是根据本申请实施例1的一种数据生成方法的流程图。如图2所示，该方法可以包括如下步骤：

步骤S202，获取用户数据。

上述的用户数据可以是用户在客户端设备的不同平台中输入的多模态数据，其中，多模态数据可以包括但不限于：文字数据和语音数据。例如，当用户在购物平台购物时，本实施例的具体应用场景为用户与卖家客服的沟通场景，此时用户数据可以为用户在购物平台中输入的文字数据“这个商品的价格是多少？”，又例如，当用户在网站平台（例如可以是搜索网站）想要查询某个东西时，本实施例的具体应用场景可以为用户与搜索网站的智能引擎之间的沟通场景，此时用户数据可以为用户向搜索网站中输入的语音数据“这个东西是什么？”，但不仅限于此。

在一种可选的实施例中，为了能够快速、准确且智能的对用户的用户数据进行反馈，在不同应用场景中，当用户在客户端设备输入用户数据后，服务器端首先可以从客户端设备获取用户的用户数据。

步骤S204，利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据。

上述的反馈数据可以是数据生成模型基于用户数据直接生成的反馈数据，还可以是由外部系统基于用户数据生成的反馈数据。需要说明的是，当数据生成模型无法直接基于用户数据生成反馈数据时，此时可以将数据生成模型看作“助理角色智能体”，此时数据生成模型可以生成调用外部系统的请求参数，由外部系统生成反馈数据。

上述的多个智能体可以包括但不限于：用户角色智能体、助理角色智能体和工具角色智能体。例如，在发言数据包含用户角色和助理角色的情况下，多个智能体可以包含两个智能体。又例如，当助理角色无法准确的对用户角色的用户数据进行反馈时，此时需要助理角色调用工具角色，以借助外部系统进行反馈（例如用户数据为“当前天气怎么样时”，助理角色可以调用工具角色，以借助外部的天气系统进行反馈），因此，多个智能体可以包含三个智能体。其中，用户角色智能体用于模仿真实世界的用户，提出需求或问题。助理角色智能体用于回答用户问题或满足用户需求，或生成用于调用工具角色智能体的请求参数。工具角色智能体基于请求参数生成工具角色的发言数据。其中，在模型训练过程中，工具角色智能体可以模拟外部系统生成反馈数据。上述的不同对话角色可以包括但不限于：用户角色智能体对应的用户角色，助理角色智能体对应的助理角色，以及工具角色智能体对应的工具角色。上述的发言数据可以包括但不限于：用户角色的训练用户数据、助理角色的训练反馈数据以及工具角色的训练调用数据。

上述的智能体（Agent）为一个函数或者模型，输入为历史轮次发言数据，输出为当前轮次发言数据/>，可以通过以下公式得到/>：/>。

其中，用户角色智能体对应的当前轮次发言数据为：/>，其中，User为用户角色智能体；助理角色智能体对应的当前轮次发言数据/>为：，其中，Assiatant为助理角色智能体；工具角色智能体对应的当前轮次发言数据/>为：/>，其中，Function为工具角色智能体。

需要说明的是，在本实施例中，助理角色智能体需要基于预先构建好的知识库数据和工具库数据以解决用户问题，实现用户需求。其中，知识库数据用于提供解答用户问题所需的相关知识文本。工具库数据用于基于用户需求调用的外部系统，其中，不同外部系统对应不同的API（即请求参数），可以以API描述文本的形式存储API。不同API描述文本中可以包括但不限于：API名称、API功能说明、API的入参定义以及API的出参定义。

还需要说明的是，知识库数据和工具库数据与本申请的应用具体场景有关，因此在得到训练对话数据之前，可以从应用场景中对知识库数据和工具库数据进行梳理，或者自动构建。本申请实施例主要关注的是知识库数据和工具库数据构建好之后的训练对话数据的构建。其中，知识库数据和工具库数据的定义为：，其中，/>为第i个场景的知识库数据和工具库数据，以文本的形式存储。在后续步骤中，可以忽略场景下标i。

在一种可选的实施例中，服务器端从客户端设备获取到用户数据后，首先可以对用户数据进行解析，当确定可以通过数据生成模型生成用户数据对应的反馈数据时，可以通过训练好的数据生成模型对用户数据进行处理，以快速、准确且智能的得到用户数据对应的反馈数据。例如，当服务器端获取到的用户数据为“这个商品的价格为多少？”时，可以通过训练好的数据生成模型对用户数据进行处理，得到反馈数据为“这个商品的价格为×××”，但不仅限于此。

在另一种可选的实施例中，服务器端从客户端设备获取到用户数据后，首先可以对用户数据进行解析，当确定无法通过数据生成模型生成用户数据对应的反馈数据时，此时可以通过数据生成模型生成调用外部系统的请求参数，由外部系统生成反馈数据。例如，当服务器端获取到的用户数据为“当前天气怎么样？”时，数据生成模型可以生成调用外部系统的请求参数，此时由天气系统生成“今天天气为晴”的反馈数据，但不仅限于此。

需要说明的是，在通过数据生成模型对用户数据处理之前，需要通过训练对话数据对数据生成模型进行训练，以提高数据生成模型的生成效率和生成准确率。其中，可以通过多个智能体的交互构建得到训练对话数据，例如，首先可以通过用户角色智能体生成用户角色的训练用户数据，其次可以通过助理角色智能体生成训练用户数据对应的训练反馈数据，若用户角色智能体未继续生成训练用户数据，则可以得到一组由两个智能体生成的训练对话数据。若用户角色智能体继续生成训练用户数据，那么可以通过助理角色智能体，继续生成训练用户数据对应的训练反馈数据，或者继续生成用于调用工具角色智能体的请求参数，然后工具角色智能体可以基于请求参数生成工具角色的发言数据，此时可以得到一组由三个智能体生成的训练数据，但不仅限于此。最后可以基于一组或多组的训练对话数据对数据生成模型进行训练，以提高数据生成模型的生成效率和生成准确率。

步骤S206，输出反馈数据。

在一种可选的实施例中，当服务器端通过数据生成模型或者外部系统得到用户数据对应的反馈数据后，可以将该反馈数据发送至客户端设备，客户端设备接收到该反馈数据后，可以在不同平台的显示框中向用户显示该反馈数据。

在本申请实施例中，采用获取用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出反馈数据的方式。容易注意到的是，通过多个智能体的交互构建，能够构建更加真实、多样的对话数据，基于更加真实、多样的训练对话数据对模型进行训练，达到了增强模型的泛化性的目的，从而实现了对模型训练时，可以使训练后的模型泛化性较强的技术效果，进而解决了的技术问题。

本申请上述实施例中，该方法还包括：利用多个智能体中的第一智能体生成第一轮次发言数据；将第一轮次发言数据作为历史轮次发言数据，并利用多个智能体中的第二智能体基于历史轮次发言数据，生成当前轮次发言数据；将当前轮次发言数据作为历史轮次发言数据，并重复执行利用第二智能体生成当前轮次发言数据的步骤，直至已经生成的多个轮次发言数据满足预设条件；确定所述已经生成的多个轮次发言数据为所述训练对话数据。

上述的训练对话数据可以表示为，其中，M为训练对话数据集合，/>为多个训练对话数据，t为训练对话数据的数量。其中，/>为一个二元组：/>，包括对话角色/>和对话数据/>。其中，对话角色/>包括：/>，其中，User为用户角色，Assistant为助理角色，Function为工具对象。当/>为User时，/>为用户角色的对话数据，当/>为Assistant时，/>为助理角色的对话数据，当/>为Function时，/>为工具角色的对话数据。

上述的第一智能体可以是用户角色智能体，上述的第二智能体可以是用户角色智能体、助理角色智能体以及工具角色智能体中的任意一个。上述的预设数量可以是用户提前确定的，用于生成多个轮次的训练对话数据。

在一种可选的实施例中，当通过用户角色智能体生成第一轮次发言数据后，此时可以将第一轮次发言数据作为历史轮次发言数据，并通过第二智能体基于历史轮次发言数据，生成历史轮次发言数据之后的当前轮次发言数据；其次可以将当前轮次发言数据作为历史轮次发言数据，并继续通过第二智能体基于历史轮次发言数据，生成历史轮次发言数据之后的当前轮次发言数据，以此类推，可以重复执行通过第二智能体生成当前轮次发言数据的步骤，在生成的对话数据的数量达到预设数量的情况下，可以确定已经生成的多个轮次发言数据为训练对话数据。

在另一种可选的实施例中，在重复执行通过第二智能体生成当前轮次发言数据的步骤的情况下，在用户角色智能体或者助理角色智能体输出指定字符后，可以确定已经生成的对话数据为训练对话数据。例如，当用户角色智能体输出“结束对话”的字符后，可以停止重复生成当前轮次发言数据的步骤，此时可以确定已经生成的多个轮次发言数据为训练对话数据。

本申请上述实施例中，多个智能体包含用户角色智能体、助理角色智能体和工具角色智能体，用户角色智能体用于生成用户角色的发言数据，助理角色智能体用于生成助理角色的发言数据，或生成用于调用工具角色智能体的请求参数，工具角色智能体基于请求参数生成工具角色的发言数据。

上述的请求参数可以是上述的API描述文本。

在一种可选的实施例中，多个智能体可以包括用户角色智能体、助理角色智能体以及工具角色智能体。其中，用户角色智能体用于生成用户的用户数据（即发言数据）；助理角色智能体用于基于用户的用户数据，生成用户数据的反馈数据，或者生成用于调用工具角色智能体的请求参数；工具角色智能体用于基于请求参数生成工具角色的发言数据。

本申请上述实施例中，在第二智能体为用户角色智能体的情况下，利用多个智能体中的第二智能体基于历史轮次发言数据，生成当前轮次发言数据，包括：基于知识库数据和工具库数据，生成场景描述信息，其中，知识库数据用于控制助理角色智能体生成助理角色的发言数据，工具库数据用于控制助理角色智能体生成请求参数，场景描述信息用于表征助理角色对应的对话功能和使用场景；基于知识库数据、工具库数据和场景描述信息，生成用户角色的画像信息；利用用户角色智能体基于场景描述信息、画像信息和历史轮次发言数据，生成当前轮次发言数据。

上述的知识库数据和工具库数据可以是上述的，在后续的描述中，可以省略场景下标i。不同的智能体可以通过已有的大语言模型实现，例如可以是生成式预训练模型3（Generative Pre-trained Transformer 3，GPT-3）、生成式预训练模型4（GenerativePre-trained Transformer 4，GPT-4）、元智能大规模语言模型（Large Language ModelMeta AI，LLaMa）等，但不仅限于此。其中，可以通过以下公式得到大语言模型的输出文本y：

y=LLM（z，x）；

其中，LLM为大语言模型，z为指令文本，x为输出文本。在不同智能体中，通过将不同的任务指令模板和任务输入模板，输入至不同智能体对应的大语言模型中，可以得到处理结果（即输出文本y）。

在一种可选实施例中，首先可以对知识库数据和工具库数据进行处理，得到场景描述信息，其次可以基于知识库数据、工具库数据和场景描述信息，生成用户角色的画像信息；最后可以通过用户角色智能体基于场景描述信息、画像信息和历史轮次发言数据，生成当前轮次发言数据。

例如，可以将知识库数据和工具库数据输入至场景描述生成模块中，得到场景描述信息，其次可以通过语言模型对知识库数据、工具库数据和场景描述信息进行处理得到用户角色的画像信息，最后可以通过用户角色智能体对应的大语言模型对场景描述信息、画像信息和历史轮次发言数据进行处理，得到当前轮次发言数据。

需要说明的是，知识库数据用于控制助理角色智能体生成助理角色的发言数据，工具库数据用于控制助理角色智能体生成请求参数，场景描述信息用于表征助理角色对应的对话功能和使用场景。

本申请上述实施例中，基于知识库数据和工具库数据，生成场景描述信息，包括：利用场景描述生成模块基于知识库数据和工具库数据，生成场景描述信息。

上述的场景描述生成模块可以是大语言模型LLM中的任意一种语言模型，通过将知识库数据和工具库数据输入至大语言模型中，可以得到场景描述信息。

在一种可选的实施例中，可以通过以下公式得到场景描述信息d：

；

其中，g为知识库数据和工具库数据，LLM为场景描述生成模块对应的语言模型，为场景描述生成模块对应的任务指令模板，/>为任务指令数据，/>为场景描述生成模块对应的任务输入模板，/>为任务输入数据。

由上式可知，将任务指令数据和任务输入数据/>输入至场景描述生成模块LLM中后，可以得到场景描述信息d。

需要说明的是，在真实世界中，助理角色（例如可以是助理）与用户角色（例如可以是用户）所掌握的信息是不对称的，助理了解具体的知识和工具，而用户只对助理的功能和所处场景有大致的模糊认知，因此在本实施例中，通过语言模型为用户角色智能体构建出与助理角色智能体的不对称信息，以实现更好的多样性。其中，场景描述信息d中包含助理角色智能体的功能介绍和场景描述，但不包含具体的知识和工具信息。

其中，任务指令模板具体可以包括但不限于：

你是一名智能助理，可以利用工具帮助用户，为了让用户了解你的能力，你需要生成一份中文的自我介绍，要求可以包括但不限于如下内容：

1、你需要介绍你的能力，不需要给出打招呼等闲聊内容；

2、介绍的长度控制在80字以内；

3、API的描述是面向开发者的，而不是用户，因此应当生成更加清晰移动的介绍，而不是直接复制API描述的内容。

其中，任务输入数据具体可以包括但不限于：

你了解以下知识：{knowledge}；

你可以使用以下API工具：{APIs}。

其中，{knowledge}和{APIs}来自知识库数据和工具库数据。{knowledge}是助理角色智能体所知的知识文本，{APIs}是助理角色智能体所知的工具描述文本（即请求参数），可以包括但不限于：API名称、API功能说明、API的入参定义以及API的出参定义。

本申请上述实施例中，基于知识库数据、工具库数据和场景描述信息，生成用户角色的画像信息，包括：利用画像生成模块基于知识库数据、工具库数据和场景描述信息，生成画像信息。

上述的画像生成模块可以是大语言模型LLM中的任意一种语言模型，通过将知识库数据、工具库数据和场景描述信息输入至画像生成模块中，可以得到画像信息。

在一种可选的实施例中，可以通过以下公式得到画像信息，其中，j表示画像信息的数量：

；

其中，LLM为画像生成模块对应的语言模型，为画像生成模块对应的任务指令模板，/>为任务指令数据，/>为画像生成模块对应的任务输入模板，为任务输入数据。

由上式可知，将任务指令数据和任务输入数据/>输入至画像生成模块LLM中，可以得到画像信息/>。

需要说明的是，在真实世界中，不同用户的背景、性格和特点都不同，所以不同用户在一组发言中的行为都会不同，因此本实施例通过语言模型为用户角色智能体生成一组多样化的画像信息。在一组对话中，可以采用其中一个的画像信息，从而实现同一场景内的多个发言数据的用户角色智能体的多样性。

其中，任务指令模板具体可以包括但不限于：

请根据助理角色智能体所处的场景，分析该场景的用户角色智能体可能具有的特点，具体要求可以包括但不限于：

生成10个不同的用户角色智能体对应的用户角色的画像信息，且不同画像信息之间不重复，其中，画像信息不仅限于10个，还可以是8个，12个等。

其中，任务输入模板可以包括但不限于：

该场景的描述为：{scenario}；

助理角色智能体具有以下知识：{knowledge}；

助理角色智能体可以使用以下API工具：{APIs}。

其中，{scenario}是场景描述，来自场景描述信息d。{knowledge}和{APIs}来自知识库数据和工具库数据g。{knowledge}是助理角色智能体所知的知识文本，{APIs}是助理角色智能体所知的工具描述文本（即请求参数），可以包括但不限于：API名称、API功能说明、API的入参定义以及API的出参定义。

本申请上述实施例中，利用用户角色智能体基于场景描述信息、画像信息和历史轮次发言数据，生成当前轮次发言数据，包括：将场景描述信息、画像信息和历史轮次发言数据输入至用户角色智能体对应的任务指令模板，生成用户角色智能体对应的任务指令数据；将场景描述信息、画像信息和历史轮次发言数据输入至用户角色智能体对应的任务输入模板，生成用户角色智能体对应的任务输入数据；利用用户角色智能体基于用户角色智能体对应的任务指令数据和任务输入数据，生成当前轮次发言数据。

在一种可选的实施例中，可以通过以下公式得到当前轮次发言数据：

；

其中，为历史轮次发言数据，LLM为用户角色智能体对应的语言模型，/>为用户角色智能体对应的任务指令模板，/>为任务指令数据，/>为用户角色智能体对应的任务输入模板，/>为任务输入数据。

其中，任务指令模板对画像信息生成任务做了一些规定，可以包括但不限于：

你是一名真实的用户，正在与一个助理角色智能体对话，请根据你所了解的信息、你的用户画像，生成你的下一轮回复，具体要求可以包括但不限于：

1、在对话中，你可以有多样化的行为，包括提供有用的信息、拒绝回答、修改已提供的信息等等。

其中，任务输入模板具体可以包括但不限于：

该场景的描述为：{scenario}；

你的用户画像为：{profile}；

对话历史为：{messages}。

其中，{scenario}是场景描述，来自场景描述信息d。{profile}为画像信息，来自生成的画像信息。{messages}是历史轮次发言数据，来自/>。

本申请上述实施例中，在第二智能体为助理角色智能体和工具角色智能体的情况下，利用多个智能体中的第二智能体基于历史轮次发言数据，生成当前轮次发言数据，包括：利用助理角色智能体基于历史轮次发言数据，生成目标发言数据，其中，目标发言数据包括如下之一：助理角色的发言数据，和请求参数；在目标发言数据包括助理角色的发言数据的情况下，确定助理角色的发言数据为当前轮次发言数据；在目标发言数据包括请求参数的情况下，利用工具角色智能体基于请求参数，生成当前轮次发言数据。

上述的助理角色的发言数据，是在助理角色智能体能够直接对历史轮次发言数据进行反馈的情况下生成的，在这种情况下，发言数据可以看作是历史轮次发言数据的当前轮次发言数据。上述的请求参数，是在助理角色智能体无法直接对历史轮次发言数据进行反馈的情况下生成的，请求参数用于使工具角色智能体基于请求参数生成当前轮次发言数据，此时，工具角色智能体模拟的是外部系统。

在一种可选的实施例中，在第二智能体为助理角色智能体和工具角色智能体的情况下，首先可以基于助理角色智能体对历史轮次发言数据进行解析，生成目标发言数据，其中，在助理角色智能体能够直接反馈历史轮次发言数据的情况下，目标发言数据为助理角色的发言数据，在助理角色智能体无法直接反馈历史轮次发言数据的情况下，目标发言数据为请求参数。在目标发言数据为助理角色的发言数据的情况下，可以确定助理角色的发言数据为当前轮次发言数据。在目标发言数据为请求参数的情况下，可以通过工具角色智能体基于请求参数，生成当前轮次发言数据。

本申请上述实施例中，利用助理角色智能体基于历史轮次发言数据，生成目标对话数据，包括：将知识库数据、工具库数据和历史轮次发言数据输入至助理角色智能体对应的任务指令模板，生成助理角色智能体对应的任务指令数据；将知识库数据、工具库数据和历史轮次发言数据输入至助理角色智能体对应的任务输入模板，生成助理角色智能体对应的任务输入数据；利用助理角色智能体基于助理角色智能体对应的任务指令数据和任务输入数据，生成目标对话数据。

在一种可选的实施例中，可以通过以下公式得到目标发言数据：

；

其中，LLM为助理角色智能体对应的大语言模型，为助理角色智能体对应的任务指令模板，/>为任务指令数据，/>为助理角色智能体对应的任务输入模板，/>为任务输入数据。

需要说明的是，助理角色智能体的目标是利用知识库数据和工具库数据回答用户问题或满足用户需求，助理角色智能体可知的信息有：知识库数据和工具库数据g。助理角色智能体的发言数据有两种情况：面向用户时的发言数据是助理角色对用户角色的回复；面向工具角色智能体时的发言数据是助理角色智能体调用工具API时的请求参数，以运行在客户端的脚本语言对象表示（JavaScript Object Notation，JSON）字符串的形式表示。

其中，任务指令模板对助理角色智能体的行为做了一些规定，具体可以包括但不限于：

1、如果你需要回复用户，请以“Response：回复内容”的格式生成；

2、如果你需要调用外部系统，请以“Action：API名称 Action Input：API请求参数”的形式回复；

3、如果用户没有提供API的必选参数值，你可以询问用户，不要询问用户API的可选参数值；

4、如果你的知识和工具无法帮助用户，你需要告知用户。

其中，任务输入模板用于给出知识和工具信息，具体可以包括但不限于：

你了解以下知识：{knowledge}；

你可以使用以下API工具：{APIs}；

对话历史为：{messages}。

其中，{knowledge}和{APIs}来自知识库数据和工具库数据g。{knowledge}是助理角色智能体所知的知识文本，{APIs}是助理角色智能体所知的工具描述文本，可以包括但不限于：API名称、API功能说明、API的入参定义以及API的出参定义。{messages}是历史轮次发言数据，来自。

本申请上述实施例中，利用工具角色智能体基于请求参数，生成当前轮次发言数据，包括：将知识库数据、工具库数据和请求参数输入至工具角色智能体对应的任务指令模板，生成工具角色智能体对应的任务指令数据；将知识库数据、工具库数据和请求参数输入至工具角色智能体对应的任务输入模板，生成工具角色智能体对应的任务输入数据；利用工具角色智能体基于工具角色智能体对应的任务指令数据和任务输入数据，生成当前轮次发言数据。

上述的请求参数也可以看作是历史轮次发言数据。其中，上述实施例已经限定了助理角色智能体的当前轮次发言数据可以包括如下之以：助理角色的发言数据，和请求参数，因此，请求参数可以看作是助理角色智能体在当前发言轮次的当前轮次发言数据，而在下一个发言轮次时，请求参数就可以被看作历史轮次发言数据。

；

其中，LLM为工具角色智能体对应的大语言模型，为工具角色智能体对应的任务指令模板，/>为任务指令数据，/>为工具角色智能体对应的任务输入模板，/>为任务输入数据。

需要说明的是，在助理角色智能体调用API后，需要获得API的返回值以进行下一步行动，真实的API返回值需要由对应的服务器端系统支持，成本较高，因此在本实施例中，通过语言模型建立工具角色智能体，模拟API调用过程。

其中，任务指令模板对工具角色智能体的行为做了一些规定，具体可以包括但不限于：

请根据API定义和对话历史，为API的请求生成一个合理的返回，具体要求可以包括但不限于：

1、返回值需要是可以解析的JSON格式；

2、返回值需要完整，不能有省略号。

其中，任务输入模板用于给出知识和工具信息，以及调用API，其中，具体要求可以包括但不限于：

API定义为：{APIs}；

对话历史为：{messages}。

其中，{APIs}是助理角色智能体所知的工具描述文本（即请求参数），来自知识库数据和工具库数据g，可以包括但不限于：API名称、API功能说明、API的入参定义以及API的出参定义。{messages}是历史轮次发言数据，来自。

本申请上述实施例中，该方法还包括：输出当前轮次发言数据；接收当前轮次发言数据对应的反馈结果，其中，反馈结果用于表征对当前轮次发言数据进行修改后得到的结果；基于反馈结果对生成当前轮次发言数据的目标智能体进行调整。

在一种可选的实施例中，在得到当前轮次的轮次数据后，首先还可以向客户端设备输出当前轮次的轮次数据，其次可以接受对当前轮次的轮次数据的反馈结果，然后可以基于反馈结果对生成当前轮次的轮次数据的目标智能体进行调整。

例如，向客户端设备输出当前轮次的轮次数据后，客户端设备的开发人员可以对当前轮次的轮次数据进行修改得到反馈结果，并将反馈结果重新发送至服务器端，那么服务器端可以基于反馈结果对生成当前轮次的轮次数据的目标智能体进行调整，进而可以提高目标智能体生成当前轮次的轮次数据的准确性。

本申请上述实施例中，基于反馈结果对生成当前轮次发言数据的目标智能体进行调整，包括如下至少之一：基于反馈结果对目标智能体的模型参数进行调整；基于反馈数据对目标智能体对应的任务指令模板和任务输入模板进行调整；基于反馈数据对输入至目标智能体的知识库数据和工具库数据进行调整。

在一种可选的实施例中，服务器端可以基于反馈结果对目标智能体的模型参数进行调整。

在另一种可选的实施例中，服务器端还可以基于反馈数据对目标智能体对应的任务指令模板和任务输入模板进行调整。

在又一种可选的实施例中，服务器端还可以基于反馈数据对输入至目标智能体的知识库数据和工具库数据进行调整。

本申请实施例提供了一种基于不对称信息的多智能体对话数据的构建方法，首先建立具有不对称信息（包括知识、目标、行为等）的多个智能体（包括用户角色智能体、助理角色智能体、工具角色智能体），然后通过多智能体之间的交互，构架多样化数据。

本申请实施例的所提供的方法主要包括五个步骤：

步骤S1，准备知识库数据和工具库数据；

步骤S2，建立助理角色智能体；

步骤S3，建立用户角色智能体；

步骤S4，建立工具角色智能体；

步骤S5，通过多个智能体的交互，构建对话数据。

图3是根据本申请实施例1的一种可选的多个智能体交互的示意图，如图3所示，在用户角色智能体（User）的视角下，通过一组知识库数据和工具库数据可以得到面向用户角色智能体的功能描述，其次可以将该功能描述分别发送至用户角色智能体，和生成多个不同的用户画像（即画像信息），然后可以从多个不同的用户画像中采集一个用户画像发送至用户角色智能体，同时，用户角色智能体还可以从多轮发言数据中获取到历史轮次发言数据，最后用户角色智能体可以基于功能描述、一个用户画像以及历史轮次发言数据生成用户角色智能体对应的当前轮次发言数据。

在助理角色智能体（Assistant）的视角下，首先可以将一组知识库数据和工具库数据发送至助理角色智能体，同时助理角色智能体可以从多轮发言数据中获取到历史轮次发言数据，最后助理角色智能体可以基于一组知识库数据和工具库数据，以及历史轮次发言数据，生成助理角色智能体对应的当前轮次发言数据。

在工具角色智能体（Function）的视角下，首先可以将一组知识库数据和工具库数据发送至工具角色智能体，同时工具角色智能体可以从多轮发言数据中获取到历史轮次发言数据（即请求参数），最后工具角色智能体可以基于一组知识库数据和工具库数据，以及历史轮次发言数据，生成工具角色智能体对应的当前轮次发言数据。

本申请实施例通过不对称信息模拟真实世界中的用户，能够构建更加真实、多样的对话数据。本申请实施例通过场景生成描述，构建用户角色智能体和助理角色智能体之间的不对称信息，知识库数据和工具库数据的具体细节对于用户角色智能体是不可见的，由此构建的对话更加真实和多样。本申请实施例通过生成一组用户画像描述，使得一次对话中的用户智能体都具有不同的画像背景，提升对话的多样性。此外，本申请实施例还通过智能体对API调用结果进行模拟，相比传统方案中调用真实外部系统获取返回值，本申请的方法的实现成本更低，易于扩展到大量多样化的API工具。

需要说明的是，本申请所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于分析的数据、存储的数据、展示的数据等），均为经用户授权或者经过各方充分授权的信息和数据，并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准，并提供有相应的操作入口，供用户选择授权或者拒绝。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质（如ROM/RAM、磁碟、光盘）中，包括若干指令用以使得一台终端设备（可以是手机，计算机，服务器，或者网络设备等）执行本申请各个实施例所述的方法。

实施例2

图4是根据本申请实施例2的一种数据生成方法的流程图。如图4所示，该方法可以包括如下步骤：

步骤S402，构建多个智能体，其中，不同智能体用于生成不同对话角色的发言数据；

步骤S404，通过多个智能体进行交互，生成训练对话数据，其中，训练对话数据用于对数据生成模型进行训练，数据生成模型用于生成用户数据对应的反馈数据。

在一种可选的实施例中，为了能够快速、准确且智能的生成用户的用户数据对应的反馈数据，首先可以构建多个智能体，其次可以通过多个智能体的交互，生成训练对话数据。其中，不同智能体用于生成不同对话角色的发言数据，训练对话数据用于对数据生成模型进行训练，数据生成模型用于生成用户数据对应的反馈数据。

本申请上述实施例中，通过多个智能体进行交互，生成训练对话数据，包括：利用多个智能体中的第一智能体生成第一轮次发言数据；将第一轮次发言数据作为历史轮次发言数据，并利用多个智能体中的第二智能体基于历史轮次发言数据，生成当前轮次发言数据；将当前轮次发言数据作为历史轮次发言数据，并重复执行利用第二智能体生成当前轮次发言数据的步骤，直至已经生成的对话数据的数量达到预设数量；确定已经生成的对话数据为训练对话数据。

在一种可选的实施例中，当通过用户角色智能体生成第一轮次发言数据后，此时可以将第一轮次发言数据作为历史轮次发言数据，并通过第二智能体基于历史轮次发言数据，生成历史轮次发言数据之后的当前轮次发言数据；其次可以将当前轮次发言数据作为历史轮次发言数据，并继续通过第二智能体基于历史轮次发言数据，生成历史轮次发言数据之后的当前轮次发言数据，以此类推，可以重复执行通过第二智能体生成当前轮次发言数据的步骤，在生成的对话数据的数量达到预设数量的情况下，可以确定生成的对话数据为训练对话数据。

实施例3

图5是根据本申请实施例3的一种数据生成方法的流程图。如图5所示，该方法可以包括如下步骤：

步骤S502，响应作用于操作界面上的输入指令，在操作界面上显示用户数据；

步骤S504，响应作用于操作界面上的反馈指令，在操作界面上显示用户数据对应的反馈数据，其中，反馈数据是利用数据生成模型处理用户数据所生成的数据，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据。

图6是根据本申请实施例3的一种可选的操作界面的示意图，如图6所示，该操作界面包括：输入按钮、反馈按钮和显示区域。如图6所示，当用户想要获取用户数据对应的反馈数据时，首先可以对操作界面中的输入按钮执行操作（例如，可以是按压操作或点击操作），基于操作可以产生输入指令，操作界面可以响应于输入指令在显示区域显示用户数据，其次用户可以对操作界面的反馈按钮执行操作（例如，可以是按压操作或点击操作），基于操作可以产生反馈指令，操作界面可以响应于反馈指令在显示区域显示用户数据对应的反馈数据。其中，反馈数据是利用数据生成模型处理用户数据所生成的数据，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据。

实施例4

图7是根据本申请实施例4的一种数据生成方法的流程图。如图7所示，该方法可以包括如下步骤：

步骤S702，通过调用第一接口获取用户数据，其中，第一接口包括第一参数，第一参数的参数值包括用户数据；

步骤S704，利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；

步骤S706，通过调用第二接口输出反馈数据，其中，第二接口包括第二参数，第二参数的参数值包括反馈数据。

上述的第一接口可以是服务器端向客户端设备获取用户数据的接口。上述的第二接口可以是服务器端向客户端设备输出反馈数据的接口。

在一种可选的实施例中，为了能够快速、准确且智能的生成用户的用户数据对应的反馈数据，当用户在客户端设备输入用户数据后，服务器端首先可以从通过第一接口客户端设备获取用户的用户数据，其次可以对用户数据进行解析，在确定数据生成模型可以直接生成用户数据对应的反馈数据后，服务器端可以通过数据生成模型处理用户数据，生成用户数据对应的反馈数据，最后服务器端可以通过调用第二接口向客户端设备输出反馈数据。

在另一种可选的实施例中，为了能够快速、准确且智能的生成用户的用户数据对应的反馈数据，当用户在客户端设备输入用户数据后，服务器端首先可以从通过第一接口客户端设备获取用户的用户数据，其次可以对用户数据进行解析，在确定数据生成模型无法直接生成用户数据对应的反馈数据时，可以通过数据生成模型生成调用外部系统的请求参数，其次可以通过服务器端调用与外部系统之间的第三接口，向外部系统发送请求参数，外部系统通过第三接口获取到请求参数后，可以基于请求参数生成用户数据对应的反馈数据，并通过调用与服务器端之间的第四接口，向服务器端返回反馈数据，服务器端接收到反馈数据后，可以通过调用第二接口，向客户端设备返回用户数据对应的反馈数据。

其中，第一接口包括第一参数，第一参数的参数值包括用户数据，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的对话数据，第二接口包括第二参数，第二参数的参数值包括反馈数据。第三接口可以是服务器端向外部系统发送请求参数的接口，第三接口包括第三参数，第三参数的参数值包括请求数据，第四接口可以是外部系统向服务器端返回反馈数据的接口，第四接口包括第四参数，第四参数的参数值包括反馈数据。

需要说明的是，在得到反馈数据后，还可以将反馈数据作为训练对话数据，用于对数据生成模型进行调整。

实施例5

根据本申请实施例，还提供了一种用于实施上述数据生成方法的数据生成装置。图8是根据本申请实施例5的一种数据生成装置的示意图，如图8所示，该装置包括：获取模块82、生成模块84和输出模块86。

其中，获取模块用于获取用户数据；生成模块用于利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出模块用于输出反馈数据。

此处需要说明的是，上述获取模块82、生成模块84和输出模块86对应于实施例1中的步骤S202至步骤S206，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块或单元可以是存储在存储器中并由一个或多个处理器处理的硬件组件或软件组件，上述模块也可以作为装置的一部分可以运行在实施例1提供的服务器10中。

本申请上述实施例中，该装置还包括：第一生成模块、第二生成模块、重复模块和确定模块。

其中，第一生成模块用于利用多个智能体中的第一智能体生成第一轮次发言数据；第二生成模块用于将第一轮次发言数据作为历史轮次发言数据，并利用多个智能体中的第二智能体基于历史轮次发言数据，生成当前轮次发言数据；重复模块用于将当前轮次发言数据作为历史轮次发言数据，并重复执行利用第二智能体生成当前轮次发言数据的步骤，直至已经生成的多个轮次发言数据满足预设条件；确定模块用于确定已经生成的多个轮次发言数据为训练对话数据。

本申请上述实施例中，多个智能体包含用户角色智能体、助理角色智能体和工具角色智能体，用户角色智能体用于生成用户角色的发言数据，助理角色智能体用于生成助理角色的发言数据，或生成用于调用工具角色智能体的请求参数，工具角色智能体用于基于请求参数生成工具角色的发言数据。

本申请上述实施例中，在第二智能体为用户角色智能体的情况下，第二生成模块包括：第一生成单元、第二生成单元和第三生成单元。

其中，第一生成单元用于基于知识库数据和工具库数据，生成场景描述信息，其中，知识库数据用于控制助理角色智能体生成助理角色的对话数据，工具库数据用于控制助理角色智能体生成请求参数，场景描述信息用于表征助理角色对应的对话功能和使用场景；第二生成单元用于基于知识库数据、工具库数据和场景描述信息，生成用户角色的画像信息；第三生成单元用于利用用户角色智能体基于场景描述信息、画像信息和历史轮次发言数据，生成当前轮次发言数据。

本申请上述实施例中，第一生成单元包括：第一生成子单元。

其中，第一生成子单元用于利用场景描述生成模块基于知识库数据和工具库数据，生成场景描述信息。

本申请上述实施例中，第二生成单元包括：第二生成子单元。

其中，第二生成子单元用于利用画像生成模块基于知识库数据、工具库数据和场景描述信息，生成画像信息。

本申请上述实施例中，第三生成单元包括：第三生成子单元、第四生成子单元和第五生成子单元。

其中，第三生成子单元用于将场景描述信息、画像信息和历史轮次发言数据输入至用户角色智能体对应的任务指令模板，生成用户角色智能体对应的任务指令数据；第四生成子单元用于将场景描述信息、画像信息和历史轮次发言数据输入至用户角色智能体对应的任务输入模板，生成用户角色智能体对应的任务输入数据；第五生成子单元用于利用用户角色智能体基于用户角色智能体对应的任务指令数据和任务输入数据，生成当前轮次发言数据。

本申请上述实施例中，在第二智能体为助理角色智能体和工具角色智能体的情况下，第二生成模块还包括：第四生成单元、确定单元和第五生成单元。

其中，第四生成单元用于利用助理角色智能体基于历史轮次发言数据，生成目标发言数据，其中，目标发言数据包括如下之一：助理角色的发言数据，和请求参数；确定单元用于在目标发言数据包括助理角色的发言数据的情况下，确定助理角色的发言数据为当前轮次发言数据；第五生成单元用于在目标发言数据包括请求参数的情况下，利用工具角色智能体基于请求参数，生成当前轮次发言数据。

本申请上述实施例中，第四生成单元包括：第六生成子单元、第七生成子单元和第八生成子单元。

其中，第六生成子单元用于将知识库数据、工具库数据和历史轮次发言数据输入至助理角色智能体对应的任务指令模板，生成助理角色智能体对应的任务指令数据；第七生成子单元用于将知识库数据、工具库数据和历史轮次发言数据输入至助理角色智能体对应的任务输入模板，生成助理角色智能体对应的任务输入数据；第八生成子单元用于利用助理角色智能体基于助理角色智能体对应的任务指令数据和任务输入数据，生成目标发言数据。

本申请上述实施例中，第五生成单元包括：第九生成子单元、第十生成子单元和第十一生成子单元。

其中，第九生成子单元用于将知识库数据、工具库数据和请求参数输入至工具角色智能体对应的任务指令模板，生成工具角色智能体对应的任务指令数据；第十生成子单元用于将知识库数据、工具库数据和请求参数输入至工具角色智能体对应的任务输入模板，生成工具角色智能体对应的任务输入数据；第十一生成子单元用于利用工具角色智能体基于工具角色智能体对应的任务指令数据和任务输入数据，生成当前轮次发言数据。

本申请上述实施例中，该装置还包括：对话数据输出模块、接收模块和调整模块。

其中，对话数据输出模块用于输出当前轮次发言数据；接收模块用于接收当前轮次发言数据对应的反馈结果，其中，反馈结果用于表征对当前轮次发言数据进行修改后得到的结果；调整模块用于基于反馈结果对生成当前轮次发言数据的目标智能体进行调整。

本申请上述实施例中，调整模块包括如下至少之一：第一调整单元、第二调整单元和第三调整单元。

其中，第一调整单元用于基于反馈结果对目标智能体的模型参数进行调整；第二调整单元用于基于反馈数据对目标智能体对应的任务指令模板和任务输入模板进行调整；第三调整单元用于基于反馈数据对输入至目标智能体的知识库数据和工具库数据进行调整。

需要说明的是，本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同，但不仅限于实施例1所提供的方案。

实施例6

根据本申请实施例，还提供了一种用于实施上述数据生成方法的数据生成装置。图9是根据本申请实施例6的一种数据生成装置的示意图，如图9所示，该装置包括：构建模块92和生成模块94。

其中，构建模块用于构建多个智能体，其中，不同智能体用于生成不同对话角色的发言数据；生成模块用于通过多个智能体进行交互，生成训练对话数据，其中，训练对话数据用于对数据生成模型进行训练，数据生成模型用于生成用户数据对应的反馈数据。

此处需要说明的是，上述构建模块92和生成模块94对应于实施例2中的步骤S402至步骤S404，两个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块或单元可以是存储在存储器中并由一个或多个处理器处理的硬件组件或软件组件，上述模块也可以作为装置的一部分可以运行在实施例1提供的服务器10中。

实施例7

根据本申请实施例，还提供了一种用于实施上述数据生成方法的数据生成装置。图10是根据本申请实施例7的一种数据生成装置的示意图，如图10所示，该装置包括：第一显示模块1002和第二显示模块1004。

其中，第一显示模块用于响应作用于操作界面上的输入指令，在操作界面上显示用户数据；第二显示模块用于响应作用于操作界面上的反馈指令，在操作界面上显示用户数据对应的反馈数据，其中，反馈数据是利用数据生成模型处理用户数据所生成的数据，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据。

此处需要说明的是，上述第一显示模块1002和第二显示模块1004对应于实施例3中的步骤S502至步骤S504，两个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块或单元可以是存储在存储器中并由一个或多个处理器处理的硬件组件或软件组件，上述模块也可以作为装置的一部分可以运行在实施例1提供的服务器10中。

实施例8

根据本申请实施例，还提供了一种用于实施上述数据生成方法的数据生成装置。图11是根据本申请实施例8的一种数据生成装置的示意图，如图11所示，该装置包括：获取模块1102、生成模块1104和输出模块1106。

其中，获取模块用于通过调用第一接口获取用户数据，其中，第一接口包括第一参数，第一参数的参数值包括用户数据；生成模块用于利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出模块用于通过调用第二接口输出反馈数据，其中，第二接口包括第二参数，第二参数的参数值包括反馈数据。

此处需要说明的是，上述获取模块1102、生成模块1104和输出模块1106对应于实施例4中的步骤S702至步骤S706，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块或单元可以是存储在存储器中并由一个或多个处理器处理的硬件组件或软件组件，上述模块也可以作为装置的一部分可以运行在实施例1提供的服务器10中。

实施例9

本申请的实施例可以提供一种计算机终端，该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地，在本实施例中，上述计算机终端也可以替换为移动终端等终端设备。

可选地，在本实施例中，上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中，上述计算机终端可以执行数据生成方法中以下步骤的程序代码：获取用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出反馈数据。

可选地，图12是根据本申请实施例的一种计算机终端的结构框图。如图12所示，该计算机终端A可以包括：一个或多个（图中仅示出一个）处理器1202、存储器1204、存储控制器、以及外设接口，其中，外设接口与射频模块、音频模块和显示器连接。

其中，存储器可用于存储软件程序以及模块，如本申请实施例中的数据生成方法和装置对应的程序指令/模块，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的数据生成方法。存储器可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：获取用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出反馈数据。

可选的，上述处理器还可以执行如下步骤的程序代码：利用多个智能体中的第一智能体生成第一轮次发言数据；将第一轮次发言数据作为历史轮次发言数据，并利用多个智能体中的第二智能体基于历史轮次发言数据，生成当前轮次发言数据；将当前轮次发言数据作为历史轮次发言数据，并重复执行利用第二智能体生成当前轮次发言数据的步骤，直至已经生成的多个轮次发言数据满足预设条件；确定已经生成的多个轮次发言数据为训练对话数据。

可选的，上述处理器还可以执行如下步骤的程序代码：多个智能体包含用户角色智能体、助理角色智能体和工具角色智能体，用户角色智能体用于生成用户角色的发言数据，助理角色智能体用于生成助理角色的发言数据，或生成用于调用工具角色智能体的请求参数，工具角色智能体用于基于请求参数生成工具角色的发言数据。

可选的，上述处理器还可以执行如下步骤的程序代码：基于知识库数据和工具库数据，生成场景描述信息，其中，知识库数据用于控制助理角色智能体生成助理角色的发言数据，工具库数据用于控制助理角色智能体生成请求参数，场景描述信息用于表征助理角色对应的对话功能和使用场景；基于知识库数据、工具库数据和场景描述信息，生成用户角色的画像信息；利用用户角色智能体基于场景描述信息、画像信息和历史轮次发言数据，生成当前轮次发言数据。

可选的，上述处理器还可以执行如下步骤的程序代码：利用场景描述生成模块基于知识库数据和工具库数据，生成场景描述信息。

可选的，上述处理器还可以执行如下步骤的程序代码：利用画像生成模块基于知识库数据、工具库数据和场景描述信息，生成画像信息。

可选的，上述处理器还可以执行如下步骤的程序代码：将场景描述信息、画像信息和历史轮次发言数据输入至用户角色智能体对应的任务指令模板，生成用户角色智能体对应的任务指令数据；将场景描述信息、画像信息和历史轮次发言数据输入至用户角色智能体对应的任务输入模板，生成用户角色智能体对应的任务输入数据；利用用户角色智能体基于用户角色智能体对应的任务指令数据和任务输入数据，生成当前轮次发言数据。

可选的，上述处理器还可以执行如下步骤的程序代码：利用助理角色智能体基于历史轮次发言数据，生成目标发言数据，其中，目标发言数据包括如下之一：助理角色的发言数据，和请求参数；在目标发言数据包括助理角色的发言数据的情况下，确定助理角色的发言数据为当前轮次发言数据；在目标发言数据包括请求参数的情况下，利用工具角色智能体基于请求参数，生成当前轮次发言数据。

可选的，上述处理器还可以执行如下步骤的程序代码：将知识库数据、工具库数据和历史轮次发言数据输入至助理角色智能体对应的任务指令模板，生成助理角色智能体对应的任务指令数据；将知识库数据、工具库数据和历史轮次发言数据输入至助理角色智能体对应的任务输入模板，生成助理角色智能体对应的任务输入数据；利用助理角色智能体基于助理角色智能体对应的任务指令数据和任务输入数据，生成目标发言数据。

可选的，上述处理器还可以执行如下步骤的程序代码：将知识库数据、工具库数据和请求参数输入至工具角色智能体对应的任务指令模板，生成工具角色智能体对应的任务指令数据；将知识库数据、工具库数据和请求参数输入至工具角色智能体对应的任务输入模板，生成工具角色智能体对应的任务输入数据；利用工具角色智能体基于工具角色智能体对应的任务指令数据和任务输入数据，生成当前轮次发言数据。

可选的，上述处理器还可以执行如下步骤的程序代码：输出当前轮次发言数据；接收当前轮次发言数据对应的反馈结果，其中，反馈结果用于表征对当前轮次发言数据进行修改后得到的结果；基于反馈结果对生成当前轮次发言数据的目标智能体进行调整。

可选的，上述处理器还可以执行如下步骤之一的程序代码：基于反馈结果对目标智能体的模型参数进行调整；基于反馈数据对目标智能体对应的任务指令模板和任务输入模板进行调整；基于反馈数据对输入至目标智能体的知识库数据和工具库数据进行调整。

采用本申请实施例，提供了一种获取用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出反馈数据的方式。容易注意到的是，通过多个智能体的交互构建，能够构建更加真实、多样的对话数据，基于更加真实、多样的训练对话数据对模型进行训练，达到了增强模型的泛化性的目的，从而实现了对模型训练时，可以使训练后的模型泛化性较强的技术效果，进而解决了的技术问题。

本领域普通技术人员可以理解，图所示的结构仅为示意，计算机终端也可以是智能手机（如Android手机、iOS手机等）、平板电脑、掌上电脑以及移动互联网设备（MobileInternetDevices，MID）、PAD等终端设备。图12其并不对上述电子装置的结构造成限定。例如，计算机终端A还可包括比图12中所示更多或者更少的组件（如网络接口、显示装置等），或者具有与图12所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器（Read-Only Memory，ROM）、随机存取器（RandomAccess Memory，RAM）、磁盘或光盘等。

实施例10

本申请的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于保存上述实施例一所提供的数据生成方法所执行的程序代码。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：获取用户数据；利用数据生成模型处理用户数据，生成用户数据对应的反馈数据，其中，用于训练数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成训练对话数据中不同对话角色的发言数据；输出反馈数据。

可选地，在本实施例中，存储介质还被设置为存储用于执行以下步骤的程序代码：利用多个智能体中的第一智能体生成第一轮次发言数据；将第一轮次发言数据作为历史轮次发言数据，并利用多个智能体中的第二智能体基于历史轮次发言数据，生成当前轮次发言数据；将当前轮次发言数据作为历史轮次发言数据，并重复执行利用第二智能体生成当前轮次发言数据的步骤，直至已经生成的多个轮次发言数据满足预设条件；确定已经生成的多个轮次发言数据为训练对话数据。

可选地，在本实施例中，存储介质还被设置为存储用于执行以下步骤的程序代码：多个智能体包含用户角色智能体、助理角色智能体和工具角色智能体，用户角色智能体用于生成用户角色的发言数据，助理角色智能体用于生成助理角色的发言数据，或生成用于调用工具角色智能体的请求参数，工具角色智能体用于基于请求参数生成工具角色的发言数据。

可选地，在本实施例中，存储介质还被设置为存储用于执行以下步骤的程序代码：基于知识库数据和工具库数据，生成场景描述信息，其中，知识库数据用于控制助理角色智能体生成助理角色的发言数据，工具库数据用于控制助理角色智能体生成请求参数，场景描述信息用于表征助理角色对应的对话功能和使用场景；基于知识库数据、工具库数据和场景描述信息，生成用户角色的画像信息；利用用户角色智能体基于场景描述信息、画像信息和历史轮次发言数据，生成当前轮次发言数据。

可选地，在本实施例中，存储介质还被设置为存储用于执行以下步骤的程序代码：利用场景描述生成模块基于知识库数据和工具库数据，生成场景描述信息。

可选地，在本实施例中，存储介质还被设置为存储用于执行以下步骤的程序代码：利用画像生成模块基于知识库数据、工具库数据和场景描述信息，生成画像信息。

可选地，在本实施例中，存储介质还被设置为存储用于执行以下步骤的程序代码：将场景描述信息、画像信息和历史轮次发言数据输入至用户角色智能体对应的任务指令模板，生成用户角色智能体对应的任务指令数据；将场景描述信息、画像信息和历史轮次发言数据输入至用户角色智能体对应的任务输入模板，生成用户角色智能体对应的任务输入数据；利用用户角色智能体基于用户角色智能体对应的任务指令数据和任务输入数据，生成当前轮次发言数据。

可选地，在本实施例中，存储介质还被设置为存储用于执行以下步骤的程序代码：利用助理角色智能体基于历史轮次发言数据，生成目标发言数据，其中，目标发言数据包括如下之一：助理角色的发言数据，和请求参数；在目标发言数据包括助理角色的发言数据的情况下，确定助理角色的发言数据为当前轮次发言数据；在目标发言数据包括请求参数的情况下，利用工具角色智能体基于请求参数，生成当前轮次发言数据。

可选地，在本实施例中，存储介质还被设置为存储用于执行以下步骤的程序代码：将知识库数据、工具库数据和历史轮次发言数据输入至助理角色智能体对应的任务指令模板，生成助理角色智能体对应的任务指令数据；将知识库数据、工具库数据和历史轮次发言数据输入至助理角色智能体对应的任务输入模板，生成助理角色智能体对应的任务输入数据；利用助理角色智能体基于助理角色智能体对应的任务指令数据和任务输入数据，生成目标发言数据。

可选地，在本实施例中，存储介质还被设置为存储用于执行以下步骤的程序代码：将知识库数据、工具库数据和请求参数输入至工具角色智能体对应的任务指令模板，生成工具角色智能体对应的任务指令数据；将知识库数据、工具库数据和请求参数输入至工具角色智能体对应的任务输入模板，生成工具角色智能体对应的任务输入数据；利用工具角色智能体基于工具角色智能体对应的任务指令数据和任务输入数据，生成当前轮次发言数据。

可选地，在本实施例中，存储介质还被设置为存储用于执行以下步骤的程序代码：输出当前轮次发言数据；接收当前轮次发言数据对应的反馈结果，其中，反馈结果用于表征对当前轮次发言数据进行修改后得到的结果；基于反馈结果对生成当前轮次发言数据的目标智能体进行调整。

可选地，在本实施例中，存储介质还被设置为存储用于执行以下步骤之一的程序代码：基于反馈结果对目标智能体的模型参数进行调整；基于反馈数据对目标智能体对应的任务指令模板和任务输入模板进行调整；基于反馈数据对输入至目标智能体的知识库数据和工具库数据进行调整。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可为个人计算机、服务器或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种数据生成方法，其特征在于，包括：

获取用户数据；

利用数据生成模型处理所述用户数据，生成所述用户数据对应的反馈数据，其中，用于训练所述数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成所述训练对话数据中不同对话角色的发言数据；

输出所述反馈数据。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

利用所述多个智能体中的第一智能体生成第一轮次发言数据；

将所述第一轮次发言数据作为历史轮次发言数据，并利用所述多个智能体中的第二智能体基于所述历史轮次发言数据，生成当前轮次发言数据；

将所述当前轮次发言数据作为所述历史轮次发言数据，并重复执行利用所述第二智能体生成所述当前轮次发言数据的步骤，直至已经生成的多个轮次发言数据满足预设条件；

确定所述已经生成的多个轮次发言数据为所述训练对话数据。

3.根据权利要求2所述的方法，其特征在于，所述多个智能体包含用户角色智能体、助理角色智能体和工具角色智能体，所述用户角色智能体用于生成用户角色的发言数据，所述助理角色智能体用于生成助理角色的发言数据，或生成用于调用所述工具角色智能体的请求参数，所述工具角色智能体用于基于所述请求参数生成工具角色的发言数据。

4.根据权利要求3所述的方法，其特征在于，在所述第二智能体为所述用户角色智能体的情况下，利用所述多个智能体中的第二智能体基于所述历史轮次发言数据，生成当前轮次发言数据，包括：

基于知识库数据和工具库数据，生成场景描述信息，其中，所述知识库数据用于控制所述助理角色智能体生成所述助理角色的发言数据，所述工具库数据用于控制所述助理角色智能体生成所述请求参数，所述场景描述信息用于表征所述助理角色对应的对话功能和使用场景；

基于所述知识库数据、所述工具库数据和所述场景描述信息，生成所述用户角色的画像信息；

利用所述用户角色智能体基于所述场景描述信息、所述画像信息和所述历史轮次发言数据，生成所述当前轮次发言数据。

5.根据权利要求4所述的方法，其特征在于，基于知识库数据和工具库数据，生成场景描述信息，包括：

利用场景描述生成模块基于所述知识库数据和所述工具库数据，生成所述场景描述信息。

6.根据权利要求4所述的方法，其特征在于，基于所述知识库数据、所述工具库数据和所述场景描述信息，生成所述用户角色的画像信息，包括：

利用画像生成模块基于所述知识库数据、所述工具库数据和所述场景描述信息，生成所述画像信息。

7.根据权利要求4所述的方法，其特征在于，利用所述用户角色智能体基于所述场景描述信息、所述画像信息和所述历史轮次发言数据，生成所述当前轮次发言数据，包括：

将所述场景描述信息、所述画像信息和所述历史轮次发言数据输入至所述用户角色智能体对应的任务指令模板，生成所述用户角色智能体对应的任务指令数据；

将所述场景描述信息、所述画像信息和所述历史轮次发言数据输入至所述用户角色智能体对应的任务输入模板，生成所述用户角色智能体对应的任务输入数据；

利用所述用户角色智能体基于所述用户角色智能体对应的任务指令数据和任务输入数据，生成所述当前轮次发言数据。

8.根据权利要求3所述的方法，其特征在于，在所述第二智能体为所述助理角色智能体和所述工具角色智能体的情况下，利用所述多个智能体中的第二智能体基于所述历史轮次发言数据，生成当前轮次发言数据，包括：

利用助理角色智能体基于历史轮次发言数据，生成目标发言数据，其中，所述目标发言数据包括如下之一：所述助理角色的发言数据，和所述请求参数；

在所述目标发言数据包括所述助理角色的发言数据的情况下，确定所述助理角色的发言数据为所述当前轮次发言数据；

在所述目标发言数据包括所述请求参数的情况下，利用所述工具角色智能体基于所述请求参数，生成所述当前轮次发言数据。

9.根据权利要求8所述的方法，其特征在于，利用所述助理角色智能体基于所述历史轮次发言数据，生成目标发言数据，包括：

将知识库数据、工具库数据和所述历史轮次发言数据输入至所述助理角色智能体对应的任务指令模板，生成所述助理角色智能体对应的任务指令数据；

将所述知识库数据、所述工具库数据和所述历史轮次发言数据输入至所述助理角色智能体对应的任务输入模板，生成所述助理角色智能体对应的任务输入数据；

利用所述助理角色智能体基于所述助理角色智能体对应的任务指令数据和任务输入数据，生成所述目标发言数据。

10.根据权利要求8所述的方法，其特征在于，利用所述工具角色智能体基于所述请求参数，生成所述当前轮次发言数据，包括：

将知识库数据、工具库数据和所述请求参数输入至所述工具角色智能体对应的任务指令模板，生成所述工具角色智能体对应的任务指令数据；

将所述知识库数据、所述工具库数据和所述请求参数输入至所述工具角色智能体对应的任务输入模板，生成所述工具角色智能体对应的任务输入数据；

利用所述工具角色智能体基于所述工具角色智能体对应的任务指令数据和任务输入数据，生成所述当前轮次发言数据。

11.根据权利要求2所述的方法，其特征在于，所述方法还包括：

输出所述当前轮次发言数据；

接收所述当前轮次发言数据对应的反馈结果，其中，所述反馈结果用于表征对所述当前轮次发言数据进行修改后得到的结果；

基于所述反馈结果对生成所述当前轮次发言数据的目标智能体进行调整。

12.根据权利要求11所述的方法，其特征在于，基于所述反馈结果对生成所述当前轮次发言数据的目标智能体进行调整，包括如下至少之一：

基于所述反馈结果对所述目标智能体的模型参数进行调整；

基于反馈数据对所述目标智能体对应的任务指令模板和任务输入模板进行调整；

基于所述反馈数据对输入至所述目标智能体的知识库数据和工具库数据进行调整。

13.一种数据生成方法，其特征在于，包括：

构建多个智能体，其中，不同智能体用于生成不同对话角色的发言数据；

通过所述多个智能体进行交互，生成训练对话数据，其中，所述训练对话数据用于对数据生成模型进行训练，所述数据生成模型用于生成用户数据对应的反馈数据。

14.根据权利要求13所述的方法，其特征在于，通过所述多个智能体进行交互，生成训练对话数据，包括：

15.一种数据生成方法，其特征在于，包括：

响应作用于操作界面上的输入指令，在所述操作界面上显示用户数据；

响应作用于所述操作界面上的反馈指令，在所述操作界面上显示所述用户数据对应的反馈数据，其中，所述反馈数据是利用数据生成模型处理所述用户数据所生成的数据，用于训练所述数据生成模型的训练对话数据是通过多个智能体的交互构建得到的，不同智能体用于生成所述训练对话数据中不同对话角色的发言数据。

16.一种数据生成方法，其特征在于，包括：

通过调用第一接口获取用户数据，其中，所述第一接口包括第一参数，所述第一参数的参数值包括所述用户数据；

通过调用第二接口输出所述反馈数据，其中，所述第二接口包括第二参数，所述第二参数的参数值包括所述反馈数据。

17.一种电子设备，其特征在于，包括：

存储器，存储有可执行程序；

处理器，用于运行所述程序，其中，所述程序运行时执行权利要求1至16中任意一项所述的方法。

18.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的可执行程序，其中，在所述可执行程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至16中任意一项所述的方法。