CN117556864B

CN117556864B - 信息处理方法、电子设备及存储介质

Info

Publication number: CN117556864B
Application number: CN202410044265.5A
Authority: CN
Inventors: 马文涛; 王轲; 武玉川; 李永彬; 黄非
Original assignee: Alibaba Cloud Computing Ltd
Current assignee: Alibaba Cloud Computing Ltd
Priority date: 2024-01-12
Filing date: 2024-01-12
Publication date: 2024-04-16
Anticipated expiration: 2044-01-12
Also published as: CN117556864A

Abstract

本申请提供一种信息处理方法、电子设备及存储介质，应用于人工智能技术领域，其中方法包括：确定智能体对应的待处理信息；将所述待处理信息和节点序列信息输入到大模型，其中，所述节点序列信息用于指示任务流程中包含的多个节点以及节点之间的边，节点表示针对智能体的行动指令，边表示节点间的跳转，以使所述大模型根据所述待处理信息，确定待执行的目标节点，并控制所述智能体执行所述目标节点对应的行动指令。本申请可以实现复杂流程的规划以及执行过程的可控，使智能体更加高效、准确地完成任务，并且，能够支持不同场景定制不同的任务流程，满足不同场景下的使用需求，提升用户体验度。

Description

信息处理方法、电子设备及存储介质

技术领域

本申请涉及人工智能技术，尤其涉及一种信息处理方法、电子设备及存储介质。

背景技术

大模型驱动的智能体(Agent)技术是大模型与人工智能领域的重要研究内容之一，有助于实现大模型在各行各业的广泛应用。

智能体能够通过自主规划来完成任务，对任务的处理可以简单描述为：感知、规划和行动（action），其中，感知是指智能体从环境中获取信息，规划是指智能体为了完成任务而做出的决策过程，例如可以对任务进行拆分，从而自主完成流程的规划，行动是指基于环境和规划做出的动作。

为了提升处理效果，可以利用大模型作为智能体的核心控制模块，基于大模型的能力对任务进行规划，并控制智能体实现任务的处理。但是，目前大模型驱动的智能体很难支持复杂的任务，容易产生不可控等问题，任务处理的效率和准确性较低，并且，很难满足对不同场景下任务流程的定制化需求，用户体验不佳。

发明内容

本申请提供一种信息处理方法、电子设备及存储介质，用以提升大模型驱动的智能体的任务处理效果。

第一方面，本申请实施例提供一种信息处理方法，包括：

确定智能体对应的待处理信息；

将所述待处理信息和节点序列信息输入到大模型，其中，所述节点序列信息用于指示任务流程中包含的多个节点以及节点之间的边，节点表示针对智能体的行动指令，边表示节点间的跳转，以使所述大模型根据所述待处理信息，确定待执行的目标节点，并控制所述智能体执行所述目标节点对应的行动指令。

第二方面，本申请实施例提供一种信息处理方法，包括：

获取用户的输入信息；

将所述输入信息和节点序列信息输入到大模型，其中，所述节点序列信息用于指示任务流程中包含的多个节点以及节点之间的边，节点表示针对智能体的行动指令，边表示节点间的跳转，以使所述大模型根据所述输入信息，确定待执行的目标节点，根据所述目标节点对应的行动指令确定智能体输出信息；

将所述智能体输出信息输出给用户。

第三方面，本申请实施例提供一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述电子设备执行上述任一方面所述的方法。

第四方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上述任一方面所述的方法。

本申请实施例提供的信息处理方法、电子设备及存储介质，可以确定智能体对应的待处理信息，将所述待处理信息和节点序列信息输入到大模型，其中，所述节点序列信息用于指示任务流程中包含的多个节点以及节点之间的边，节点表示针对智能体的行动指令，边表示节点间的跳转，以使所述大模型根据所述待处理信息，确定待执行的目标节点，并控制所述智能体执行所述目标节点对应的行动指令，从而可以利用任务流程中的节点和边构建智能体的处理流程，使得大模型可以更加准确地理解任务流程，驱动智能体参照任务流程执行相应的行动指令，实现复杂流程的规划以及执行过程的可控，从而更加高效、准确地完成任务，并且，能够支持不同场景定制不同的任务流程，满足不同场景下的使用需求，提升用户体验度。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1为本申请实施例提供的一种应用场景示意图；

图2为本申请实施例提供的一种信息处理方法的流程示意图；

图3为本申请实施例提供的一种ETC激活的流程图；

图4为本申请实施例提供的一种ETC消费记录查询的流程图；

图5为本申请实施例提供的一种智能体交互框架的示意图；

图6为本申请实施例提供的一种智能体训练方法的流程示意图；

图7为本申请实施例提供的一种构建训练数据的原理示意图；

图8为本申请实施例提供的一种应用于智能客服场景的信息处理方法的流程示意图；

图9为本申请实施例提供的一种电子设备的结构示意图。

通过上述附图，已示出本申请明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围，而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。

需要说明的是，本申请所涉及的用户信息（包括但不限于用户设备信息、用户属性信息等）和数据（包括但不限于用于分析的数据、存储的数据、展示的数据等），均为经用户授权或者经过各方充分授权的信息和数据，并且相关数据的收集、使用和处理需要遵守相关法律法规和标准，并提供有相应的操作入口，供用户选择授权或者拒绝。

本申请实施例可以通过大模型，例如，大语言模型来实现。其中，大语言模型是指具有大规模语言模型参数的深度学习语言模型，通常包含上亿、上百亿、上千亿、上万亿甚至十万亿以上的语言模型参数。大语言模型又可以称为基石语言模型/基础语言模型（Foundation Model），通过大规模无标注的语料进行大语言模型的预训练，产出亿级以上参数的预训练语言模型，这种语言模型能适应广泛的下游任务，语言模型具有较好的泛化能力，例如大规模语言模型（Large Language Model，LLM）、多模态预训练语言模型（multi-modal pre-training model）等。

大语言模型在实际应用时，仅需少量样本对预训练语言模型进行微调即可应用于不同的任务中，大语言模型可以广泛应用于自然语言处理（Natural LanguageProcessing，NLP）、计算机视觉等领域，具体可以应用于如视觉问答（Visual QuestionAnswering， VQA）、图像描述（Image Caption，IC）、图像生成等计算机视觉领域任务，以及基于文本的情感分类、文本摘要生成、机器翻译等自然语言处理领域任务，大语言模型主要的应用场景包括数字助理、智能机器人、搜索、在线教育、办公软件、电子商务、智能设计等。

首先对本申请所涉及的名词进行解释：

智能体:自主采取行动以实现目标，并可以通过学习或获取知识来提高其性能。

有向图：一个图（Graph）是表示物件与物件之间的关系的方式，是图论的基本研究对象。一个图看起来是由一些小圆点（称为顶点或节点）和连结这些圆点的直线或曲线（称为边）组成的。如果给图的每条边规定一个方向，那么得到的图称为有向图，其边也称为有向边。

下面先对本申请的应用场景进行说明。

大模型驱动的智能体，可以模仿人类与外界环境的交互过程对任务进行处理，例如，基于对环境的感知，结合自己的记忆和对世界的知识理解，做出规划、决策和行动，行动作用于环境后，环境会给智能体新的反馈，结合对反馈的观察，再做出行动，如此循环往复，最终通过与环境的交互实现任务的处理。

上述大模型驱动智能体的方案，可应用于各个领域的各种场景。以智能客服场景为例，传统的智能客服往往通过定义复杂的状态机来解决流程相关的任务。这种架构下，智能客服在与用户交互时，只能按照预定义好的状态机向用户输出固定的话术，交互生硬且遇到状态机之外的问题难以处理。

在将智能体应用于智能客服场景时，智能体可以在大模型的驱动下，对任务进行自主拆分和规划，并通过对用户输入信息的感知，不断地进行决策和行动实现任务的处理。

然而，当前的智能体还很难解决复杂的流程任务，主要瓶颈在于：

（1）复杂流程构建：较为复杂的任务会涉及到复杂的流程知识，这些流程存在严谨的先后与分支逻辑，目前的智能体通过大模型自主构建流程，但是在分支比较复杂的情况下大模型很难规划好整个流程，因此，复杂情况下智能体无法真正理解任务流程并完成复杂流程知识的构建，导致任务处理效果较差。

（2）可控规划：当前的智能体基于大模型自主规划整个执行流程，人类无法基于场景知识规划执行过程，导致整个执行路径很难按照自定义的场景知识去走，出错后也无法干预，难以做到可控规划。

有鉴于此，本申请实施例提供一种应用于智能体的信息处理方法，支持客户配置流程图，根据流程图中的节点和边构建智能体的处理流程，在智能体与环境的交互过程中，可以基于大模型确定当前智能体在流程图中所处的节点，并根据所处的节点控制智能体执行相应的行动指令，从而实现复杂流程的规划以及执行过程的可控。

图1为本申请实施例提供的一种应用场景示意图。如图1所示，本申请实施例提供的方案可以涉及以下几个阶段：

1.离线训练阶段，可以采用多个行业对应的训练数据对大模型驱动的智能体进行训练，其中，训练数据中可以包括各个行业的流程图，使得大模型具备利用流程图驱动智能体进行任务处理的能力。

2.客户配置阶段，也可以称为流程定制阶段，在该阶段，客户可以结合自身的行业，给出特定场景对应的流程图。例如，对于某高速ETC（Electronic Toll Collection，电子不停车收费）企业来说，可以配置ETC相关任务对应的流程图，并配置对应的API（Application Programming Interface，应用程序编程接口）系统，API系统可以包括流程图中可能使用到的API，从而使智能体可以借助于API系统更好地实现任务的处理。

具体的，客户配置的流程图可以为包含节点和边的有向图，在有向图中，节点表示智能体对应的行动指令，用于指引智能体的行动，边表示节点间的跳转。在获取到有向图后，可以将有向图转换成一个结构化的图指令，即节点序列信息，节点序列信息可以表现为文本的形式，便于输入到大模型进行处理。

3.在线使用阶段，智能体可以担任智能客服的角色，通过与用户的交互来处理相关的任务，例如，指引用户办理ECT激活等。在处理任务的过程中，根据流程图得到的节点序列信息会对大模型进行指引，使大模型可以基于当前的信息，确定当前待执行的节点，使得智能体可以执行当前节点对应的行动，例如，在节点包含调用API的行动指令时，智能体可以调用API系统中的相关API。

其中，本申请实施例中的“客户”是指对智能体对应的流程图进行配置的角色，可以是企业客户，例如ETC企业，也可以是其他类型的客户，“用户”是指在实际应用中，与智能体进行交互的角色，例如，智能体作为ECT领域的智能客服时，用户可以为有ECT办理需求的消费者。

通过上述方案，可以利用图结构解决复杂任务流程的构建问题，借助于流程图中的节点和边实现大模型驱动智能体进行任务的处理，让智能体按照场景定义的图指令逐步执行，实现路径可控。

相比于传统智能客服借助状态机输出固定回复话术的方式，本申请更加灵活，相比于智能体自主规划流程实现智能客服功能的方式，本申请通过流程图实现对大模型进行指引，使得大模型可以更加方便地理解任务流程，驱动智能体参照流程图进行行动，使得智能体的行动更加可控，从而更加高效、准确地完成任务，并且，支持客户定制场景相关的流程图，满足不同场景下的使用需求，还可以根据智能体的表现随时调整流程图以提高任务的处理效果，提升用户体验度。

由于大模型与智能体结合的方案在各个领域的落地还处于起步阶段，几乎没有复杂任务流程以及基于流程的训练数据，因此，本申请会针对大模型与智能体结合后基于任务流程的处理过程以及训练数据的构建过程，进行具体的说明。

下面结合附图，对本申请的一些实施方式作详细说明。在各实施例之间不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。另外，下述各方法实施例中的步骤时序仅为一种举例，而非严格限定。

图2为本申请实施例提供的一种信息处理方法的流程示意图。本实施例中的方法可以在任意具有信息处理功能的设备上实施，例如，云上实施、本地部署、客户端实施、IOT（Internet of Things，物联网）设备实施等。如图2所示，所述方法可以包括：

步骤201、确定智能体对应的待处理信息。

其中，所述智能体可以为大模型驱动的智能体，或者可以称为大模型控制的智能体，其中，驱动或控制的含义是，大模型可以作为对智能体行动进行决策的核心模块，智能体可以主动获取大模型输出的信息，并执行相应的行动。

在图1所示的方案中，智能体可以包括大模型，在其它可选的实现方式中，大模型与智能体也可以是两个分离的部分，本申请实施例对两者关系不作限定，只要能够实现由大模型对智能体进行驱动即可。

在智能体包括大模型的情况下，智能体中还可以设置有处理装置，用于执行本申请实施例提供的方法，该处理装置可以表现为软件、硬件或者软硬结合的方式。在智能体不包括大模型的情况下，本申请实施例提供的方法可以由智能体执行，当然，也可以通过其它外部的装置执行，只要能够实现智能体的动作即可。

智能体可以用于与环境进行交互，所述待处理信息可以包括智能体从环境获取到的信息。其中，环境可以是智能体之外的任意事物，例如，环境可以包括下述至少一项：用户、API系统、文档系统、其它智能体等，相应的，从环境获取到的信息可以包括下述至少一项：用户的输入信息、API系统返回的信息、文档系统返回的信息、其它智能体发送的信息（包括其它智能体生成或转发的信息等）。

示例性地，在智能客服领域，所述智能体对应的待处理信息可以包括用户的输入信息。

步骤202、将所述待处理信息和节点序列信息输入到大模型，其中，所述节点序列信息用于指示任务流程中包含的多个节点以及节点之间的边，节点表示针对智能体的行动指令，边表示节点间的跳转，以使所述大模型根据所述待处理信息，确定待执行的目标节点，并控制所述智能体执行所述目标节点对应的行动指令。

其中，行动也可以称为行为或者动作，是智能体的重要能力之一，在本申请实施例中，可以利用节点序列信息中的节点来对智能体的行动进行指示，利用边来对智能体在多个行动之间的跳转进行指示，使得大模型可以根据节点序列信息实现对智能体行动的驱动。

可选的，节点序列信息中，每个节点包含的行动指令，可以用于指示智能体进行一次或多次行动，每个节点可以对应一个或多个边。每个边用于连接两个节点，且任意两个节点之间最多有一条边。边可以是有方向的，用于表示节点之间的跳转，例如，节点A和节点B之间具有一条边，可以表示节点A执行完成后进入节点B。

此外，有些边还可以用于表示跳转条件，例如，节点A和节点B之间的边具有某种跳转条件，在满足该条件时才会进入节点B。

可选的，所述节点序列信息可以表现为多种形式，例如文本形式或者图像形式。在大模型具备图像处理能力的情况下，可以将流程图直接作为节点序列信息输入到大模型。在大模型不具备图像处理能力或者对性能要求较高的情况下，可以将流程图转换为文本形式的节点序列信息，并输入到大模型。

在将待处理信息和节点序列信息输入到大模型后，大模型可以根据节点序列信息，确定任务的具体流程，再结合待处理信息，可以确定当前所在的位置，即当前所处的节点，从而可以控制智能体执行节点对应的行动指令。

可选的，所述智能体可以通过与环境的多个轮次的交互实现任务的处理。每一轮次的交互信息可以包括智能体输出信息，即智能体输出到环境的信息，还可以包括智能体输入信息，即智能体从环境获取到的信息。

其中，一个轮次的交互可以包括智能体的一次输出和一次输入，交互的对象为环境，可以向环境输出一些信息，并从环境获取一些信息，从而完成一次交互。

如前所述，环境可以包括用户、API系统、文档系统、其它智能体等，每一轮次的具体交互对象可以为其中的一种，各个轮次交互的具体对象可以相同，也可以不同。

例如，在第一个轮次中，智能体与环境的交互具体为与用户的交互，智能体可以向用户输出询问信息，并获取用户输入的需求，在第二个轮次中，智能体与环境的交互具体为与API系统的交互，智能体可以向API系统输出待调用的API的名称和入参取值，并获取API系统返回的出参取值，在第三个轮次中，智能体可以继续与用户或者API系统或者其它对象进行交互，通过多个轮次的交互完成任务的处理。

上述步骤201至步骤202可以是每一轮次分别执行的步骤。在任一轮次，所述待处理信息包括之前轮次的交互信息，以使所述大模型根据之前轮次的交互信息、所述节点序列信息以及上一轮次对应的节点确定当前轮次对应的目标节点。

其中，大模型如何确定上一轮次对应的节点可以有多种实现方式。

在一种实现方式中，可以根据之前轮次的交互信息，确定当前已经执行到节点序列信息中的哪一节点，将该节点作为上一轮次对应的节点，并根据上一轮次对应的节点确定当前轮次对应的目标节点。示例性地，节点序列信息中的节点依次包括：节点1用于询问用户要查询哪个订单、节点2用于根据订单确定要查询的具体事项（如查询商品如何使用、或者查询快递信息）、节点3用于根据要查询的具体事项调用对应的API，节点3之后还可以包括其它节点。

大模型具有一定的自然语言理解和分析能力，能够根据已有交互情况确定当前执行到节点序列信息中的哪个位置，例如，若根据之前轮次的交互信息，判断当前已经询问并确定了要查询的订单和具体事项，但是还未调用对应的API，则可以确定上一轮次对应的节点为节点2，接下来可以执行节点3。

另一种实现方式中，可以直接将上一轮次对应的节点提示给大模型。可选的，每一轮次对应的节点可以由大模型自己确定并输出，并且，每一轮次输入到大模型的信息可以包含上一轮次确定的节点，以使大模型根据上一轮次对应的节点确定当前轮次对应的节点。

示例性地，输入到大模型的信息可以为：“节点序列信息为……，上一轮次对应的节点为……，之前轮次的交互信息为……，请根据这些信息确定当前要执行的节点，并确定要输出给环境的信息（例如发送给用户或API系统的信息）”。

以智能客服场景为例，与环境的交互包括下述至少一项：与用户进行交互、调用API、查询文档。其中，所述API系统包括多个API，用于根据待调用的API的入参的取值，返回对应的出参的取值；所述文档系统包括多个文档，用于根据待查询的信息，输出对应的文档。

在每一轮次中，智能体可以与用户、API系统、文档系统中的任意一项进行交互。在经过多轮交互后，完成任务处理。

具体的，可以通过节点序列信息中的多个节点实现多轮交互。本申请实施例对每一节点的功能不作限制。对于节点序列信息中的任一节点，该节点可以对应一轮交互，也可以对应至少两轮交互，也可以不涉及交互，只指示自身的计算过程，例如根据已有信息进行某些计算或者判断。并且，节点对应的交互次数也不作限制，可以由大模型根据当前与环境的交互情况进行智能分析，确定需要进行几次交互才能执行完该节点。

一种可选的方式中，在某一节点指示与环境进行交互时，大模型可以驱动智能体通过一次或多次交互过程完成对该节点的执行。

可选的，所述大模型确定当前轮次对应的目标节点，可以包括：根据之前轮次的交互信息，确定上一轮次对应的节点是否执行完毕，若执行完毕，则当前轮次对应的目标节点为上一轮次对应节点的下一节点；若未执行完毕，则当前轮次对应的目标节点依然为上一轮次的节点。

示例性的，某一节点指示调用API，而调用API的参数取值需要询问用户才能确定，则大模型可以先控制智能体与用户进行交互，再对当前是否获取到全部参数的取值进行判断，再通过与API系统的交互实现API的调用。

在这种情况下，在每一轮次，大模型可以确定上一轮次的节点是否执行完毕，例如，是否完成了节点指示的调用API的行动，若没有，则当前轮次对应的目标节点还是上一轮次的节点，直至完成上一轮次的节点指示的行动指令，才进入下一节点。

可选的，控制所述智能体执行所述目标节点对应的行动指令，包括：所述大模型判断当前是否满足执行目标节点对应的行动指令的条件，若满足，则当前轮次用于执行所述行动指令，若不满足，则当前轮次用于执行为所述行动指令做准备的交互。

示例性地，在确定当前的目标节点后，大模型可以根据之前轮次的交互，确定当前是否满足执行目标节点对应的行动指令的条件，例如，是否满足API调用的条件，若满足，则直接控制智能体与API系统进行交互，完成API的调用，若不满足，则确定API调用需要的准备工作，例如，需要先确定参数的取值，则可以先通过与用户的交互确定参数取值。

可选的，在根据目标节点对应的行动指令确定当前轮次的交互为与用户进行交互时，所述智能体输出信息包括对用户的回复信息，相应的，智能体输入信息包括用户的输入信息。

在根据目标节点对应的行动指令确定当前轮次的交互为调用API时，所述智能体输出信息包括待调用的API的名称和入参的取值，以使智能体根据API的名称和入参的取值向API系统发送API调用请求，相应的，智能体输入信息包括API系统返回的API的出参的取值。

在根据目标节点对应的行动指令确定当前轮次的交互为查询文档时，所述智能体输出信息包括待查询的信息，以使智能体根据待查询的信息向文档系统发送查询请求，相应的，智能体输入信息包括文档系统返回的查询到的文档。

通过上述方案，可以使智能体通过与用户、API系统和文档系统的交互完成任务的处理，从而借助API系统和文档系统的能力更好地实现为用户的服务，提升任务处理的效率，提高用户体验。

在另一种可选的方式中，可以设置每一节点对应一次交互，即，智能体在跳转到每一节点时，只需要进行一次交互便可完成该节点并进入下一节点。

相应的，所述大模型确定当前轮次对应的目标节点，可以包括：确定当前轮次对应的目标节点为上一轮次对应节点的下一节点，以控制所述智能体执行所述目标节点对应的行动指令。

这样，大模型可以更加简单、准确地判断当前的目标节点，从而使智能体的处理逻辑更加高效，可控性更强。

下面结合某高速ETC的智能客服流程，对本申请实施例的处理过程进行详细说明。

图3为本申请实施例提供的一种ETC激活的流程图。图4为本申请实施例提供的一种ETC消费记录查询的流程图。如图3和图4所示，在两个流程图中均包含节点和边，二者有不同的含义，其中节点包含每一步对智能体的行动指令，可以在一定程度上代表智能体的动作集合。边表示节点之间的跳转，其中还包含了用户的各种意图和表述、判断的依据条件等。

需要说明的是，为了便于描述，将每个节点对应的ID（标识）显示在文本框中，实际应用中并不需要显示出来。

在上述流程图中，还可以将文档、API的相关信息融合到节点中，通过节点的行动指令实现与文档系统、API系统的交互。例如，图中的B、F、J节点中的指令包含了对API的调用，表示到该节点需要调用对应API，G节点中的激活知识其实是一个文档，该节点指示根据文档知识来指导用户激活。可以看出通过流程图的节点设计，可以将文档、API和流程知识有机结合起来。

在获取到流程图后，可以对流程图进行处理，将流程图转换为对应的节点序列信息。

具体的，参考图3，ETC激活流程图对应的节点序列信息可以为：

“flowchart TD

A[开始]--ETC激活-->B[根据系统手机号，调用获取车牌信息的API，获取用户车牌信息]

B-->C[遍历用户车牌信息中的车牌号，跟用户确认待激活的车牌号]

C-->D{是否获取到待激活的车牌号}

D--是-->F[根据待激活的车牌号，调用获取车型信息的API，查询车型和对应激活知识]

F-->G[根据激活知识指导激活]

D--否-->E[询问待激活的车牌号]

E-->F

G--激活成功-->H[恭喜激活成功，致谢再见]”

参考图4，ETC消费记录查询流程图对应的节点序列信息可以为：

“flowchart TD

I([开始])--ETC消费记录查询-->J[根据获取ETC消费记录的API的定义，询问参数并调用]

J--查询返回内容正常-->K[告知用户查询返回的消费记录]

J--查询返回内容为空-->L[告知查询异常,请用户确认车牌号及日期]

K&L-->M[询问是否还有其它需要]

M--没有-->N[致谢并再见]”

其中，flowchart TD可以指示流程图中节点的方向为从上到下。“[]”和“{}”中的内容用于表示节点对应的行动指令，前者主要用于表示需要进行交互的内容，例如对用户的回复或者调用API的信息，后者主要用于表示智能体自身执行的流程，例如对某些参数进行判断。

“--”用于表示边，利用边可以描述整个流程图的跳转情况。“--”与“--”之间的内容用于表示跳转条件，可以用描述性自然语言描述各种跳转条件，例如用户意图、基于变量或内容的判断分支等。

上述流程图描述了ETC场景下的相关任务流程，为了更好地进行展示，上述流程图中还设置了开始节点、判断节点等，在开始节点，智能体可以向用户输出固定的询问话术，在判断节点，智能体可以根据当前的情况执行相应的判断流程。在实际应用中，可以根据场景需求对流程图进行调整。

例如，可以取消节点D，直接在节点C后设置2个边，分别连接节点E和节点F，基于边给出对应的跳转条件（是或者否）。又例如，两个流程图可以合并为一个流程图，具体的，可以将两个开始节点合并为一个，并分别通过不同的边进入ETC激活流程和ETC消费记录查询流程。

结合上述流程图，可以使大模型驱动智能体按照场景相关的流程协助用户完成ETC办理。为了更好地实现对大模型的指引，在本申请实施例中，可以通过提示信息（prompt）协助智能体实现任务处理，其中，提示信息可以包括输入提示信息和/或输出提示信息。

其中，输入提示信息可以包括下述至少一项：智能体画像信息、节点序列信息、跳转条件信息、API信息、任务信息、环境信息。下面通过几个方面分别对各个输入提示信息进行说明。

在第一种可选的实现方式中，输入提示信息可以包括智能体画像信息。其中，智能体画像信息可以用于定义智能体的角色和功能描述等，功能描述可以包括针对各个流程图的描述。

示例性地，所述智能体画像信息可以具体为：“你是高速ETC的智能助手，现在需要通过接听用户电话，帮助用户实现ETC设备激活、查询ETC消费记录，请根据以下流程，与用户进行沟通”。

在第二种可选的实现方式中，输入提示信息可以包括节点序列信息。其中，节点序列信息可以参考上述图3和图4对应的节点序列信息。

在第三种可选的实现方式中，输入提示信息可以包括跳转条件信息，跳转条件信息可以用于对边涉及的跳转条件进行解释或描述。可能涉及到的跳转条件可以包括但不限于：用户的意图、槽位和调用API后的返回值等。

可选的，在节点序列信息涉及的多个边中，每个边都可以用于指示两个节点之间的跳转。此外，至少部分边还可以用于表示跳转条件，以使所述大模型根据所述待处理信息，确定当前是否满足目标边对应的跳转条件，其中，所述目标边为上一轮次的节点作为起始节点的边，在满足目标边对应的跳转条件时，确定所述目标节点为所述目标边的结束节点。

示例性地，在节点L和节点M之间有一条边，说明在节点L执行完后，执行节点M，这是边用于指示节点间跳转的功能。此外，边还可以对应跳转条件，例如，节点I和节点J之间的跳转条件为“ETC消费记录查询”，说明在用户的意图为ETC消费记录查询时，才会进入节点J。

在任意一轮交互中，若大模型判断上一轮次的节点为节点I，并且，以节点I作为起始节点的目标边对应的跳转条件为“ETC消费记录查询”，若当前满足该跳转条件，则可以确定当前的目标节点为目标边的结束节点，即，节点J。

跳转条件可以由客户设置，某些跳转条件的判断较为简单，例如，只需要判断是或否即可。某些跳转条件的判断可能难度较大，例如，当客户定义跳转条件为特定场景涉及的某些意图或槽位时，大模型可能很难对该场景下的意图和槽位进行准确的判断。此时，可以在输入提示信息中增加对意图和槽位的描述信息，便于大模型准确判断是否满足跳转条件。

可选的，智能体与环境的交互包括与用户的交互，智能体输入信息包括用户的输入信息，在所述节点序列信息中任一节点的跳转条件包括意图和/或槽位时，所述方法还包括：将所述跳转条件信息输入到大模型，所述跳转条件信息包括所述节点序列信息包含的意图和/或槽位对应的描述信息，以使大模型在确定用户的输入信息与目标边对应的意图和/或槽位的描述信息相匹配时，确定满足目标边对应的跳转条件。

其中，意图可以是指用户的需求，例如，用户的输入信息为“A地区明天的天气怎么样”，则可以确定对应的意图为“天气查询”，槽位可以是意图对应的至少一个参数，例如，“天气查询”这一意图对应的槽位可以包括“地点”、“时间”等，根据意图和槽位的取值，可以确定输出给用户的信息，例如：“A地区明天多云转小雨”。

其中，所述描述信息可以是用于对意图和/或槽位进行解释的任意信息，例如，可以为意图或槽位对应的常见话术。

示例性地，节点A和节点B之间的跳转条件为“激活ETC”，为了提高大模型对该意图的理解，可以利用跳转条件信息对其进行解释说明。例如，跳转条件信息可以为：“流程中----中间表示跳转条件，其中包含的用户意图及其示例话术为：ETC激活：[‘我要激活ETC’，‘ETC设备买完怎么使用’]”。

根据上述跳转条件信息，大模型可以确定节点A和节点B之间的跳转条件对应的意图的具体含义，在确定用户的输入信息与目标边对应的意图的描述信息相匹配时，确定满足目标边对应的跳转条件。其中，相匹配可以是指语义相同或类似。

例如，在用户的输入信息为类似“我要激活ETC”或者“ETC设备买完怎么使用”的表述时，说明用户的意图为“ETC激活”，此时，可以由节点A跳转到节点B，执行节点B对应的流程。

类似地，跳转条件还可以包括对槽位的判断，相应的，跳转条件信息中可以包含对槽位的描述信息，具体实现原理与意图类似，此处不再赘述。

通过上述方案，可以利用大模型对节点间的跳转条件进行判断，在确定当前满足跳转条件时，进入跳转条件对应的目标节点，从而支持客户通过对边进行设置的方式实现对节点间跳转条件的限制，进而实现对智能体在各个行动之间的跳转进行限制，满足任务对应的需求。并且，在边包含对意图和/或槽位的识别时，可以将对应的意图和/或槽位的描述信息输入至大模型，使得大模型可以根据相关信息准确判断当前待进入的节点，减少大模型对特定场景的知识理解不足导致无法准确执行流程的情况，提升智能体处理任务的准确性。

在第四种可选的实现方式中，输入提示信息可以包括API信息。针对节点序列信息中涉及的API可以给出对应的API信息。

所述API信息可以包括API的名称、描述信息、至少一个入参和至少一个出参，以使所述大模型在目标节点对应的行动指令包括调用API时，确定当前是否获取到所述至少一个入参的取值，在未获取到至少部分入参的取值时，基于描述信息与用户进行交互，确定所述至少部分入参的取值，并确定调用API时对应的智能体输出信息包括：所述API的名称、所述API的至少一个入参的取值，以通过所述智能体输出信息完成API的调用，获取至少一个出参的取值。

示例性地，所述API信息具体可以为：

“流程中涉及的API信息包括：

获取ETC消费记录的API：

名称：getETCRecord；

描述信息:按照日期查询ETC消费记录，每次只能查询一天的消费记录；

输入参数：{"plate_no（车牌号）":{"description（描述）":"车牌号，7位的字符串，其中第一位为省级简称，后面为字母和数字","type（类型）":"string（字符串）"},"date（日期）":{"description":"日期：年+月+日，例如2022年5月6日、2021年7月1日，注意日期必须完整包含年、月、日，需要跟用户确认日期", "type":"string"}}；

输出参数：{"record（记录）":{"description": "消费记录描述文本", "type":"string"}}。”

参考上述示例，获取ETC消费记录的API对应的入参包括车牌号和日期，若根据上下文信息或者其它信息已经确定了车牌号，但是还未确定要查询的日期，则可以通过与用户的交互确定日期，与用户进行交互时，可以参考描述信息，例如，提示用户输入要查询的日期，每次只能查询一天的消费记录。

在获取到用户输入的日期后，可以将API的名称、各个入参对应的取值作为智能体输出信息，从而可以使API系统根据API的名称、各个入参对应的取值，返回出参对应的取值。

通过上述方案，可以将节点序列信息中涉及的各个API的信息作为输入提示信息输入到大模型，使得大模型可以根据API信息驱动智能体与API系统进行交互，完成对API的正确调用，从而可以借助于API系统高效实现任务的处理，进一步提升任务处理效果。

此外，节点序列信息中未涉及的、但是在实际应用中有可能被大模型通过检索或其它方式使用到的API，也可以给出对应的API信息，这样，即使节点的行动指令中没有直接出现某些API，但是，在输入提示信息中有这些API的信息，大模型也可以基于当前的情况选择使用这些API来实现任务的处理。

在第五种可选的实现方式中，输入提示信息可以包括任务信息，所述任务信息可以用于描述智能体要处理的任务，还可以包含任务处理过程中的注意事项等，从而实现对大模型驱动智能体处理任务的有效指导。

示例性地，所述任务信息具体可以为：“请通过与用户的交流协助用户完成ETC的相关任务。注意：1、请在回答用户问题时，专注于处理与流程、API相关的问题，完成对用户的引导。2、当用户提供参数信息时，确保按照指定格式进行确认。3、避免重复回复用户的问题，特别是已经确认过的事项。”

在第六种可选的实现方式中，输入提示信息可以包括环境信息。可选的，可以将环境信息输入到大模型，以使所述大模型在目标节点对应的行动指令包括调用API时，根据所述待处理信息和环境信息确定待调用的API的至少部分入参的取值，并在存在特定入参时，基于与用户的交互确定所述特定入参的取值；其中，所述特定入参为无法通过待处理信息以及环境信息确定取值的入参。

其中，所述环境信息可以包括无需与用户交互即可确定的信息，例如，当前的日期、时间等。

示例性地，所述环境信息可以具体为：“请记住当前的时间为：2023年10月21日17:00:00。用户的来电手机号码为13XXXX。”

参考上述示例，假设目标节点对应的行动指令包括调用获取用户ETC消费记录的API，且该API对应的入参包括待查询的日期，若根据待处理信息，例如之前轮次与用户的交互信息，确定用户想要查询昨天的消费记录，则可以结合环境信息确定待查询的日期为2023年10月20日。若存在根据之前轮次的交互信息和环境信息无法确定取值的入参，则可以进一步询问用户，通过与用户的交互确定相关参数的取值。

通过上述方案，可以将环境信息作为输入提示信息输入到大模型，使得大模型可以根据环境信息确定目标节点对应的API的至少部分入参的取值，减少与用户的交互次数，提高用户体验。

在实际应用中，输入提示信息可以包括上述六种实现方式涉及的一种或多种信息。示例性地，输入提示信息可以包括依次排列的下述信息：智能体画像信息、ETC激活流程对应的节点序列信息、ETC激活流程对应的跳转条件信息、ETC激活流程对应的API的信息、ETC消费记录查询流程对应的节点序列信息、ETC消费记录查询流程对应的跳转条件信息、ETC消费记录查询流程对应的API的信息、任务信息、环境信息。

可选的，这些信息可以同时输入到大模型，例如，将这些信息作为一整段的文本输入到大模型，或者，这些信息也可以分开输入。这些信息能够作为大模型的输入信息，实现对大模型的指引，帮助大模型更好地完成任务。

可选的，还可以将输出提示信息输入到大模型；其中，所述输出提示信息用于提示大模型的输出信息包括：上一轮次对应的节点、当前轮次的目标节点、根据目标节点确定的智能体输出信息。下面对输出提示信息进行详细说明。

其中，输出提示信息也可以称为输出思维链，用于提示大模型输出哪些内容。通过输出提示信息，可以对大模型的输出信息进行限制，来让大模型找到当前处于流程图中的哪个位置，并确定相应的行动指令。

可选的，大模型的输出信息可以包括思考部分和智能体输出信息，思考部分可以包括：上一轮次对应的节点、跳转条件（若有）、当前轮次的目标节点。其中，跳转条件也可以省略。

可选的，思考部分还可以包括：若目标节点对应的行动指令包括调用API，则思考API的入参取值是否都已获取到，并给出是否可以调用API的结论。

可选的，智能体输出信息可以按照交互的类型进行区分，例如，在与用户交互时，智能体输出信息为对用户的回复信息，在调用API时，智能体输出信息为API的名称和入参的取值。

可选的，所述方法还包括：确定所述大模型生成的输出信息中的智能体输出信息；通过智能体输出所述智能体输出信息。

示例性地，输入到大模型的输出提示信息具体可以为：

“请按照如下格式进行回答：

thought（思考部分）：【上一个节点】+【跳转条件】+【当前跳入节点】+……；

response（智能体输出信息）：【回答内容】，请注意按照格式填写。”

将上述输出提示信息输入到大模型后，大模型可以了解自身需要输出哪些内容，并按照对应的逻辑进行输出。

一示例中，当前需要调用API，大模型的输出信息可以具体为：

“thought:上一个节点=A，当前意图=ETC激活，当前应该跳入节点B，从上文中，可以得知getuserinfo（获取车牌信息的API）的参数及其取值，手机号码为13XXXX，getuserinfo的所有必选参数已知，不需要再询问，可以调用getuserinfo。

action（待执行的行动，具体为API的名称）：getuserinfo；

action input（行动对应的输入，具体为API入参的取值）：手机号码13XXXX。”

在大模型确定API的名称和入参的取值后，智能体可以根据名称和取值，通过API系统完成对相关API的调用，得到对应的出参的取值，并反馈给大模型，使得大模型可以根据出参的取值进行下一轮次的处理。

另一示例中，当前需要与用户进行交互，大模型的输出信息可以具体为：

“thought:上一个节点=B，当前应跳入节点C，遍历并确认车牌号。

response：好的，根据您的来电手机号查询到两个车牌，分别为京AXXXX和京BXXXX，请问您激活的是哪个呢？”

智能体可以将response的内容输出给用户，若用户后续还有输入，则将用户的输入信息反馈给大模型，使得大模型可以根据用户的输入信息进行下一轮次的处理。

在实际应用中，可以在每一轮次中，都将输入提示信息、输出提示信息和待处理信息输入到大模型，其中，待处理信息包括之前轮次的交互信息。为了便于理解，下面给出几轮交互信息的参考示例：

“<start（开始）>assistant（智能助手角色，用于表示智能体）：

您好，这里是高速ETC中心智能助手，请问有什么可以帮您？<end（结束）>

<start>user（用户）：

你好，我刚买了你们的ETC，按照说明书激活了还是用不了。<end>

<start>assistant：

thought:上一个节点=A，当前意图=ETC激活，当前应该跳入节点B，从上文中，可以得知getuserinfo的参数及其取值，手机号码为13XXXX，getuserinfo的所有必选参数已知，不需要再询问，可以调用getuserinfo。

action：getuserinfo；

action input：手机号码13XXXX。<end>

<start>function（职能角色，用于表示API系统）：

京AXXXX，京BXXXX。<end>

<start>assistant：

thought:上一个节点=B，当前应跳入节点C，遍历并确认车牌号。

response：好的，根据您的来电手机号查询到两个车牌，分别为京AXXXX和京BXXXX，请问您激活的是哪个呢？<end>”

其中，<start>和<end>用于表示某一角色当前输出的信息的开始位置和结束位置。

具体的，在第一个轮次，可以将输入提示信息、输出提示信息输入到大模型，输入提示信息、输出提示信息可以参考前述示例。输入提示信息中包含了流程图的相关信息，使得大模型可以按照流程图的指引进行规划，输出提示信息中包含了输出思维链，使得大模型可以通过思考节点间的跳转来控制智能体执行具体的行动指令。

其中，第一个轮次对应开始节点，即节点A，用于和用户打招呼。可选的，可以预先为开始节点配置对应的问候信息，作为智能体输出信息，例如：“您好，这里是高速ETC中心智能助手，请问有什么可以帮您”。在智能体输出对应的问候信息后，用户会输入query（问题），例如，“你好，我刚买了你们的ETC，按照说明书激活了还是用不了”，作为智能体输入信息。

在第二个轮次，可以将输入提示信息、输出提示信息和待处理信息输入到大模型，此时的待处理信息包括之前轮次的交互信息，即，第一轮次中的智能体输出信息和智能体输入信息。使得大模型可以根据这些信息进行思考，确定当前待执行的节点，并对下一步的行动做出决策，例如调用API，此时大模型会输出API对应的Action和Action Input。一旦检测到大模型的输出信息包括API对应的Action和Action Input，智能体就可以通过API的信息，与API系统进行交互，获取出参的取值。

在第三个轮次，可以将输入提示信息、输出提示信息和待处理信息输入到大模型，此时的待处理信息包括之前两个轮次的交互信息。大模型可以根据这些信息，驱动智能体与用户进行交互。以此类推，直至完成ETC激活的任务。

通过上述方案，可以使大模型根据之前轮次的交互信息和流程图的相关信息，结合上一轮次对应的节点确定当前轮次对应的目标节点，使得智能体可以根据目标节点的行动指令，完成与用户交互、调用API等行动，从而使得大模型可以更好地按照流程图进行智能体行动的规划，提升智能体执行任务的可控性，更好地实现可控规划的效果。此外，可以将输出提示信息输入到大模型，提示大模型的输出信息包括上一轮次对应的节点、当前轮次的目标节点、根据目标节点确定的智能体输出信息等，从而对大模型做出有效的引导，利用大模型的能力合理规划当前的行动，进一步提升智能体的可控性。

在实际应用中，输入提示信息、输出提示信息和待处理信息可以同时输入到大模型，例如，将输入提示信息和输出提示信息作为头部信息，与当前的待处理信息进行拼接后，输入到大模型，或者，也可以分开输入到大模型。

此外，提示信息还可以包括其它内容，例如，本申请实施例提供的各种大模型判断目标节点的方法、确定当前轮次交互内容的方法等，也可以作为提示信息输入到大模型。

以上给出了智能体通过与用户、API系统的多轮交互实现任务处理的示例。在其它可选的实现方式中，智能体也可以仅与用户进行交互、或者仅与API系统进行交互，流程图可以涉及多轮交互，也可以涉及一轮交互，一轮交互在流程图中的位置不作限定，例如，在前一个或几个节点中，可以先利用环境信息执行某些行动指令，在中间某节点与用户或API系统进行交互，在最后一个或几个节点中，根据交互的结果和其它信息继续执行相关的行动指令，直至完成任务的处理。

综上，本实施例提供的信息处理方法，可以确定智能体对应的待处理信息，将所述待处理信息和节点序列信息输入到大模型，其中，所述节点序列信息用于指示任务流程中包含的多个节点以及节点之间的边，节点表示针对智能体的行动指令，边表示节点间的跳转，以使所述大模型根据所述待处理信息，确定待执行的目标节点，并控制所述智能体执行所述目标节点对应的行动指令，从而可以利用任务流程中的节点和边构建智能体的处理流程，使得大模型可以更加准确地理解任务流程，驱动智能体参照任务流程执行相应的行动指令，实现复杂流程的规划以及执行过程的可控，从而更加高效、准确地完成任务，并且，能够支持不同场景定制不同的任务流程，满足不同场景下的使用需求，提升用户体验度。

下面对节点的行动指令对应的具体内容及节点序列信息的构建过程进行详细说明。

如前所述，节点对应的行动指令可以包括与用户进行交互、调用API、查询文档、对参数进行判断等。相应的，节点序列信息中的多个节点可以包括：回复节点、调用节点、查询节点、判断节点等。

在一种可选的实现方式中，所述多个节点包括用于对用户进行回复的回复节点，回复节点对应的行动指令为以下任意一种类型：

普通回复，用于指示根据行动指令中包含的内容进行回复；

严格回复，用于指示按照行动指令中给出的禁止修改的内容和格式进行回复；

分步回复，用于指示通过至少两次交互实现对用户的回复；

灵活回复，用于指示根据行动指令中给出的知识进行回复；

其中，所述行动指令中包含用于指示回复的类型的关键词，以使大模型根据关键词确定回复的类型，并生成相应的回复信息。

具体的，普通回复是指：对于回复内容没有严格的要点信息要求时，可以直接编辑行动指令告知如何回复，如：[告诉用户在A地有购房提取记录时，无法在B地领取补贴]。在普通回复的情况下，智能体输出的内容可以与行动指令给出的内容一致，也可以稍作调整，例如，可以为不同的智能体配置不同的风格，如严谨、活泼等，大模型可以根据相应的风格对行动指令中的内容进行适应性的调整并输出。

严格回复是指：在回复内容包括重要且不可修改的内容时，使用严格回复，严格回复的内容和格式可以由客户确定，例如，格式为[严格回复：回复内容标题]，由于严格回复一般较长，具体的回复内容可以在回复知识列具体定义。

分步回复是指：在回复内容较长且可以分步告知用户时，使用分步回复，例如，分步回复对应的行动指令可以为[先确定优惠券的类别，再根据店铺优惠券和直播优惠券的知识进行回复]，或者[根据ETC激活知识拆解多步，分步引导用户激活ETC]。

灵活回复是指：当回复内容可以基于某个知识进行选择性回答时，可以使用灵活回复，具体的，可以给出对应知识并让大模型基于该知识进行灵活回复，示例性地，行动指令可以为[基于打车金知识灵活回复]，其中，打车金知识可以写在节点的行动指令中，也可以通过其它方式输入到大模型，例如，包含在输入提示信息中。示例性地，输入提示信息可以包括：{打车金知识:在XX应用的评价页面，用户将看到打车金红包，点击之后就可以获得数量不等的打车金，可以直接抵扣出行消费。打车金可以用来抵扣快车消费，满10元可用，并且可以和打车优惠券叠加使用。打车金的有效期只有一周。}

上述不同类型的回复内容，可以直接写在节点的行动指令中，大模型可以根据行动指令中的关键词，确定对应的类型，并按照对应的类型进行回复。例如，行动指令中包含了严格、灵活、分步等关键词，则可以按照相应的类型生成回复信息。若没有包含严格、灵活、分步中的任一关键词，则可以按照普通回复的类型生成回复信息。

可选的，客户可以直接通过流程图指定各个节点的回复类型，并配置对应的行动指令。

通过设置不同类型的回复节点，使大模型按照类型生成对应的回复信息，可以满足不同场景下的回复需求，并且，还能利用一个节点实现对大模型的一次或多次交互的指引，有助于利用有限的流程图实现更多的流程交互，使得客户不必繁琐地配置流程图中的节点和跳转条件，提升客户体验度。

在另一种可选的实现方式中，所述多个节点包括用于调用API的调用节点，调用节点对应的行动指令包括：

默认部分，用于指示调用的API的名称；其中，所述API对应至少一个入参；

自定义部分，用于指示所述至少一个入参中全部或部分入参的取值的格式，以使所述大模型根据所述自定义部分得到符合格式的取值。

可选的，调用节点可以主要用于描述API的调用过程，其中，自定义部分可以为非必填项，即，调用节点对应的行动指令可以仅包括默认部分，也可以包括默认部分和自定义部分。

示例性地，默认部分可以为：[根据XXXAPI的定义询问相关参数并调用]。自定义部分一般用来提醒参数格式等内容，如：[注意参数日期的格式必须为年+月+日]。

通过提供默认部分和自定义部分，可以满足不同API的调用需求，并且，默认部分和自定义部分均可以由客户设置，客户可以通过自定义部分提醒大模型将参数转换为准确的格式，提升API调用的准确性，保证任务顺利完成。

在又一种可选的实现方式中，所述多个节点还可以包括判断节点、用于查询文档的查询节点等。

其中，判断节点一般可以用于根据某个内容或变量进行判断以决定后续分支，判断节点可以涉及与用户的交互，也可以不涉及，例如可以是询问用户某个信息或基于某个变量进行判断。

示例性地，判断节点的行动指令可以为：{询问用户办公地点是C地还是E地}或{判断车辆个数是否大于5}，后者也可以直接用伪代码来表示，如{if（如果）车辆个数>5}后面接True（真）和False（假）进入不同的分支。

查询节点可以用于与文档系统进行交互从而实现查询文档的能力，例如，所述查询节点对应的行动指令可以为：[根据用户选择的激活方式，查询相关的文档]。

客户可以通过画图的方式，完成对上述各种类型节点的配置。可选的，可以获取客户输入的用于指示任务流程的流程图；根据所述流程图，生成所述节点序列信息。其中，所述流程图中的节点和边的含义可以参考前述内容。所述节点序列信息可以为文本形式，具体可以表现为伪代码的形式。节点序列信息可以通过对图结构的描述将整个任务流程所涉及的行动指令呈现出来。

为了便于转换成文本形式的节点序列信息，可以设计一套流程图到伪代码的转换协议。例如，在一些技术中，提供从伪代码到流程图的转换，本申请实施例可以参考这类技术对应的转换协议，实现从流程图到伪代码的转换，使得流程图包含的信息可以转化成文本序列的指令。

可选的，根据所述流程图，生成所述节点序列信息，包括：确定所述流程图中的多个节点，为各个节点分配对应的ID；确定所述流程图中的多个边，针对每一个边生成一段文本，所述文本包括该边的起始节点的ID、结束节点的ID以及结束节点对应的行动指令，若该边还包括跳转条件，则在起始节点的ID和结束节点的ID之间插入跳转条件。

其中，所述节点序列信息包括多段文本以及方向信息，所述方向信息用于指示多段文本的执行顺序，所述多段文本为所述多个边对应的文本。

以图3为例，在获取到客户输入的流程图时，流程图中包含各个节点对应的行动指令，但是不包含节点ID，可以遍历流程图中的所有节点，并为每个节点分配对应的ID。支持客户输入多张流程图，各个流程图中节点的ID可以不重复，以尽量避免任务处理过程中出现问题。

在为每个节点分配ID后，可以遍历所有的边，针对每一个边，使用预设的字符表示该边，例如“--”，并利用该字符连接该边的起始节点的ID和结束节点的ID，若该边还包括跳转条件，则可以插入跳转条件。此外，还可以添加结束节点对应的行动指令，使得大模型在跳转到该边对应的结束节点时，可以控制智能体执行相应的行动指令。

其中，流程图可以为有向图，边可以对应有方向，起始节点和结束节点可以为边的两个端点处的节点。在根据多个边生成多段文本后，多段文本形成所述节点序列信息。

节点序列信息中的方向信息可以用于指示多段文本的执行顺序，例如，自下而上执行，或者，自上而下执行等。可选的，方向信息也可以省略，默认自上而下执行。

通过上述方案，可以通过让客户像画日常流程图一样完成复杂任务的流程构建，并且，通过预先设计的规范对流程图进行转换，使得转换后得到的文本形式的节点序列信息与流程图的内容一致，且能够被大模型理解，从而使任务能够被顺利执行。

图5为本申请实施例提供的一种智能体交互框架的示意图。如图5所示，智能体交互系统可以主要涉及三个角色：用户、智能体、系统，其中，系统可以为API系统等。

客户可以为智能体配置流程知识和API知识，其中，流程知识可以包括流程图。流程知识和API知识可以有各自的处理模块，用于实现将流程图构建为图指令（文本形式的节点序列信息）、以及API的定义和注册。

API知识可以是领域中需要调用的工具，包括常用的查询、修改等等各类操作，每个API可以包含对应的出参和入参。根据API知识可以完成API的定义和注册。其中，定义和注册的参数可以是API包含的全部参数，也可以仅包括需要跟用户交互才能得到的参数，其它参数可以基于规则或者环境信息补充，即，大模型可以仅处理其中一部分参数。

图指令构建器可以用于根据流程图对应的节点序列信息和API的定义和注册信息，生成输入到大模型的信息，例如，可以生成提示信息并拼接用户的输入信息，给到大模型进行处理。大模型可以根据图指令构建器输出的信息进行规划，决定智能体每一步的行动。

可选的，大模型除了获取图指令构建器输出的信息，还可以直接从图指令和API的定义和注册信息中获取知识，例如，图指令构建器输出到大模型的提示信息中可能仅包含了部分API信息和图指令，大模型可以通过对当前的情况进行分析，在必要时从构建的全部图指令和API信息中获取知识，并进行处理。

图5所示的方案可以应用于在线使用阶段，也可以应用于离线训练阶段，在离线训练阶段，可以使用用户模拟器来代替用户，使用系统模拟器来代替API系统。其中，用户模拟器和系统模拟器可以分别使用具有较强处理能力的LLM来实现，从而对智能体进行训练。

示例性地，可以将prompt、各个API的信息以及待调用的API的名称和入参，输入到LLM，prompt为“你是一个用于处理API调用的系统，请参考相关的API知识，根据待调用的API的名称和入参的取值，生成并返回对应的出参的取值”，从而使LLM可以模拟API系统的功能，辅助实现API的调用。

这样，在离线训练阶段很难直接获取各行各业的用户和API系统的情况下，通过系统模拟器和用户模拟器，可以实现对真实用户和API系统的模拟，从而在尽量节约资源的情况下完成智能体的训练，提升训练的整体效率。

可选的，为了缓解训练数据匮乏的问题，本申请实施例中，可以基于多智能体(multi-agent)自动构建训练数据。

图6为本申请实施例提供的一种智能体训练方法的流程示意图。如图6所示，智能体的训练方法可以包括：

步骤601、根据所述智能体的画像信息，生成用于与所述智能体交互的多个用户的画像信息。

步骤602、根据各个用户的画像信息，分别构建对应的用户智能体，并根据所述智能体的画像信息，构建机器人智能体。

其中，所述用户智能体和所述机器人智能体均是基于经过训练的模型实现的。

所述智能体可以是用于与用户进行交互的智能体，即，智能体在完成任务的过程中，会涉及与用户的交互，此处不排除智能体还可能与其它模块，例如API系统进行交互。

在对智能体进行训练之前，可以先构建训练数据，由于大模型与智能体的落地应用较少，几乎没有对应的训练数据，因此，可以先根据智能体的画像信息，构建对应的用户智能体和机器人智能体，再完成训练数据的构建。

图7为本申请实施例提供的一种构建训练数据的原理示意图。如图7所示，可以先根据待训练的智能体的画像信息，生成对应的用户的画像信息。

示例性地，智能体的画像信息为：高速ETC中心智能助手，可以帮助激活ETC、查询ETC消费记录等。可以将智能体的画像信息输入到语言模型，利用语言模型的能力，生成与该智能体进行交互的多个用户的画像信息。

例如，可以提示语言模型如下信息：现在有一个智能客服，它的功能是……，跟它交互的用户可能会有哪些人，把他们的画像描述出来。语言模型可以根据提示生成多个画像信息，例如，用户1：新买了一辆车需要激活ETC；用户2：有两辆车，需要先激活再查询。

遍历生成的所有画像信息，分别构建对应的用户智能体，此外，根据智能体的画像信息，可以构建机器人智能体，其中，机器人智能体用于对前述实施例中的智能体进行模拟，用户智能体用于对用户进行模拟，机器人智能体和用户智能体都可以基于LLM或者其它能力较强的模型实现，从而基于模型的能力模拟智能体和用户之间的交互，生成对应的对话数据，作为后续的训练数据。具体的，可以将相关的画像信息输入到LLM，使得LLM可以按照画像信息实现对话。

例如，可以向机器人智能体对应的LLM输入如下的提示信息：“你是一个高速ETC中心智能助手，可以帮助激活ETC、查询ETC消费记录，请通过与用户的交流协助用户完成ETC的相关任务……”。可以向用户智能体对应的LLM输入如下的提示信息：“你是一个新买了一辆车并且需要激活ETC的用户，请通过与智能客服的交流完成ETC的激活……”。

步骤603、基于节点序列信息样本，控制所述机器人智能体与各个用户智能体进行交互，得到多个对话数据，所述对话数据包括用户智能体与机器人智能体的多轮对话。

在构建多个用户智能体和机器人智能体后，可以从中选择任意一个用户智能体和机器人智能体，两者按照自身对应的画像信息进行交互，构建对话数据，例如，用户智能体输出：“我新买的车需要激活ETC”，机器人智能体可以输出：“好的，查询到您的车牌信息为京CXXXX，请问是要激活这个车牌吗”。

在构建对话数据时，机器人智能体的处理过程可以参考前述实施例中智能体的处理过程，即，可以结合节点序列信息样本进行处理。此外，当节点序列信息样本中涉及调用API时，还可以利用系统模拟器完成API的调用。

步骤604、根据多个对话数据以及对应的节点序列信息样本，对所述智能体进行训练，得到训练后的智能体。

在得到多个对话数据后，可以根据对话数据和节点序列信息样本，对待训练的智能体进行训练，训练后的智能体可以用于执行图2所示的方法。

可选的，可以针对多个行业分别构建对话数据和节点序列信息样本，具体的，针对每一行业，可以设置该行业对应的智能体的画像信息，并获取该行业对应的流程图，根据流程图构建节点序列信息样本，进一步实现该行业的对话数据的构建，使得训练后的智能体具备多个行业的任务处理能力。

本实施例提供的训练方法，通过构建的用户智能体，可以模拟真实用户，从而基于场景知识构建多轮对话数据，形成与流程图严格对应的微调（fine-tuning）数据，对智能体进行针对性训练，进一步提升智能体在复杂任务上的效果。此外，通过智能体的画像信息构建了多样性的用户画像信息，再基于多样性的用户画像信息构建多样化的用户智能体，使得用户侧具有高度的多样性，进而可以构建高质量且多样性的训练数据，有效提升训练效果。

可选的，基于节点序列信息样本，控制所述机器人智能体与各个用户智能体进行交互，可以包括：在用户智能体与机器人智能体进行交互的过程中，将用户智能体与机器人智能体的交互信息以及判别提示信息输入到判别模型，其中，所述判别提示信息用于提示判别模型根据所述机器人智能体对应的画像信息、节点序列信息样本，判断所述交互信息中机器人智能体输出的信息是否满足要求；若根据判别模型确定所述机器人智能体输出的信息不满足要求，则指示所述机器人智能体重新生成输出的信息。

具体的，由于智能体与大模型的结合是一项比较新的技术，即使是现有的能力较强的模型，在某些场景下可能也很难较好地完成任务处理，因此，在本申请实施例中，可以增加一个判别模型作为对抗的角色，时刻关注机器人智能体是否按照期望去输出。

例如，可以向判别模型输入如下提示信息：“现在有一个智能客服，它的功能是……，当前任务的处理流程是……，它与用户的交互信息是……，请从管理者的角度去看它的回复是否合适”。如果判别模型认为机器人智能体输出的信息不满足要求，则可以让机器人智能体重新进行输出。

可选的，还可以提示判别模型输出不满足要求的原因，从而可以将不满足要求的原因也输入到机器人智能体，让机器人智能体结合原因进行重新输出。

其中，所述判别模型也可以使用能力较强的模型实现，如LLM。判别模型主要用于对机器人智能体的输出进行判断，由于判断相对于生成来说通常较为简单，因此，利用判别模型的判断能力可以对机器人智能体的生成能力进行辅助，帮助机器人智能体更好地完成对话的生成，提升构建的训练数据的准确性，提升智能体的训练效果。

参考图7，可以设计机器人回复质量判断智能体，机器人回复质量判断智能体基于前述的判别模型实现，具体的，在机器人智能体生成回复内容后，可以将先回复内容发送给机器人回复质量判断智能体，由机器人回复质量判断智能体反馈对回复质量好坏的判断以及对应的原因，机器人智能体可以根据机器人回复质量判断智能体的反馈，向用户智能体输出质量好的回复。

可选的，可以基于图6和图7所示的方案，利用用户智能体、机器人智能体等构建训练数据，再基于训练数据，通过图5所示框架对智能体进行训练。在训练完成后，可以由客户配置相关的流程知识和API知识，并在发布后进入在线使用阶段，在线使用阶段以真实用户的query作为输入信息，使用真正的API系统实现API的调用。

综上所述，本申请实施例通过图结构解决了复杂流程的构建问题，让智能体按照场景定义的图指令逐步执行实现路径可控，并且，还使用了多智能体自动构建对话数据的方式进一步解决训练数据匮乏的问题。本申请实施例至少具有如下的效果：

1.基于图结构和流程图规范，让客户像画日常流程图一样完成对智能体的复杂任务流程的知识构建；

2.基于流程图中的边表示跳转条件、节点表示当前行动指令，将流程图转换成一个结构化的图指令，同时，为大模型每一次的输出设计了通过前一节点加跳转条件推断出当前节点、再基于当前节点进行行动的思维链，确保大模型基于流程图进行可控规划与执行；

3.通过基于大模型和多画像的角色扮演，构建了多样化的用户智能体，自动构建基于场景知识的多轮对话数据，在没有数据的情况下模拟出对应的数据，有效缓解了训练数据匮乏的问题，从而进一步对智能体进行针对性训练，保障了智能体的处理效果与可控性。

本申请实施例提供的方法可以应用于任意领域和场景。图8为本申请实施例提供的一种应用于智能客服场景的信息处理方法的流程示意图。如图8所示，所述方法包括：

步骤801、获取用户的输入信息。

步骤802、将所述输入信息和节点序列信息输入到大模型，其中，所述节点序列信息用于指示任务流程中包含的多个节点以及节点之间的边，节点表示针对智能体的行动指令，边表示节点间的跳转，以使所述大模型根据所述输入信息，确定待执行的目标节点，并根据所述目标节点对应的行动指令确定智能体输出信息。

其中，所述智能体可以通过与用户多个轮次的交互实现任务的处理。各个轮次均可以执行上述的步骤。可选的，可以仅将最新获取到的用户的输入信息输入到大模型，也可以将之前轮次的交互信息都输入到大模型，还可以将提示信息也输入到大模型，以提升任务处理效果。

步骤803、将所述智能体输出信息输出给用户。

其中，所述智能体输出信息可以为智能体发给用户的信息。在通过大模型得到智能体输出信息后，可以将智能体输出信息输出给用户。在经过多轮交互后，可以完成任务的处理。

本实施例中各步骤的具体实现原理和过程可以参见前述实施例，此处不再赘述。

本实施例提供的信息处理方法，可以使用大模型驱动的智能体架构实现智能客服的功能，规避了传统智能客服配置成本大、门槛高、不够灵活的问题，并且，还可以解决智能体在复杂流程知识构建以及规划部分的可控性等方面的问题，能够使智能体按照任务流程的指引完成任务的处理，提升用户体验度。

对应于上述的方法，本申请实施例还提供一种信息处理装置，包括：

确定模块，用于确定智能体对应的待处理信息；

处理模块，用于将所述待处理信息和节点序列信息输入到大模型，其中，所述节点序列信息用于指示任务流程中包含的多个节点以及节点之间的边，节点表示针对智能体的行动指令，边表示节点间的跳转，以使所述大模型根据所述待处理信息，确定待执行的目标节点，并控制所述智能体执行所述目标节点对应的行动指令。

本申请实施例还提供一种应用于智能客服场景的信息处理装置，包括：

获取模块，用于获取用户的输入信息；

处理模块，用于将所述输入信息和节点序列信息输入到大模型，其中，所述节点序列信息用于指示任务流程中包含的多个节点以及节点之间的边，节点表示针对智能体的行动指令，边表示节点间的跳转，以使所述大模型根据所述输入信息，确定待执行的目标节点，根据所述目标节点对应的行动指令确定智能体输出信息；

输出模块，用于将所述智能体输出信息输出给用户。

本申请实施例提供的装置的具体实现原理和效果可以参见前述实施例，此处不再赘述。

图9为本申请实施例提供的一种电子设备的结构示意图。如图9所示，本实施例的电子设备可以包括：

至少一个处理器901；以及与所述至少一个处理器通信连接的存储器902；其中，所述存储器902存储有可被所述至少一个处理器901执行的指令，所述指令被所述至少一个处理器901执行，以使所述电子设备执行如上述任一实施例所述的方法。可选地，存储器902既可以是独立的，也可以跟处理器901集成在一起。

本实施例提供的电子设备的实现原理和技术效果可以参见前述各实施例，此处不再赘述。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现前述任一实施例所述的方法。

本申请实施例还提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现前述任一实施例所述的方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）或处理器执行本申请各个实施例所述方法的部分步骤。

应理解，上述处理器可以是处理单元（Central Processing Unit，CPU），还可以是其它通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。存储器可能包含高速随机存取存储器（Random Access Memory，RAM），也可能还包括非易失性存储（Non-Volatile Memory， NVM），例如至少一个磁盘存储器，还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。

上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器（Static Random-Access Memory，SRAM），电可擦除可编程只读存储器（Electrically-Erasable Programmable Read-Only Memory，EEPROM），可擦除可编程只读存储器（Erasable Programmable Read-Only Memory，EPROM），可编程只读存储器（Programmable read-only memory，PROM），只读存储器（Read-Only Memory，ROM），磁存储器，快闪存储器，磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。

一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路中。当然，处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其它要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质（如ROM/RAM、磁碟、光盘）中，包括若干指令用以使得一台终端设备（可以是手机，计算机，服务器，空调器，或者网络设备等）执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种信息处理方法，其特征在于，包括：

确定智能体对应的待处理信息；

将所述待处理信息和节点序列信息输入到大模型，其中，所述节点序列信息用于指示任务流程中包含的多个节点以及节点之间的边，节点表示针对智能体的行动指令，边表示节点间的跳转，以使所述大模型根据所述待处理信息，确定待执行的目标节点，并控制所述智能体执行所述目标节点对应的行动指令；

其中，所述边还用于表示跳转条件，以使所述大模型根据所述待处理信息，确定当前是否满足目标边对应的跳转条件，其中，所述目标边为上一轮次的节点作为起始节点的边，在满足目标边对应的跳转条件时，确定所述目标节点为所述目标边的结束节点；

所述待处理信息包括用户的输入信息；

在所述节点序列信息中任一节点的跳转条件包括意图和/或槽位时，所述方法还包括：将跳转条件信息输入到大模型，所述跳转条件信息包括所述节点序列信息包含的意图和/或槽位对应的描述信息，以使大模型在确定用户的输入信息与目标边对应的意图和/或槽位的描述信息相匹配时，确定满足目标边对应的跳转条件。

2.根据权利要求1所述的方法，其特征在于，所述智能体通过与环境的多个轮次的交互实现任务的处理；

在任一轮次，所述待处理信息包括之前轮次的交互信息；其中，所述交互信息包括智能体输出信息和从环境获取到的智能体输入信息，以使所述大模型根据之前轮次的交互信息、所述节点序列信息以及上一轮次对应的节点确定当前轮次对应的目标节点。

3.根据权利要求2所述的方法，其特征在于，与环境的交互包括下述至少一项：与用户进行交互、调用应用程序编程接口API、查询文档；

在根据目标节点对应的行动指令确定当前轮次的交互为与用户进行交互时，所述智能体输出信息包括对用户的回复信息；

在根据目标节点对应的行动指令确定当前轮次的交互为调用API时，所述智能体输出信息包括待调用的API的名称和入参的取值；

在根据目标节点对应的行动指令确定当前轮次的交互为查询文档时，所述智能体输出信息包括待查询的信息。

4.根据权利要求2所述的方法，其特征在于，还包括：

将所述节点序列信息中API对应的API信息输入到大模型；其中，所述API信息包括API的名称、描述信息、至少一个入参和至少一个出参，以使所述大模型在目标节点对应的行动指令包括调用API时，确定当前是否获取到该API的至少一个入参的取值，在未获取到至少部分入参的取值时，基于该API的描述信息与用户进行交互，确定所述至少部分入参的取值，以通过API的名称、至少一个入参的取值完成API的调用，获取至少一个出参的取值。

5.根据权利要求2所述的方法，其特征在于，还包括：

将环境信息输入到大模型，以使所述大模型在目标节点对应的行动指令包括调用API时，根据所述待处理信息和环境信息确定待调用的API的至少部分入参的取值，并在存在特定入参时，基于与用户的交互确定所述特定入参的取值；其中，所述特定入参为无法通过待处理信息以及环境信息确定取值的入参。

6.根据权利要求2所述的方法，其特征在于，还包括：

将输出提示信息输入到大模型；其中，所述输出提示信息用于提示大模型的输出信息包括：上一轮次对应的节点、当前轮次的目标节点、根据目标节点确定的智能体输出信息；

在确定所述大模型生成的输出信息中的智能体输出信息后，通过智能体输出所述智能体输出信息。

7.根据权利要求1所述的方法，其特征在于，所述多个节点包括用于对用户进行回复的回复节点，回复节点对应的行动指令为以下任意一种类型：

普通回复，用于指示根据行动指令中包含的内容进行回复；

分步回复，用于指示通过至少两次交互实现对用户的回复；

灵活回复，用于指示根据行动指令中给出的知识进行回复；

8.根据权利要求1所述的方法，其特征在于，所述多个节点包括用于调用API的调用节点，调用节点对应的行动指令包括：

9.根据权利要求1-8任一项所述的方法，其特征在于，还包括：

获取客户输入的用于指示任务流程的流程图；

根据所述流程图，生成所述节点序列信息，所述节点序列信息为文本形式。

10.根据权利要求1-8任一项所述的方法，其特征在于，在所述智能体用于与用户进行交互时，所述智能体通过下述方式训练得到：

根据所述智能体的画像信息，生成用于与所述智能体交互的多个用户的画像信息；

根据各个用户的画像信息，分别构建对应的用户智能体，并根据所述智能体的画像信息，构建机器人智能体；其中，所述用户智能体和所述机器人智能体均是基于经过训练的模型实现的；

基于节点序列信息样本，控制所述机器人智能体与各个用户智能体进行交互，得到多个对话数据，所述对话数据包括用户智能体与机器人智能体的多轮对话；

根据多个对话数据以及对应的节点序列信息样本，对所述智能体进行训练，得到训练后的智能体。

11.一种信息处理方法，其特征在于，包括：

获取用户的输入信息；

将所述智能体输出信息输出给用户；

其中，所述边还用于表示跳转条件，以使所述大模型根据所述用户的输入信息，确定当前是否满足目标边对应的跳转条件，其中，所述目标边为上一轮次的节点作为起始节点的边，在满足目标边对应的跳转条件时，确定所述目标节点为所述目标边的结束节点；

12.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述电子设备执行权利要求1-11任一项所述的方法。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求1-11任一项所述的方法。