CN117290468A

CN117290468A - 智能对话方法、装置和存储介质

Info

Publication number: CN117290468A
Application number: CN202311080907.9A
Authority: CN
Inventors: 李宏广; 王宝元
Original assignee: Beijing Hongmian Xiaoice Technology Co Ltd
Current assignee: Beijing Hongmian Xiaoice Technology Co Ltd
Priority date: 2023-08-25
Filing date: 2023-08-25
Publication date: 2023-12-26
Anticipated expiration: 2043-08-25

Abstract

本发明提供一种智能对话方法、装置和存储介质，该方法具体包括：从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图；每一外部专家模型意图分别具有相应的外部专家模型；当存在目标外部专家模型意图时，基于与目标外部专家模型意图匹配的目标外部专家模型，确定与输入信息对应的回复结果；当不存在目标外部专家模型意图时，确定输入信息所对应的用户人设信息；以及基于用户人设信息，利用闲聊意图模型确定与输入信息相匹配的闲聊回复结果；闲聊意图模型采用GPT模型网络模块。由此，能够支持人机对话系统完成对应不同外部专家模型意图的精准对话服务，提高人机对话系统的对话回复能力。

Description

智能对话方法、装置和存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种智能对话方法、装置和非暂态计算机可读存储介质。

背景技术

随着人工智能技术的不断发展与普及，人机智能对话系统已在各种业务场景下应用，例如消费购买场景下的导购客服，游戏场景下的NPC，等等。

目前，大部分的人机智能对话系统采用深度学习模型对用户的问题进行语义分析，并通过对大量的历史数据(例如，问题答案对)的学习，帮助产生出相匹配的答案。

但是，目前的人机智能对话系统，基于深度学习模型的训练需要学习海量的问题答案样本，导致较高的系统部署成本。此外，人机智能对话系统往往只能完成针对对话特定领域范围的内容，导致系统的对话服务场景受限。

针对上述问题，目前业界暂未提出较佳的解决方案。

发明内容

本发明提供一种智能对话方法、装置和非暂态计算机可读存储介质，用以解决现有技术中人机智能对话系统部署成本高、对话回复能力差且仅能支持特定对话领域范围的问答服务的缺陷。

本发明提供一种智能对话方法，所述方法包括：从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图；每一所述外部专家模型意图分别具有相应的外部专家模型；当存在所述目标外部专家模型意图时，基于与所述目标外部专家模型意图匹配的目标外部专家模型，确定与所述输入信息对应的回复结果；当不存在所述目标外部专家模型意图时，确定所述输入信息所对应的用户人设信息；以及基于所述用户人设信息，利用闲聊意图模型确定与所述输入信息相匹配的闲聊回复结果；所述闲聊意图模型采用GPT模型网络模块。

根据本发明提供的一种智能对话方法，针对每一所述外部专家模型分别设置有相应的提示词预测单元和回复信息预测单元，所述提示词预测单元和所述回复信息预测单元采用GPT模型网络模块，其中，所述基于与所述目标外部专家模型意图匹配的目标外部专家模型，确定与所述输入信息对应的回复结果，包括：基于所述目标外部专家模型所对应的提示词预测单元，以确定与所述输入信息对应的外部专家模型提示词；从所述目标外部专家模型，获取与所述外部专家模型提示词匹配的服务执行结果；基于所述目标外部专家模型所对应的回复信息预测单元，确定与所述服务执行结果相应的回复结果。

根据本发明提供的一种智能对话方法，所述基于所述用户人设信息，利用闲聊意图模型确定与所述输入信息相匹配的闲聊回复结果，包括：从多个预设的NPC角色信息中，确定与所述用户人设信息匹配的目标NPC角色信息；获取所述当前会话所对应的用户信息，并查询关于所述目标NPC角色信息与所述用户信息之间的历史NPC对话记录；将所述历史NPC对话记录和所述输入信息输入至所述闲聊意图模型，以确定对应所述目标NPC角色信息的闲聊回复结果。

根据本发明提供的一种智能对话方法，所述输入信息的确定步骤，包括：基于目标会话群组所对应的信息输入窗口，采集所述输入信息，所述目标会话群组包含所述多个预设的NPC角色信息。

根据本发明提供的一种智能对话方法，所述从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图，包括：获取输入信息和对应当前会话的历史多轮对话记录，并根据所述输入信息和所述历史多轮对话记录确定相应的输入信息序列；从预设的至少一个外部专家模型意图中，检测是否存在与输入信息序列对应的目标外部专家模型意图。

根据本发明提供的一种智能对话方法，所述从预设的至少一个外部专家模型意图中，检测是否存在与输入信息序列对应的目标外部专家模型意图，包括：基于预设的外部专家模型意图确定模块，从预设的至少一个外部专家模型意图中，确定与所述输入信息序列对应的目标外部专家模型意图；其中，所述外部专家模型意图确定模块采用GPT模型网络模块。

根据本发明提供的一种智能对话方法，针对所述外部专家模型意图提取模块、所述提示词预测单元和所述回复信息预测单元的训练操作包括：获取示例样本集；所述示例样本集包含针对所述外部专家模型意图确定模块的第一示例样本子集，针对所述提示词预测单元的第二示例样本子集和针对所述回复信息预测单元的第三示例样本子集；基于所述第一示例样本子集、所述第二示例样本子集和所述第三示例样本子集，分别对相应的所述外部专家模型意图确定模块、所述提示词预测单元和所述回复信息预测单元按照上下文学习方式进行训练。

根据本发明提供的一种智能对话方法，所述获取示例样本集，包括：在确定用户交互操作满足预设的样本录入操作条件的情况下，获取样本录入信息；基于所述样本录入信息，确定所述示例样本集。

本发明还提供一种智能对话装置，所述装置包括：目标意图检测组件，用于从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图；每一所述外部专家模型意图分别具有相应的外部专家模型；第一回复组件，用于当存在所述目标外部专家模型意图时，基于与所述目标外部专家模型意图匹配的目标外部专家模型，确定与所述输入信息对应的回复结果；用户人设识别组件，用于当不存在所述目标外部专家模型意图时，确定所述输入信息所对应的用户人设信息；以及第二回复组件，用于基于所述用户人设信息，利用闲聊意图模型确定与所述输入信息相匹配的闲聊回复结果；所述闲聊意图模型采用GPT模型网络模块。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种智能对话方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述智能对话方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述智能对话方法。

本发明提供的一种智能对话方法、装置、电子设备及非暂态计算机可读存储介质，通过针对至少一个外部专家模型意图分别预设相应的外部专家模型，在收到输入信息后，检测是否存在与输入信息匹配的目标外部专家模型意图。当存在时，利用相应的目标外部专家模型确定相应的回复结果，以支持智能对话系统完成对应不同外部专家模型意图下的精准问答服务。当不存在时，确定用户人设信息，并利用闲聊意图模型来确定针对输入信息和用户人设信息的闲聊回复结果，闲聊意图模型采用GPT模型网络模块，支持更轻量化的样本训练，实现了智能对话系统针对不同的用户人设信息分别采用不同的对话回复内容，实现个性化的闲聊对话回复服务，增强智能对话系统的对话回复能力。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据本发明实施例的智能对话方法的一示例的流程图；

图2示出了根据图1中的步骤S130的一示例的操作流程图；

图3示出了适于应用于本发明实施例的NPC交流群组的示例的界面示意图；

图4示出了根据本发明实施例的智能对话方法的一示例的流程图；

图5示出了根据本发明实施例的一示例的智能对话系统的结构框图；

图6示出了根据本发明实施例的针对智能对话系统进行训练的一示例的流程图；

图7示出了根据本发明实施例的智能对话方法的另一示例的流程图；

图8示出了根据本发明实施例的智能对话系统的一示例的操作原理示意图；

图9示出了根据本发明实施例的智能对话装置的一示例的结构框图；

图10是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1示出了根据本发明实施例的智能对话方法的一示例的流程图。

关于本发明实施例方法的执行主体，其可以是任意具有计算或处理能力的控制器或处理器，以实现向客户端用户提供智能对话服务的目标。在一些示例中，其可以是通过软件、硬件或软硬件结合的方式被集成配置在客户端或服务端中，在此应不加限制。

需说明的是，目前的人机对话系统并没有充分利用其他专家模型的能力，包括多轮交互的文生图能力，超级计算能力，实时检索能力。此外，人机对话系统在开放域闲聊场景回复能力也存在人设一致性弱等体验问题。

下面将以智能对话系统为示例性的实施主体，来对本发明所涉及的技术方案的细节进行介绍。但应理解的是，下属流程中所涉及的一个或多个步骤可以是由在客户端或服务端中所安装部署的一个或多个控制器或软件来实现的。

如图1所示，在步骤S110中，从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图。

这里，智能对话系统可以采用各种已知的或潜在的方式，确定输入信息所对应的外部专家模型意图。示例性地，一方面，可以采用文本匹配方式来确定外部专家模型意图，另一方面，还可以采用机器学习的方式来识别外部专家模型意图，例如支持向量机、深度学习算法等等，在此暂不做限制。另外，外部专家模型意图可以是多样化的，例如知识专家模型意图、计算专家模型意图和文生图专家模型意图等等，在此也暂不作限制。

此外，针对每一外部专家模型意图分别具有相应的外部专家模型，外部专家模型可以采用各种非限制性的机器学习模型，以支持向特定的外部专家模型意图提供对话服务。

在步骤S121中，当存在目标外部专家模型意图时，基于与目标外部专家模型意图匹配的目标外部专家模型，确定与输入信息对应的回复结果。

示例性地，当目标外部专家模型意图是知识专家模型意图时，通过调用问答意图模型来确定输入信息所对应的问答结果，当目标外部专家模型意图是计算专家模型意图时，通过调用计算专家模型来确定输入信息所对应的数学计算结果，当目标外部专家模型意图是绘图意图时，通过调用文生图专家模型来确定输入信息所对应的绘图结果。

在步骤S123中，当不存在目标外部专家模型意图时，确定输入信息所对应的用户人设信息。

在一些实施方式中，通过查询与输入信息的用户相匹配的人设标签，以确定相应的用户人设信息。这里，用户人设信息可以是预设的至少一种人设风格类型、例如萌妹子人设、萝莉人设、大叔人设、程序员人设和家庭主妇人设等等。此外，还可以通过针对输入信息以及当前会话进行上下文分析，以智能识别相应的用户人设信息。

在步骤S130中，基于用户人设信息，利用闲聊意图模型确定与输入信息相匹配的闲聊回复结果。由此，智能对话系统针对不同用户人设信息能够输出个性化闲聊回复，例如萌妹子人设的“诺诺诺”和“呜呜呜”，以满足不同用户的对话偏好风格，提高智能对话系统的回复能力。

这里，闲聊意图模型采用GPT模型网络模块，实现了轻量化的样本训练，也保障了智能对话系统的输出结果的高精确度，更多细节将在下文中结合其他实施例的描述展开。

图2示出了根据图1中的步骤S130的一示例的操作流程图。

如图2所示，在步骤S210中，从多个预设的NPC角色信息中，确定与用户人设信息匹配的目标NPC角色信息。

在一些情况下，智能对话系统可以是被应用在NPC客服中的，以实现NPC角色与用户之间的智能对话。在一些情况下，存在多个NPC角色同时服务于用户的情况，每个NPC被赋予了相应的智能人设，以与不同的用户人设匹配，实现向用户提供沉浸式的拟人化的用户对话感受。

在步骤S220中，获取当前会话所对应的用户信息，并查询关于目标NPC角色信息与用户信息之间的历史NPC对话记录。

示例性地，通过查询智能对话系统的日志，得到用户与目标NPC角色之间的对话记录。

在步骤S230中，将历史NPC对话记录和输入信息输入至闲聊意图模型，以确定对应目标NPC角色信息的闲聊回复结果。

在本发明实施例的一些业务场景中，其可被应用于AI群聊场景中，将真人用户与多个虚拟NPC角色组建在同一交流群组中，各个NPC根据与用户之间的实时交流情况，选择最适宜的NPC与用户进行群聊交流，以提高人机对话体验。

在一些实施方式中，基于目标会话群组所对应的信息输入窗口，采集输入信息，目标会话群组包含多个预设的NPC角色信息。图3示出了适于应用于本发明实施例的NPC交流群组的示例。如图3所示，NPC交流群组中包含NPC角色窗口320，其显示了多个NPC角色1、2、3…n，用户通过信息输入出口310输入信息，例如已输入的“你吃早饭了吗”和待输入的“是的，我已经吃过了，那你准备什么时候去吃”。示例性地，在用户在NPC群聊中输入“你吃早饭了吗”之后，通过对用户人设信息匹配的“NPC 3”查询与用户之间的历史NPC对话记录，将其一同输入至闲聊意图模型，以确定对应目标NPC角色信息的闲聊回复结果，例如“人家今天还没吃呢，你呢？你前几天这个点都已经吃了”。

由此，根据输入信息所对应的用户人设信息，从多个NPC角色信息选择最适宜的目标NPC角色信息与用户进行交流，除了综合考量当前会话信息之外，还会综合考虑目标NPC角色与用户之间的历史NPC对话记录，保障回复结果能够更智能拟人化，满足沉浸式人机对话体验的需求。

图4示出了根据本发明实施例的智能对话方法的一示例的流程图。在本示例中，针对每一外部专家模型分别设置有相应的提示词预测单元和回复信息预测单元。

如图4所示，在步骤S410中，从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图。

在步骤S420中，在确定存在目标外部专家模型意图的情况下，基于目标外部专家模型所对应的提示词预测单元，以确定与输入信息对应的外部专家模型提示词。这里，提示词预测单元可以采用GPT(Generative Pre-trained Transformer,生成式预训练Transformer)模型网络模块，以实现提取或生成针对输入信息的外部专家模型提示词。

需说明的是，智能对话系统针对不同的对话意图分别配置有相应的GPT模型网络模块，例如针对计算专家模型意图配置有相应的计算类提示词预测单元，针对文生图专家模型意图配置有相应的画图类提示词预测单元。这样，在确定了目标外部专家模型意图之后，可以利用相匹配的提示词预测单元预测出较为得当的关键词，例如通过数学计算类提示词预测单元预测输入信息中的“公式名称”，而通过画图类提示词预测单元预测输入信息中的“图形名称”等等。

在步骤S430中，从目标外部专家模型，获取与外部专家模型提示词匹配的服务执行结果。

需说明的是，智能对话系统针对不同的对话意图分别配置有相应的目标外部专家模型。这样，在得到与输入信息相匹配的外部专家模型提示词之后，智能对话系统能够通过目标外部专家模型调用目标服务对外部专家模型提示词进行处理，以得到相应的服务执行结果，例如调用计算专家模型的计算结果，或者调用文生图专家模型的画图结果。

在步骤S440中，基于目标外部专家模型所对应的回复信息预测单元，确定与服务执行结果相应的回复结果。这里，回复信息预测单元采用GPT模型网络模块，以实现基于服务执行结果预测相应的回复结果，通过对外部服务知识点进行整理，使得回复结果能够更加贴合对话问答服务的需求。

通过本发明实施例，基于目标外部专家模型意图调用相应的提示词预测单元预测输入信息所对应的外部专家模型提示词，进而调用目标外部专家模型意图对应的外部外部专家模型得到与外部专家模型提示词匹配的服务执行结果，基于目标外部专家模型意图调用相应的回复信息预测单元预测服务执行结果所对应的回复结果。由此，通过设置针对不同的对话意图的预测分支(亦即，针对每个外部专家模型分别设置有相应的提示词预测单元和回复信息预测单元)，能够支持人机对话系统完成对应不同精准外部专家模型下的对话服务。另外，针对特定对话意图，通过调用匹配的外部外部专家模型来支持问答服务，能有效借助外部技能服务，支持多元化场景的问答服务。此外，各个对话意图所对应的预测分支中的预测单元或机器学习模型均采用GPT模型网络模块，相比于采用深度学习模型的集成化架构，本方案所提供的人机对话系统能实现更轻量化的训练，提高了人机对话系统的上线效率，且每个单元均能实现单独的有针对性的独立优化，也保障了人机对话系统的对话服务精确度。

需说明的是，智能对话系统针对不同的对话意图分别配置有相应的回复信息预测单元，例如针对计算专家模型意图配置有相应的计算类问答任务预测单元，针对文生图专家模型意图配置有相应的画图类任务预测单元，实现精准预测针对不同对话意图的回复结果，使得回复结果能够更加贴合对话场景，提高人机对话的服务体验。

图5示出了根据本发明实施例的一示例的智能对话系统的结构框图。

如图5所示，通过外部专家模型意图提取模块510确定输入信息所对应的目标外部专家模型意图，并根据目标外部专家模型意图选用相应的预测分支进行问答服务。具体地，对应意图a的预测分支包含提示词预测单元521和回复信息预测单元525，提示词预测单元521和回复信息预测单元525与相应的外部专家模型523连接，对应意图b的预测分支包含提示词预测单元531和回复信息预测单元535，提示词预测单元531和回复信息预测单元535与相应的外部专家模型533连接，对应意图c的预测分支包含提示词预测单元541和回复信息预测单元545，提示词预测单元541和回复信息预测单元545与相应的外部专家模型543连接。由此，通过不同预测分支的预测单元和外部专家模型的部署，能够实现智能对话系统较佳地处理各种对话意图的输入信息。

在本发明实施例中，在智能对话系统中，每一预测分支均集成了多个采用机器学习模型的预测单元，为了降低智能对话系统的部署成本，各个预测分支中的预测单元可以采用大语言模型中的GPT模型网络模块。

应理解的是，GPT模型网络模块是一种基于Transformer架构的文本生成算法，其运行机制主要分为两个步骤：预训练和通用指令微调阶段。在预训练阶段，GPT模型网络模块使用大规模语料库进行无监督学习，学习文本的语言模型。通用指令微调阶段，将预训练的GPT模型网络模块用于特定的文本生成任务。因此，通过在特定的任务上进行有监督学习，GPT模型网络模块可以进一步优化模型参数，以便更好地生成符合任务要求的文本。

具体地，将多个已完成预训练阶段的GPT模型网络模块在预测分支上针对相应的外部专家模型进行部署，并通过相应外部专家模型意图任务的样本进行指令微调，便可以实现较佳地处理各种外部专家模型意图任务。相比之下，深度学习模型需要利用对应不同任务的海量的训练样本，其会导致更高的部署成本和需求更高系统资源配置，而不会存在相应的落地产品。

作为本发明实施例的一种优选实施方式，外部专家模型意图确定模块510也可以是用于识别各个对话意图的GPT模型网络模块，由此实现智能对话系统的进一步的轻量化，能够在各种终端设备场景中应用。

图6示出了根据本发明实施例的针对智能对话系统进行训练的一示例的流程图。

在步骤610中，获取示例样本集。

这里，示例样本集包含针对外部专家模型意图确定模块的第一示例样本子集，针对提示词预测单元的第二示例样本子集和针对回复信息预测单元的第三示例样本子集。

在一些实施方式中，智能对话系统的样本还可以由用户来进行指定，例如针对不同意图指定相应的示例样本，以满足用户的个性化对话服务需求。具体地，在确定用户交互操作满足预设的样本录入操作条件的情况下，获取样本录入信息，继而基于样本录入信息，确定示例样本集。结合业务场景来说，用户可以对客户端进行操作，例如用户触发样本录入控件，并进行示例样本的录入操作。

在步骤S620中，基于第一示例样本子集、第二示例样本子集和第三示例样本子集，分别对相应的外部专家模型意图确定模块、提示词预测单元和回复信息预测单元按照ICL(In-Context Learning,上下文学习)方式进行训练。

通过本发明实施例，智能对话系统能够基于示例样本集，自动筛选不同GPT模型网络模块所需要的示例样本，分别进行ICL微调训练，实现少样本训练的目标，而无需进行大规模样本训练，提高了智能对话系统的训练效率。

图7示出了根据本发明实施例的智能对话方法的另一示例的流程图。

如图7所示，在步骤S710中，获取输入信息和对应当前会话的历史多轮对话记录，并根据输入信息和历史多轮对话记录确定相应的输入信息序列。

这里，针对用户输入的对话内容包括两部分，一部分是当前对话输入X＝{x1，x2，…xn}，另一部分是对话历史Context＝{q1,r1,q2,r2,…qn,rn}，其中q和r分别表示历史问询内容和历史回复内容。

在步骤S720中，基于输入信息序列，从预设的至少一个对话意图中，检测是否存在相应的目标外部专家模型意图。由此，实现当前会话的多轮对话在外部专家模型意图上的高一致性。

图8示出了根据本发明实施例的智能对话系统的一示例的操作原理示意图。具体地，智能对话系统设置有分别针对三个特定对话意图的预测分支，即计算专家模型意图、文生图专家模型意图和知识专家模型意图。针对不属于此三个特定对话意图的输入信息，其会被归类至闲聊意图进行处理。在本发明实施例中，通过输入信息序列，综合考虑当前输入信息和历史多轮对话记录，识别用户的目标外部专家模型意图，实现了多轮对话一致性回复能力高的效果。如图8所示，智能对话系统包括外部专家模型提示器801、对应开放域问答预测分支的检索句生成单元802、知识专家模型803和问答任务回复单元804，对应数学计算预测分支的数学公式推理单元805、计算专家模型806和数学计算回复单元807，对应画图预测分支的文生图提示词生成单元808、文生图专家模型809和画图回复单元810，对应闲聊分支的闲聊回复单元811。

通过外部专家模型提示器801，该模块根据对话内容完成是否调用外部专家模型的意图判断。

需说明的是，需要预先向外部专家模型提示器801给定针对不同外部专家模型的定义及对话示例样本，并将其记录在外部专家模型描述TP中，以完成对外部专家模型提示器801的微调训练。TP的示例：

TP＝{{T1Df,T1Dg},{T2Df,T2Dg},{T3Df,T3Dg},{CDf,CDg}}

其中，T1D,T1Dg,T2Df,T2Dg,T3Df,T3Dg分别表示知识专家模型，计算专家模型，文生图专家模型的定义及示例对话内容。CDf,CDg表示闲聊的定义和相应的对话示例样本。

具体地，是否调用外部专家模型及具体的哪个外部专家模型的意图判断调用Ψ1函数得到X’＝{x’1，x’2，x’3，x’4}：

X′＝Ψ1(X,Context,TP)

其中，X＝{x1，x2，…xn}和Context＝{q1,r1,q2,r2,…qn,rn}，Ψ1函数表示外部专家模型提示器，其可以是采用GPT网络模块。

进而，如果是需要调用外部专家模型，会生成调用具体的外部专家模型的意图内容，包括知识专家模型，计算专家模型，文生图专家模型三个内容，分别对应于T1D、T2Df和T3Df。此外，如果是不需要调用外部专家模型，直接输出属于闲聊的意图，其对应于CDf。

在步骤S730中，在确定存在目标外部专家模型意图的情况下，根据目标外部专家模型意图调用对应的提示词预测单元，以确定与输入信息序列对应的外部专家模型提示词。

继续上述的示例，在完成具体外部专家模型的判断之后，如果是实时问答检索，接着首先通过检索句生成单元802得到检索句SearchQuery＝{s1,s2,…sn}。检索句生成单元802用于执行以下操作：

SearchQuery＝Ψ2(X,Context，QADP)

其中X＝{x1，x2，…xn}和Context＝{q1,r1,q2,r2,…qn,rn}，Ψ2函数表示检索句生成提示器,其同样可以采用GPT模型网络模块。

这里，QADP表示与检索任务相关的问答示例样本，并可以是由用户进行设置的。

示例性地，QADP＝“问答示例1：\n用户：我想知道中国有几个行政区\nSearchQuery＝”中国行政区数量”\n问答示例2：\n用户:北京东四环有什么好吃的\nSearchQuery＝”北京东四环美食”。当存在用户输入信息为X＝用户：“乘风破浪第四季一公有哪些作品”，历史多轮对话记录Context＝“用户：你好\n助手：你好，我是大语言模型，有什么可以帮您”。Ψ2＝“这是一个检索句生成任务，根据示例给出对应的知识专家模型提示词”，进而，将用户输入信息、历史多轮对话记录和问答示例样本进行组合，得到输入信息(“乘风破浪第四季一公有哪些作品”)+历史多轮对话记录(“用户：你好\n助手：你好，我是大语言模型，有什么可以帮您”)+示例样本(“我想知道中国有几个行政区”-“北京东四环有什么好吃的”)，并经过上下文预测分析，以实现精准预测输入信息所对应的知识专家模型提示词，例如相应的输出内容为SearchQuery＝“乘风破浪第四季作品”。

在步骤S740中，根据目标外部专家模型意图调用对应的目标外部专家模型，并基于目标外部专家模型获取与外部专家模型提示词匹配的服务执行结果。

结合上述的检索任务的示例，在得到知识专家模型提示词之后通过调用外部的知识专家模型803检索到对应的相关知识：

Knowledge＝Search(SearchQuery)

其中SearchQuery＝{s1,s2,…sn}，Search表示知识专家模型，Knowledge＝{kowledge1,kowledge2,…kowledgeN}表示N条相关的知识。

在步骤S750中，根据目标外部专家模型意图调用对应的回复信息预测单元，以根据服务执行结果和输入信息序列确定回复结果。由此，实现当前会话的多轮对话在回复方式上的高一致性。

结合上述的检索任务的示例，在得到相关知识后，通过问答任务回复单元804可以得到最终的问答回复QARsp＝{qar1，qar2，…qarn}。如下所示：

QARsp＝Ψ3(X,Context，Knowledge)

其中，X＝{x1，x2，…xn}和Context＝{q1,r1,q2,r2,…qn,rn}，Ψ3函数表示基于GPT模型网络模块的问答任务回复单元804，Knowledge表示相关知识，QARsp表示相关的问答回复内容。

QARsp的示例如下：

输入内容为：用户：“乘风破浪第四季一公有哪些作品”，历史多轮对话记录为：“用户：你好\n助手：你好，我是大语言模型，有什么可以帮您”。知识：“乘风破浪第四季第一次公演精彩纷呈，作品有A和B的《XX》，C的《YY》合唱还有《ZZ》等作品，大家都很喜欢这些姐姐。”Ψ3＝“这是一个基于外部知识进行问答回复任务。根据对话输入给出合理的回复”。最终，所输出的回复结果为：“乘风破浪第四季一公有A和B的《XX》，C的《YY》合唱还有《ZZ》等作品”。

在本发明实施例中，智能对话系统下的各个预测单元均输入均包含当前输入信息和历史对话记录，有助于提高各个预测单元的输出结果的精确度和多轮对话回复一致性。

本发明基于大语言模型，通过预定义的外部专家模型提示器可以识别当前对话内容是否进行外部专家模型的能力触发判断。如果是开放域闲聊对话，基于对话历史可以做到高一致性回复。如果是需要触发外部专家模型，通过特定的外部专家模型提示词即可触发对应的外部专家模型实现用户的需求响应。针对开放域问答需求，通过生成检索词的方式调用搜索引擎完成相关知识的检索，GPT模型网络模块基于对话历史和检索知识进行回复内容的生成。

应理解的是，上述仅以开放域检索任务为示例，将对应检索问答意图的输入信息进行了描述，其实施例中的部分可以被借鉴到对应其他特定对话意图的输入信息的处理过程中。

一方面，针对计算专家模型意图，首先通过数学公式推理单元805得到相关的需要运行的数学公式MathEquations＝{e1,e2,…en}。数学公式推理单元805具体执行以下操作：

MathEquations＝Ψ4(X,Context，MathDP)

其中，输入信息X＝{x1，x2，…xn}，历史多轮对话记录Context＝{q1,r1,q2,r2,…qn,rn}，Ψ4函数表示数学公式推理单元805，其可以采用基于GPT模型网络模块的数学推理计算提示器。

这里，MathDP表示与数学计算任务相关的数学推理计算示例。

示例性地，MathDP＝“问答示例1：\n用户：橘子重30千克，橘子是橙子的5倍，橙子多重\nMathEquation＝”(30/5)”\n问答示例2：\n用户:5500千克大米，吃掉了3125千克，还剩多少大米\nMathEquation＝”(5500-3125)”。当存在用户输入信息为X＝“小明有存款34590元，小张是他的一半，小张有多少存款”，历史多轮对话记录Context＝“用户：你好\n助手：你好，我是大语言模型，有什么可以帮您”。Ψ4＝“这是一个数学计算任务，根据示例推理出相关可执行的数学公式”，进而，将用户输入信息、历史多轮对话记录和问答示例样本进行组合，得到输入信息(“小明有存款34590元，小张是他的一半，小张有多少存款”)+历史多轮对话记录(“用户：你好\n助手：你好，我是大语言模型，有什么可以帮您”)+示例样本(“橘子重30千克，橘子是橙子的5倍，橙子多重”-“5500千克大米，吃掉了3125千克，还剩多少大米”)，并通过数学公式推理单元805进行上下文预测分析，以实现精准预测输入信息所对应的数学公式，例如得到相应的数学公式为：Calculate——(34590/2)。

得到需要数学计算的公式MathEquations之后，调用外部的计算专家模型806得到相关的计算结果：

MathResults＝Calculators(MathEquations)

其中，Calculators表示计算专家模型，MathEquations＝{e1,e2,…en}表示N条相关的数学公式，MathResults表示不同数学公式的中间结果。

最终根据对话内容和数学计算的中间结果得到最终的数学计算回复

MathRsp＝Ψ5(X,Context，MathEquations,MathResults)

其中X＝{x1，x2，…xn}和Context＝{q1,r1,q2,r2,…qn,rn}，MathEquations＝{e1,e2,…en}表示N条相关的数学公式，MathResults表示不同数学公式的中间结果，Ψ5函数表示数学计算回复单元807，其可以采用GPT模型网络模块，MathRsp表示相关的数学计算回复内容。例如，MathRsp为“由于小张的存款是小明的一半，因此小张的存款是34590/2＝17295，小张存款是17295元”。

通过本发明实施例，针对数学计算需求，GPT模型网络模块通过链式推理生成对应的计算公式，调用外部计算器可以得到中间步骤计算结果，GPT模型网络模块基于推理过程和计算结果给出最终的数学计算结果及相关回复内容。

另一方面，针对文生图专家模型意图，首先通过文生图提示词生成单元808得到相关的文生图提示词Text2ImPt＝{text2image1,text2image2,…text2imageN}。文生图提示词生成单元808具体执行以下操作：

Text2ImPt＝Ψ6(X,Context，PictureDP)

其中X＝{x1，x2，…xn}和Context＝{q1,r1,q2,r2,…qn,rn}，Ψ6函数表示文生图提示词生成单元808，其可以采用GPT模型网络模块，PictureDP表示相关的文生图对话示例。

示例性地，PictureDP＝“问答示例1：\n用户：帮我画一张资深程序员的照片\nText2ImPt＝”(格子衫、双肩包、眼睛有神、眼袋严重、运动鞋)”\n问答示例2：\n用户:帮我画一张御姐女生的照片\nText2ImPt＝”(个子高挑、颧骨偏高、眉毛修长、唇部饱满、气质高冷)”。当存在用户输入信息是X＝“帮我画一张棕色长发的可爱萝莉照片”，历史多轮对话记录Context＝“用户：你好\n助手：你好，我是大语言模型，有什么可以帮您”。Ψ6＝“这是一个图片输入的用户请求，请给出相关的文生图的提示词集合”，进而，将用户输入信息、历史多轮对话记录和问答示例样本进行组合，得到输入信息(帮我画一张棕色长发的可爱萝莉照片)+历史多轮对话记录(“用户：你好\n助手：你好，我是大语言模型，有什么可以帮您”)+示例样本(“帮我画一张资深程序员的照片”-“帮我画一张棕色长发的可爱萝莉照片”)，并通过文生图提示词生成单元808进行上下文预测分析，以实现精准预测输入信息所对应的文生图专家模型提示词集合，例如，少女、8k、棕色长发、高清、可爱、萝莉、真实和逼真。

在得到文生图专家模型提示词Text2ImPt之后，调用文生图专家模型809得到相关的画图回复结果：

Image＝Picture(Text2ImPt)

其中，Picture表示文生图专家模型，Text2ImPt表示文生图提示词，Image表示画图结果。这里，画图回复单元810可以直接将画图结果进行输出回复。由此，针对画图需求，GPT模型网络模块通过生成相关的文生图的提示词之后，调用外部文生图模型即可生成对应的图片，基于图片内容和对话历史返回给用户相关的结果。

通过本发明实施例，提供了基于GPT模型网络模块和外部专家模型的个性化对话系统，该系统具备开放域个性化回复能力强，多轮对话一致性回复能力高的对话特点，同时具备数学计算能力，文生图能力和实时检索能力。此外，智能对话系统还可以根据不同业务场景的需求而增添或删除对应不同意图的预测分支。

在步骤S760中，在确定不存在目标外部专家模型意图的情况下，预测输入信息序列所对应的用户人设信息。

具体地，在确定当前的输入信息不属于上述三类意图的情况下，确定输入信息是与闲聊意图相匹配的，此时可以通过闲聊模型模块对输入信息序列进行预测，以确定相应的回复信息。

这里，用户人设信息可以是预设的至少一种人设风格类型、例如萝莉人设、大叔人设、程序员人设和家庭主妇人设等等。

在步骤S770中，基于用户人设信息，确定与输入信息序列相匹配的闲聊回复结果。

针对对应于闲聊意图的输入信息，可以通过对话历史给出特定人设的闲聊回复ChatRsp。

ChatRsp＝Ψ7(X,Context，PsPf)

其中，输入信息X＝{x1，x2，…xn}，历史多轮对话记录Context＝{q1,r1,q2,r2,…qn,rn}，PsPf表示给定的不同个性化人设的描述信息，Ψ7函数表示基于GPT模型网络模块的闲聊回复单元811，ChatRsp表示相关的闲聊对话回复内容。

通过本发明实施例，针对不同的用户人设信息，分别采用不同的对话回复内容，实现个性化的闲聊对话回复服务。

举例来说，如果用户人设信息为“萌妹子”，PsPf＝“你现在假装是一个萌妹子的人设，根据对话内容给出符合合理的回复，回复风格是可爱清纯的风格。包括一些“诺诺诺”和“呜呜呜”等乖巧表达”。此外用户人设信息为“程序员”，PsPf＝“你现在假装是一个程序员科技宅的人设，根据对话内容给出符合合理的回复，回复风格是直男，不解风情的风格。同时你很喜欢数码产品”。

下面对本发明提供的智能对话装置进行描述，下文描述的智能对话装置与上文描述的智能对话方法可相互对应参照。

图9示出了根据本发明实施例的智能对话装置的一示例的结构框图。

如图9所示，智能对话装置900包括目标意图检测组件910、服务结果回复组件920、用户人设识别组件930和闲聊结果回复组件940。

目标意图检测组件910用于从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图；每一所述外部专家模型意图分别具有相应的外部专家模型。

第一回复组件920用于当存在所述目标外部专家模型意图时，基于与所述目标外部专家模型意图匹配的目标外部专家模型，确定与所述输入信息对应的回复结果。

用户人设识别组件930用于当不存在所述目标外部专家模型意图时，确定所述输入信息所对应的用户人设信息。

第二回复组件940用于基于所述用户人设信息，利用闲聊意图模型确定与所述输入信息相匹配的闲聊回复结果；所述闲聊意图模型采用GPT模型网络模块。

图10示例了一种电子设备的实体结构示意图，如图10所示，该电子设备可以包括：处理器(processor)1010、通信接口(Communications Interface)1020、存储器(memory)1030和通信总线1040，其中，处理器1010，通信接口1020，存储器1030通过通信总线1040完成相互间的通信。处理器1010可以调用存储器1030中的逻辑指令，以执行智能对话方法，该方法包括：从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图；每一所述外部专家模型意图分别具有相应的外部专家模型；当存在所述目标外部专家模型意图时，基于与所述目标外部专家模型意图匹配的目标外部专家模型，确定与所述输入信息对应的回复结果；当不存在所述目标外部专家模型意图时，确定所述输入信息所对应的用户人设信息；以及基于所述用户人设信息，利用闲聊意图模型确定与所述输入信息相匹配的闲聊回复结果；所述闲聊意图模型采用GPT模型网络模块。

此外，上述的存储器1030中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的智能对话方法，该方法包括：从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图；每一所述外部专家模型意图分别具有相应的外部专家模型；当存在所述目标外部专家模型意图时，基于与所述目标外部专家模型意图匹配的目标外部专家模型，确定与所述输入信息对应的回复结果；当不存在所述目标外部专家模型意图时，确定所述输入信息所对应的用户人设信息；以及基于所述用户人设信息，利用闲聊意图模型确定与所述输入信息相匹配的闲聊回复结果；所述闲聊意图模型采用GPT模型网络模块。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的智能对话方法，该方法包括：从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图；每一所述外部专家模型意图分别具有相应的外部专家模型；当存在所述目标外部专家模型意图时，基于与所述目标外部专家模型意图匹配的目标外部专家模型，确定与所述输入信息对应的回复结果；当不存在所述目标外部专家模型意图时，确定所述输入信息所对应的用户人设信息；以及基于所述用户人设信息，利用闲聊意图模型确定与所述输入信息相匹配的闲聊回复结果；所述闲聊意图模型采用GPT模型网络模块。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种智能对话方法，其特征在于，所述方法包括：

从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图；每一所述外部专家模型意图分别具有相应的外部专家模型；

当存在所述目标外部专家模型意图时，基于与所述目标外部专家模型意图匹配的目标外部专家模型，确定与所述输入信息对应的回复结果；

当不存在所述目标外部专家模型意图时，确定所述输入信息所对应的用户人设信息；以及

基于所述用户人设信息，利用闲聊意图模型确定与所述输入信息相匹配的闲聊回复结果；所述闲聊意图模型采用GPT模型网络模块。

2.根据权利要求1所述智能对话方法，其特征在于，针对每一所述外部专家模型分别设置有相应的提示词预测单元和回复信息预测单元，所述提示词预测单元和所述回复信息预测单元采用GPT模型网络模块，

其中，所述基于与所述目标外部专家模型意图匹配的目标外部专家模型，确定与所述输入信息对应的回复结果，包括：

基于所述目标外部专家模型所对应的提示词预测单元，以确定与所述输入信息对应的外部专家模型提示词；

从所述目标外部专家模型，获取与所述外部专家模型提示词匹配的服务执行结果；

基于所述目标外部专家模型所对应的回复信息预测单元，确定与所述服务执行结果相应的回复结果。

3.根据权利要求1所述智能对话方法，其特征在于，所述基于所述用户人设信息，利用闲聊意图模型确定与所述输入信息相匹配的闲聊回复结果，包括：

从多个预设的NPC角色信息中，确定与所述用户人设信息匹配的目标NPC角色信息；

获取当前会话所对应的用户信息，并查询关于所述目标NPC角色信息与所述用户信息之间的历史NPC对话记录；

将所述历史NPC对话记录和所述输入信息输入至所述闲聊意图模型，以确定对应所述目标NPC角色信息的闲聊回复结果。

4.根据权利要求3所述智能对话方法，其特征在于，所述输入信息的确定步骤，包括：

基于目标会话群组所对应的信息输入窗口，采集所述输入信息，所述目标会话群组包含所述多个预设的NPC角色信息。

5.根据权利要求2所述智能对话方法，其特征在于，所述从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图，包括：

获取输入信息和对应当前会话的历史多轮对话记录，并根据所述输入信息和所述历史多轮对话记录确定相应的输入信息序列；

从预设的至少一个外部专家模型意图中，检测是否存在与输入信息序列对应的目标外部专家模型意图。

6.根据权利要求5所述智能对话方法，其特征在于，所述从预设的至少一个外部专家模型意图中，检测是否存在与输入信息序列对应的目标外部专家模型意图，包括：

基于预设的外部专家模型意图确定模块，从预设的至少一个外部专家模型意图中，确定与所述输入信息序列对应的目标外部专家模型意图；其中，所述外部专家模型意图确定模块采用GPT模型网络模块。

7.根据权利要求6所述智能对话方法，其特征在于，针对所述外部专家模型意图确定模块、所述提示词预测单元和所述回复信息预测单元的训练操作包括：

获取示例样本集；所述示例样本集包含针对所述外部专家模型意图确定模块的第一示例样本子集，针对所述提示词预测单元的第二示例样本子集和针对所述回复信息预测单元的第三示例样本子集；

基于所述第一示例样本子集、所述第二示例样本子集和所述第三示例样本子集，分别对相应的所述外部专家模型意图确定模块、所述提示词预测单元和所述回复信息预测单元按照上下文学习方式进行训练。

8.根据权利要求7所述智能对话方法，其特征在于，所述获取示例样本集，包括：

在确定用户交互操作满足预设的样本录入操作条件的情况下，获取样本录入信息；

基于所述样本录入信息，确定所述示例样本集。

9.一种智能对话装置，其特征在于，所述装置包括：

目标意图检测组件，用于从预设的至少一个外部专家模型意图中，检测是否存在与输入信息对应的目标外部专家模型意图；每一所述外部专家模型意图分别具有相应的外部专家模型；

第一回复组件，用于当存在所述目标外部专家模型意图时，基于与所述目标外部专家模型意图匹配的目标外部专家模型，确定与所述输入信息对应的回复结果；

用户人设识别组件，用于当不存在所述目标外部专家模型意图时，确定所述输入信息所对应的用户人设信息；以及

第二回复组件，用于基于所述用户人设信息，利用闲聊意图模型确定与所述输入信息相匹配的闲聊回复结果；所述闲聊意图模型采用GPT模型网络模块。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-8任一项所述智能对话方法。