CN117744630B

CN117744630B - 模型接入方法、装置及电子设备

Info

Publication number: CN117744630B
Application number: CN202410184360.5A
Authority: CN
Inventors: 颉彬; 屠静; 王亚
Original assignee: Zhuo Shi Zhi Xing Tianjin Technology Co ltd
Current assignee: Zhuo Shi Zhi Xing Tianjin Technology Co ltd
Priority date: 2024-02-19
Filing date: 2024-02-19
Publication date: 2024-05-28
Anticipated expiration: 2044-02-19
Also published as: CN117744630A

Abstract

本发明公开了一种模型接入方法、装置及电子设备，涉及人工智能技术领域。所述方法包括：获取待配置模型的接入接口文档，并自动解析文档生成待配置模型的模型描述文本、接入模式以及接入模式对应的接入配置，识别出接收到的询问文本的询问意图，利用询问意图和模型描述文本确定目标模型，利用询问意图和询问文本确定目标配置，以便接入目标模型，并利用目标模型获取到询问文本的答复信息并输出。本发明自动解析接口文档获取到模型所支持的所有接入模式对应的接入配置，相对于人工解析更加高效，在接收到询问文本后，结合询问文本以及询问意图确定适配的目标模型和目标接入模式以实现模型接入，可高效灵活地接入模型。

Description

模型接入方法、装置及电子设备

技术领域

本发明涉及人工智能技术领域，具体涉及一种模型接入方法、装置及电子设备。

背景技术

近年来，随着人工智能技术的快速发展，各类模型应运而生，模型开发者可以发布模型的接入接口文档，以便使用者可利用接入接口文档进行接口适配，接入模型以使用模型功能。

然而，目前的接口适配工作通常由使用者依据接入接口文档手动实现具体的接口逻辑，并且，使用者仅确保可正常接入模型即可，不会全面配置接口支持的所有接入模式。这种方式适配效率低下且模型接入的方式单一，导致模型接入的效率和灵活性较差。

发明内容

本发明实施例提供一种模型接入方法、装置及电子设备，可以有效提升模型接入的效率和灵活性。

本发明实施例提供一种模型接入方法，该方法包括：

获取多个待配置模型的接入接口文档；

对所述接入接口文档进行解析处理，得到待配置模型的模型描述文本、至少一个接入模式以及每个所述接入模式对应的接入配置，所述接入配置包括请求参数、响应参数以及字段映射关系，所述字段映射关系包括所述响应参数中的响应字段与输出字段之间的映射关系；

若接收到询问文本，对所述询问文本进行意图识别，得到所述询问文本对应的询问意图；

将所述询问意图和每个所述待配置模型的模型描述文本进行匹配，以从所述多个待配置模型中确定目标模型；

结合所述询问意图和所述询问文本，从候选配置中确定目标配置，所述候选配置为所述目标模型对应的接入配置；

利用所述目标配置中的请求参数，将所述询问文本发送至所述目标模型，以便所述目标模型对所述询问文本进行推理，得到所述询问文本对应的响应信息；

按照所述目标配置中的字段映射关系，将所述响应信息映射为所述询问文本对应的答复信息并输出。

本发明实施例还提供一种模型接入装置，该装置包括：

文档获取模块，用于获取多个待配置模型的接入接口文档；

解析模块，用于对所述接入接口文档进行解析处理，得到待配置模型的模型描述文本、至少一个接入模式以及每个所述接入模式对应的接入配置，所述接入配置包括请求参数、响应参数以及字段映射关系，所述字段映射关系包括所述响应参数中的响应字段与输出字段之间的映射关系；

意图识别模块，用于若接收到询问文本，对所述询问文本进行意图识别，得到所述询问文本对应的询问意图；

模型确定模块，用于将所述询问意图和每个所述待配置模型的模型描述文本进行匹配，以从所述多个待配置模型中确定目标模型；

配置确定模块，用于结合所述询问意图和所述询问文本，从候选配置中确定目标配置，所述候选配置为所述目标模型对应的接入配置；

接入模块，用于利用所述目标配置中的请求参数，将所述询问文本发送至所述目标模型，以便所述目标模型对所述询问文本进行推理，得到所述询问文本对应的响应信息；

输出模块，用于按照所述目标配置中的字段映射关系，将所述响应信息映射为所述询问文本对应的答复信息并输出。

本发明实施例还提供一种电子设备，包括处理器和存储器，所述存储器存储有多条指令；所述处理器从所述存储器中加载指令，以执行本发明实施例所提供的任一种模型接入方法中的步骤。

本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本发明实施例所提供的任一种模型接入方法中的步骤。

本发明实施例可以自动解析待配置模型的接入接口文档，生成待配置模型的模型描述文本和接入配置，接入配置和接入模式一一对应，在接收到询问文本时，可匹配询问文本对应的询问意图和模型描述文本，以确定出目标模型，再利用询问意图和询问文本，确定出目标配置，最后利用目标配置连接目标模型推理询问文本，并将对应的答复信息输出。自动解析接口文档获取到模型所支持的所有接入模式对应的接入配置，相对于人工解析更加高效，在接收到询问文本后，结合询问文本以及询问意图确定适配的目标模型和目标接入模式以实现模型接入，可高效灵活地接入模型。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的模型接入方法的应用场景示意图；

图2是本发明实施例提供的模型接入方法的流程示意图；

图3是本发明实施例提供的解析接入接口文档的流程示意图；

图4是本发明实施例提供的模型接入方法的整体架构示意图；

图5是本发明实施例提供的模型接入装置的结构示意图；

图6是本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

通用大模型是可处理多种任务的模型如自然语言处理，图像识别等任务，但通用大模型在一些特定任务上的表现较差，例如，文生图模型、文生视频模型、金融领域的模型、医疗领域的模型等等。为了使得模型在各种任务上均有较好的表现，可以接入各种不同的模型，以扩展其处理能力。模型开发者通过会编写对应的接入接口文档，以便使用者可正确接入模型进行使用。

发明人在研究中发现，目前通常是人工阅读接口文档然后使用中间件或自定义的适配器来实现不同系统间的数据交换和通信，这个过程需要大量的手动配置和维护。并且，当接口文档内记载了多种接入模式时，使用者也仅会选择一种进行配置，以节约时间成本，这就导致始终采用一种方式接入模型，灵活性较差。由此，发明人提出了本发明的一种模型接入方法、装置及电子设备，以解决上述问题。

可参考图1，示出了模型接入方法的应用场景示意图，其中，该应用场景中可以包括终端101、服务器102以及多个待配置模型。终端101、服务器102以及待配置模型 103三者可通过网络进行数据交互，本发明实施例中，执行主体为服务器102。

终端101可以是手机、平板电脑、智能蓝牙设备、智能穿戴设备、笔记本电脑、或者个人电脑（Personal Computer，PC）、车载终端等设备；服务器102可以是单一服务器，也可以是由多个服务器组成的服务器集群。

用户可通过终端101上传待配置模型的接入接口文档，并将该接入接口文档发送给服务器102。从而，服务器102可解析接入接口文档，得到待配置模型的模型描述文本、接入模式以及接入模式对应的接入配置。

用户可通过终端101将询问文本发送给服务器102，由服务器102对询问文本进行意图识别得到询问意图；将询问意图和每个模型描述文本进行匹配，以确定目标模型，结合询问意图和询问文本，确定目标配置；利用目标配置中的请求参数，将询问文本发送至目标配置对应的目标模型中。如图1中，若确定待配置模型3为目标模型，则将询问文本发送至待配置模型3，再接收待配置模型3的响应信息。

最后服务器102按照目标配置中的字段映射关系，将响应信息映射为答复信息，并将答复信息发送至终端101进行输出。

在本实施例中，提供了一种模型接入方法，如图2所示，该模型接入方法的具体流程可以如下：

S110、获取多个待配置模型的接入接口文档。

待配置模型是指可能会被调用的神经网络模型，该神经网络模型具体可表现为插件、工具等，接入接口文档是一种用于描述接入待配置模型的应用程序编程接口的相关信息的文档。其中，接入接口是指接入待配置模型的接口，接入接口文档中可包括该接入接口的相关描述，如待配置模型的模型描述文本、接口的请求地址、请求方式、必填参数、非必填参数、接口认证方法、接口响应内容等等信息，便于用户理解和使用接入接口。

待配置模型通常为多个，需要上传每个待配置模型的接口文档，该接口文档可由用户主动上传，其可以单个上传也可以批量上传，在此不做具体限定。

S120、对所述接入接口文档进行解析处理，得到待配置模型的模型描述文本、至少一个接入模式以及每个所述接入模式对应的接入配置。

通过解析接入接口文档，可获知该待配置模型的模型描述文本、接入接口所支持的接入模式，以及接入模式对应的接入配置。其中，接入模式是指与待配置模型进行通信的模式，例如，http模式、socket模式等，而接入配置则是使用对应的接入模式接入待配置模型时，所需要使用的参数集合。

在一些实施方式中，接入模式以及对应的接入配置可通过如下方式获取到：获取所述接入接口文档的文档格式以及文档大小；若所述文档格式不为预设格式，或所述文档大小不处于预设范围内，重新获取新的接入接口文档；若所述文档格式为预设格式，且所述文档大小处于预设范围内，从所述接入接口文档中提取出模型描述文本以及各个接入模式对应的配置参数，所述配置参数包括请求参数以及接口响应参数；响应于针对所述配置参数的确认指令，建立输出字段与所述接口响应参数中的响应字段之间的映射关系，得到字段映射关系；利用所述接入模式对应的所述配置参数和所述字段映射关系，对所述接入模式进行接入校验；若所述接入模式通过所述接入校验，将所述配置参数和所述字段映射关系确定为所述接入模式对应的接入配置。

同时可参阅图3，示出了解析接入接口文档的流程示意图。其中，文档格式是指文档所采用的文件格式或数据格式，由于接入接口文档通常是纯文本文档，常见的接入接口文档的文档格式为txt、doc、docx、pdf等，文档格式可通过接入接口文档的文件扩展名确定。文档大小是指接入接口文档所占用的存储空间大小，以字节为单位进行标识，通常可使用为对应的指令查看接入接口文档的文档大小。

预设文档为预先设置的接入接口文档的常见格式，例如doc、docx、txt、pdf等，预设范围是指接入接口文档的文档大小通常所处于的范围，可根据实际的经验进行设置。

为了降低数据处理量，可利用文档格式和文档大小进行初步校验，在初步校验通过后，再进行解析，以避免对非接入接口文档进行解析。例如，可获取到接入接口文档的文档格式和文档大小，若文档格式不为预设格式或文档大小不处于预设范围内，可认为该接入接口文档有较大概率是非接入接口文档，判定未通过初步校验，若文档格式为预设格式且文档大小处于预设范围内，可认为接入接口文档有较大概率是接入接口文档，判定初步校验通过，再进行后续的解析。

由于接入接口文档通常是纯文本文档，可直接读取文档内容，通过分词、词性标注等处理，从接入接口文档中提取出模型描述文本、各个接入模式对应的配置参数。其中，此时提取出的接入模式为接入接口所支持的通信模式，其可以是多个也可以是一个。对接入接口文档的解析可由预先训练好的大语言模型实现，或者通过关键字识别等方式实现，在此不做具体限定。

模型描述文本是用于描述待配置模型的文本，可以包括模型功能描述、模型参数量等。其中，模型功能描述是指描述待配置模型的功能及能力的相关信息，例如，文生图、文生视频，法律的智能问答、中医类智能问答等。模型类型可包括分类、生成等，模型参数量是指待配置模型中可调整的参数数量。

配置参数可以包括接入接口的请求参数以及响应参数，请求参数可包括接口的请求方法、请求路径、参数格式等，可用于构造接入模型的接入请求。响应参数可包含该接入接口所返回的内容中各个字段的含义，以便正确地解析和使用接口返回的数据。

为了提升配置参数的准确性，可通过提示词的方式将配置参数发送给用户进行确认，在用户确认后，可继续后续流程。例如将提示词模板和配置参数拼接后发送给用户，在接收到确认的回复后，可认为收到确认指令后，可继续后续流程。若用户认为不正确，可由用户主动修改后，将用户修改后的内容作为配置参数继续后续流程。

为了准确识别待配置模型的响应，在接收到针对配置参数的确认指令时，可以预先建立响应参数中的各个响应字段和输出字段之间的映射关系，得到字段映射关系。例如，可以是针对每个输出字段，将所述输出字段与各个响应字段进行字符匹配处理；若存在匹配成功的响应字段，建立所述匹配成功的响应字段和所述输出字段之间的映射关系；若不存在匹配成功的响应字段，提取所述输出字段和每个响应字段的语义特征，得到输出字段对应的第一语义特征以及每个响应字段对应的第二语义特征；利用所述第一语义特征和所述第二语义特征，计算所述输出字段和响应字段之间的语义相似度；建立最大的语义相似度对应的响应字段与所述输出字段之间的映射关系。

其中，输出字段为电子设备可识别的字段，该字段可预先根据实际需要进行定义。针对每个输出字段，可将输出字段和各个响应字段进行字符匹配，得到匹配参数。

例如，可以是针对每个响应字段，将所述输出字段和所述响应字段中字段长度较小者确定为第一字段，将所述输出字段和所述响应字段中字段长度较大者确定为第二字段；计算所述第一字段对应的第一哈希值；以所述第一字段的字段长度，从所述第二字段中截取多个第二子字段；计算每个所述第二子字段对应的第二哈希值；若存在任意一个第二哈希值与所述第一哈希值一致，确定所述输出字段和所述响应字段匹配成功；若所有所述第二哈希值均与所述第一哈希值不一致，确定所述输出字段和所述响应字段匹配不成功。

例如，存在响应字段type和content，输出字段为result.type，由于两个响应字段的长度小于输出字段，则两个响应字段均作为第一字段，输出字段为第二字段。针对字段type，可将result.type划分为8个第二子字段，然后这8个第二子字段和第一字段均按照相同的哈希算法转换为哈希值，得到第一哈希值和多个第二哈希值。若第一哈希值和任意一个第二哈希值一致，则第二字段中包含该第一字段，判定匹配成功，若第一哈希值和所有第二哈希值均不一致，则第二字段中不包含该第一字段，判定匹配不成功。

若存在匹配成功的响应字段，建立匹配成功的响应字段和输出字段之间的映射关系。若不存在匹配成功的响应字段，提取输出字段和每个响应字段的语义特征，得到输出字段对应的第一语义特征以及每个响应字段对应的第二语义特征。通过计算语义相似度并确定出最大的语义相似度对应的响应字段，建立其与输出字段的映射关系。其中，语义相似度可以是第一语义特征和第二语义特征之间的特征距离，该特征距离越大，语义相似度越小。利用字段匹配和语义匹配，可确保从响应参数中确定出输出字段匹配的响应字段，避免匹配失败，以正常建立字段映射关系。

字段映射关系建立完毕后，为了确保可正常接入待配置模型，可将字段映射关系发送给终端，以供用户确认，用户确认后可以利用接入模式对应的配置参数和字段映射关系，对接入模式进行接入校验。如，可以是根据所述请求参数和样本文本，构造样本请求；若所述样本请求成功发送至所述待配置模型，从所述待配置模型获取所述样本文本对应的样本响应；若所述样本响应包含所述响应参数中的所有响应字段，按照所述字段映射关系将所述样本响应转换为样本输出；若所述样本输出符合预设格式，确定所述接入模式通过所述接入校验。

样本请求是用于测试是否能正常接入待配置模型的请求，请求参数中可包括请求方法、请求路径、参数格式等，根据这些参数和样本文本可构造出样本请求，以便将样本文本发送至待配置模型进行处理。若样本请求成功发送至待配置模型，则可以从待配置模型处获取到样本文本对应的样本响应，样本响应则为待配置模型对样本文本进行推理后所得到的数据。可选地，在将样本请求向待配置模型发送后，可启用计时器，当计时到预设值时，若仍未获取到样本响应，可认为样本请求发送失败，则接入模式未通过接入校验。

在获取到样本响应后，可确定样本响应中是否包含响应参数中的所有响应字段，若包含，可判定样本响应正常，并继续按照字段映射关系将样本响应转换为样本输出。若样本响应中不包含所有响应字段，可判定样本响应异常，该接入模式不通过接入校验。

预设格式为正常输出所对应的格式，可预先根据实际的需要进行设置，若样本输出不符合预设格式，则可能是字段映射出错，可判定接入模式未通过接入校验，若样本输出符合预设格式，可判定接入模式通过接入校验。需要说明的是，若接入模式未通过接入校验，表明该接入模式无法正常接入待配置模型，可向终端发送具体确定未通过接入校验的理由，以引导用户进行问题定位，并修改配置参数或字段映射关系。

若接入模式通过接入校验，则该接入模式可正常接入待配置模型，可直接将配置参数和字段映射关系作为接入模式对应的接入配置。而解析出来的模型描述文本、接入模式以及接入模式对应的接入配置，则一并关联存储以供后续接入模型时使用。

S130、若接收到询问文本，对所述询问文本进行意图识别，得到所述询问文本对应的询问意图。

前述步骤上传接入接口文档并解析得到接入配置后，该接入配置可在收到询问文本时使用。询问文本是用于和模型进行交互的文本，该询问文本可由用户输入，在接收到询问文本后，通常需要给出询问文本对应的答复信息，该答复信息可以是纯文本，也可以是多模态信息。为了给出准确的答复信息，可以对询问文本进行意图识别，识别出询问意图，以便基于询问意图进行后续处理。

其中，询问意图可通过预先训练的识别模型进行处理得到，在训练模型时，可以是先准备好训练样本集，该训练样本集可包括多个训练数据，以及每个训练数据对应的意图标签，将训练数据输入模型可得到预测标签，基于预测标签和意图标签之间的差异构建损失函数，在损失函数收敛时，得到识别模型。其中，意图标签的具体内容和数量可根据待配置模型的功能进行设置，然后将询问文本输入该识别模型，即可得到询问意图。

S140、将所述询问意图和每个所述待配置模型的模型描述文本进行匹配，以从所述多个待配置模型中确定目标模型。

在识别出询问文本对应的询问意图后，可将询问意图和模型描述文本进行匹配，以从多个待配置模型中确定目标模型，其中，目标模型为推理询问文本的待配置模型。

确定目标模型时，可以是对所述询问意图进行编码处理，得到意图向量；对每个待配置模型的模型功能描述进行编码处理，得到每个模型功能描述对应的描述向量；计算所述意图向量和每个所描述向量之间的语义相似度；若存在大于预设相似度的语义相似度，将大于预设相似度的语义相似度对应的待配置模型确定为候选模型；若不存在大于预设相似度的语义相似度，将最大的语义相似度对应的待配置模型确定为候选模型；将最大的模型参数量对应的候选模型，确定为目标模型。

模型描述文本可包括模型功能描述和模型参数量，模型功能描述是指用于描述待配置模型的功能的文本，模型参数量则是指待配置模型中可调整的参数数量。意图识别得到的询问意图通常以文本的形式表示，可对询问意图进行编码处理，得到意图向量，对每个待配置模型的模型功能描述进行相同的编码处理，可得到描述向量，然后，可计算出意图向量和每个描述向量之间的语义相似度。

其中，预设相似度为预先设置的相似度，若语义相似度大于预设相似度，可认为两者非常相似，为了提升后续处理询问文本的准确度，若存在大于预设相似度的语义相似度，则将该语义相似度对应的模型功能描述作为候选描述文本。若不存在大于预设相似度的语义相似度，可直接将语义相似度中的最大值对应的模型功能描述作为候选描述文本，避免后续没有合适的模型处理询问文本。然后，可将候选描述文本对应的待配置模型确定为候选模型。

需要说明的是，候选模型为可处理询问文本的模型，模型参数量越大，可认为候选模型的推理理解能力越强，由此，可直接将模型参数量最大的候选模型，确定为目标模型使用。

S150、结合所述询问意图和所述询问文本，从候选配置中确定目标配置。

候选配置是指目标模型对应的接入配置，由于接入配置和接入模式对应，则候选配置也和接入模式对应，结合询问意图和询问文本，从候选配置中确定目标配置时，也是在确定适合当前询问意图和询问文本的接入模式。

若候选配置的数量不大于预设数量，将所述候选配置确定为目标配置；若候选配置的数量大于预设数量，针对每个候选配置，利用所述询问意图和询问文本，预测所述询问文本对应的问答轮数；根据预设接入模式和轮数范围之间的对应关系以及所述问答轮数，从预设接入模式中确定候选模式；若在所述候选配置对应的接入模式中检测到所述候选模式，将所述候选模式对应的候选配置确定为目标配置；若未在所述候选配置对应的接入模式中检测到所述候选模式，利用所述预设接入模式对应的优先级，从候选配置中确定目标配置。

其中，预设数量可根据实际需要进行设置，在本发明实施例中，预设数量为1。若候选配置的数量不大于1，则认为候选配置是唯一的，可直接将候选配置作为目标配置，以降低数据处理量。若候选配置的数量大于1，则需要从中选择合适的配置作为目标配置。

针对每个候选配置，可利用询问意图和询问文本，预测询问文本对应的问答轮数，其中，问答轮数是指在发出该询问文本后，后续和该询问文本关联的提问文本的数量。可选地，利用数据库将历史时间段内产生的对话数据按照意图进行分类存储，历史时间段是指当前时间之前的时间段，例如当前时间之前的一个月，一个周等，利用询问意图，可直接从数据库中获取到对应的历史对话记录。

历史对话记录中可包括多个历史询问文本及对应的历史答复文本，将历史询问文本和询问文本分别进行语义特征提取，得到对应的语义特征向量，再计算向量之间的距离即可得到询问文本和历史询问文本之间的相似度。然后可按照相似度从高到低对历史询问文本排序，将排序靠前的前n个历史询问文本作为候选询问文本，其中，n可根据实际需要进行设置，例如，可设置为3。

然后，利用历史对话记录，可确定多个候选询问文本对应的追问文本的数量。也即，可检测在候选询问文本之后出现的历史询问文本，若该历史询问文本和候选询问文本之间具有一定的关联性，则判定其为追问文本。针对每个候选询问文本，均可获取到其对应的追问文本的数量。计算多个候选询问文本对应的追问文本的平均数量，作为询问文本对应的问答轮数。

预设接入模式可包括http流式模式、http非流式模式以及socket模式，可为每个预设接入模式设置有其适配的轮数范围。需要说明的是，http流式模式和http非流式模式均是基于http通信，通过发送请求来获取响应，每个请求都需要建立新的连接，在完成后关闭连接，不同之处在于http流式模式可将请求分块发送，无需等待整个请求准备好，传输效率较高，而http非流式模式则需要等待整个请求准备好后再发送，传输效率相对较慢。socket模式在建立一次连接后，可持久保持连接，支持实时双向通信，数据基于TCP协议传输，传输效率高。

在智能问答场景中，回复所消耗的时间影响着用户体验，综合不同接入模式的优缺点，为了具有较好的实时性，http非流式模式适用于较小的轮数范围， http流式模式适用于较大的轮数范围，socket模式适用于更大的轮数范围。

其中，具体的轮数范围可根据实际经验进行设置，例如，在本发明实施例中http非流式模式的轮数范围可为[0,1)，http流式模式的轮数范围可为[1,4)，socket模式的轮数范围可为[4，+∞)。

然后可利用问答轮数所处于的轮数范围，确定出候选接入模式。由于候选接入模式不一定是目标模型支持的，由此，若候选配置对应的接入模式中包含该候选接入模式，则直接将该候选接入模式对应的候选配置确定为目标配置。若候选配置对应的接入模式中不包含该候选接入模式，则按照预先设置的各个预设接入模式的优先级，将接入模式的优先级最高的候选配置，作为目标配置。在本发明实施例中，优先级可设置为http流式模式>socket模式>http非流式模式。在确定目标配置时，不仅利用意图选择合适的目标模型，还结合预测出的问答轮数选择当前情况下，综合性能最好的接入模式，灵活性较高，且可确保问答场景的实时性要求，提升用户体验。

S160、利用所述目标配置中的请求参数，将所述询问文本发送至所述目标模型，以便所述目标模型对所述询问文本进行推理，得到所述询问文本对应的响应信息。

目标配置则是需要使用的接入配置，根据目标配置中的请求参数，可将询问文本封装为询问请求发送至目标模型，以便目标模型可对询问文本进行推理后，得到对应的响应信息。其中，响应信息可包括文本、图像、视频中的至少一种。

S170、按照所述目标配置中的字段映射关系，将所述响应信息映射为所述询问文本对应的答复信息并输出。

由于字段映射关系为响应字段和输出字段之间的映射关系，得到响应信息后，可按照字段映射关系将响应信息映射为答复信息，即此时的答复信息则为可被输出的信息，再将答复信息输出至终端，用户即可获取到询问文本对应的答复信息。

为了进一步详细说明本发明的模型接入方法，可参阅图4，示出了模型接入方法的整体架构示意图。该模型接入方法可集成在一个模型平台中，其中，由用户可基于该平台上传多个模型对应的接入接口文档，并对接入接口文档进行解析，自动生成接口支持的接入模式对应的接入配置，在接收到用户的询问文本后，需要确定出目标模型以及目标接入模式，从而可定位出目标接入配置，使用目标接入配置和目标模型连接，并利用目标模型推理询问文本，最后通过字段映射将其转换为答复信息输出。

例如，模型平台的基础模型为通用大模型，通过自动解析文生图模型的接入接口文档，可生成接入该文生图模型的多个接入配置，每个接入配置和接入模式对应。当用户输入询问文本后，可由模型平台中的通用大模型识别出询问文本为文生图意图，则可以确定文生图模型为目标模型，随后利用意图和询问文本确定出目标配置，以接入目标模型。通过目标模型将生成的图片作为答复信息输出。该种方式在有新模型出现时，可快速将新模型的功能集成在模型平台中，且进行数据处理时，不仅选择数据合适的模型，也一并确认最优的接入模式，实现高效灵活地接入模型。

本发明实施例提供的模型接入方案可以应用在各种需要使用模型进行数据处理的场景中。比如，以智能问答为例，可预先通过自动解析模型的接入接口文档，生成接入模式对应的接入配置，在接收到用户输入的问题后，可自动确定出需要接入的模型和使用的接入配置，并接入模型进行问题处理，得到答复信息并输出。

通过本发明实施例提供的模型接入方式，可以自动解析用户上传的接入接口文档，得到接口所支持的接入模式以及对应的接入配置，无需人工手动配置，可有效提升接口配置效率，在接收到询问文本时，可利用询问文本和询问意图确定适配的目标模型和目标接入模式，自适应接入目标模型。

为了更好地实施以上方法，本发明实施例还提供一种模型接入装置，该模型接入装置具体可以集成在电子设备中，该电子设备可以为终端、服务器等设备。其中，终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、个人电脑等设备；服务器可以是单一服务器，也可以是由多个服务器组成的服务器集群。

比如，在本实施例中，将以模型接入装置具体集成在服务器中为例，对本发明实施例的方法进行详细说明。

例如，如图5所示，该模型接入装置200可以包括：

文档获取模块210，用于获取多个待配置模型的接入接口文档；

解析模块220，用于对所述接入接口文档进行解析处理，得到待配置模型的模型描述文本、至少一个接入模式以及每个所述接入模式对应的接入配置，所述接入配置包括请求参数、响应参数以及字段映射关系，所述字段映射关系包括所述响应参数中的响应字段与输出字段之间的映射关系；

意图识别模块230，用于若接收到询问文本，对所述询问文本进行意图识别，得到所述询问文本对应的询问意图；

模型确定模块240，用于将所述询问意图和每个所述待配置模型的模型描述文本进行匹配，以从所述多个待配置模型中确定目标模型；

配置确定模块250，用于结合所述询问意图和所述询问文本，从候选配置中确定目标配置，所述候选配置为所述目标模型对应的接入配置；

接入模块260，用于利用所述目标配置中的请求参数，将所述询问文本发送至所述目标模型，以便所述目标模型对所述询问文本进行推理，得到所述询问文本对应的响应信息；

输出模块270，用于按照所述目标配置中的字段映射关系，将所述响应信息映射为所述询问文本对应的答复信息并输出。

在一些实施例中，解析模块220具体用于：

获取所述接入接口文档的文档格式以及文档大小；

若所述文档格式不为预设格式，或所述文档大小不处于预设范围内，重新获取新的接入接口文档；

若所述文档格式为预设格式，且所述文档大小处于预设范围内，从所述接入接口文档中提取出模型描述文本以及各个接入模式对应的配置参数，所述配置参数包括请求参数以及接口响应参数；

响应于针对所述配置参数的确认指令，建立输出字段与所述接口响应参数中的响应字段之间的映射关系，得到字段映射关系；

利用所述接入模式对应的所述配置参数和所述字段映射关系，对所述接入模式进行接入校验；

若所述接入模式通过所述接入校验，将所述配置参数和所述字段映射关系确定为所述接入模式对应的接入配置。

在一些实施例中，解析模块220具体用于：

针对每个输出字段，将所述输出字段与各个响应字段进行字符匹配处理；

若存在匹配成功的响应字段，建立所述匹配成功的响应字段和所述输出字段之间的映射关系；

若不存在匹配成功的响应字段，提取所述输出字段和每个响应字段的语义特征，得到输出字段对应的第一语义特征以及每个响应字段对应的第二语义特征；

利用所述第一语义特征和所述第二语义特征，计算所述输出字段和响应字段之间的语义相似度；

建立最大的语义相似度对应的响应字段与所述输出字段之间的映射关系。

在一些实施例中，解析模块220具体用于：

针对每个响应字段，将所述输出字段和响应字段中，字段长度较小者确定为第一字段，将字段长度较大者确定为第二字段；

计算所述第一字段对应的第一哈希值；

以所述第一字段的字段长度，从所述第二字段中截取多个第二子字段；

计算每个所述第二子字段对应的第二哈希值；

若存在任意一个所述第二哈希值与所述第一哈希值一致，确定所述输出字段和所述响应字段匹配成功；

若所有所述第二哈希值均与所述第一哈希值不一致，确定所述输出字段和所述响应字段匹配不成功。

在一些实施例中，解析模块220具体用于：

根据所述请求参数和样本文本，构造样本请求；

若所述样本请求成功发送至所述待配置模型，从所述待配置模型获取所述样本文本对应的样本响应；

若所述样本响应包含所述响应参数中的所有响应字段，按照所述字段映射关系将所述样本响应转换为样本输出；

若所述样本输出符合预设格式，确定所述接入模式通过所述接入校验。

在一些实施例中，模型描述文本包括模型功能描述和模型参数量，模型确定模块240具体用于：

对所述询问意图进行编码处理，得到意图向量；

对每个待配置模型的模型功能描述进行编码处理，得到每个模型功能描述对应的描述向量；

计算所述意图向量和每个所描述向量之间的语义相似度；

若存在大于预设相似度的语义相似度，将大于预设相似度的语义相似度对应的待配置模型确定为候选模型；

若不存在大于预设相似度的语义相似度，将最大的语义相似度对应的待配置模型确定为候选模型；

将最大的模型参数量对应的候选模型，确定为目标模型。

在一些实施例中，配置确定模块250具体用于：

若候选配置的数量不大于预设数量，将所述候选配置确定为目标配置；

若候选配置的数量大于预设数量，针对每个候选配置，利用所述询问意图和所述询问文本，预测所述询问文本对应的问答轮数；

根据预设接入模式和轮数范围之间的对应关系以及所述问答轮数，从预设接入模式中确定候选模式；

若在所述候选配置对应的接入模式中检测到所述候选模式，将所述候选模式对应的候选配置确定为目标配置；

若未在所述候选配置对应的接入模式中检测到所述候选模式，利用所述预设接入模式对应的优先级，从候选配置中确定目标配置。

在一些实施例中，配置确定模块250具体用于：

获取所述询问意图关联的历史对话记录，所述历史对话记录中包括多个历史询问文本和历史答复文本；

利用所述询问文本和每个所述历史询问文本之间的相似度，从历史询问文本中确定多个候选询问文本；

利用多个候选询问文本对应的追问文本的数量，计算所述询问文本对应的问答轮数。

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。

由上可知，本实施例的模型接入装置可以自动解析用户上传的接入接口文档，得到接口所支持的接入模式以及对应的接入配置，无需人工手动配置，可有效提升接口配置效率，在接收到询问文本时，可利用询问文本和询问意图确定适配的目标模型和目标接入模式，自适应接入目标模型。

本发明实施例还提供一种电子设备，该电子设备可以为终端、服务器等设备。在本实施例中，将以本实施例的电子设备是服务器为例进行详细描述，比如，如图6所示，其示出了本发明实施例所涉及的电子设备的结构示意图，具体来讲：

该电子设备可以包括一个或者一个以上处理核心的处理器310、一个或一个以上计算机可读存储介质的存储器320、电源330、输入模块340以及通信模块350等部件。本领域技术人员可以理解，图6中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器310是该电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器320内的软件程序和/或模块，以及调用存储在存储器320内的数据，执行电子设备的各种功能和处理数据。在一些实施例中，处理器310可包括一个或多个处理核心；在一些实施例中，处理器310可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器310中。

存储器320可用于存储软件程序以及模块，处理器310通过运行存储在存储器320的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器320可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器320可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器320还可以包括存储器控制器，以提供处理器310对存储器320的访问。

电子设备还包括给各个部件供电的电源330，在一些实施例中，电源330可以通过电源管理系统与处理器310逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源330还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该电子设备还可包括输入模块340，该输入模块340可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

该电子设备还可包括通信模块350，在一些实施例中通信模块350可以包括无线模块，电子设备可以通过该通信模块350的无线模块进行短距离无线传输，从而为用户提供了无线的宽带互联网访问。比如，该通信模块350可以用于帮助用户收发电子邮件、浏览网页和访问流式媒体等。

尽管未示出，电子设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，电子设备中的处理器310会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器320中，并由处理器310来运行存储在存储器320中的应用程序，从而实现本发明各实施例方法中的步骤。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

由上可知，本实施例提供的电子设备可以自动解析用户上传的接入接口文档，得到接口所支持的接入模式以及对应的接入配置，无需人工手动配置，可有效提升接口配置效率，在接收到询问文本时，可利用询问文本和询问意图确定适配的目标模型和目标接入模式，自适应接入目标模型。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本发明实施例提供一种计算机可读存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本发明实施例所提供的任一种模型接入方法中的步骤。

其中，该存储介质可以包括：只读存储器（ROM，Read Only Memory）、随机存取记忆体（RAM，Random Access Memory）、磁盘或光盘等。

根据本发明的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机程序/指令，该计算机程序/指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机程序/指令，处理器执行该计算机程序/指令，使得该电子设备执行上述实施例中提供的自动解析文档方面或者模型接入方面的各种可选实现方式中提供的方法。

由于该存储介质中所存储的指令，可以执行本发明实施例所提供的任一种模型接入方法中的步骤，因此，可以实现本发明实施例所提供的任一种模型接入方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本发明实施例所提供的一种模型接入方法、装置及电子设备进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种模型接入方法，其特征在于，所述方法包括：

获取多个待配置模型的接入接口文档；

2.根据权利要求1所述的方法，其特征在于，所述对所述接入接口文档进行解析处理，得到待配置模型的模型描述文本、至少一个接入模式以及每个所述接入模式对应的接入配置，包括：

获取所述接入接口文档的文档格式以及文档大小；

3.根据权利要求2所述的方法，其特征在于，所述建立输出字段与所述接口响应参数中的响应字段之间的映射关系，得到字段映射关系，包括：

4.根据权利要求3所述的方法，其特征在于，所述将所述输出字段与各个响应字段进行字符匹配处理，包括：

针对每个响应字段，从所述输出字段和所述响应字段中确定第一字段和第二字段，其中，所述第一字段的字段长度小于所述第二字段的字段长度；

计算所述第一字段对应的第一哈希值；

计算每个所述第二子字段对应的第二哈希值；

5.根据权利要求2所述的方法，其特征在于，所述利用所述接入模式对应的所述配置参数和所述字段映射关系，对所述接入模式进行接入校验，包括：

根据所述请求参数和样本文本，构造样本请求；

6.根据权利要求1所述的方法，其特征在于，所述模型描述文本包括模型功能描述和模型参数量，所述将所述询问意图和每个所述待配置模型的模型描述文本进行匹配，以从所述多个待配置模型中确定目标模型，包括：

对所述询问意图进行编码处理，得到意图向量；

计算所述意图向量和每个所描述向量之间的语义相似度；

将最大的模型参数量对应的候选模型，确定为目标模型。

7.根据权利要求1所述的方法，其特征在于，所述结合所述询问意图和所述询问文本，从候选配置中确定目标配置，包括：

8.根据权利要求7所述的方法，其特征在于，所述利用所述询问意图和所述询问文本，预测所述询问文本对应的问答轮数，包括：

9.一种模型接入装置，其特征在于，所述装置包括：

文档获取模块，用于获取多个待配置模型的接入接口文档；

10.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有多条指令；所述处理器从所述存储器中加载指令，以执行如权利要求1~8任一项所述的模型接入方法中的步骤。