CN117370537B - 基于aigc的问答应用开发方法和平台 - Google Patents

基于aigc的问答应用开发方法和平台 Download PDF

Info

Publication number
CN117370537B
CN117370537B CN202311674427.5A CN202311674427A CN117370537B CN 117370537 B CN117370537 B CN 117370537B CN 202311674427 A CN202311674427 A CN 202311674427A CN 117370537 B CN117370537 B CN 117370537B
Authority
CN
China
Prior art keywords
question
answer
application
session
platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311674427.5A
Other languages
English (en)
Other versions
CN117370537A (zh
Inventor
唐美霞
陈士辛
王宗禹
毕志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lazas Network Technology Shanghai Co Ltd
Zhejiang Koubei Network Technology Co Ltd
Original Assignee
Lazas Network Technology Shanghai Co Ltd
Zhejiang Koubei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lazas Network Technology Shanghai Co Ltd, Zhejiang Koubei Network Technology Co Ltd filed Critical Lazas Network Technology Shanghai Co Ltd
Priority to CN202311674427.5A priority Critical patent/CN117370537B/zh
Publication of CN117370537A publication Critical patent/CN117370537A/zh
Application granted granted Critical
Publication of CN117370537B publication Critical patent/CN117370537B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Stored Programmes (AREA)

Abstract

本申请提供了一种基于AIGC的问答应用开发方法和平台,其中方法包括:向应用开发平台发起问答应用新建请求;响应于所述应用开发平台针对所述新建请求开放的问答应用管理权限,配置所述问答应用的基础信息,所述基础信息包括大语言对话模型的类型选择信息;向所述应用开发平台录入问答物料,以使所述应用开发平台获取问答物料文档并将所述问答物料文档进行向量化处理并存储,并基于所述问答物料对选择的大语言对话模型进行训练得到问答应用。本申请可提高问答应用开发效率。

Description

基于AIGC的问答应用开发方法和平台
技术领域
本申请涉及人工智能技术领域,尤其是涉及到一种基于AIGC的问答应用开发方法和平台。
背景技术
随着人工智能的发展,例如人工智能生成内容(AIGC)的发展和使用,基于知识库的问答模式诉求爆发式增长。例如在电商平台中,“商家助手”或“销售小秘”可以采用基于AIGC实现的问答应用,用以自动向用户提问给出答案。问答应用是指问答类应用或程序,也可称为AIGC应用、AGI(通用人工智能)应用或会话应用。
如何快速、高效地进行问答应用的开发,在目前还没有很好的解决方案,是本领域技术人员需要考虑的一个技术问题。
发明内容
有鉴于此,本申请提供了一种基于AIGC的问答应用开发方法和平台,主要目的在于高效开发问答类应用。
依据本申请的一个方面,提供了一种基于AIGC的问答应用开发方法,包括:
向应用开发平台发起问答应用新建请求;
响应于所述应用开发平台针对所述新建请求开放的问答应用管理权限,配置所述问答应用的基础信息,所述基础信息包括大语言对话模型的类型选择信息;
向所述应用开发平台录入问答物料,以使所述应用开发平台获取问答物料文档并将所述问答物料文档进行向量化处理并存储,并基于所述问答物料对选择的大语言对话模型进行训练得到问答应用。
在一种实现方式中,所述响应于所述应用开发平台针对所述请求开放的问答应用管理权限,配置所述问答应用的基础信息,包括:
响应于所述应用开发平台针对所述新建请求生成的问答应用数据表及开放的问答应用请求接口,通过调用所述问答应用请求接口,配置全局配置信息以存储在所述问答应用数据表中。
在一种实现方式中,所述向所述应用开发平台录入问答物料,包括:
获取问答物料文档,将所述问答物料文档录入至所述应用开发平台,或者,
确定问答物料存储地址,根据所述问答物料存储地址从物料存储节点抓取问答物料文档,并通过远程过程调用将抓取到的问答物料文档录入至所述应用开发平台。
在一种实现方式中,还包括:
引用所述应用开发平台开放的通用组件或平台组件,或者通过组件自研入口开发自研组件;
将所述通用组件、平台组件或所述自研组件,以前端功能组件或独立页面集成至所述问答应用中。
在一种实现方式中,所述引用所述应用开发平台开放的通用组件或平台组件,包括:
访问所述应用开发平台开放的组件可视化编排入口,选取通用组件或平台组件,并对组件配置参数进行确认或更改。
在一种实现方式中,还包括:
问答会话创建,其中,发起针对所述问答应用的访问请求,使所述应用开发平台基于所述访问请求生成会话记录生成接口并创建问答会话,以及,将提问消息通过所述会话记录生成接口发送至问答会话下的问答消息表中,使所述应用开发平台在所述问答消息表中对提问消息以及对应的答案消息进行持久化处理;和/或,
问答会话反馈,其中,针对答案消息进行打分并反馈至所述应用开发平台,使所述应用开发平台更新所述问答消息表中反馈字段,以记录问答反馈信息;和/或,
问答会话管理,其中,通过所述应用开发平台开放的会话管理权限,查看问答会话列表、查看指定会话下的问答消息表,或者删除无效会话。
在一种实现方式中,还包括:
访问所述应用开发平台开放的流程编排入口,选取功能组件并通过流程编排方式串联两个及以上的功能组件。
在一种实现方式中,还包括:
向应用开发平台发起问答应用使用请求;
响应于所述应用开发平台针对所述使用请求开放的已有问答应用的配置权限,对所述已有问答应用的配置信息进行确认或更改,得到更新后的问答应用。
依据本申请的一个方面,提供了一种基于AIGC的问答应用开发平台,包括能力层和应用层,其中,
所述能力层,用于提供问答应用基础资源,并提供通用人工智能AGI能力,驱动问答应用运行的流程引擎,以及,对功能组件、接口或入口的开放权限进行管理;
所述应用层,用于提供开发问答应用的功能组件,其中,所述功能组件包括问答应用配置管理组件,用于针对问答应用新建请求,开放问答应用管理权限以配置问答应用的基础信息,所述基础信息包括大语言对话模型的类型选择信息,所述功能组件还包括物料管理组件,用于录入问答物料文档并将所述问答物料文档进行向量化处理并存储,并基于所述问答物料对配置的大语言对话模型进行训练得到问答应用。
在一种实现方式中,所述功能组件还包括会话管理组件,所述会话管理组件进一步包括问答会话创建模块、问答会话反馈模块及问答会话管理模块;其中,
问答会话创建模块,基于问答应用的访问请求生成会话记录生成接口并创建问答会话,以及,在所述问答消息表中对提问消息以及对应的答案消息进行持久化处理;
问答会话反馈模块,接收针对答案消息的打分反馈信息,更新所述问答消息表中反馈字段,以记录问答反馈信息;
问答会话管理模块,用于开放会话管理权限,以使用户查看问答会话列表、查看指定会话下的问答消息表,或者删除无效会话。
在一种实现方式中。
所述功能组件还包括流程编排组件,用于提供流程编排入口,并通过流程编排方式串联两个及以上的功能组件。
在一种实现方式中,
所述应用层还用于提供使用已有问答应用的应用市场,所述应用市场根据问答应用使用请求,开放已有问答应用的配置权限, 并根配置信息得到并提供更新后的问答应用。
借由上述技术方案,本申请提供的一种基于AIGC的问答应用开发方法和平台,通过将物料管理、模型选择等问答应用中通用能力进行抽离封装成组件,并在后台页面提供各个功能组件的管理权限(开放管理接口),从而使得应用开发者可以快速、高效地创建一个问答应用。例如,通过开放问答应用管理权限,可对问答应用的基础信息进行配置,其中,包括大语言对话模型(LLM)的类型选择,以及,开放物料管理权限,从而可向应用开发平台录入问答物料,以使应用开发平台获取个性化问答物料文档并将问答物料文档进行向量化处理并存储,最终基于所选模型类型以及物料进行训练得到问答应用。
在具体实现中,通过提供物料管理、物料索引、LLM模型管理层能力,以及用户端的应用创建、会话管理、会话反馈、会话交互等全套的通用能力,最终实现从多层能力通用且可配置化,提高不同场景AIGC应用的研发效率。AIGC应用的需求方可以基于以上能力,直接复用运营端和用户端能力,完成全新AIGC应用研发。另外,还支持直接使用或配置已有应用,实现更加简便。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种基于AIGC的问答应用开发平台示意图;
图2示出了本申请实施例提供的一种基于AIGC的问答应用开发方法流程图;
图3示出了本申请实施例提供的一种基于AIGC的问答应用开发方法中配置页面示意图;
图4示出了本申请实施例提供的一种基于AIGC的问答应用开发方法中物料管理流程图;
图5示出了本申请实施例提供的一种基于AIGC的问答应用开发方法中会话管理中文档链路示意图;
图6示出了本申请实施例提供的一种基于AIGC的问答应用开发方法中流程编排示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在问答模式诉求高速增长的背后,AIGC应用背后的整体流程和实现方案基本异曲同工。但是,目前算法、视觉以及前端等研发角色均是按照单一场景去研发,并未抽离成统一的通用能力。而每一个应用场景新建AIGC全套能力,均需要花费较长时间,例如需要2-3个月时间。那如何将AIGC能力快速高效的应用不同领域不同场景,成为突破快速复制AIGC大范围应用的瓶颈之一。
在现有针对问答应用开发场景中,例如在电商场景下,商家与用户之间的问答和知识库场景对AIGC的诉求非常强烈,当前研发和需求侧均有许多涉及AIGC的尝试。但是大多数均面向细分场景定制开发,例如商家小助手问答场景、销售电销金牌话术,销售小蜜,代码生成辅助插件、低代码搭建场景等,但此类场景存在许多可抽象复用的能力,常见的通用能力如:
模型选择:提供可使用的模型选择能力,如通义千问、chatGLM等,或者自训练的模型;
物料管理:物料的抓取、切割、向量化、存储和搜索等通用流程;针对代码类、文档类做不同的物流管理优化方案;
链路编排:对数据来源,查询链路做定制编排,如知识库需要抓取文档资料,代码插件需要获取代码内容、低代码场景输出模型代码;
权限管控:对用户可访问内容做权限控制,避免用户访问到敏感内容;
反馈收集:通过提供用户反馈入口,对内容质量做评估和反馈,根据用户反馈调整服务质量;
模板复用:对常见的场景,如知识库问答,代码辅助等,提供可复用的模板,需求方只需要定制数据即可;
模版配置:自定义prompt(提示)模板管理等能力。
申请人研究发现,若能将此类能力做抽象,可辅助研发人员快速创建或复制出新的AGI(通用人工智能)应用,同时应用开发者也可以将创建后的应用通过配置化开放给他人使用。
基于上述分析,本申请实施例将以上通用能力抽离封装,并提供用户自创AGI应用或者复制已有AGI应用的通用解决方案,以此达到高效地、不断地繁衍新AGI应用的目的,提高效率,且降低人力成本及时间成本。
本申请实施例提供的问答应用开发平台,可帮助用户定制和使用AGI类应用能力。用户可通过该平台自创应用或者复制其他已开发好的AGI类应用;也可通过后台提供的可复用的工具,通过可视化编排的方式来定制自己的AGI应用。该应用开发平台可面向终端产品用户以及应用开发者,其中,终端产品用户:对于希望直接使用AGI应用的用户,只需要通过简单的配置,便可快速自创应用或者使用平台内其他开发者创建的应用;应用开发者,是希望从0开发AGI应用的开发者。
概况而言,可通过以下三类能力,快速的创建一个新的AGI类应用:
1.AGI类应用通用能力:如物料的处理、存储和检索,LLM(大语言模型)层对话能力等;
2.平台能力:后台会对常用的平台能力做封装,规范并格式化出入参等形式,如文档接口、数据传输接口等;
3.上述两类能力的组件化,并提供可视化编排的入口,通过对组件的配置和编排,可完成新AGI类应用的创建。
参见图1,示出了本申请实施例提供的一种基于AIGC的问答应用开发平台示意图。该问答应用开发平台主要分为底层能力和应用层能力。
能力层,提供底层能力,主要分为4类能力: a.提供后台基础功能运行所需的账号、权限、数据等信息的基础能力层; b.通用的AGI能力,提供可复用的AGI应用开发中的常见能力,如物料的向量化、存储检索、LLM对话等能力; c.用于驱动应用运行的流程引擎;d.供其他应用调用的开放能力。
应用层,为用户可接触到的后台应用内容,分为应用市场和应用开发两部分,其中,应用市场,用户在此处直接使用其他开发者开发的应用,通过简单的配置即可直接使用; 应用开发,当用户无法在应用市场中找到满足自己需求的应用时,可通过应用开发模块来开发新的应用。
对本申请实施例涉及到的术语解释如下:
组件(功能组件):用于编排产品流程的原子能力,包括后台内置的通用组件、面向平台调用能力的平台组件、以及开发者自研的组件;
流程:一系列组件编排成一个流程,包括节点和流程控制;
物料管理:是指针对不同场景储备的知识内容的抓取、切割、向量化、存储和搜索等通用流程;
模型选择:是指人工智能背后的训练模型,包括开源或者可访问的LLM模型。比如通义千问、chatGLM等,或者自训练的模型;
终端产品:最终给到客户的产品,如问答系统对应的前端问答组件,代码生成的组件对应的插件等;
问答应用:一个完整的AGI应用,可分发给该应用面向的客户使用,一个应用通常由如下部分组成:(1)应用基础信息:包括应用名称、图标、LLM模型、说明文档等信息;(2)终端产品:开发者可在应用中添加1-n个终端产品,使用者可以通过下载/应用的方式使用;(3)应用流程:一个应用可包含1-n条流程,可通过终端产品入口调用;配置项目:(4)开发者抽象出的通用配置项目,使用应用的用户可通过修改配置进行定制化。
据此,本申请实施例提供一种基于AIGC的问答应用开发平台,包括能力层和应用层,其中,能力层,用于提供问答应用基础资源,并提供通用人工智能AGI能力,驱动问答应用运行的流程引擎,以及,对功能组件、接口或入口的开放权限进行管理;应用层,用于提供开发问答应用的功能组件,其中,功能组件包括问答应用配置管理组件,用于针对问答应用新建请求,开放问答应用管理权限以配置问答应用的基础信息,基础信息包括LLM(大语言对话模型)的类型选择信息,功能组件还包括物料管理组件,用于录入问答物料文档并将问答物料文档进行向量化处理并存储,并基于问答物料对配置的大语言对话模型进行训练得到问答应用。
其中,在一种实现方式中,功能组件还包括会话管理组件,会话管理组件进一步包括问答会话创建模块、问答会话反馈模块及问答会话管理模块;其中,问答会话创建模块,基于问答应用的访问请求生成会话记录生成接口并创建问答会话,以及,在问答消息表中对提问消息以及对应的答案消息进行持久化处理;问答会话反馈模块,接收针对答案消息的打分反馈信息,更新问答消息表中反馈字段,以记录问答反馈信息; 问答会话管理模块,用于开放会话管理权限,以使用户查看问答会话列表、查看指定会话下的问答消息表,或者删除无效会话。
在一种实现方式中,功能组件还包括流程编排组件,用于提供流程编排入口,并通过流程编排方式串联两个及以上的功能组件。
在一种实现方式中,应用层还用于提供使用已有问答应用的应用市场,应用市场根据问答应用使用请求,开放已有问答应用的配置权限, 并根配置信息得到并提供更新后的问答应用。
参见图2,示出了本申请实施例提供的一种基于AIGC的问答应用开发方法流程图。
该问答应用开发方法可包括如下步骤S201-S203。
S201:向应用开发平台发起问答应用新建请求。
用户(应用开发者或终端产品用户),可通过应用开发平台后台页面进行访问或登录操作,从而向应用开发平台发起文档应用新建请求。访问或登录时,可获取用户信息并进行用户权限校验,校验通过才允许发起问答应用新建请求。
S202:响应于应用开发平台针对新建请求开放的问答应用管理权限,配置问答应用的基础信息,基础信息包括大语言对话模型的类型选择信息。
应用基础信息包括但不限于应用名称、图片、说明文档以及LLM模型类型,特别的,为了提高问答应用开发效率,在应用开发平台中内置多种LLM模型类型供用户选择,另外也支持自研模型。
具体实现中,向应用开发平台发送新建请求后,应用开发平台会新建一个文档应用数据表,并且开发一个问答应用请求接口,由此,后台页面通过调用问答应用请求接口,配置全局配置信息以存储在问答应用数据表中。
S203:向应用开发平台录入问答物料,以使应用开发平台获取问答物料文档并将问答物料文档进行向量化处理并存储,并基于问答物料对选择的大语言对话模型进行训练得到问答应用。
问答物料是指问答应用模型所依据的问答文档。在一种实现方式中,用户可将文档物料文档直接上传至应用开发平台,例如读取本地文档并录入。在另一种实现方式中,可读取云端或存储节点的文档物料文档,并通过远程过程调用(RPC)等方式将抓取到的问答物料文档录入至应用开发平台。例如,通过提供问答物料链接,通过问答物料链接确定问答物料存储地址,根据问答物料存储地址从物料存储节点抓取问答物料文档,并通过RPC将抓取到的问答物料文档录入至应用开发平台。
在将问答物料录入至应用开发平台之后,应用开发平台基于问答物料对步骤S202所选择的大语言对话模型进行训练,得到问答应用。
上述步骤是从新建应用角度描述的,实际中,问答应用开发平台还提供直接使用或更改配置后使用已有应用的功能。在此情况下,可执行如下步骤:向应用开发平台发起问答应用使用请求;响应于应用开发平台针对使用请求开放的已有问答应用的配置权限,对已有问答应用的配置信息进行确认或更改,得到更新后的问答应用。这种情况更适用于终端产品用户,这类用户希望直接使用AGI应用户,只需要通过简单的配置,便可快速自创应用或者使用平台内其他开发者创建的应用。
下面从应用管理、物料管理、组件引用、会话管理、流程编排等角度,对本申请实施例提供的问答应用开发方法及平台进行示例性说明。
一、应用管理
用户可以新建应用,并可在应用列表中做增删改管理应用等操作,具体功能包括:查询应用列表(应用名、描述、封面图)、修改应用信息、新增应用、删除应用。
在新建应用的过程中,可参见图3,示出了本申请实施例提供的一种基于AIGC的问答应用开发方法中应用配置页面示意图。该配置页面示出了新建应用的基础信息配置页面,包括封面(可插入图片等)、应用名称、简介、模型选择等。
具体实现中,可通过新增应用信息表和相关请求接口,实现用户自助的应用管理功能。其中数据表示如表1所示、请求接口如表2所示。
二、物料管理
管理问答所需的物料,主要为文档管理和录入,具体包括:
1、物料列表
2、展示物料信息:更新时间、物料来源、文章标题和原始链接
3、重新抓取功能:删除后重新录入文档
4、删除功能:删除文档
5、录入文档按钮
本申请实施例中,支持利用文档工具或知识库工具录入物料。以语雀(一种知识库工具)文档录入为例,对物料录入流程进行示例性说明。参见图4,示出了本申请实施例提供的一种基于AIGC的问答应用开发方法中物料管理流程图。其过程包括:1,用户输入链接以及token(用于鉴权);2,前端页面根据输入的链接,判断链接类型,并在知识库中调用获取语雀文章列表接口,从而在Node(节点)获取文章列表,以及,根据链接类型在Node(节点)抓取文章;3,通过HSF(一种分布式服务架构)在存储层对文档内容进行向量化处理;4,对向量数据进行存储;5、将数据在Node节点存储为doc对象;6、向用户反馈流程处理结束提示。
三、组件引用
本申请实施例中,组件是用于编排产品流程的原子能力,包括后台内置的通用组件、面向平台调用能力的平台组件、以及开发者自研的组件。
在用户(应用开发者)进行应用开发过程中,可以引用平台提供的各类组件或自研组件,例如,可以引用应用开发平台开放的通用组件或平台组件,或者通过组件自研入口开发自研组件;然后,将通用组件、平台组件或自研组件,以前端功能组件或独立页面集成至问答应用中。其中,通过访问应用开发平台开放的组件可视化编排入口,选取通用组件或平台组件,并对组件配置参数进行确认或更改。
例如,在用户(应用开发者)进行应用开发过程中,通过点击“引用组件”功能按钮,可实现如下功能:
1、查看组件引用代码:例如appkey参数从node获取
2、预览组件:右侧实时显示SearchBar(搜索按钮)和FloatingButton(悬浮按钮),点击可以唤起聊天弹层
3、修改参数:提供props参数配置入口,修改后代码中的参数和右侧参数实时生效。
四、会话管理
应用开发平台提供会话管理功能,用于回归终端产品用户的提问对话,其功能包括:
1、会话列表:查看该应用下的会话列表
2、查看会话详情:查看指定会话下的消息列表
3、删除会话:删除无效会话
具体实现中,可新建两个数据表ab_session(问答会话)和ab_message(问答消息表),分别用来存储会话信息和会话中的消息信息,以及,新增数据请求接口,分别用来查询应用下的会话、删除会话以及查询会话中的消息列表。其中具体数据表格式可参见上述表1-表2,原理类似,不再赘述。
当用户访问管理员集成的组件/页面时,会生成一次会话记录生成接口(/api/abSession/add),在ab_session表中创建一条会话记录。每次用户发送消息时,会创建一条ab_message记录来持久化用户的问题以及给到用户的答案;用户对答案打分反馈后,会更新ab_message中的feedback字段,用来记录用户满意度。
参见图5,示出了本申请实施例中问答链路示意图。其过程包括两个分支:数据处理分支(实线)以及消息处理分支(虚线),其中数据处理分支包括:1、管理员维护数据,在数据处理模块进行数据源配置,并且编排数据流程,以及权限配置、分割/向量化处理;2、将向量化后的数据存储在向量数据库;消息处理分支包括:1、用户提问并在数据处理模块进行向量化处理;2、基于向量数据库进行向量搜索;3、生成prompt(提示);4、基于prompt查找LLM模型;5、向用户输出答案。
在一种实现方式中,在问答应用开发方法中还包括如下步骤:
问答会话创建,其中,发起针对问答应用的访问请求,使应用开发平台基于访问请求生成会话记录生成接口并创建问答会话,以及,将提问消息通过会话记录生成接口发送至问答会话下的问答消息表中,使应用开发平台在问答消息表中对提问消息以及对应的答案消息进行持久化处理;
和/或,问答会话反馈,其中,针对答案消息进行打分并反馈至应用开发平台,使应用开发平台更新问答消息表中反馈字段,以记录问答反馈信息;
和/或,问答会话管理,其中,通过应用开发平台开放的会话管理权限,查看问答会话列表、查看指定会话下的问答消息表,或者删除无效会话。
五、流程编排
流程编排是指一系列组件编排得到一个流程,包括流程节点和流程控制。在基础的物料文档和纯文本物料之外,问答应用开发平台还支持用户(应用开发者)通过流程编排的形式串联流程组件。一个流程由多个流程组件组成,每个组件定义了通用的出入参数,可在用户回答前后进行一些定制化操作。
因此在一种实现方式中,在上述问答应用开发方法中,还可以包括如下步骤:访问应用开发平台开放的流程编排入口,选取功能组件并通过流程编排方式串联两个及以上的功能组件。
参见图6,示出了本申请实施例提供的一种基于AIGC的问答应用开发方法中流程编排示意图。该流程编排例子中,包括六个节点:1、读取文档;2、调用HSF服务;3、数据查询;4、数据计算;5、文档;6、发送消息。通过流程编排,可方便用户自定义流程节点及执行顺序,实现个性化定制。
以一个会话应用开发的完整流程,可包括如下步骤:
Step1:新建应用。
应用管理员在后台页面中点击新建应用,选择封面/描述和默认的模型后,平台会调用/api/abApp/add接口,在ab_app表内生成一条新的应用数据。
Step2:物料录入。
应用管理员在应用管理-物料管理内,可以录入语雀文档/自定义文本内容,其中语雀问答录入流程可参考图4。
Step3:集成开放服务。
应用管理员参考组件集成内的代码应用示例,可以将开放组件以前端组件/独立页面的方式集成至自己的场景中。
Step4:用户问答。
当用户访问管理员集成的组件/页面时,会生成一次会话记录生成接口(/api/abSession/add),在ab_session表中创建一条会话记录;每次用户发送消息时,会创建一条ab_message记录来持久化用户的问题以及给到用户的答案;用户对答案打分反馈后,会更新ab_message中的feedback字段,用来记录用户满意度。答案检索链路流程可参见图5。
Step5: 会话管理。
应用管理员可以在后台,通过会话管理看到用户的会话记录(ab_session表),以及会话下的消息记录(ab_message表)。
Step6:流程编排。
在基础的语雀和纯文本物料之外,平台还支持应用管理员通过流程编排的形式串联流程插件。一个流程由多个流程插件,每个插件定义了通用的出入参数,可在用户回答去前后进行一些定制化操作。流程编排具体示例可参考图6。
综上,本申请实施例提供的问答应用开发方法及平台,通过将物料管理、模型选择等问答应用中通用能力进行抽离封装成组件,并在后台页面提供各个功能组件的管理权限(开放管理接口),从而使得应用开发者可以快速创建一个问答应用。例如,通过开放问答应用管理权限,可对问答应用的基础信息进行配置,其中,包括大语言对话模型(LLM)的类型选择,以及,开放物料管理权限,从而可向应用开发平台录入问答物料,以使应用开发平台获取个性化问答物料文档并将问答物料文档进行向量化处理并存储,最终基于所选模型类型以及物料进行训练得到问答应用。
在具体实现中,通过提供物料管理、物料索引、LLM模型管理层能力,以及用户端的应用创建、会话管理、会话反馈、会话交互等全套的通用能力,最终实现从多层能力通用且可配置化,提高不同场景AIGC应用的研发效率。AIGC应用的需求方可以基于以上能力,直接复用运营端和用户端能力,完成全新AIGC应用研发。
本申请的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
向应用开发平台发起问答应用新建请求;
响应于所述应用开发平台针对所述新建请求开放的问答应用管理权限,配置所述问答应用的基础信息,所述基础信息包括大语言对话模型的类型选择信息;
向所述应用开发平台录入问答物料,以使所述应用开发平台获取问答物料文档并将所述问答物料文档进行向量化处理并存储,并基于所述问答物料对选择的大语言对话模型进行训练得到问答应用。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本申请的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
向应用开发平台发起问答应用新建请求;
响应于所述应用开发平台针对所述新建请求开放的问答应用管理权限,配置所述问答应用的基础信息,所述基础信息包括大语言对话模型的类型选择信息;
向所述应用开发平台录入问答物料,以使所述应用开发平台获取问答物料文档并将所述问答物料文档进行向量化处理并存储,并基于所述问答物料对选择的大语言对话模型进行训练得到问答应用。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或功能组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (12)

1.一种基于AIGC的问答应用开发方法,其特征在于,包括:
向应用开发平台发起问答应用新建请求;
响应于所述应用开发平台针对所述新建请求开放的问答应用管理权限,配置所述问答应用的基础信息,所述基础信息包括大语言对话模型的类型选择信息;
基于所述应用开放平台开放的物料管理组件管理权限,向所述应用开发平台录入用户个性化问答物料,以使所述应用开发平台获取问答物料文档并将所述问答物料文档进行向量化处理并存储,并基于所述问答物料对选择的大语言对话模型进行训练得到问答应用;
其中,向所述应用开发平台录入个性化问答物料,使得应用开发平台对问答物料进行向量化处理并存储,包括:用户输入链接以及token;前端页面根据token完成鉴权后,根据输入的链接调用文档列表接口,并在相应节点抓取文档;通过HSF在存储层对文档内容进行向量化处理,并将向量数据存储为doc对象。
2.根据权利要求1所述的方法,其特征在于,所述响应于所述应用开发平台针对所述请求开放的问答应用管理权限,配置所述问答应用的基础信息,包括:
响应于所述应用开发平台针对所述新建请求生成的问答应用数据表及开放的问答应用请求接口,通过调用所述问答应用请求接口,配置全局配置信息以存储在所述问答应用数据表中。
3.根据权利要求1所述的方法,其特征在于,所述向所述应用开发平台录入问答物料,包括:
获取问答物料文档,将所述问答物料文档录入至所述应用开发平台,或者,
确定问答物料存储地址,根据所述问答物料存储地址从物料存储节点抓取问答物料文档,并通过远程过程调用将抓取到的问答物料文档录入至所述应用开发平台。
4.根据权利要求1所述的方法,其特征在于,还包括:
引用所述应用开发平台开放的通用组件或平台组件,或者通过组件自研入口开发自研组件;
将所述通用组件、平台组件或所述自研组件,以前端功能组件或独立页面集成至所述问答应用中。
5.根据权利要求4所述的方法,其特征在于,所述引用所述应用开发平台开放的通用组件或平台组件,包括:
访问所述应用开发平台开放的组件可视化编排入口,选取通用组件或平台组件,并对组件配置参数进行确认或更改。
6.根据权利要求1所述的方法,其特征在于,还包括:
问答会话创建,其中,发起针对所述问答应用的访问请求,使所述应用开发平台基于所述访问请求生成会话记录生成接口并创建问答会话,以及,将提问消息通过所述会话记录生成接口发送至问答会话下的问答消息表中,使所述应用开发平台在所述问答消息表中对提问消息以及对应的答案消息进行持久化处理;和/或,
问答会话反馈,其中,针对答案消息进行打分并反馈至所述应用开发平台,使所述应用开发平台更新所述问答消息表中反馈字段,以记录问答反馈信息;和/或,
问答会话管理,其中,通过所述应用开发平台开放的会话管理权限,查看问答会话列表、查看指定会话下的问答消息表,或者删除无效会话。
7.根据权利要求1所述的方法,其特征在于,还包括:
访问所述应用开发平台开放的流程编排入口,选取功能组件并通过流程编排方式串联两个及以上的功能组件。
8.根据权利要求1-7任一项所述的方法,其特征在于,还包括:
向应用开发平台发起问答应用使用请求;
响应于所述应用开发平台针对所述使用请求开放的已有问答应用的配置权限, 对所述已有问答应用的配置信息进行确认或更改,得到更新后的问答应用。
9.一种基于AIGC的问答应用开发平台,其特征在于,包括能力层和应用层,其中,
所述能力层,用于提供问答应用基础资源,并提供通用人工智能AGI能力,驱动问答应用运行的流程引擎,以及,对功能组件、接口或入口的开放权限进行管理;
所述应用层,用于提供开发问答应用的功能组件,其中,所述功能组件包括问答应用配置管理组件,用于针对问答应用新建请求,开放问答应用管理权限以配置问答应用的基础信息,所述基础信息包括大语言对话模型的类型选择信息,所述功能组件还包括物料管理组件,用于录入用户个性化问答物料文档并将所述问答物料文档进行向量化处理并存储,并基于所述问答物料对配置的大语言对话模型进行训练得到问答应用;
其中,所述应用层具体用于:在基于用户输入链接以及token之后,前端页面根据token完成鉴权后,根据输入的链接调用文档列表接口,并在相应节点抓取文档;通过HSF在存储层对文档内容进行向量化处理,并将向量数据存储为doc对象。
10.根据权利要求9所述的平台,其特征在于,
所述功能组件还包括会话管理组件,所述会话管理组件进一步包括问答会话创建模块、问答会话反馈模块及问答会话管理模块;其中,
问答会话创建模块,基于问答应用的访问请求生成会话记录生成接口并创建问答会话,以及,在问答消息表中对提问消息以及对应的答案消息进行持久化处理;
问答会话反馈模块,接收针对答案消息的打分反馈信息,更新所述问答消息表中反馈字段,以记录问答反馈信息;
问答会话管理模块,用于开放会话管理权限,以使用户查看问答会话列表、查看指定会话下的问答消息表,或者删除无效会话。
11.根据权利要求9所述的平台,其特征在于,
所述功能组件还包括流程编排组件,用于提供流程编排入口,并通过流程编排方式串联两个及以上的功能组件。
12.根据权利要求9-11任一项所述的平台,其特征在于,
所述应用层还用于提供使用已有问答应用的应用市场,所述应用市场根据问答应用使用请求,开放已有问答应用的配置权限,并根配置信息得到并提供更新后的问答应用。
CN202311674427.5A 2023-12-08 2023-12-08 基于aigc的问答应用开发方法和平台 Active CN117370537B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311674427.5A CN117370537B (zh) 2023-12-08 2023-12-08 基于aigc的问答应用开发方法和平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311674427.5A CN117370537B (zh) 2023-12-08 2023-12-08 基于aigc的问答应用开发方法和平台

Publications (2)

Publication Number Publication Date
CN117370537A CN117370537A (zh) 2024-01-09
CN117370537B true CN117370537B (zh) 2024-04-19

Family

ID=89400646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311674427.5A Active CN117370537B (zh) 2023-12-08 2023-12-08 基于aigc的问答应用开发方法和平台

Country Status (1)

Country Link
CN (1) CN117370537B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210924A (zh) * 2019-04-15 2019-09-06 腾讯科技(深圳)有限公司 产品功能定制方法、装置以及服务器
CN111951805A (zh) * 2020-07-10 2020-11-17 华为技术有限公司 一种文本数据处理方法及装置
CN116795968A (zh) * 2023-07-05 2023-09-22 珠海市卓轩科技有限公司 一种基于Chat LLM技术的知识扩展及QA系统
CN116860221A (zh) * 2023-07-28 2023-10-10 金现代信息产业股份有限公司 一种低代码数据模型智能推荐方法及系统
CN117009483A (zh) * 2023-07-24 2023-11-07 腾讯科技(深圳)有限公司 问答服务的生成方法、装置、设备及可读存储介质
CN117056481A (zh) * 2023-08-09 2023-11-14 西藏宁算科技集团有限公司 基于大模型技术的云服务行业对话帮助系统及实现方法
CN117131171A (zh) * 2023-08-07 2023-11-28 山东浪潮科学研究院有限公司 一种基于大语言模型的领域智能助手方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210924A (zh) * 2019-04-15 2019-09-06 腾讯科技(深圳)有限公司 产品功能定制方法、装置以及服务器
CN111951805A (zh) * 2020-07-10 2020-11-17 华为技术有限公司 一种文本数据处理方法及装置
CN116795968A (zh) * 2023-07-05 2023-09-22 珠海市卓轩科技有限公司 一种基于Chat LLM技术的知识扩展及QA系统
CN117009483A (zh) * 2023-07-24 2023-11-07 腾讯科技(深圳)有限公司 问答服务的生成方法、装置、设备及可读存储介质
CN116860221A (zh) * 2023-07-28 2023-10-10 金现代信息产业股份有限公司 一种低代码数据模型智能推荐方法及系统
CN117131171A (zh) * 2023-08-07 2023-11-28 山东浪潮科学研究院有限公司 一种基于大语言模型的领域智能助手方法和装置
CN117056481A (zh) * 2023-08-09 2023-11-14 西藏宁算科技集团有限公司 基于大模型技术的云服务行业对话帮助系统及实现方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Example-based Chat-oriented Dialogue System with Personalized Long-term Memory;Bang, Jeesoo et al.;IEEE;20150402;第238-243页 *
面向限定领域问答系统的自然语言理解方法综述;王东升;王卫民;王石;符建辉;诸峰;;计算机科学;20170815(08);第1-8+41页 *

Also Published As

Publication number Publication date
CN117370537A (zh) 2024-01-09

Similar Documents

Publication Publication Date Title
US6249291B1 (en) Method and apparatus for managing internet transactions
US8260815B2 (en) System and method for accessing non-compatible content repositories
Frischmuth et al. Ontowiki–an authoring, publication and visualization interface for the data web
US7836119B2 (en) Distributed execution model for cross-organizational declarative web applications
KR20090005097A (ko) 웹 커뮤니티 및 웹 애플리케이션에 대해 데이터를 변환하는시스템 및 방법
JP2011204228A (ja) 学習メカニズムを用いたマッシュアップインフラストラクチャ
US8001154B2 (en) Library description of the user interface for federated search results
CN115017182A (zh) 一种可视化的数据分析方法及设备
CN111859076A (zh) 数据爬取方法、装置、计算机设备及计算机可读存储介质
CN116048517B (zh) 基于b/s架构应用系统的api接口生成方法、系统和装置
CN117370537B (zh) 基于aigc的问答应用开发方法和平台
Ramos-Vidal et al. A Software Product Line for Digital Libraries.
Bouhissi et al. Semantic enrichment of web services using linked open data
Shrivastava Learning Salesforce Einstein
CN115114519A (zh) 基于人工智能的推荐方法、装置、电子设备及存储介质
US20220035606A1 (en) System and method for tailoring a customizer for integration process modeling visual element to a domain specific language for business integrations
Biehl GraphQL API Design
Guerrero et al. Consuming Data in Fiori Applications
Alili et al. A model-driven framework for the modeling and the description of data-as-a-service to assist service selection and composition
KR102683041B1 (ko) 디자인 이미지 제공 시스템 및 방법
JP7057984B2 (ja) 検索システム
Ramirez et al. mAPI: A modular framework for the integrated use of distributed resources
Hillier Advanced SharePoint Services Solutions
Vidojevic Analysis and design of a semantic modeling language to describe public data sources
Trinh Mashup-based linked data integration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant