CN117807212A - 一种基于大模型的数据资源供需对接交互式问答功能设计方法 - Google Patents

一种基于大模型的数据资源供需对接交互式问答功能设计方法 Download PDF

Info

Publication number
CN117807212A
CN117807212A CN202410001516.1A CN202410001516A CN117807212A CN 117807212 A CN117807212 A CN 117807212A CN 202410001516 A CN202410001516 A CN 202410001516A CN 117807212 A CN117807212 A CN 117807212A
Authority
CN
China
Prior art keywords
data
information
user
intention
large model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410001516.1A
Other languages
English (en)
Inventor
陆志鹏
韩光
郑曦
王晓亮
国丽
刘国栋
范国浩
唐超
王欢
张婧莹
崔晨光
刘翔宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cec Digital Innovation Beijing Technology Co ltd
Zhongdian Data Industry Co ltd
Original Assignee
Cec Digital Innovation Beijing Technology Co ltd
Zhongdian Data Industry Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cec Digital Innovation Beijing Technology Co ltd, Zhongdian Data Industry Co ltd filed Critical Cec Digital Innovation Beijing Technology Co ltd
Priority to CN202410001516.1A priority Critical patent/CN117807212A/zh
Publication of CN117807212A publication Critical patent/CN117807212A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于大模型的数据资源供需对接交互式问答功能设计方法。本方法包括:用户使用自然语言输入查询需求,解析用户文字描述中的关键词,识别用户意图并提取关键信息;如果识别过程中发现用户意图不明确或者提取的关键信息不完整,向用户发送反馈信息提示用户补全内容;确定用户意图并提取完整相关信息后,生成查询SQL,调用和查询数据生态资源知识库获取数据服务商信息、数据信息、数据使用场景信息;将查询到的数据信息发送至大模型,通过prompt组织和整合答案并展现给用户。本方法可根据数据需求快速定位潜在数据供应商,且与人工咨询服务方式相比,本方法成本费用大幅降低,且实施周期短,可帮助企业进行快速决策。

Description

一种基于大模型的数据资源供需对接交互式问答功能设计 方法
技术领域
本发明属于数据资源供需对接方法技术领域,尤其涉及一种基于大模型的数据资源供需对接交互式问答功能设计方法。
背景技术
随着信息技术的发展,各行各业对数据的需求不断增长,数据已经成为现今企业和社会最重要的资产之一。在数据资产的驱动下,企业可以更好地了解用户需求,优化业务流程,挖掘企业潜在客户。在新时期数字经济战略发展中,数字化转型和数字化创新的重要性持续凸显,其中,高价值数据的供给和需求之间也需要更加高效的对接方式。
传统的数据资源供需对接方式通常以人工咨询服务方式为主。咨询服务公司的行业数据专员,通常在某一行业领域有丰富的数据从业经验,他们对某一行业数据流向和相关数据资产持有方有非常清晰的认知,可以高效准确地定位到数据供给方。但是,传统的数据资源供需对接方式人力成本较高,费用支出居高不下,且实施周期较长,不利于迅速应对市场变化和业务需求。
发明内容
为了克服传统数据资源供需对接方式存在的上述缺陷,本发明提出了一种新的基于大模型的数据资源供需对接交互式问答功能设计方法。
具体地,本发明提供了一种基于大模型的数据资源供需对接交互式问答功能设计方法,本方法包括:
S1.用户使用自然语言输入查询需求,解析用户文字描述中的关键词,识别用户意图并提取关键信息;
S2.如果识别过程中发现用户意图不明确或者提取的关键信息不完整,向用户发送反馈信息提示用户补全内容;
S3.确定用户意图并提取完整相关信息后,生成查询SQL,调用和查询数据生态资源知识库获取数据服务商信息、数据信息、数据使用场景信息;
S4.将查询到的数据信息发送至大模型,通过prompt组织和整合答案并展现给用户。
进一步地,本发明基于大模型的数据资源供需对接交互式问答功能设计方法步骤S1中所述的用户意图包括数据服务商查询和/或数据场景查询。
进一步地,本发明基于大模型的数据资源供需对接交互式问答功能设计方法步骤S1中所述的关键信息包括:数据服务商信息、数据信息、使用场景信息、数据分级分类信息。
进一步地,本发明基于大模型的数据资源供需对接交互式问答功能设计方法步骤S3中所述的数据生态资源知识库为整合了数据服务商信息、数据信息、数据使用场景信息、数据分级分类信息的知识库。
进一步地,本发明基于大模型的数据资源供需对接交互式问答功能设计方法步骤S3中所述的数据生态资源知识库在数据采集、数据清洗、数据加工过程中对数据进行了精细化处理并构建了相关的知识图谱,为各类场景的数据查询提供数据资源。
进一步地,本发明基于大模型的数据资源供需对接交互式问答功能设计方法步骤S4中所述的大模型的训练数据语料包括:政府网站语料、企事业官网语料、资讯类网站语料、论坛对话语料以及百科类语料。
另外,本发明还提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述程序被处理器执行时实现上述的基于大模型的数据资源供需对接交互式问答功能设计方法的步骤。
另一方面,本发明还提供了一种基于大模型的数据资源供需对接交互式问答功能设计系统,本系统包括:
用户意图识别模块:解析用户查询需求文字描述中的关键词,识别用户意图;
用户信息提取模块:解析用户查询需求文字描述中的关键词,提取关键信息;
信息反馈模块:如果发现用户意图不明确或者提取的关键信息不完整,向用户发送反馈信息提示用户补全内容;
查询SQL生成模块:确定用户意图并提取完整相关信息后,生成查询SQL;
信息查询模块:调用和查询数据生态资源知识库获取数据服务商信息、数据信息、数据使用场景信息;
答案生成模块:将查询到的数据信息发送至大模型,通过prompt组织和整合答案并展现给用户。
各模块按照前述的基于大模型的数据资源供需对接交互式问答功能设计方法实施运行。
综上,本发明基于大模型的数据资源供需对接交互式问答功能设计方法具有以下优点:
(1)本发明方法可帮助数据需求方独立实现简单任务项目的数据供应商搜索,以及为复杂任务项目进行前期信息储备和业务背景知识积累。
(2)本发明方法可根据数据需求快速定位潜在数据供应商,且与人工咨询服务方式相比,本方法成本费用大幅降低,且实施周期短,可帮助企业进行快速决策。
(3)本发明方法中的交互式问答功能设计也可使数据需求方在交互问答的过程中进一步梳理思路,发现相关的数据需求和潜在商业价值。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面对本发明实施例叙述中需要使用的附图作简要介绍,显而易见地,下述附图仅是本发明中记载的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法的技术架构示意图。
图2为本发明方法的实施流程示意图。
图3为根据本发明一种实施例的本方法在具体场景中的实施方式及实施效果示意图。
图4为根据本发明另一种实施例的本方法在具体场景中的实施方式及实施效果示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例,本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
同时,应理解,本发明的保护范围并不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围。
实施例:一种基于大模型的数据资源供需对接交互式问答功能设计方法
由于大语言模型的参数量通常在十亿量级左右,因此大模型具有比机器学习和深度学习更强的语义理解能力。同时大语言模型的训练数据语料包括大量政府网站、企事业官网、资讯类网站、论坛对话语料以及百科类语料等,且训练语料的规模在TB级以上。基于如上训练数据集的描述,可基本推测参数量在十亿量级以上的大语言模型应具备中级数据分析经理的从业经验和相关数据背景知识。
在以上认知的基础上,本发明方法采用交互式问答的设计,通过解析数据需求方文字描述中的关键词和意图,逐步梳理、理解数据需求方对数据资源的规定和要求,直到返回满足数据需求方要求的高质量数据源。
如图1和图2所示,本方法的具体实现步骤如下:
步骤一:用户询问“某家数据服务商可提供哪些类型的数据服务”或者根据自身实际场景询问“某些数据服务哪些数据服务商可以提供”,如“数据包这家公司有什么数据资源可以提供”或者“手机实名数据可以从哪里获取”;
步骤二:模型接收到用户输入的需求后自动识别用户意图并提取关键信息,如果识别过程中用户意图不明确或者提取的关键信息不完整,向用户发送反馈信息提示用户补全内容;
步骤三:确定用户意图且提取完整信息后,调用和查询数据生态资源知识库获取数据服务商信息、数据信息、使用场景信息等知识。数据生态资源知识库为整合了数据服务商信息、数据使用场景信息、数据分级分类信息等数据知识的知识库,该知识库在数据采集、清洗加工过程中对数据进行了精细化处理并构建了相关的知识图谱,为各类场景的数据查询提供高质量高可信的数据资源。
步骤四:将查询到的数据发送至大模型,通过prompt组织答案并展现给用户。
本方法在具体场景中的实施方式及实施效果如图3和图4所示。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰获得等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均应包含在本发明的权利要求保护范围之内。

Claims (8)

1.一种基于大模型的数据资源供需对接交互式问答功能设计方法,其特征在于,所述方法包括:
S1.用户使用自然语言输入查询需求,解析用户文字描述中的关键词,识别用户意图并提取关键信息;
S2.如果识别过程中发现用户意图不明确或者提取的关键信息不完整,向用户发送反馈信息提示用户补全内容;
S3.确定用户意图并提取完整相关信息后,生成查询SQL,调用和查询数据生态资源知识库获取数据服务商信息、数据信息、数据使用场景信息;
S4.将查询到的数据信息发送至大模型,通过prompt组织和整合答案并展现给用户。
2.根据权利要求1所述的基于大模型的数据资源供需对接交互式问答功能设计方法,其特征在于,步骤S1中所述的用户意图包括数据服务商查询和/或数据场景查询。
3.根据权利要求2所述的基于大模型的数据资源供需对接交互式问答功能设计方法,其特征在于,步骤S1中所述的关键信息包括:数据服务商信息、数据信息、使用场景信息、数据分级分类信息。
4.根据权利要求1所述的基于大模型的数据资源供需对接交互式问答功能设计方法,其特征在于,步骤S3中所述的数据生态资源知识库为整合了数据服务商信息、数据信息、数据使用场景信息、数据分级分类信息的知识库。
5.根据权利要求4所述的基于大模型的数据资源供需对接交互式问答功能设计方法,其特征在于,步骤S3中所述的数据生态资源知识库在数据采集、数据清洗、数据加工过程中对数据进行了精细化处理并构建了相关的知识图谱,为各类场景的数据查询提供数据资源。
6.根据权利要求1所述的基于大模型的数据资源供需对接交互式问答功能设计方法,其特征在于,步骤S4中所述的大模型的训练数据语料包括:政府网站语料、企事业官网语料、资讯类网站语料、论坛对话语料以及百科类语料。
7.一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述程序被处理器执行时实现权利要求1-6任一项所述的基于大模型的数据资源供需对接交互式问答功能设计方法的步骤。
8.一种基于大模型的数据资源供需对接交互式问答功能设计系统,其特征在于,所述系统包括:
用户意图识别模块:解析用户查询需求文字描述中的关键词,识别用户意图;
用户信息提取模块:解析用户查询需求文字描述中的关键词,提取关键信息;
信息反馈模块:如果发现用户意图不明确或者提取的关键信息不完整,向用户发送反馈信息提示用户补全内容;
查询SQL生成模块:确定用户意图并提取完整相关信息后,生成查询SQL;
信息查询模块:调用和查询数据生态资源知识库获取数据服务商信息、数据信息、数据使用场景信息;
答案生成模块:将查询到的数据信息发送至大模型,通过prompt组织和整合答案并展现给用户。
CN202410001516.1A 2024-01-02 2024-01-02 一种基于大模型的数据资源供需对接交互式问答功能设计方法 Pending CN117807212A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410001516.1A CN117807212A (zh) 2024-01-02 2024-01-02 一种基于大模型的数据资源供需对接交互式问答功能设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410001516.1A CN117807212A (zh) 2024-01-02 2024-01-02 一种基于大模型的数据资源供需对接交互式问答功能设计方法

Publications (1)

Publication Number Publication Date
CN117807212A true CN117807212A (zh) 2024-04-02

Family

ID=90425340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410001516.1A Pending CN117807212A (zh) 2024-01-02 2024-01-02 一种基于大模型的数据资源供需对接交互式问答功能设计方法

Country Status (1)

Country Link
CN (1) CN117807212A (zh)

Similar Documents

Publication Publication Date Title
US11899681B2 (en) Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium
CN112507139B (zh) 基于知识图谱的问答方法、系统、设备及存储介质
CN115168736A (zh) 一种评标专家推荐方法、装置、设备及介质
CN117370493A (zh) 一种基于大语言模型的系统智能交互方法与装置
CN112765310A (zh) 一种基于深度学习与相似度匹配的知识图谱问答的方法
CN117520514A (zh) 一种问答任务处理方法、装置、设备及可读存储介质
CN113626571B (zh) 答句生成方法、装置、计算机设备和存储介质
Weinzierl et al. Predictive business process monitoring with context information from documents
CN112883202A (zh) 一种基于知识图谱的多组件建模方法和系统
US20240062016A1 (en) Systems and Methods for Textual Classification Using Natural Language Understanding Machine Learning Models for Automating Business Processes
CN117095419A (zh) 一种pdf文档数据处理与信息抽取装置及方法
CN117807212A (zh) 一种基于大模型的数据资源供需对接交互式问答功能设计方法
CN111813918B (zh) 一种科技资源推荐处理方法及装置
CN112148939A (zh) 数据处理方法、装置及电子设备
CN111309773A (zh) 一种车辆信息的查询方法、装置、系统及存储介质
CN115248854B (zh) 一种基于知识图谱的自动问答方法、系统及存储介质
Wenner et al. Levels of intelligent information access using ontology transformations
CN113868322B (zh) 一种语义结构解析方法、装置、设备及虚拟化系统、介质
Weinzierl et al. Predictive Business Process Monitoringwith Context Information from Documents.
Leida et al. Outlines for dynamic visualization of semantic web data
Paulus et al. Towards Combining Semantic Concepts from Multiple Knowledge Bases
CN114064862A (zh) 问答方法、装置及设备
Lyu Design of Intelligent Customer Service Knowledge Base for Medical Insurance Based on Foundation-scale Models
CN115080720A (zh) 基于rpa及ai的文本处理方法、装置、设备及介质
CN117668182A (zh) 融合知识图谱和大语言模型的规范智能问答方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination