CN118312531A - 查询语言生成方法、系统、电子设备及存储介质 - Google Patents
查询语言生成方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN118312531A CN118312531A CN202410718435.3A CN202410718435A CN118312531A CN 118312531 A CN118312531 A CN 118312531A CN 202410718435 A CN202410718435 A CN 202410718435A CN 118312531 A CN118312531 A CN 118312531A
- Authority
- CN
- China
- Prior art keywords
- index
- data
- natural language
- language data
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000004458 analytical method Methods 0.000 claims abstract description 282
- 238000012545 processing Methods 0.000 claims abstract description 78
- 238000004364 calculation method Methods 0.000 claims abstract description 69
- 238000001914 filtration Methods 0.000 claims description 38
- 238000012795 verification Methods 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 230000001960 triggered effect Effects 0.000 claims description 6
- 238000007405 data analysis Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000002452 interceptive effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种查询语言生成方法、系统、电子设备及存储介质,该方法包括:获取用户输入至大模型的自然语言数据,以及获取预先生成的指标库中多个预设分析指标的指标名称;其中指标库基于原始数据库生成;利用大模型基于多个预设分析指标的指标名称,对自然语言数据进行识别,确定自然语言数据包括的至少一个目标分析指标;利用处理引擎根据指标库包括的目标分析指标的计算逻辑,生成自然语言数据对应的结构化查询语言SQL数据,其中SQL数据用于从所述原始数据库中查询数据。本申请通过提取自然语言数据包括的目标分析指标,基于目标分析指标能够较准确的生成自然语言数据对应的SQL数据。
Description
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种查询语言生成方法、系统、电子设备及存储介质。
背景技术
随着科技的发展,大模型应用而生,大模型是指具有大规模参数和复杂计算结构的机器学习模型。一般的,在利用大模型进行数据分析时,大模型可以获取相关数据库的元信息,根据用户输入的自然语言和数据库的元信息,生成结构化查询语言(StructuredQuery Language,SQL)数据,但是用户输入的自然语言较复杂和多变,使得大模型生成的SQL数据的准确度难以保障;以及将数据库的元信息提供给大模型,存在数据库关键信息泄露的风险,降低了数据库存储数据的安全性。
发明内容
有鉴于此,本公开至少提供一种查询语言生成方法、系统、电子设备及存储介质,可以提高生成的SQL数据的准确度。
第一方面,本公开提供了一种查询语言生成方法,包括:
获取用户输入至大模型的自然语言数据,以及获取预先生成的指标库中多个预设分析指标的指标名称;其中所述指标库基于原始数据库生成;
利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标;
利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据,其中所述SQL数据用于从所述原始数据库中查询数据。
一种可能的实施方式中,在利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别之前,还包括:
利用至少一种匹配算法,确定所述预设分析指标与所述自然语言数据之间的匹配度;
根据各预设分析指标分别与所述自然语言数据之间的匹配度,从所述多个预设分析指标中选取候选分析指标;
所述利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标,包括:
利用所述大模型基于所述候选分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标。
一种可能的实施方式中,所述方法还包括:
利用所述大模型从所述自然语言数据中提取结构参数,所述结构参数包括以下至少一种:维度参数、过滤条件参数、排序参数;
所述利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据,包括:
利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,在所述结构参数包括维度参数、过滤条件参数、排序参数时,所述利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据,包括:
利用处理引擎根据所述目标分析指标的计算逻辑,生成所述目标分析指标对应的指标虚拟表;
利用处理引擎根据所述维度参数,生成维度虚拟表;
使用所述至少一个目标分析指标的所述指标虚拟表、所述维度虚拟表、所述过滤条件参数和所述排序参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,在结构参数包括维度参数时,所述方法还包括:
利用所述处理引擎基于所述指标库包括的指标列表和维度列表,对所述至少一个目标分析指标和所述维度参数进行校验,得到校验结果;
所述利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据,包括:
在所述校验结果指示指标和维度存在时,利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,所述方法还包括:
基于预设结构形式,对所述结构参数进行调整,生成调整后结构参数,其中所述调整后结构参数用于生成SQL数据。
一种可能的实施方式中,所述方法还包括:
对所述自然语言数据对应的SQL数据进行调整,得到调整后的SQL数据,其中调整过程包括以下至少一种:
增加限制limit语句;
相同的子查询进行合并;
将过滤条件调整到虚拟表的查询当中;
相同的过滤条件进行合并;
按照预设基准格式进行格式化处理。
一种可能的实施方式中,所述方法还包括:
响应于触发的指标管理操作,展示指标管理界面;
接收在所述指标管理界面输入的更新后的分析指标的指标数据,并将所述更新后的分析指标的指标数据存储至指标库,其中所述指标数据包括指标名称和计算逻辑。
一种可能的实施方式中,所述方法还包括:
确定适配多种业务场景的各种指标类型;
根据所述各种指标类型,以及所述原始数据库中存储的数据类型,确定每种指标类型下的至少一个预设分析指标;
基于所述各种指标类型下的各预设分析指标,生成所述指标库。
第二方面,本公开提供了一种查询语言生成系统,包括:
指标库,用于存储多个预设分析指标的指标数据,所述指标数据包括指标名称;其中所述指标库基于原始数据库生成;
大模型,用于获取用户输入的自然语言数据,以及获取预先生成的指标库中多个预设分析指标的指标名称;并基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标;
处理引擎,用于根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据,其中所述SQL数据用于从所述原始数据库中查询数据。
一种可能的实施方式中,在利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别之前,大模型还用于:
利用至少一种匹配算法,确定所述预设分析指标与所述自然语言数据之间的匹配度;
根据各预设分析指标分别与所述自然语言数据之间的匹配度,从所述多个预设分析指标中选取候选分析指标;
所述大模型,在利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标时,用于:
利用所述大模型基于所述候选分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标。
一种可能的实施方式中,所述大模型还用于:
利用所述大模型从所述自然语言数据中提取结构参数,所述结构参数包括以下至少一种:维度参数、过滤条件参数、排序参数;
所述处理引擎,在根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据时,用于:
根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,在所述结构参数包括维度参数、过滤条件参数、排序参数时,所述处理引擎,在根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据时,用于:
利用处理引擎根据所述目标分析指标的计算逻辑,生成所述目标分析指标对应的指标虚拟表;
利用处理引擎根据所述维度参数,生成维度虚拟表;
使用所述至少一个目标分析指标的所述指标虚拟表、所述维度虚拟表、所述过滤条件参数和所述排序参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,在结构参数包括维度参数时,所述处理引擎还用于:
基于所述指标库包括的指标列表和维度列表,对所述至少一个目标分析指标和所述维度参数进行校验,得到校验结果;
所述处理引擎在根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据时,用于:
在所述校验结果指示指标和维度存在时,利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,所述处理引擎还用于:
基于预设结构形式,对所述结构参数进行调整,生成调整后结构参数,其中所述调整后结构参数用于生成SQL数据。
一种可能的实施方式中,所述处理引擎还用于:
对所述自然语言数据对应的SQL数据进行调整,得到调整后的SQL数据,其中调整过程包括以下至少一种:
增加限制limit语句;
相同的子查询进行合并;
将过滤条件调整到虚拟表的查询当中;
相同的过滤条件进行合并;
按照预设基准格式进行格式化处理。
一种可能的实施方式中,所述系统还包括:调整模块,用于:
响应于触发的指标管理操作,展示指标管理界面;
接收在所述指标管理界面输入的更新后的分析指标的指标数据,并将所述更新后的分析指标的指标数据存储至指标库,其中所述指标数据包括指标名称和计算逻辑。
一种可能的实施方式中,所述指标库为根据下述步骤生成的:
确定适配多种业务场景的各种指标类型;
根据所述各种指标类型,以及所述原始数据库中存储的数据类型,确定每种指标类型下的至少一个预设分析指标;
基于所述各种指标类型下的各预设分析指标,生成所述指标库。
第三方面,本公开提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述第一方面或任一实施方式所述的查询语言生成方法的步骤。
第四方面,本公开提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述第一方面或任一实施方式所述的查询语言生成方法的步骤。
本申请提供了一种查询语言生成方法,在获取到用户输入至大模型的自然语言数据后,可以获取预先生成的指标库中多个预设分析指标的指标名称;并利用大模型基于多个预设分析指标的指标名称,对自然语言数据进行识别,确定自然语言数据包括的至少一个目标分析指标,实现了自然语言数据中目标分析指标的提炼和识别,再利用处理引擎根据指标库包括的目标分析指标的计算逻辑,能够较准确的生成自然语言数据对应的SQL数据,进而可以保障数据分析结果的准确性和可靠性。
同时,本申请通过基于数据库生成了指标库,以便大模型根据指标库中预设分析指标的指标名称进行指标识别,以及使得处理引擎可以根据指标库中目标分析指标的计算逻辑生成SQL,无需获取数据库的元信息,缓解了数据库的元信息泄露的风险,保障了数据库中存储数据的安全性。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了一种相关技术中生成SQL数据的示意图;
图2示出了本公开实施例所提供的一种查询语言生成方法的流程示意图;
图3示出了本公开实施例所提供的另一种查询语言生成方法的流程示意图;
图4示出了本公开实施例所提供的一种生成SQL数据的流程示意图;
图5示出了本公开实施例所提供的一种查询语言生成系统的架构示意图;
图6示出了本公开实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
参见图1所示,在利用大模型进行数据分析时,大模型可以获取相关数据库的元信息,根据用户输入的自然语言和数据库的元信息,生成结构化查询语言(Structured QueryLanguage,SQL)数据,但是用户输入的自然语言较复杂和多样,使得大模型生成的SQL数据的准确度难以保障,进而会导致数据分析的准确度较低;以及将数据库的元信息提供给大模型,存在数据库关键信息泄露的风险,降低了数据库存储数据的安全性。
为了缓解上述问题,本申请实施例提供了一种查询语言生成方法,在获取到用户输入至大模型的自然语言数据后,可以获取预先生成的指标库中多个预设分析指标的指标名称;并利用大模型基于多个预设分析指标的指标名称,对自然语言数据进行识别,能够较准确的确定自然语言数据包括的至少一个目标分析指标,实现了自然语言数据中目标分析指标的提炼和识别,再利用处理引擎根据指标库包括的目标分析指标的计算逻辑,能够较准确的生成自然语言数据对应的SQL数据,进而可以保障数据分析结果的准确性和可靠性。
同时,本申请通过基于数据库生成了指标库,以便大模型根据指标库中预设分析指标的指标名称进行指标识别,以及使得处理引擎可以根据指标库中目标分析指标的计算逻辑生成SQL,无需获取数据库的元信息,缓解了数据库的元信息泄露的风险,保障了数据库中存储数据的安全性。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
为便于对本公开实施例进行理解,首先对本公开实施例所公开的一种查询语言生成方法进行详细介绍。本公开实施例所提供的查询语言生成方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该查询语言生成方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
参见图2所示,为本公开实施例所提供的查询语言生成方法的流程示意图,该方法包括S201至S203,其中:
S201、获取用户输入至大模型的自然语言数据,以及获取预先生成的指标库中多个预设分析指标的指标名称;其中所述指标库基于原始数据库生成。
S202、利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标;
S203、利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据,其中所述SQL数据用于从所述原始数据库中查询数据。
下述分别对S201-S203进行具体说明。
针对S201:
大模型为预先训练得到的深度学习模型,该大模型可以进行数据分析。用户可以在大模型的交互界面上输入自然语言数据。其中自然语言数据可以包括表达数据分析请求的数据内容,比如自然语言数据可以为“计算去年的总销售额与今年相比的增长率”,再比如自然语言数据可以为“查询近三个月的线上门店销售额”等。
以及可以从预先生成的指标库中获取指标列表,指标列表包括预先生成的多个预设分析指标的指标名称,还可以包括预设分析指标的指标描述信息,指标描述信息可以用于反映预设分析指标的物理意义等信息。指标库是基于原始数据库生成的,比如原始数据库存储的是线上门店和线下门店的销售数据,则预设分析指标比如可以包括营收额、成本、销售额、销售增长率等,其中指标库中预设分析指标可以根据需要进行设置。指标库可以进行管理维护,比如可以对指标库中预设分析指标进行修改、删除、新增等操作,以使得指标库满足用户的多样性要求,进而满足用户对数据分析的需求,提高用户体验。
一种可选实施方式中,所述方法还包括:确定适配多种业务场景的各种指标类型;根据所述各种指标类型,以及所述原始数据库中存储的数据类型,确定每种指标类型下的至少一个预设分析指标;基于所述各种指标类型下的各预设分析指标,生成所述指标库。
业务场景比如银行业务场景、商场业务场景、电商业务场景、企业业务场景等等,其中业务场景可以根据实际需要进行确定。各种指标类型比如可以包括:原子指标类型、派生指标类型、复合指标类型、占比指标类型、差值指标类型、列表指标类型、排名指标类型等。
再可以针对每种指标类型,根据原始数据库中存储的数据类型,确定每种指标类型下的至少一个预设分析指标。其中预设分析指标可以根据实际应用场景进行确定,本申请对此不进行具体限定。示例性的,若原始数据库中存储的数据类型为线上门店和线下门店的销售数据、成本数据、订单数据等等,则原子指标类型可以为基础分析指标,如收入、支出等分析指标。派生指标类型可以包括原子指标结合过滤条件得到的分析指标,如年收入、季度收入等分析指标。复合指标类型可以包括对多个指标进行运算(如加减乘除运算)的分析指标,如利润等分析指标。排名指标类型如收入排名、销售排名等分析指标。差值指标类型如收入增长、支出缩减等分析指标。占比指标类型如经营利润、小微商户占比等分析指标。列表指标类型如各项成本、各项支出等分析指标,各项成本所包括的成本类型可以根据需求进行设置。
进而基于各种指标类型下的各预设分析指标生成指标库,即指标库中包括各种指标类型下的各预设分析指标。
通过确定各种指标类型,可以根据各种指标类型以及原始数据库中存储的数据类型,确定每种指标类型下的至少一个预设分析指标,使得预设分析指标较全面,以便使得指标库中预设分析指标可以满足用户需求,提高用户体验。
一种可选实施方式中,所述方法还包括:响应于触发的指标管理操作,展示指标管理界面;接收在所述指标管理界面输入的更新后的分析指标的指标数据,并将所述更新后的分析指标的指标数据存储至指标库,其中所述指标数据包括指标名称和计算逻辑。
指标库包括的多个预设分析指标可以进行展示,比如,可以直接在大模型的交互界面上展示指标库包括的至少部分预设分析指标,或者用户可以通过触发交互界面上的指标展示按钮,在交互界面展示指标库包括的预设分析指标。
交互界面上还可以设置有指标库的管理按钮,以便用户在点击管理按钮之后,触发指标管理操作,展示指标管理界面,管理按钮比如可以包括新增按钮、删除按钮、修改按钮等。实施时,用户可以在指标管理界面内对已有的预设分析指标进行更新,如更新预设分析指标的指标数据,指标数据包括指标名称、指标描述信息、计算逻辑等,接收在指标管理界面输入的预设分析指标的更新后的指标数据,并将更新后的分析指标的指标数据存储至指标库。或者,用户可以在指标管理界面内新增分析指标,并输入新增分析指标的指标数据,将新增分析指标的指标数据存储至指标库。再或者,用户还可以在指标管理界面上触发针对预设分析指标的删除操作,从指标库中将该预设分析指标的指标数据删除。
针对S202:
利用大模型基于多个预设分析指标的指标名称,对自然语言数据进行识别,确定自然语言数据包括的至少一个目标分析指标。比如,自然语言数据为“计算去年的总销售额与今年相比的增长率”,则目标分析指标可以包括增长率、总销售额等。
为了提高大模型对自然语言数据进行识别的效率,还可以从数据库包括的多个预设分析指标中确定与自然语言数据匹配的候选分析指标,以便后续根据候选分析指标,对自然语言数据进行识别。比如若自然语言数据中包括“销售”,则可以从预设分析指标中将包括“销售”的分析指标确定为候选分析指标。
一种可选实施方式中,在利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别之前,还包括:利用至少一种匹配算法,确定所述预设分析指标与所述自然语言数据之间的匹配度;根据各预设分析指标分别与所述自然语言数据之间的匹配度,从所述多个预设分析指标中选取候选分析指标。
进而可以利用所述大模型基于所述候选分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标。
匹配算法比如可以包括但不限于:最长公共子序列(longest-common-subsequence,LCS)算法、向量近似度匹配算法等。在匹配算法为多种时,可以使用每种匹配算法,确定预设分析指标与自然语言数据之间的匹配度;根据各预设分析指标分别与自然语言数据之间的匹配度,从多个预设分析指标中选取候选分析指标,比如选取匹配度大于匹配度阈值的预设分析指标作为候选分析指标,和/或,按照匹配度从高至低的顺序,选取预设数量个预设分析指标作为候选分析指标等。将多种匹配算法分别选取的候选分析指标取并集,得到与自然语言数据匹配的候选分析指标。
本申请通过根据匹配度选取候选分析指标,以利用候选分析指标对自然语言数据进行识别,可以较准确和较高效的确定自然语言数据包括的目标分析指标。
针对S203:
大模型可以将确定的目标分析指标发送给处理引擎,利用处理引擎根据指标库包括的目标分析指标的计算逻辑,生成自然语言数据对应的SQL数据,其中SQL数据用于从原始数据库中查询数据,以便根据查询到的数据进行数据分析,确定用户输入的自然语言数据对应的交互结果。
比如可以根据目标分析指标,生成指标虚拟表,进而根据指标虚拟表生成SQL数据。比如可以根据SQL的语法规则,生成查询代码段,将指标虚拟表添加至查询代码段内,生成SQL数据。
具体实施时,大模型还可以根据至少一个目标分析指标,生成包含目标分析指标的指标代码片段,将指标代码片段发送给处理引擎。处理引擎可以根据知道代码片段确定指标库中是否存在目标分析指标,和/或,判断指标代码片段的格式是否规范,若确定格式规范且目标分析指标存在,则可以根据指标代码片段,生成SQL数据。
一种可选实施方式中,所述方法还包括:利用所述大模型从所述自然语言数据中提取结构参数,所述结构参数包括以下至少一种:维度参数、过滤条件参数、排序参数。
维度dimensions参数用于反应分析指标的度量属性,比如时间、地理位置等。过滤条件参数用于从原始数据库中选取数据。排序参数用于对数据进行排序,排序参数比如可以包括正序、倒序等。
所述利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据,包括:利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
比如可以根据SQL的语法规则和结构参数,生成查询代码段,将指标虚拟表添加至查询代码段内,生成SQL数据。
可选的,在所述结构参数包括维度参数、过滤条件参数、排序参数时,所述利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据,包括:利用处理引擎根据所述目标分析指标的计算逻辑,生成所述目标分析指标对应的指标虚拟表;利用处理引擎根据所述维度参数,生成维度虚拟表;使用所述至少一个目标分析指标的所述指标虚拟表、所述维度虚拟表、所述过滤条件参数和所述排序参数,生成所述自然语言数据对应的SQL数据。
实施时,利用处理引擎根据SQL的语法规则,基于目标分析指标的计算逻辑,生成目标分析指标对应的指标虚拟表,每个目标分析指标对应一指标虚拟表;以及利用处理引擎根据维度参数,生成维度虚拟表。
并根据过滤条件参数和排序参数,生成基础查询代码,将维度虚拟表和各目标分析指标对应的指标虚拟表增加至基础查询代码,生成自然语言数据对应的SQL数据。
本申请通过上述方式生成SQL数据,可以实现多个目标分析指标的任意组合查询,提高数据查询的灵活性。
一种可选实施方式中,在结构参数包括维度参数时,所述方法还包括:利用所述处理引擎基于所述指标库包括的指标列表和维度列表,对所述至少一个目标分析指标和所述维度参数进行校验,得到校验结果。
实施时,指标库中可以预先设置有指标列表和维度列表,其中维度列表包括有多个预设维度,指标列表包括多个预设分析指标。预设维度和预设分析指标为基于原始数据库生成的。
考虑到大模型提取的指标参数(即目标分析指标)和维度参数可能存在失误,进而降低后续生成的SQL的准确度,因此,处理引擎可以从指标库中获取指标列表和维度列表,根据指标列表和维度列表,对至少一个目标分析指标和维度参数进行校验,确定指标列表中是否存在目标分析指标,以及确定维度列表中是否存在维度参数,若均存在,则确定校验结果为校验通过。若目标分析指标和/或维度参数不存在时,则确定校验结果为校验不通过,再可以利用大模型重新提取目标分析指标、维度参数。
进而可以在所述校验结果指示指标和维度存在时,利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
本申请通过对目标分析指标和维度参数进行校验,可以保障大模型提取的目标分析指标和维度参数的准确性,进而保障后续生成的SQL的准确性。
一种可选实施方式中,所述方法还包括:基于预设结构形式,对所述结构参数进行调整,生成调整后结构参数,其中所述调整后结构参数用于生成SQL数据。
考虑到用户输入的自然语言数据的数据结构是多样的,比如针对日期数据,其数据结构可能为年月日的形式,也可以为月日年的形式等。为了较准确的生成SQL数据,实施时可以基于预设结构形式,对结构参数进行调整,生成调整后结构参数。进而可以利用处理引擎根据指标库包括的目标分析指标的计算逻辑以及调整后结构参数,生成自然语言数据对应的SQL数据。
一种可选实施方式中,所述方法还包括:对所述自然语言数据对应的SQL数据进行调整,得到调整后的SQL数据,其中所述调整过程包括以下至少一种:一、增加限制limit语句;二、相同的子查询进行合并;三、将过滤条件调整到虚拟表的查询当中;四、相同的过滤条件进行合并;五、按照预设基准格式进行格式化处理。
通过对自然语言数据进行后处理调整,可以使得调整后的SQL数据较规范,数据分析的性能较佳。
结合图3,对本申请提出的查询语言生成方法进行示例性说明,该方法具体包括:
步骤1、接收用户输入至大模型的自然语言数据。
步骤2、获取语义指标平台的指标库的指标列表。
其中语义指标平台包括有指标库,指标库中设置有指标列表,指标列表包括指标定义,即预设分析指标的指标名称、指标描述信息。
步骤3、使用多种匹配算法,对指标列表中多个预设分析指标进行筛选,确定候选分析指标。
实施时,可以利用多种匹配算法,确定预设分析指标与自然语言数据之间的匹配度;并根据各预设分析指标分别与自然语言数据之间的匹配度,从多个预设分析指标中选取候选分析指标。
步骤4、利用大模型基于候选分析指标的指标名称,对自然语言数据进行识别,确定自然语言数据包括的至少一个目标分析指标,并将至少一个目标分析指标发送给处理引擎。
步骤5、利用处理引擎根据指标库包括的目标分析指标的计算逻辑,生成自然语言数据对应的结构化查询语言SQL数据,其中SQL数据用于从所述原始数据库中查询数据。
实施时,结合图4对处理引擎生成SQL数据进行示例性说明,该过程包括:
步骤51、接收大模型的提参结果。
其中提参结果可以包括:指标参数(即至少一个目标分析指标),以及结构参数,结构参数包括以下至少一种:维度参数、过滤条件参数、排序参数。
步骤52、格式校验。
具体的,可以基于指标库包括的指标列表和维度列表,对至少一个目标分析指标和维度参数进行校验,得到校验结果。
其中大模型可以给处理引擎发送用于指示结构参数的参数代码信息,以及用于指示指标参数的指标代码信息。进而处理引擎还可以根据SQL的语法规则,确定参数代码信息和指标代码信息的参数格式是否正确。
步骤53、在校验结果为校验通过时,进行前置处理。
其中前置处理的处理内容可以根据SQL的语法规则进行确定。前置处理可以包括:基于预设结构形式,对结构参数进行调整,生成调整后结构参数。
比如,在有日期分组的时候,默认按照日期groupBys;再比如,当groupBys中存在未提取到的groupBy/metric时,添加到groupBys/metricNames等等。
步骤54、SQL生成。
实施时,处理引擎根据各目标分析指标的计算逻辑,生成每个目标分析指标对应的指标虚拟表;以及根据维度参数,生成维度虚拟表;再使用至少一个目标分析指标的指标虚拟表、维度虚拟表、过滤条件参数和排序参数,生成自然语言数据对应的SQL数据。
步骤55、后置处理。
实施时,后置处理的过程可以为:对自然语言数据对应的SQL数据进行调整,得到调整后的SQL数据,其中所述调整过程包括以下至少一种:增加限制limit语句;子查询合并,即相同的子查询进行合并;过滤条件下推,即将过滤条件调整到虚拟表的查询当中;过滤条件合并,即相同的过滤条件进行合并;按照预设基准格式进行格式化处理。
本申请的查询语言生成方法,可以根据用户输入的自然语言数据生成SQL数据,使得用户无需理解SQL的语法规则、数据库的结构等信息也可得到SQL数据,降低了SQL数据的生成难度,且本申请中预设分析指标的指标数据中包括计算逻辑,以便可以根据预设分析指标的计算逻辑,生成SQL数据,使得用户在输入目标分析指标之后,无需用户在自然语言数据中添加目标分析指标的计算逻辑,简化了用户的输入内容,提高了用户体验。同时,通过确定目标分析指标,将自然语言数据转换为明确的目标分析指标,实现对自然语言数据查询要求的较准确的理解,进而根据目标分析指标的计算逻辑,能够较准确的生成SQL数据。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于相同的构思,本公开实施例还提供了一种查询语言生成系统,参见图5所示,为本公开实施例提供的查询语言生成系统的架构示意图,包括:
指标库501,用于存储预先生成的多个预设分析指标的指标数据,所述指标数据包括指标名称;其中所述指标库基于原始数据库生成;
大模型502,用于获取用户输入的自然语言数据,以及获取预先生成的指标库501中多个预设分析指标的指标名称;并基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标;
处理引擎503,用于根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据,其中所述SQL数据用于从所述数据库中获取指标数据。
一种可能的实施方式中,在利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别之前,大模型502还用于:
利用至少一种匹配算法,确定所述预设分析指标与所述自然语言数据之间的匹配度;
根据各预设分析指标分别与所述自然语言数据之间的匹配度,从所述多个预设分析指标中选取候选分析指标;
所述大模型502,在利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标时,用于:
利用所述大模型基于所述候选分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标。
一种可能的实施方式中,所述大模型502还用于:
利用所述大模型从所述自然语言数据中提取结构参数,所述结构参数包括以下至少一种:维度参数、过滤条件参数、排序参数;
所述处理引擎,在根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据时,用于:
根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,在所述结构参数包括维度参数、过滤条件参数、排序参数时,所述处理引擎503,在根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据时,用于:
利用处理引擎根据所述目标分析指标的计算逻辑,生成所述目标分析指标对应的指标虚拟表;
利用处理引擎根据所述维度参数,生成维度虚拟表;
使用所述至少一个目标分析指标的所述指标虚拟表、所述维度虚拟表、所述过滤条件参数和所述排序参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,在结构参数包括维度参数时,所述处理引擎503还用于:
基于所述指标库包括的指标列表和维度列表,对所述至少一个目标分析指标和所述维度参数进行校验,得到校验结果;
所述处理引擎在根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据时,用于:
在所述校验结果指示指标和维度存在时,利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,所述处理引擎503还用于:
基于预设结构形式,对所述结构参数进行调整,生成调整后结构参数,其中所述调整后结构参数用于生成SQL数据。
一种可能的实施方式中,所述处理引擎503还用于:
对所述自然语言数据对应的SQL数据进行调整,得到调整后的SQL数据,其中所述调整过程包括以下至少一种:
增加限制limit语句;
相同的子查询进行合并;
将过滤条件调整到虚拟表的查询当中;
相同的过滤条件进行合并;
按照预设基准格式进行格式化处理。
一种可能的实施方式中,所述系统还包括:调整模块,用于:
响应于触发的指标管理操作,展示指标管理界面;
接收在所述指标管理界面输入的更新后的分析指标的指标数据,并将所述更新后的分析指标的指标数据存储至指标库,其中所述指标数据包括指标名称和计算逻辑。
一种可能的实施方式中,所述指标库501为根据下述步骤生成的:
确定适配多种业务场景的各种指标类型;
根据所述各种指标类型,以及所述原始数据库中存储的数据类型,确定每种指标类型下的至少一个预设分析指标;
基于所述各种指标类型下的各预设分析指标,生成所述指标库。
在一些实施例中,本公开实施例提供的系统具有的功能或包含的模板可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
基于同一技术构思,本公开实施例还提供了一种电子设备。参照图6所示,为本公开实施例提供的电子设备的结构示意图,包括处理器601、存储器602、和总线603。其中,存储器602用于存储执行指令,包括内存6021和外部存储器6022;这里的内存6021也称内存储器,用于暂时存放处理器601中的运算数据,以及与硬盘等外部存储器6022交换的数据,处理器601通过内存6021与外部存储器6022进行数据交换,当电子设备600运行时,处理器601与存储器602之间通过总线603通信,使得处理器601在执行以下指令:
获取用户输入至大模型的自然语言数据,以及获取预先生成的指标库中多个预设分析指标的指标名称;其中所述指标库基于原始数据库生成;
利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标;
利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据,其中所述SQL数据用于从所述原始数据库中查询数据。
一种可能的实施方式中,处理器601执行的指令中,利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别之前,还包括:
利用至少一种匹配算法,确定所述预设分析指标与所述自然语言数据之间的匹配度;
根据各预设分析指标分别与所述自然语言数据之间的匹配度,从所述多个预设分析指标中选取候选分析指标;
利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标,包括:
利用所述大模型基于所述候选分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标。
一种可能的实施方式中,处理器601执行的指令中,还包括:
利用所述大模型从所述自然语言数据中提取结构参数,所述结构参数包括以下至少一种:维度参数、过滤条件参数、排序参数;
利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据,包括:
利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,处理器601执行的指令中,在所述结构参数包括维度参数、过滤条件参数、排序参数时,所述处理器601在利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据,包括:
利用处理引擎根据所述目标分析指标的计算逻辑,生成所述目标分析指标对应的指标虚拟表;
利用处理引擎根据所述维度参数,生成维度虚拟表;
使用所述至少一个目标分析指标的所述指标虚拟表、所述维度虚拟表、所述过滤条件参数和所述排序参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,处理器601执行的指令中,在结构参数包括维度参数时,还包括:
利用所述处理引擎基于所述指标库包括的指标列表和维度列表,对所述至少一个目标分析指标和所述维度参数进行校验,得到校验结果;
所述利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据,包括:
在所述校验结果指示指标和维度存在时,利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
一种可能的实施方式中,处理器601执行的指令中,还包括:
基于预设结构形式,对所述结构参数进行调整,生成调整后结构参数,其中所述调整后结构参数用于生成SQL数据。
一种可能的实施方式中,处理器601执行的指令中,还包括:
对所述自然语言数据对应的SQL数据进行调整,得到调整后的SQL数据,其中所述调整过程包括以下至少一种:
增加限制limit语句;
相同的子查询进行合并;
将过滤条件调整到虚拟表的查询当中;
相同的过滤条件进行合并;
按照预设基准格式进行格式化处理。
一种可能的实施方式中,处理器601执行的指令中,还包括:
响应于触发的指标管理操作,展示指标管理界面;
接收在所述指标管理界面输入的更新后的分析指标的指标数据,并将所述更新后的分析指标的指标数据存储至指标库,其中所述指标数据包括指标名称和计算逻辑。
一种可能的实施方式中,处理器601执行的指令中,还包括:
确定适配多种业务场景的各种指标类型;
根据所述各种指标类型,以及所述原始数据库中存储的数据类型,确定每种指标类型下的至少一个预设分析指标;
基于所述各种指标类型下的各预设分析指标,生成所述指标库。
其中,处理器601的具体处理流程可以参照上述方法实施例的记载,这里不再赘述。
此外,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的查询语言生成方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的查询语言生成方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (12)
1.一种查询语言生成方法,其特征在于,包括:
获取用户输入至大模型的自然语言数据,以及获取预先生成的指标库中多个预设分析指标的指标名称;其中所述指标库基于原始数据库生成;
利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标;
利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据,其中所述SQL数据用于从所述原始数据库中查询数据。
2.根据权利要求1所述的方法,其特征在于,在利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别之前,还包括:
利用至少一种匹配算法,确定所述预设分析指标与所述自然语言数据之间的匹配度;
根据各预设分析指标分别与所述自然语言数据之间的匹配度,从所述多个预设分析指标中选取候选分析指标;
所述利用所述大模型基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标,包括:
利用所述大模型基于所述候选分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标。
3.根据权利要求1所述的方法,其特征在于的,所述方法还包括:
利用所述大模型从所述自然语言数据中提取结构参数,所述结构参数包括以下至少一种:维度参数、过滤条件参数、排序参数;
所述利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据,包括:
利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
4.根据权利要求3所述的方法,其特征在于,在所述结构参数包括维度参数、过滤条件参数、排序参数时,所述利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据,包括:
利用处理引擎根据所述目标分析指标的计算逻辑,生成所述目标分析指标对应的指标虚拟表;
利用处理引擎根据所述维度参数,生成维度虚拟表;
使用所述至少一个目标分析指标的所述指标虚拟表、所述维度虚拟表、所述过滤条件参数和所述排序参数,生成所述自然语言数据对应的SQL数据。
5.根据权利要求3所述的方法,其特征在于,在结构参数包括维度参数时,所述方法还包括:
利用所述处理引擎基于所述指标库包括的指标列表和维度列表,对所述至少一个目标分析指标和所述维度参数进行校验,得到校验结果;
所述利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据,包括:
在所述校验结果指示指标和维度存在时,利用处理引擎根据所述指标库包括的所述目标分析指标的计算逻辑、以及所述结构参数,生成所述自然语言数据对应的SQL数据。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
基于预设结构形式,对所述结构参数进行调整,生成调整后结构参数,其中所述调整后结构参数用于生成SQL数据。
7.根据权利要求1-6任一所述的方法,其特征在于,所述方法还包括:
对所述自然语言数据对应的SQL数据进行调整,得到调整后的SQL数据,其中调整过程包括以下至少一种:
增加限制limit语句;
相同的子查询进行合并;
将过滤条件调整到虚拟表的查询当中;
相同的过滤条件进行合并;
按照预设基准格式进行格式化处理。
8.根据权利要求1-6任一所述的方法,其特征在于,所述方法还包括:
响应于触发的指标管理操作,展示指标管理界面;
接收在所述指标管理界面输入的更新后的分析指标的指标数据,并将所述更新后的分析指标的指标数据存储至指标库,其中所述指标数据包括指标名称和计算逻辑。
9.根据权利要求1-6任一所述的方法,其特征在于,所述方法还包括:
确定适配多种业务场景的各种指标类型;
根据所述各种指标类型,以及所述原始数据库中存储的数据类型,确定每种指标类型下的至少一个预设分析指标;
基于所述各种指标类型下的各预设分析指标,生成所述指标库。
10.一种查询语言生成系统,其特征在于,包括:
指标库,用于存储预先生成的多个预设分析指标的指标数据,所述指标数据包括指标名称;其中所述指标库基于原始数据库生成;
大模型,用于获取用户输入的自然语言数据,以及获取预先生成的指标库中多个预设分析指标的指标名称;并基于所述多个预设分析指标的指标名称,对所述自然语言数据进行识别,确定所述自然语言数据包括的至少一个目标分析指标;
处理引擎,用于根据所述指标库包括的所述目标分析指标的计算逻辑,生成所述自然语言数据对应的结构化查询语言SQL数据,其中所述SQL数据用于从所述原始数据库中查询数据。
11.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至9任一所述的查询语言生成方法的步骤。
12.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至9任一所述的查询语言生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410718435.3A CN118312531B (zh) | 2024-06-04 | 2024-06-04 | 查询语言生成方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410718435.3A CN118312531B (zh) | 2024-06-04 | 2024-06-04 | 查询语言生成方法、系统、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118312531A true CN118312531A (zh) | 2024-07-09 |
CN118312531B CN118312531B (zh) | 2024-09-06 |
Family
ID=91729337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410718435.3A Active CN118312531B (zh) | 2024-06-04 | 2024-06-04 | 查询语言生成方法、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118312531B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115329047A (zh) * | 2022-08-31 | 2022-11-11 | 中国电力科学研究院有限公司 | 调控多元数据综合查询方法、系统、计算机设备及介质 |
WO2023029854A1 (zh) * | 2021-09-03 | 2023-03-09 | 北京火山引擎科技有限公司 | 数据查询方法、装置、存储介质及电子设备 |
CN117539892A (zh) * | 2023-11-13 | 2024-02-09 | 杭州网易数之帆科技有限公司 | 应用于商业智能系统的数据处理方法、装置、介质及设备 |
CN117667991A (zh) * | 2023-10-18 | 2024-03-08 | 深圳市云积分科技有限公司 | 结构化查询语言生成方法、校验方法及装置 |
CN117931834A (zh) * | 2023-12-08 | 2024-04-26 | 上海淇玥信息技术有限公司 | 基于大语言模型意图识别的虚拟专家分析方法及装置 |
-
2024
- 2024-06-04 CN CN202410718435.3A patent/CN118312531B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023029854A1 (zh) * | 2021-09-03 | 2023-03-09 | 北京火山引擎科技有限公司 | 数据查询方法、装置、存储介质及电子设备 |
CN115329047A (zh) * | 2022-08-31 | 2022-11-11 | 中国电力科学研究院有限公司 | 调控多元数据综合查询方法、系统、计算机设备及介质 |
CN117667991A (zh) * | 2023-10-18 | 2024-03-08 | 深圳市云积分科技有限公司 | 结构化查询语言生成方法、校验方法及装置 |
CN117539892A (zh) * | 2023-11-13 | 2024-02-09 | 杭州网易数之帆科技有限公司 | 应用于商业智能系统的数据处理方法、装置、介质及设备 |
CN117931834A (zh) * | 2023-12-08 | 2024-04-26 | 上海淇玥信息技术有限公司 | 基于大语言模型意图识别的虚拟专家分析方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN118312531B (zh) | 2024-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111522816B (zh) | 基于数据库引擎的数据处理方法、装置、终端及介质 | |
CN111125118B (zh) | 关联数据查询方法、装置、设备及介质 | |
CN112307747A (zh) | 车辆配件检索方法、装置、计算机设备及可读存储介质 | |
CN110879808A (zh) | 一种信息处理方法和装置 | |
CN112529429A (zh) | 客户信息校验方法、装置、计算机设备及存储介质 | |
CN113377740A (zh) | 铁路元数据管理方法、应用方法及装置 | |
CN110532529A (zh) | 一种文件类型的识别方法及装置 | |
CN113190562A (zh) | 一种报表生成方法、装置及电子设备 | |
CN109241075A (zh) | 指标基础数据的处理方法、设备及计算机可读存储介质 | |
CN114610955A (zh) | 一种智能检索方法、装置、电子设备及存储介质 | |
CN113626558B (zh) | 一种基于智能推荐的字段标准化的方法和系统 | |
CN112364022B (zh) | 信息推导管理方法、装置、计算机设备及可读存储介质 | |
CN118312531B (zh) | 查询语言生成方法、系统、电子设备及存储介质 | |
CN117032646A (zh) | 指标配置方法、指标执行方法及系统 | |
CN116186119A (zh) | 用户行为分析方法、装置、设备及存储介质 | |
CN112416754B (zh) | 一种模型评测方法、终端、系统及存储介质 | |
CN113934729A (zh) | 一种基于知识图谱的数据管理方法、相关设备及介质 | |
US9251253B2 (en) | Expeditious citation indexing | |
CN110879835A (zh) | 基于区块链的数据处理方法、装置、设备及可读存储介质 | |
CN116719839B (zh) | 会计档案的数据查询方法、装置和电子设备 | |
CN110765118B (zh) | 一种数据的修订方法、修订装置及可读存储介质 | |
CN115168684B (zh) | 一种财务档案管理方法及系统 | |
CN113076317A (zh) | 基于大数据的数据处理方法、装置、设备及可读存储介质 | |
CN117827902A (zh) | 业务数据处理方法、装置、计算机设备以及存储介质 | |
CN117032678A (zh) | 基于资产清单的组件代码生成方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |