CN118152423A - 智能查询方法、装置、电子设备及可读存储介质 - Google Patents
智能查询方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN118152423A CN118152423A CN202410236759.3A CN202410236759A CN118152423A CN 118152423 A CN118152423 A CN 118152423A CN 202410236759 A CN202410236759 A CN 202410236759A CN 118152423 A CN118152423 A CN 118152423A
- Authority
- CN
- China
- Prior art keywords
- data
- query instruction
- data query
- target database
- description information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000003860 storage Methods 0.000 title claims abstract description 18
- 230000015654 memory Effects 0.000 claims description 27
- 238000012549 training Methods 0.000 claims description 25
- 230000007613 environmental effect Effects 0.000 claims description 7
- 238000004891 communication Methods 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000013079 data visualisation Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种智能查询方法、装置、电子设备及可读存储介质,所述方法包括:获取用户输入的与数据需求相关的描述信息;解析所述描述信息,提取所述描述信息中至少一个数据需求参数;基于所述数据需求参数,确定执行数据查询指令的目标数据库,生成数据查询指令;在所述目标数据库中执行所述数据查询指令以获取数据。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种智能查询方法、装置、电子设备及可读存储介质。
背景技术
随着企业生产经营业务不断增加,沉淀积累的数据也越来越多,数据资产成分越来越复杂,紧随而来的数据查询定位和计算需求也越来越复杂。企业为了简化数据提取的复杂度,满足业务部门的数据使用需求,不得不在数据中台开发大量数据应用功能。随之而来,数据中台的数据应用功能或数据报表越来越多,管理越来越困难。
发明内容
本申请提供一种智能查询方法,所述方法包括:
获取用户输入的与数据需求相关的描述信息;
解析所述描述信息,提取所述描述信息中至少一个数据需求参数;
基于所述数据需求参数,确定执行数据查询指令的目标数据库,生成数据查询指令;
在所述目标数据库中执行所述数据查询指令以获取数据。
可选的,基于所述数据需求参数,确定执行数据查询指令的目标数据库,生成数据查询指令,包括:
将所述数据需求参数进行格式化,并输入预训练的查询指令生成模型,并由所述查询指令生成模型确定执行查询指令的目标数据库,生成数据查询指令;其中,所述查询指令生成模型包括基于若干数据库的元数据作为训练样本进行有监督训练的机器学习模型。
可选的,所述方法还包括:
将基于所述数据查询指令获得的查询结果,以及所述数据查询指令作为训练样本输入所述查询指令生成模型进行训练。
可选的,所述数据查询指令中还包括所述数据查询指令的执行环境的环境参数;
在所述目标数据库中执行所述数据查询指令以获取数据,包括:
基于所述环境参数,确定与所述目标数据库对应的驱动程序;
创建与所述驱动程序对应的驱动实例,并基于所述驱动实例连接目标数据库,以在所述目标数据库中执行所述数据查询指令以获取数据。
可选的,在所述目标数据库中执行所述数据查询指令以获取数据,包括:
检查所述数据查询指令中的关键字以及所述数据查询指令的内容,确定所述数据查询指令是否存在安全风险;
如果所述数据查询指令不存在安全风险,基于所述关键字以及所述数据查询指令对应的语法,确定所述数据查询指令是否可以执行;
如果所述数据查询指令可以执行,检查所述数据查询指令的性能是否满足预设要求;
如果所述数据查询指令的性能满足预设要求,在所述目标数据库中执行所述数据查询指令以获取数据。
可选的,所述方法还包括:
获取所述数据查询指令的查询结果,并基于所述查询结果生成可视化的数据分析图例。
可选的,所述获取用户输入的与数据需求相关的描述信息,包括:
获取用户输入的文本形式的与数据需求相关的描述信息,或,
获取用户通过语音输入的音频形式的描述信息,并将所述音频形式的与数据需求相关的描述信息转换为文本形式的描述信息。
本申请还提供一种智能查询装置,所述装置包括:
描述信息获取单元,用于获取用户输入的与数据需求相关的描述信息;
描述信息解析单元,用于解析所述描述信息,提取所述描述信息中至少一个数据需求参数;
查询指令生成单元,用于基于所述数据需求参数,确定执行数据查询指令的目标数据库,生成数据查询指令;
数据查询单元,用于在所述目标数据库中执行所述数据查询指令以获取数据。
本申请还提供一种电子设备,包括通信接口、处理器、存储器和总线,所述通信接口、所述处理器和所述存储器之间通过总线相互连接;
所述存储器中存储机器可读指令,所述处理器通过调用所述机器可读指令,执行上述方法。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有机器可读指令,所述机器可读指令在被处理器调用和执行时,实现上述方法。
在以上实施例记载的方案中,通过解析用户输入的描述信息,自动生成数据查询指令,并自动定位到对应的数据库查询数据。实现了用户只需输入有需求相关描述信息,即可通过自动化流程从数据库中获得数据,减少了开发人员编写数据查询指令的时间成本,提高了用户获取数据的效率。
附图说明
图1是一示例性实施例提供的一种智能查询方法的流程示意图。
图2是一示例性实施例提供的一种智能查询方法的应用示意图。
图3是一示例性的实施例提供的一种智能查询装置所在电子设备的硬件结构图。
图4是一示例性的实施例提供的一种智能查询装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
请参见图1,图1是一示例性实施例提供的一种智能查询方法的流程示意图。所述方法可以包括以下步骤:
步骤102,获取用户输入的与数据需求相关的描述信息。
在本说明书中,用户可以通过与数据查询相关的查询界面输入与数据需求相关的描述信息。其中,与数据需求相关的描述信息具体可以包括用户所需要的数据。
例如,用户可以输入与数据需求相关的描述信息“我需要汽车A在2023年的销量”。
在一种实施方式中,与数据查询相关的查询界面可以提供文本框或输入框,让用户在其中输入文本。并通过文本框或输入框来获取用户输入的文本信息。
用户也可以查询界面提供的语音输入接口,通过语音进行输入,再由语音识别技术,将语音转换为文本,从而实现语音识别功能。
步骤104,解析所述描述信息,提取所述描述信息中至少一个数据需求参数。
在获取用户输入的与数据需求相关的描述信息之后,可以解析所述描述信息。
具体的,可以对获取到的描述信息进行预处理,包括去除多余的标点符号、转换为小写字母等,统一文本格式。
进一步可以通过命名实体识别技术来提取与用户需求相关的实体,如“汽车A”,“2023年”,“销量”。命名实体识别模型可以通过训练来识别不同类别的实体。在具体实现中,可以使用现有的NER库(如SpaCy、NLTK等)或使用深度学习模型(如BERT、GPT等)进行实体识别。
除此之外,也可以通过关键词匹配。在识别之前创建一个包含可能的关键词列表,如“汽车A”,“2023年”,“销量”等。然后,使用字符串匹配算法(如正则表达式、Trie树等)在文本中查找匹配的关键词,并提取相关信息。
为了更好地理解上下文,还可以使用语言模型(如GPT、BERT等)来对获取到的描述信息进行分析,以获得更多语义信息。
根据实体识别和关键词匹配的结果,提取描述信息中的数据需求参数。
例如,用户输入的与数据需求相关的描述信息为“我需要汽车A在2023年的销量”。那么可以通过上述方法,解析出的数据需求参数为“汽车A”,“2023年”,“销量”。
步骤106,基于所述数据需求参数,确定执行数据查询指令的目标数据库,生成数据查询指令。
在本说明书中,数据查询指令具体可以包括DQL指令。
DQL指令可以执行各种类型的查询操作,包括选择(SELECT)、排序(ORDER BY)、过滤(WHERE)、连接(JOIN)、聚合(GROUP BY、HAVING)等。数据查询指令提供了灵活的语法和功能,使用户能够根据自己的需求编写复杂的查询。
常见的DQL指令包括结构化查询语言(SQL),它是关系型数据库管理系统(RDBMS)中最常用的查询语言。除了SQL之外,还有其他类型的DQL,如NoSQL数据库的查询语言。
在本说明书中,可以使用解析出的参数,确定执行数据查询指令的目标数据库,并构建数据查询指令。
以SQL语句为例,当解析出的数据需求参数为“汽车A”,“2023年”,“销量”时,可以根据“汽车A”,“销量”定位到与销量相关的数据库,假设该数据库存在一个名为"sales"的表,那么可以构建SQL语句:
SELECT quantity FROM sales WHERE car_name='汽车'AND year=2023。
在一种实施方式中,可以通过预训练的查询指令生成模型,来构建数据查询指令。
其中,所述查询指令生成模型具体可以为基于若干数据库的元数据作为训练样本进行有监督训练的机器学习模型。
所述数据库的元数据具体可以包括各个数据库的数据库名,数据库中各个数据表的表名,以及各个数据表中数据列的列名等等。
通过将数据库的元数据作为训练样本,可以使得查询指令生成模型可以识别数据需求参数,并定位到具体的数据库以及数据表,从而可以直接生成准确的数据查询指令。
在实际应用中,可以将所述数据需求参数进行格式化,并将格式化的数据需求参数,并输入预训练的查询指令生成模型。
具体的,可以将多个数据需求参数处理为格式化文本,其中,格式化文本具体可以包括需求和条件。通常,格式化文本为JSON文本。
以数据需求参数为“汽车A”,“2023年”,“销量”为例。那么对应的格式化文本即可以为{需求:销量;条件:汽车A,2022年}。
通过将数据需求参数格式化,可以使得查询指令生成模型更加快速的确定目标数据库,并提高生成数据查询指令的效率。
在一种实施方式中,还可以将基于所述数据查询指令获得的查询结果以及所述查询指令,共同作为一组训练样本,输入所述查询指令生成模型进行训练。由此进行迭代训练,当用户的使用频率越高,则生成的查询指令更加准确。
步骤108,在所述数据库中执行所述数据查询指令以获取数据。
在本说明书中,生成所述数据查询指令之后,可以建立与目标数据库的连接,并执行查询操作,从数据库中获取查询结果。
在一种实施方式中,在生成所述数据查询指令时,所述中数据查询指令还包括所述数据查询指令的执行环境的环境参数。
所述环境参数具体可以包括目标数据库对应的驱动程序的驱动标识等等。
基于所述环境参数,可以确定与所述目标数据库对应的驱动程序,进一步,可以基于驱动标识,创建驱动实例。其中,所述驱动实例中具体可以包括驱动标识,数据库连接信息,数据库操作函数等等。
其中,数据库连接信息,具体可以指DBMS连接串,DBMS连接串具体可以包含URL,数据库名称,指定模式加密的用户信息,指定模式加密的密码信息等等。
数据库操作函数具体可以包括数据库查询命令函数,数据库定义命令函数,通用数据库命令函数等等。
基于驱动实例中的数据库连接信息以及数据库操作函数,可以执行所述数据查询指令并获取查询结果。
在一种实施方式中,也可以向驱动程序管理中心发起的针对目标数据库的驱动程序的调用请求;所述调用请求包括所述驱动程序的驱动标识。
驱动程序管理中心可以接收调用端发起的针对目标数据库的驱动程序的调用请求,并获取目标数据库的驱动程序的驱动标识。
进一步的,所述驱动程序管理中心可以响应于所述调用请求,查询可用驱动池,确定与所述驱动标识对应的驱动程序。
如果查询到与所述驱动标识对应的驱动程序,可以直接创建与所述驱动程序对应的驱动实例,并通过所述驱动实例连接并操作所述目标数据库。
在一种实施方式中,还可以针对以生成的数据查询指令进行安全风险检查,可执行性检查以及性能检查,从而确保数据查询指令可以准确执行。
具体可以先检查所述数据查询指令中的关键字以及所述数据查询指令的内容,确定所述数据查询指令是否存在安全风险
如果不存在安全风险,则可以进一步进行检查。如果存在安全风险,则需要针对安全风险进行修复。
如果所述数据查询指令不存在安全风险,基于所述关键字以及所述DQL对应的语法,确定数据查询指令是是否可以执行。
在实际应用中,可能会出现因为关键字缺失以及语法错误导致的数据查询指令不可以执行的情况。因此可以检查数据查询指令的关键字是否完整,以及数据查询指令的语法是否正确,同时还需要检查数据查询指令中的参数与参数类型是否匹配。
如果所述数据查询指令可以执行,则可以在执行之前,进一步检查所述数据查询指令的性能是否满足预设要求。
在实际应用中,数据查询指令中可能会包括子查询,去重处理等等非常耗费数据仓库性能的步骤,因此在数据查询指令的性能不满足预设要求时,需要针对数据查询指令进行优化。
通过安全性检查、可执行性检查、性能检修检查组成了完整的智能查询体系,安全检查、执行性检查、性能检查依次执行,对数据查询指令进行流程化的风险检查,确保投入使用的数据查询指令的准确性,从而在实际应用中提高生产效率。
在一种实施方式中,还可以获取所述数据查询指令的查询结果,并基于所述查询结果生成可视化的数据分析图例。
根据数据查询指令的查询结果,可以对数据进行必要的预处理和转换。例如,将数据聚合、筛选、排序、分组等操作,以便后续的数据可视化。
根据数据的类型和需求,可以选择适合的数据可视化工具。常见的数据可视化工具包括matplotlib、seaborn、Plotly、Tableau等。
进一步可以使用所选的数据可视化工具,基于处理后的数据生成可视化图形。
除此之外,也可以使用AIGC技术,根据预训练的分析模型和查询结果,自动生成相应的可视化图例。
在以上实施例记载的方案中,通过解析用户输入的描述信息,自动生成数据查询指令,并自动定位到对应的数据库查询数据。实现了用户只需输入有需求相关描述信息,即可通过自动化流程从数据库中获得数据,减少了开发人员编写数据查询指令的时间成本,提高了用户获取数据的效率。
请参见图2,图2是一示例性实施例提供的一种智能查询方法的应用示意图。
如图2所示,用户可以输入于数据需求相关的描述信息,在获取所述描述信息后,将所述描述信息进行格式化,并将格式化后的描述输入预训练的查询指令生成模型。
其中,查询指令生成模型的训练样本为数据库的元数据,基于若干数据库的元数据生成训练样本,可以针对所述查询指令生成模型进行训练。
除此之外,每一次生成的数据查询指令,以及所述数据查询指令的查询结果,也可与生成训练样本,并输入到所述查询指令生成模型进行迭代训练,从而提高模型的准确率。
通过预训练的查询指令生成模型,可以生成数据查询指令。在实际应用中,自动生成的数据查询指令可能存在各种问题,因此需要针对数据查询指令进行检查以及修复。
通常在实际应用中,可以从安全性,可执行性以及性能三方面针对数据查询指令进行检修。在检修完成之后,可以将所述数据查询指令投入使用。
由于实际应用中,可能存在多个不同种类的数据库,而不同数据库的驱动程序是不同的,因此为了全程自动化,还可以根据数据查询指令对应的目标数据库,自动选择目标数据库的驱动程序,生成驱动程序之后建立与目标数据库的连接。
进一步可以执行所述数据查询指令,获取查询结果。获取查询结果之后,还可以基于所述查询结果,自动生成可视化图例,以便于用户进行查看。
在以上实施例记载的方案中,通过解析用户输入的描述信息,自动生成数据查询指令,并自动定位到对应的数据库查询数据。实现了用户只需输入有需求相关描述信息,即可通过自动化流程从数据库中获得数据,减少了开发人员编写数据查询指令的时间成本,提高了用户获取数据的效率。
请参见图3,图3是一示例性的实施例示出的一种智能查询装置所在电子设备的硬件结构图。在硬件层面,该设备包括处理器302、内部总线304、网络接口306、内存308以及非易失性存储器310,当然还可能包括其他业务所需要的硬件。本说明书一个或多个实施例可以基于软件方式来实现,比如由处理器302从非易失性存储器310中读取对应的计算机程序到内存308中然后运行。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
请参见图4,图4是一示例性的实施例示出的一种智能查询装置的框图。智能查询装置可以应用于图2所示的电子设备中,以实现本说明书的技术方案。其中,上述智能查询装置可以包括:
描述信息获取单元402,用于获取用户输入的与数据需求相关的描述信息;
描述信息解析单元404,用于解析所述描述信息,提取所述描述信息中至少一个数据需求参数;
查询指令生成单元406,用于基于所述数据需求参数,确定执行数据查询指令的目标数据库,生成数据查询指令;
数据查询单元408,用于在所述目标数据库中执行所述数据查询指令以获取数据。
在本实施例中,查询指令生成单元进一步用于将所述数据需求参数进行格式化,并输入预训练的查询指令生成模型,并由所述查询指令生成模型确定执行查询指令的目标数据库,生成数据查询指令;其中,所述查询指令生成模型包括基于若干数据库的元数据作为训练样本进行有监督训练的机器学习模型。
在本实施例中,所述装置还包括:
迭代训练单元,用于将基于所述数据查询指令获得的查询结果,以及所述数据查询指令作为训练样本输入所述查询指令生成模型进行训练。
在本实施例中,所述数据查询指令中还包括所述数据查询指令的执行环境的环境参数;
数据查询单元,进一步用于基于所述环境参数,确定与所述目标数据库对应的驱动程序;
创建与所述驱动程序对应的驱动实例,并基于所述驱动实例连接目标数据库,以在所述目标数据库中执行所述数据查询指令以获取数据。
在本实施例中,数据查询单元,进一步用于检查所述数据查询指令中的关键字以及所述数据查询指令的内容,确定所述数据查询指令是否存在安全风险;
如果所述数据查询指令不存在安全风险,基于所述关键字以及所述数据查询指令对应的语法,确定所述数据查询指令是否可以执行;
如果所述数据查询指令可以执行,检查所述数据查询指令的性能是否满足预设要求;
如果所述数据查询指令的性能满足预设要求,在所述目标数据库中执行所述数据查询指令以获取数据。
在本实施例中,所述装置还包括:
图例生成单元,用于获取所述数据查询指令的查询结果,并基于所述查询结果生成可视化的数据分析图例。
在本实施例中,描述信息获取单元进一步用于获取用户输入的文本形式的与数据需求相关的描述信息,或,
获取用户通过语音输入的音频形式的描述信息,并将所述音频形式的与数据需求相关的描述信息转换为文本形式的描述信息。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例只是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本说明书所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
本说明书还提供了一种计算机可读存储介质的实施例。所述计算机可读存储介质存储有机器可读指令,所述机器可读指令在被处理器调用和执行时,可以实现本说明书中任意一个实施例提供的所述智能查询方法。
本说明书实施例提供的计算机可读存储介质具体可以包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随机存储器)、EPROM(Erasable Programmable Read-OnlyMemory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable ProgrammableRead-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光纤卡片。也就是,可读存储介质包括可以存储或传输信息的可读介质。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
在一个典型的配置中,计算机包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。
Claims (10)
1.一种智能查询方法,所述方法包括:
获取用户输入的与数据需求相关的描述信息;
解析所述描述信息,提取所述描述信息中至少一个数据需求参数;
基于所述数据需求参数,确定执行数据查询指令的目标数据库,生成数据查询指令;
在所述目标数据库中执行所述数据查询指令以获取数据。
2.根据权利要求1所述的方法,基于所述数据需求参数,确定执行数据查询指令的目标数据库,生成数据查询指令,包括:
将所述数据需求参数进行格式化,并输入预训练的查询指令生成模型,并由所述查询指令生成模型确定执行查询指令的目标数据库,生成数据查询指令;其中,所述查询指令生成模型包括基于若干数据库的元数据作为训练样本进行有监督训练的机器学习模型。
3.根据权利要求2所述的方法,所述方法还包括:
将基于所述数据查询指令获得的查询结果,以及所述数据查询指令作为训练样本输入所述查询指令生成模型进行训练。
4.根据权利要求2所述的方法,所述数据查询指令中还包括所述数据查询指令的执行环境的环境参数;
在所述目标数据库中执行所述数据查询指令以获取数据,包括:
基于所述环境参数,确定与所述目标数据库对应的驱动程序;
创建与所述驱动程序对应的驱动实例,并基于所述驱动实例连接目标数据库,以在所述目标数据库中执行所述数据查询指令以获取数据。
5.根据权利要求1所述的方法,在所述目标数据库中执行所述数据查询指令以获取数据,包括:
检查所述数据查询指令中的关键字以及所述数据查询指令的内容,确定所述数据查询指令是否存在安全风险;
如果所述数据查询指令不存在安全风险,基于所述关键字以及所述数据查询指令对应的语法,确定所述数据查询指令是否可以执行;
如果所述数据查询指令可以执行,检查所述数据查询指令的性能是否满足预设要求;
如果所述数据查询指令的性能满足预设要求,在所述目标数据库中执行所述数据查询指令以获取数据。
6.根据权利要求1所述的方法,所述方法还包括:
获取所述数据查询指令的查询结果,并基于所述查询结果生成可视化的数据分析图例。
7.根据权利要求1所述的方法,所述获取用户输入的与数据需求相关的描述信息,包括:
获取用户输入的文本形式的与数据需求相关的描述信息,或,
获取用户通过语音输入的音频形式的描述信息,并将所述音频形式的与数据需求相关的描述信息转换为文本形式的描述信息。
8.一种智能查询装置,所述装置包括:
描述信息获取单元,用于获取用户输入的与数据需求相关的描述信息;
描述信息解析单元,用于解析所述描述信息,提取所述描述信息中至少一个数据需求参数;
查询指令生成单元,用于基于所述数据需求参数,确定执行数据查询指令的目标数据库,生成数据查询指令;
数据查询单元,用于在所述目标数据库中执行所述数据查询指令以获取数据。
9.一种电子设备,包括通信接口、处理器、存储器和总线,所述通信接口、所述处理器和所述存储器之间通过总线相互连接;
所述存储器中存储机器可读指令,所述处理器通过调用所述机器可读指令,执行权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有机器可读指令,所述机器可读指令在被处理器调用和执行时,实现权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410236759.3A CN118152423A (zh) | 2024-03-01 | 2024-03-01 | 智能查询方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410236759.3A CN118152423A (zh) | 2024-03-01 | 2024-03-01 | 智能查询方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118152423A true CN118152423A (zh) | 2024-06-07 |
Family
ID=91288008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410236759.3A Pending CN118152423A (zh) | 2024-03-01 | 2024-03-01 | 智能查询方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118152423A (zh) |
-
2024
- 2024-03-01 CN CN202410236759.3A patent/CN118152423A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11995073B2 (en) | One-shot learning for text-to-SQL | |
US8122045B2 (en) | Method for mapping a data source to a data target | |
CN110659282B (zh) | 数据路由的构建方法、装置、计算机设备和存储介质 | |
US11651014B2 (en) | Source code retrieval | |
CN109033410B (zh) | 一种基于正则与字符串切割的sql解析方法 | |
CN110597844B (zh) | 异构数据库数据统一访问方法及相关设备 | |
CN112000773B (zh) | 基于搜索引擎技术的数据关联关系挖掘方法及应用 | |
US9043367B2 (en) | Self-learning data lenses for conversion of information from a first form to a second form | |
CN112434024B (zh) | 面向关系型数据库的数据字典生成方法、装置、设备及介质 | |
CN110555035A (zh) | 一种对查询语句进行优化的方法、装置 | |
US20130198117A1 (en) | Systems and methods for semantic data integration | |
CN110909126A (zh) | 一种信息查询方法及装置 | |
CN116415430B (zh) | 面向空间科学任务论证的定制化SysML模型转换方法 | |
US20180336235A1 (en) | Reconciled data storage system | |
CN113297251A (zh) | 多源数据检索方法、装置、设备及存储介质 | |
WO2016156995A1 (en) | Methods, systems and computer program products for machine based processing of natural language input | |
US10877998B2 (en) | Highly atomized segmented and interrogatable data systems (HASIDS) | |
Bartoli et al. | Semisupervised wrapper choice and generation for print-oriented documents | |
CN118152423A (zh) | 智能查询方法、装置、电子设备及可读存储介质 | |
CN113505117A (zh) | 基于数据指标的数据质量评估方法、装置、设备及介质 | |
CN103377199A (zh) | 信息处理装置和信息处理方法 | |
CN117389980B (zh) | 日志文件分析方法及装置、计算机设备和可读存储介质 | |
CN115952203B (zh) | 数据查询方法、设备、系统及存储介质 | |
US11250010B2 (en) | Data access generation providing enhanced search models | |
US20240184793A1 (en) | Deep mining of enterprise data sources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |