CN117251473B - 车辆数据查询分析方法、系统、装置和存储介质 - Google Patents

车辆数据查询分析方法、系统、装置和存储介质 Download PDF

Info

Publication number
CN117251473B
CN117251473B CN202311540131.4A CN202311540131A CN117251473B CN 117251473 B CN117251473 B CN 117251473B CN 202311540131 A CN202311540131 A CN 202311540131A CN 117251473 B CN117251473 B CN 117251473B
Authority
CN
China
Prior art keywords
database
data
query analysis
query
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311540131.4A
Other languages
English (en)
Other versions
CN117251473A (zh
Inventor
赵嵩
张静玉
陈晓军
张雨真
黎小平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Moss Zhilian Technology Co ltd
Original Assignee
Moss Zhilian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Moss Zhilian Technology Co ltd filed Critical Moss Zhilian Technology Co ltd
Priority to CN202311540131.4A priority Critical patent/CN117251473B/zh
Publication of CN117251473A publication Critical patent/CN117251473A/zh
Application granted granted Critical
Publication of CN117251473B publication Critical patent/CN117251473B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种车辆数据查询分析方法、系统、装置和存储介质。该方法包括:获取车辆数据源中的数据库名称和源表名称;接收用户指定的数据库和源表;生成表描述信息查询提示消息,将其输入大语言模型,获取第一数据库查询语句;执行第一数据库查询语句,获取表描述信息;从表描述信息中提取字段信息;从查询分析需求内容中提取出指标数据和数据展示格式;根据指标数据、数据展示格式和字段信息生成查询分析提示消息;将该消息与车辆知识库进行相似度匹配,生成知识库匹配数据;将查询分析提示消息和知识库匹配数据输入大语言模型,获取第二数据库查询语句;执行第二数据库查询语句,获取查询分析结果。本发明可提高车辆数据查询的效率和准确率。

Description

车辆数据查询分析方法、系统、装置和存储介质
技术领域
本发明的实施方式总体上涉及车辆数据分析技术领域,更具体地,涉及一种车辆数据查询分析方法、系统、装置和存储介质。
背景技术
在传统的车辆数据分析工作中,数据的搜集、清洗、处理对数据分析来说是极为关键的步骤。数据分析师需要搜集各种数据源的数据,清洗数据以确保数据的准确性和完整性,并使用数据处理工具和编程语言对数据进行处理转换,然后进行分析和建模,最后用图表的形式展示出来。但是,随着车辆数据的增加,出于查询效率及速度的考虑,不同量级的数据存储在了不同的数据库中,同时产生了更多的车辆数据宽表来存储更多的字段和信息,这使得人工的进行数据搜集和处理极为不便,同时也对数据分析师有了更高的要求。传统的数据分析需要数据分析师完成SQL等的编写,进行数据的搜集和处理,进行数据清洗等工作。只有具有不同数据库SQL基础和编程语言基础的分析师才能更好的完成这一流程。
传统的数据分析工作对数据分析师要求较高,要求其不仅需要有一定的数据分析能力,还需要有一定的编码能力,可以完成不同源的数据采集工作,并可以通过编写代码进行数据的处理。在面临海量数据或数据宽表时,在数据搜集过程中需要花费大量的时间去摸底数据,耗时耗力。
为了加快数据分析速度,部分数据分析工作会配置好SQL模板供分析师使用,但预设模板比较局限,当数据库类型较多时需要设定多个不同类型的模板进行适配,同时很难生成比较复杂的SQL语句,只能进行简单的数据检索等。
发明内容
为了解决现有技术中的上述问题,在第一方面,本发明的实施方式提供了一种车辆数据查询分析方法,所述方法应用于服务器,所述方法包括:获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将所述数据库名称和所述源表名称传输至客户端,以供所述客户端显示;从客户端接收用户在所述客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符;将所述数据库标识符、所述数据库类型和所述源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息;将所述表描述信息查询提示消息输入大语言模型,并且接收所述大语言模型针对所述表描述信息查询提示消息而生成的第一数据库查询语句;对所述已配置的车辆数据源执行所述第一数据库查询语句,以从所述已配置的车辆数据源获取所述指定数据库中的所述指定源表的表描述信息,并将所述表描述信息传输至所述客户端;从所述表描述信息中提取出字段信息,所述字段信息包括字段名称、字段类型、字段描述中的一个或多个;从所述客户端接收用户输入的查询分析需求内容;从所述查询分析需求内容中提取出指标数据和数据展示格式;将所述指标数据、所述数据展示格式和所述字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中所述查询分析提示消息中将待查询分析的字段限制于所述字段信息中的字段;将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中所述车辆知识库包括车辆相关名词含义和/或指标计算方法;将所述查询分析提示消息和所述知识库匹配数据输入大语言模型,并且接收所述大语言模型针对所述查询分析提示消息和所述知识库匹配数据而生成的第二数据库查询语句;对所述已配置的车辆数据源执行所述第二数据库查询语句,以从所述已配置的车辆数据源获取查询分析结果,并将所述查询分析结果传输至所述客户端。
在一些实施方式中,在将所述查询分析提示消息和所述知识库匹配数据输入大语言模型之前,所述方法还包括:根据所述指标数据、所述表描述信息和所述知识库匹配数据,判断所述指标数据是否能从所述指定数据库中的所述指定源表中直接获得或者计算获得;如果是,则执行将所述查询分析提示消息和所述知识库匹配数据输入大语言模型;如果否,则向所述客户端发送提示消息,所述提示消息用于提示用户再次输入查询分析需求内容。
在一些实施方式中,所述方法还包括:对所述查询分析需求内容执行错别字校验和同义词转义操作,生成经预处理的需求内容,并且从所述查询分析需求内容中提取出指标数据和数据展示格式进一步包括:从所述经预处理的需求内容中提取出指标数据和数据展示格式。
在一些实施方式中,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符包括:从客户端接收用户在所显示的所述数据库名称和所述源表名称中选择的指定数据库名称和指定源表名称;根据预先存储的数据库名称、源表名称与数据库标识符、数据库类型和源表标识符的映射表,解析得到用户所指定的数据库和源表的数据库标识符、数据库类型和源表标识符。
在一些实施方式中,将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配包括:对所述查询分析提示消息进行文本编码,生成查询分析提示编码数据;将所述查询分析提示编码数据与所述车辆知识库进行相似度匹配;将所述车辆知识库中与所述查询分析提示编码数据相似度最高的预定数目条数据作为所述知识库匹配数据。
在一些实施方式中,将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配包括:对所述查询分析提示消息进行文本编码,生成查询分析提示编码数据;将所述查询分析提示编码数据与所述车辆知识库进行相似度匹配;将所述车辆知识库中与所述查询分析提示编码数据的相似度超过预先定义的相似度阈值的数据作为所述知识库匹配数据。
在一些实施方式中,将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配包括:将所述车辆知识库中的文本知识数据转化为向量知识数据;将所述向量知识数据与所述文本知识数据组建为键值对,存储为表征知识库;将查询分析提示消息样本进行编码,转换为消息样本向量;将所述消息样本向量与所述表征知识库中的键值对进行拼接,生成相似度计算模型训练样本;通过所述相似度计算模型训练样本对相似度计算原始模型进行训练,获得经训练的相似度计算模型;利用所述经训练的相似度计算模型来计算所述查询分析提示消息与所述车辆知识库中的数据之间的相似度。
在第二方面,本发明的实施方式提出了一种车辆数据查询分析系统,所述系统包括服务器和客户端。
所述服务器用于:获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将所述数据库名称和所述源表名称传输至客户端,以供所述客户端显示;从客户端接收用户在所述客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符;将所述数据库标识符、所述数据库类型和所述源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息;将所述表描述信息查询提示消息输入大语言模型,并且接收所述大语言模型针对所述表描述信息查询提示消息而生成的第一数据库查询语句;对所述已配置的车辆数据源执行所述第一数据库查询语句,以从所述已配置的车辆数据源获取所述指定数据库中的所述指定源表的表描述信息,并将所述表描述信息传输至所述客户端;从所述表描述信息中提取出字段信息,所述字段信息包括字段名称、字段类型、字段描述中的一个或多个;从所述客户端接收用户输入的查询分析需求内容;从所述查询分析需求内容中提取出指标数据和数据展示格式;将所述指标数据、所述数据展示格式和所述字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中所述查询分析提示消息中将待查询分析的字段限制于所述字段信息中的字段;将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中所述车辆知识库包括车辆相关名词含义和/或指标计算方法;将所述查询分析提示消息和所述知识库匹配数据输入大语言模型,并且接收所述大语言模型针对所述查询分析提示消息和所述知识库匹配数据而生成的第二数据库查询语句;对所述已配置的车辆数据源执行所述第二数据库查询语句,以从所述已配置的车辆数据源获取查询分析结果,并将所述查询分析结果传输至所述客户端。
所述客户端用于:从所述服务器接收所述已配置的车辆数据源中的所述数据库名称和所述源表名称,并显示所述数据库名称和所述源表名称;接收用户在所显示的数据库名称和源表名称中选择的指定数据库和指定源表,并将其传输至所述服务器;从所述服务器接收所述表描述信息,并显示所述表描述信息;接收用户输入的查询分析需求内容,并将所述查询分析需求内容传输至所述服务器;从所述服务器接收所述查询分析结果,并显示所述查询分析结果。
在第三方面,本发明的实施方式提出了一种车辆数据查询分析装置,所述装置应用于服务器,所述装置包括:名称获取模块,配置用于获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将所述数据库名称和所述源表名称传输至客户端,以供所述客户端显示;指定信息获取模块,配置用于从客户端接收用户在所述客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符;表描述信息查询提示消息生成模块,配置用于将所述数据库标识符、所述数据库类型和所述源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息;第一数据库查询语句获取模块,配置用于将所述表描述信息查询提示消息输入大语言模型,并且接收所述大语言模型针对所述表描述信息查询提示消息而生成的第一数据库查询语句;表描述信息获取模块,配置用于对所述已配置的车辆数据源执行所述第一数据库查询语句,以从所述已配置的车辆数据源获取所述指定数据库中的所述指定源表的表描述信息,并将所述表描述信息传输至所述客户端;字段信息提取模块,配置用于从所述表描述信息中提取出字段信息,所述字段信息包括字段名称、字段类型、字段描述中的一个或多个;需求内容接收模块,配置用于从所述客户端接收用户输入的查询分析需求内容;指标数据提取模块,配置用于从所述查询分析需求内容中提取出指标数据和数据展示格式;查询分析提示消息生成模块,配置用于将所述指标数据、所述数据展示格式和所述字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中所述查询分析提示消息中将待查询分析的字段限制于所述字段信息中的字段;知识库匹配模块,配置用于将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中所述车辆知识库包括车辆相关名词含义和/或指标计算方法;第二数据库查询语句获取模块,配置用于将所述查询分析提示消息和所述知识库匹配数据输入大语言模型,并且接收所述大语言模型针对所述查询分析提示消息和所述知识库匹配数据而生成的第二数据库查询语句;查询分析结果获取模块,配置用于对所述已配置的车辆数据源执行所述第二数据库查询语句,以从所述已配置的车辆数据源获取查询分析结果,并将所述查询分析结果传输至所述客户端。
在第四方面,本发明的实施方式提出了一种存储介质,存储有计算机可读指令,当所述指令由处理器运行时,执行根据上述任何实施方式所述的方法。
本发明的实施方式提出的车辆数据查询分析方法、系统、装置和存储介质可以协助数据分析师完成数据的搜集、处理工作。本发明将大语言模型引入数据分析领域,辅助完成数据的搜集、清洗等工作,使用表描述作为提示,保证数据查询具有更强的准确性和针对性,用来提升数据查询分析的精确率,保证数据分析工作在面对不同源海量数据和更多的数据宽表时具有更高的效率的同时也有更高的准确率。该系统作为一个黑盒系统提供给用户,用户只需提出需求而不需要进行代码的编写,降低了数据分析门槛。
本发明的实施方式根据用户输入的需求能够完成不同数据库、数据源的数据查询、分析工作,大大节约数据摸底分析的时间和成本。不需要预设模板、配置详细参数,用户输入自己的需求便可以自动的进行数据搜集和分析,结果保存,更加方便易用。
附图说明
通过参考附图阅读下文的详细描述,本发明实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示出了根据本发明的实施方式的车辆数据查询分析方法的流程图;
图2示出了根据本发明的实施方式的车辆数据查询分析系统的框架示意图;
图3示出了根据本发明的实施方式的车辆数据查询分析装置的框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。
在一个方面,本发明的实施方式提供了一种车辆数据查询分析方法。参考图1,其示出了根据本发明的实施方式的车辆数据查询分析方法100的流程图。方法100应用于服务器。如图1所示,方法100包括步骤S101-S112。
在步骤S101中,获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将数据库名称和源表名称传输至客户端,以供客户端显示。在本发明的实施方式中,源表是数据库的下一级目录。
在步骤S102中,从客户端接收用户在客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取指定数据库的数据库标识符和数据库类型以及指定源表的源表标识符。
作为本发明的一个实施方式,获取指定数据库的数据库标识符和数据库类型以及指定源表的源表标识符包括:从客户端接收用户在所显示的数据库名称和源表名称中选择的指定数据库名称和指定源表名称;根据预先存储的数据库名称、源表名称与数据库标识符、数据库类型和源表标识符的映射表,解析得到用户所指定的数据库和源表的数据库标识符、数据库类型和源表标识符。
在步骤S103中,将数据库标识符、数据库类型和源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息(prompt)。
在步骤S104中,将表描述信息查询提示消息输入大语言模型(Large LanguageModel,LLM),并且接收大语言模型针对表描述信息查询提示消息而生成的第一数据库查询语句。换言之,该第一数据库查询语句是用于获取表描述的查询语句。数据库查询语句例如可以是SQL(Structured Query Language)语句。
在步骤S105中,对已配置的车辆数据源执行第一数据库查询语句,以从已配置的车辆数据源获取指定数据库中的指定源表的表描述信息,并将表描述信息传输至客户端。
由于在表描述信息查询提示消息中包括了数据库类型,可以使得大语言模型根据不同的数据库类型而生成不同的数据库查询语句,从而,可以实现对不同数据库的操作,并且加入新的数据库种类时不需要有进一步的配置修改,与用户自行编写数据库查询语句或者采用固定的配置模板生成数据库查询语句相比,更加灵活。
在步骤S106中,从表描述信息中提取出字段信息,字段信息包括字段名称、字段类型、字段描述中的一个或多个。
在步骤S107中,从客户端接收用户输入的查询分析需求内容。
在步骤S108中,从查询分析需求内容中提取出指标数据和数据展示格式。指标数据可以包括用户想要从数据库中获得的指标,或者是通过数据库的源表中的信息计算得到的数据。
作为本发明的一个实施方式,该方法还可以包括:对查询分析需求内容执行错别字校验和同义词转义操作,生成经预处理的需求内容。从查询分析需求内容中提取出指标数据和数据展示格式进一步包括:从经预处理的需求内容中提取出指标数据和数据展示格式。
在步骤S109中,将指标数据、数据展示格式和字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中查询分析提示消息中将待查询分析的字段限制于字段信息中的字段。查询分析提示模板的作用是规范一下需求内容的语言,通过将这些内容填入模板中,可以将需求表达得更加规范和准确。
由于字段信息反映了表描述信息,通过将字段信息加入到查询分析提示消息中,可以使得后续LLM输出的数据库查询语句(例如SQL语句)具有更强的准确性,有效避免了LLM杜撰数据字段名的情况。
在步骤S110中,将查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中车辆知识库包括车辆相关名词含义和/或指标计算方法。车辆知识库主要包括两部分,一部分是车辆相关名词含义(例如公司自定义的名词、公司自定义的车辆标识符、充电桩站费用规则等等),一部分是指标计算方法,例如,指标计算公式,哪些指标超过阈值会导致车辆质量问题,等等。
通过引入车辆知识库,可以辅助LLM更好地理解和处理车辆数据指标。将知识库匹配数据与提示消息共同输入LLM,可以增强LLM对特殊名词数据的理解能力。
作为本发明的一个实施方式,将查询分析提示消息与预先存储的车辆知识库进行相似度匹配可以包括:对查询分析提示消息进行文本编码,生成查询分析提示编码数据;将查询分析提示编码数据与车辆知识库进行相似度匹配;将车辆知识库中与查询分析提示编码数据相似度最高的预定数目条数据作为知识库匹配数据。
作为本发明的另一个实施方式,将查询分析提示消息与预先存储的车辆知识库进行相似度匹配包括:对查询分析提示消息进行文本编码,生成查询分析提示编码数据;将查询分析提示编码数据与车辆知识库进行相似度匹配;将车辆知识库中与查询分析提示编码数据的相似度超过预先定义的相似度阈值的数据作为知识库匹配数据。
作为本发明的又一个实施方式,将查询分析提示消息与预先存储的车辆知识库进行相似度匹配包括:将车辆知识库中的文本知识数据转化为向量知识数据;将向量知识数据与文本知识数据组建为键值对,存储为表征知识库;将查询分析提示消息样本进行编码,转换为消息样本向量;将消息样本向量与表征知识库中的键值对进行拼接,生成相似度计算模型训练样本;通过相似度计算模型训练样本对相似度计算原始模型进行训练,获得经训练的相似度计算模型;利用经训练的相似度计算模型来计算查询分析提示消息与车辆知识库中的数据之间的相似度。
仅作为一个具体示例,可以使用训练好的Embedding(嵌入)模型完成知识库中文本数据到向量的转化,将该向量与源文本知识组建键值对,一并存入车辆知识库作为知识的表征。构造后的提示消息通过Embedding模型进行编码,转化为向量,拼接知识库中向量集,作为训练样本,训练出一个可预测文本间相似度的支持向量机(Support VectorMachine,SVM)模型。将SVM模型预测出的相似度进行排序,获取相似度最高的前n向量对应的知识库数据,并将该部分数据作为提示与提示消息共同输入LLM。
在步骤S111中,将查询分析提示消息和知识库匹配数据输入大语言模型,并且接收大语言模型针对查询分析提示消息和知识库匹配数据而生成的第二数据库查询语句。
在步骤S112中,对已配置的车辆数据源执行第二数据库查询语句,以从已配置的车辆数据源获取查询分析结果,并将查询分析结果传输至客户端。可选地,获取到查询分析结果之后,根据步骤S108中获取的数据展示格式来输出对应结果,方便用户进行查看和进一步的分析。
可选地,本发明的实施方式可以使用微调后的开源大模型,在服务器本地运行该模型,没有外部接口,从而可以防止数据泄露,减少泄密风险,保证车辆数据的安全性。
作为本发明的一个实施方式,在将查询分析提示消息和知识库匹配数据输入大语言模型之前,该方法还可以包括:根据指标数据、表描述信息和知识库匹配数据,判断指标数据是否能从指定数据库中的指定源表中直接获得或者计算获得;如果是,则执行将查询分析提示消息和知识库匹配数据输入大语言模型;如果否,则启动需求澄清程序,向客户端发送提示消息,提示消息用于提示用户再次输入查询分析需求内容,并再次将指标、用户需求陈述历史及相关的数据库描述构建prompt,与车辆知识库进行匹配,再次输入LLM,重复执行本步骤,直到可以获得数据或用户停止操作。
随着车联网数据的增加,不同量级的数据存储到了不同类型的数据库中,同时数据表字段也在大量增长,给数据查询分析工作带来了极大的不便。本发明的实施方式实现了一个黑盒的系统,用户仅需要输入自己需要查询的数据表名、存储的数据库和需求,就可以获得想要的数据或图表,不需要编写SQL,提升了工作的效率,降低了数据分析使用门槛。
本发明的实施方式根据用户的输入内容自行获取数据源的相关信息,并进行数据的查询分析,不需要用户提前对原始数据进行摸底分析就可以直接过滤无用数据,获得所需数据,使得数据分析工作更加高效。多数据源自动适配,生成语言,不需要关注数据源切换时的语言、函数等变更,避免了由于语言问题导致程序执行过程中出现的错误。
通过输入数据描述信息限制了大模型的输出,使得大模型生成的SQL语句更加准确。
在另一方面,本发明的实施方式提出了一种车辆数据查询分析系统,系统包括服务器和客户端。参考图2,其示出了根据本发明的实施方式的车辆数据查询分析系统的框架示意图。客户端也可称为web端,包括数据源选择模块、需求输入模块、结果展示模块、数据下载模块。服务器可以是本地服务器或者云端服务器,包括指令接收处理模块、结果处理输出模块、标准化输入模块、大模型模块、数据库交互模块和数据解析模块。
服务器用于:
获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将数据库名称和源表名称传输至客户端,以供客户端显示;
从客户端接收用户在客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取指定数据库的数据库标识符和数据库类型以及指定源表的源表标识符;
将数据库标识符、数据库类型和源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息;
将表描述信息查询提示消息输入大语言模型,并且接收大语言模型针对表描述信息查询提示消息而生成的第一数据库查询语句;
对已配置的车辆数据源执行第一数据库查询语句,以从已配置的车辆数据源获取指定数据库中的指定源表的表描述信息,并将表描述信息传输至客户端;
从表描述信息中提取出字段信息,字段信息包括字段名称、字段类型、字段描述中的一个或多个;
从客户端接收用户输入的查询分析需求内容;
从查询分析需求内容中提取出指标数据和数据展示格式;
将指标数据、数据展示格式和字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中查询分析提示消息中将待查询分析的字段限制于字段信息中的字段;
将查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中车辆知识库包括车辆相关名词含义和/或指标计算方法;
将查询分析提示消息和知识库匹配数据输入大语言模型,并且接收大语言模型针对查询分析提示消息和知识库匹配数据而生成的第二数据库查询语句;
对已配置的车辆数据源执行第二数据库查询语句,以从已配置的车辆数据源获取查询分析结果;
将查询分析结果传输至客户端。
客户端用于:
从服务器接收已配置的车辆数据源中的数据库名称和源表名称,并显示数据库名称和源表名称;
接收用户在所显示的数据库名称和源表名称中选择的指定数据库和指定源表,并将其传输至服务器;
从服务器接收表描述信息,并显示表描述信息;
接收用户输入的查询分析需求内容,并将查询分析需求内容传输至服务器;
从服务器接收查询分析结果,并显示查询分析结果。
在又一方面,本发明的实施方式提出了一种车辆数据查询分析装置,该装置应用于服务器。参考图3,其示出了根据本发明的实施方式的车辆数据查询分析装置的框图,该装置包括模块301-312。
名称获取模块301可以配置用于获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将数据库名称和源表名称传输至客户端,以供客户端显示。
指定信息获取模块302可以配置用于从客户端接收用户在客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取指定数据库的数据库标识符和数据库类型以及指定源表的源表标识符。
表描述信息查询提示消息生成模块303可以配置用于将数据库标识符、数据库类型和源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息。
第一数据库查询语句获取模块304可以配置用于将表描述信息查询提示消息输入大语言模型,并且接收大语言模型针对表描述信息查询提示消息而生成的第一数据库查询语句。
表描述信息获取模块305可以配置用于对已配置的车辆数据源执行第一数据库查询语句,以从已配置的车辆数据源获取指定数据库中的指定源表的表描述信息,并将表描述信息传输至客户端。
字段信息提取模块306可以配置用于从表描述信息中提取出字段信息,字段信息包括字段名称、字段类型、字段描述中的一个或多个。
需求内容接收模块307可以配置用于从客户端接收用户输入的查询分析需求内容。
指标数据提取模块308可以配置用于从查询分析需求内容中提取出指标数据和数据展示格式。
查询分析提示消息生成模块309可以配置用于将指标数据、数据展示格式和字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中查询分析提示消息中将待查询分析的字段限制于字段信息中的字段。
知识库匹配模块310可以配置用于将查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中车辆知识库包括车辆相关名词含义和/或指标计算方法。
第二数据库查询语句获取模块311可以配置用于将查询分析提示消息和知识库匹配数据输入大语言模型,并且接收大语言模型针对查询分析提示消息和知识库匹配数据而生成的第二数据库查询语句。
查询分析结果获取模块312可以配置用于对已配置的车辆数据源执行第二数据库查询语句,以从已配置的车辆数据源获取查询分析结果,并将查询分析结果传输至客户端。
需要注意的是,本发明的实施方式提出的车辆数据查询分析装置中的各个模块实现的功能与上文描述的车辆数据查询分析方法的各个步骤一一对应,其具体实施方式、示例和有益效果请参见上文对于方法的描述。
在又一方面,本发明的实施方式提出了一种存储介质,存储有计算机可读指令,当指令由处理器运行时,执行上述任何实施方式描述的车辆数据查询分析方法。
本发明的实施方式提出的车辆数据查询分析方法、系统、装置和存储介质可以协助数据分析师完成数据的搜集、处理工作。本发明将大语言模型引入数据分析领域,辅助完成数据的搜集、清洗等工作,使用表描述作为提示,保证数据查询具有更强的准确性和针对性,用来提升数据查询分析的精确率,保证数据分析工作在面对不同源海量数据和更多的数据宽表时具有更高的效率的同时也有更高的准确率。该系统作为一个黑盒系统提供给用户,用户只需提出需求而不需要进行代码的编写,降低了数据分析门槛。
本发明根据用户输入的需求能够完成不同数据库、数据源的数据查询、分析工作,大大节约数据摸底分析的时间和成本。不需要预设模板、配置详细参数,用户输入自己的需求便可以自动的进行数据搜集和分析,结果保存,更加方便易用。
出于示意的目的,已经给出了本发明的实施方式的前述说明,其并非是穷举性的也并非要将本发明限制为所公开的确切形式。本领域技术人员可以理解的是,在不偏离本发明的范围的情况下可以做出各种变化,并且可以将其中的元件替换为等同物。另外,在不偏离本发明的基本范围的情况下,可以进行很多修改以使得特定的情况或材料适应于本发明的教导。因此,本发明不试图限制于所公开的作为用于实现本发明所预期的最佳模式的特定实施方式,本发明将包括落入所附的权利要求的范围内的所有实施方式。

Claims (10)

1.一种车辆数据查询分析方法,其特征在于,所述方法应用于服务器,所述方法包括:
获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将所述数据库名称和所述源表名称传输至客户端,以供所述客户端显示;
从客户端接收用户在所述客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符;
将所述数据库标识符、所述数据库类型和所述源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息;
将所述表描述信息查询提示消息输入大语言模型,并且接收所述大语言模型针对所述表描述信息查询提示消息而生成的第一数据库查询语句;
对所述已配置的车辆数据源执行所述第一数据库查询语句,以从所述已配置的车辆数据源获取所述指定数据库中的所述指定源表的表描述信息,并将所述表描述信息传输至所述客户端;
从所述表描述信息中提取出字段信息,所述字段信息包括字段名称、字段类型、字段描述中的一个或多个;
从所述客户端接收用户输入的查询分析需求内容;
从所述查询分析需求内容中提取出指标数据和数据展示格式;
将所述指标数据、所述数据展示格式和所述字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中所述查询分析提示消息中将待查询分析的字段限制于所述字段信息中的字段;
将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中所述车辆知识库包括车辆相关名词含义和/或指标计算方法;
将所述查询分析提示消息和所述知识库匹配数据输入大语言模型,并且接收所述大语言模型针对所述查询分析提示消息和所述知识库匹配数据而生成的第二数据库查询语句;
对所述已配置的车辆数据源执行所述第二数据库查询语句,以从所述已配置的车辆数据源获取查询分析结果,并将所述查询分析结果传输至所述客户端。
2.根据权利要求1所述的方法,其特征在于,在将所述查询分析提示消息和所述知识库匹配数据输入大语言模型之前,所述方法还包括:
根据所述指标数据、所述表描述信息和所述知识库匹配数据,判断所述指标数据是否能从所述指定数据库中的所述指定源表中直接获得或者计算获得;
如果是,则执行将所述查询分析提示消息和所述知识库匹配数据输入大语言模型;
如果否,则向所述客户端发送提示消息,所述提示消息用于提示用户再次输入查询分析需求内容。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述查询分析需求内容执行错别字校验和同义词转义操作,生成经预处理的需求内容,并且
从所述查询分析需求内容中提取出指标数据和数据展示格式进一步包括:从所述经预处理的需求内容中提取出指标数据和数据展示格式。
4.根据权利要求1所述的方法,其特征在于,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符包括:
从客户端接收用户在所显示的所述数据库名称和所述源表名称中选择的指定数据库名称和指定源表名称;
根据预先存储的数据库名称、源表名称与数据库标识符、数据库类型和源表标识符的映射表,解析得到用户所指定的数据库和源表的数据库标识符、数据库类型和源表标识符。
5.根据权利要求1所述的方法,其特征在于,将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配包括:
对所述查询分析提示消息进行文本编码,生成查询分析提示编码数据;
将所述查询分析提示编码数据与所述车辆知识库进行相似度匹配;
将所述车辆知识库中与所述查询分析提示编码数据相似度最高的预定数目条数据作为所述知识库匹配数据。
6.根据权利要求1所述的方法,其特征在于,将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配包括:
对所述查询分析提示消息进行文本编码,生成查询分析提示编码数据;
将所述查询分析提示编码数据与所述车辆知识库进行相似度匹配;
将所述车辆知识库中与所述查询分析提示编码数据的相似度超过预先定义的相似度阈值的数据作为所述知识库匹配数据。
7.根据权利要求1所述的方法,其特征在于,将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配包括:
将所述车辆知识库中的文本知识数据转化为向量知识数据;
将所述向量知识数据与所述文本知识数据组建为键值对,存储为表征知识库;
将查询分析提示消息样本进行编码,转换为消息样本向量;
将所述消息样本向量与所述表征知识库中的键值对进行拼接,生成相似度计算模型训练样本;
通过所述相似度计算模型训练样本对相似度计算原始模型进行训练,获得经训练的相似度计算模型;
利用所述经训练的相似度计算模型来计算所述查询分析提示消息与所述车辆知识库中的数据之间的相似度。
8.一种车辆数据查询分析系统,其特征在于,所述系统包括服务器和客户端,
所述服务器用于:
获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将所述数据库名称和所述源表名称传输至客户端,以供所述客户端显示;
从客户端接收用户在所述客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符;
将所述数据库标识符、所述数据库类型和所述源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息;
将所述表描述信息查询提示消息输入大语言模型,并且接收所述大语言模型针对所述表描述信息查询提示消息而生成的第一数据库查询语句;
对所述已配置的车辆数据源执行所述第一数据库查询语句,以从所述已配置的车辆数据源获取所述指定数据库中的所述指定源表的表描述信息,并将所述表描述信息传输至所述客户端;
从所述表描述信息中提取出字段信息,所述字段信息包括字段名称、字段类型、字段描述中的一个或多个;
从所述客户端接收用户输入的查询分析需求内容;
从所述查询分析需求内容中提取出指标数据和数据展示格式;
将所述指标数据、所述数据展示格式和所述字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中所述查询分析提示消息中将待查询分析的字段限制于所述字段信息中的字段;
将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中所述车辆知识库包括车辆相关名词含义和/或指标计算方法;
将所述查询分析提示消息和所述知识库匹配数据输入大语言模型,并且接收所述大语言模型针对所述查询分析提示消息和所述知识库匹配数据而生成的第二数据库查询语句;
对所述已配置的车辆数据源执行所述第二数据库查询语句,以从所述已配置的车辆数据源获取查询分析结果,并将所述查询分析结果传输至所述客户端,
所述客户端用于:
从所述服务器接收所述已配置的车辆数据源中的所述数据库名称和所述源表名称,并显示所述数据库名称和所述源表名称;
接收用户在所显示的数据库名称和源表名称中选择的指定数据库和指定源表,并将其传输至所述服务器;
从所述服务器接收所述表描述信息,并显示所述表描述信息;
接收用户输入的查询分析需求内容,并将所述查询分析需求内容传输至所述服务器;
从所述服务器接收所述查询分析结果,并显示所述查询分析结果。
9.一种车辆数据查询分析装置,其特征在于,所述装置应用于服务器,所述装置包括:
名称获取模块,配置用于获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将所述数据库名称和所述源表名称传输至客户端,以供所述客户端显示;
指定信息获取模块,配置用于从客户端接收用户在所述客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符;
表描述信息查询提示消息生成模块,配置用于将所述数据库标识符、所述数据库类型和所述源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息;
第一数据库查询语句获取模块,配置用于将所述表描述信息查询提示消息输入大语言模型,并且接收所述大语言模型针对所述表描述信息查询提示消息而生成的第一数据库查询语句;
表描述信息获取模块,配置用于对所述已配置的车辆数据源执行所述第一数据库查询语句,以从所述已配置的车辆数据源获取所述指定数据库中的所述指定源表的表描述信息,并将所述表描述信息传输至所述客户端;
字段信息提取模块,配置用于从所述表描述信息中提取出字段信息,所述字段信息包括字段名称、字段类型、字段描述中的一个或多个;
需求内容接收模块,配置用于从所述客户端接收用户输入的查询分析需求内容;
指标数据提取模块,配置用于从所述查询分析需求内容中提取出指标数据和数据展示格式;
查询分析提示消息生成模块,配置用于将所述指标数据、所述数据展示格式和所述字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中所述查询分析提示消息中将待查询分析的字段限制于所述字段信息中的字段;
知识库匹配模块,配置用于将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中所述车辆知识库包括车辆相关名词含义和/或指标计算方法;
第二数据库查询语句获取模块,配置用于将所述查询分析提示消息和所述知识库匹配数据输入大语言模型,并且接收所述大语言模型针对所述查询分析提示消息和所述知识库匹配数据而生成的第二数据库查询语句;
查询分析结果获取模块,配置用于对所述已配置的车辆数据源执行所述第二数据库查询语句,以从所述已配置的车辆数据源获取查询分析结果,并将所述查询分析结果传输至所述客户端。
10.一种存储介质,其特征在于,存储有计算机可读指令,当所述指令由处理器运行时,执行根据权利要求1-7中任一项所述的方法。
CN202311540131.4A 2023-11-20 2023-11-20 车辆数据查询分析方法、系统、装置和存储介质 Active CN117251473B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311540131.4A CN117251473B (zh) 2023-11-20 2023-11-20 车辆数据查询分析方法、系统、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311540131.4A CN117251473B (zh) 2023-11-20 2023-11-20 车辆数据查询分析方法、系统、装置和存储介质

Publications (2)

Publication Number Publication Date
CN117251473A CN117251473A (zh) 2023-12-19
CN117251473B true CN117251473B (zh) 2024-03-15

Family

ID=89126838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311540131.4A Active CN117251473B (zh) 2023-11-20 2023-11-20 车辆数据查询分析方法、系统、装置和存储介质

Country Status (1)

Country Link
CN (1) CN117251473B (zh)

Citations (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008113045A1 (en) * 2007-03-14 2008-09-18 Evri Inc. Query templates and labeled search tip system, methods, and techniques
WO2009136426A1 (ja) * 2008-05-08 2009-11-12 三菱電機株式会社 検索クエリ提供装置
CN104484392A (zh) * 2014-12-11 2015-04-01 北京国双科技有限公司 数据库查询语句生成方法及装置
US9336272B1 (en) * 2013-02-13 2016-05-10 Amazon Technologies, Inc. Global query hint specification
CN106844369A (zh) * 2015-12-03 2017-06-13 北京国双科技有限公司 对象化sql语句构造方法及装置
CN107943466A (zh) * 2016-10-13 2018-04-20 腾讯科技(深圳)有限公司 数据库访问语句生成方法、装置及设备
CN110968601A (zh) * 2019-11-28 2020-04-07 中国银行股份有限公司 一种数据查询处理方法及装置
CN111339246A (zh) * 2020-02-10 2020-06-26 腾讯云计算(北京)有限责任公司 查询语句模板的生成方法、装置、设备及介质
CN111459967A (zh) * 2020-03-03 2020-07-28 深圳壹账通智能科技有限公司 结构化查询语句生成方法、装置、电子设备及介质
WO2020259309A1 (zh) * 2019-06-28 2020-12-30 苏宁云计算有限公司 一种多维数据查询方法及装置
CN114328572A (zh) * 2020-09-28 2022-04-12 北京鸿享技术服务有限公司 基于sql解析器的数据查询方法、装置、系统及介质
CN114691718A (zh) * 2022-03-29 2022-07-01 中国工商银行股份有限公司 一种查询语句生成方法和装置
CN115114281A (zh) * 2021-03-23 2022-09-27 阿里巴巴新加坡控股有限公司 查询语句的生成方法和装置,存储介质和电子设备
CN115168402A (zh) * 2022-07-08 2022-10-11 支付宝(杭州)信息技术有限公司 训练序列生成模型的方法及装置
CN116303558A (zh) * 2023-01-18 2023-06-23 阿里巴巴(中国)有限公司 查询语句生成方法、数据查询方法及生成模型训练方法
CN116340584A (zh) * 2023-05-24 2023-06-27 杭州悦数科技有限公司 一种自动生成复杂图数据库查询语句服务的实现方法
EP4220434A1 (en) * 2022-01-27 2023-08-02 Intuit Inc. Intelligent query auto-completion systems and methods
CN116629227A (zh) * 2023-07-24 2023-08-22 海信集团控股股份有限公司 一种将文本转换为sql语句的方法及设备
CN116701431A (zh) * 2023-05-25 2023-09-05 东云睿连(武汉)计算技术有限公司 一种基于大语言模型的数据检索方法及系统
CN116701437A (zh) * 2023-08-07 2023-09-05 上海爱可生信息技术股份有限公司 数据转化方法、数据转化系统、电子设备及可读存储介质
CN116756169A (zh) * 2023-05-30 2023-09-15 淘宝(中国)软件有限公司 交互式生成数据报表的方法及计算设备
US11769017B1 (en) * 2022-12-30 2023-09-26 Google Llc Generative summaries for search results
CN116860949A (zh) * 2023-08-21 2023-10-10 人民网股份有限公司 问答处理方法、装置、系统、计算设备及计算机存储介质
CN116894078A (zh) * 2023-07-28 2023-10-17 广东保伦电子股份有限公司 一种信息交互方法、装置、电子设备及介质
CN116910221A (zh) * 2023-08-09 2023-10-20 上海深牛科技有限公司 一种基于相似度检索提升大规模语言模型响应速度的方法
CN116955674A (zh) * 2023-09-20 2023-10-27 杭州悦数科技有限公司 一种通过LLM生成图数据库语句的方法及web装置
CN116975927A (zh) * 2023-08-17 2023-10-31 南开大学 基于自然语言提示的llm语言用户隐私信息保护方法
CN117056351A (zh) * 2023-10-07 2023-11-14 腾讯科技(深圳)有限公司 Sql语句生成方法、装置及设备
CN117076718A (zh) * 2023-08-22 2023-11-17 北京意如图真科技有限公司 一种基于大语言模型的图数据库查询处理系统及方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11157533B2 (en) * 2017-11-08 2021-10-26 International Business Machines Corporation Designing conversational systems driven by a semantic network with a library of templated query operators
US20220414228A1 (en) * 2021-06-23 2022-12-29 The Mitre Corporation Methods and systems for natural language processing of graph database queries
US20230074406A1 (en) * 2021-09-07 2023-03-09 Google Llc Using large language model(s) in generating automated assistant response(s

Patent Citations (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008113045A1 (en) * 2007-03-14 2008-09-18 Evri Inc. Query templates and labeled search tip system, methods, and techniques
WO2009136426A1 (ja) * 2008-05-08 2009-11-12 三菱電機株式会社 検索クエリ提供装置
US9336272B1 (en) * 2013-02-13 2016-05-10 Amazon Technologies, Inc. Global query hint specification
CN104484392A (zh) * 2014-12-11 2015-04-01 北京国双科技有限公司 数据库查询语句生成方法及装置
CN106844369A (zh) * 2015-12-03 2017-06-13 北京国双科技有限公司 对象化sql语句构造方法及装置
CN107943466A (zh) * 2016-10-13 2018-04-20 腾讯科技(深圳)有限公司 数据库访问语句生成方法、装置及设备
WO2020259309A1 (zh) * 2019-06-28 2020-12-30 苏宁云计算有限公司 一种多维数据查询方法及装置
CN110968601A (zh) * 2019-11-28 2020-04-07 中国银行股份有限公司 一种数据查询处理方法及装置
CN111339246A (zh) * 2020-02-10 2020-06-26 腾讯云计算(北京)有限责任公司 查询语句模板的生成方法、装置、设备及介质
CN111459967A (zh) * 2020-03-03 2020-07-28 深圳壹账通智能科技有限公司 结构化查询语句生成方法、装置、电子设备及介质
CN114328572A (zh) * 2020-09-28 2022-04-12 北京鸿享技术服务有限公司 基于sql解析器的数据查询方法、装置、系统及介质
CN115114281A (zh) * 2021-03-23 2022-09-27 阿里巴巴新加坡控股有限公司 查询语句的生成方法和装置,存储介质和电子设备
EP4220434A1 (en) * 2022-01-27 2023-08-02 Intuit Inc. Intelligent query auto-completion systems and methods
CN114691718A (zh) * 2022-03-29 2022-07-01 中国工商银行股份有限公司 一种查询语句生成方法和装置
CN115168402A (zh) * 2022-07-08 2022-10-11 支付宝(杭州)信息技术有限公司 训练序列生成模型的方法及装置
US11769017B1 (en) * 2022-12-30 2023-09-26 Google Llc Generative summaries for search results
CN116303558A (zh) * 2023-01-18 2023-06-23 阿里巴巴(中国)有限公司 查询语句生成方法、数据查询方法及生成模型训练方法
CN116340584A (zh) * 2023-05-24 2023-06-27 杭州悦数科技有限公司 一种自动生成复杂图数据库查询语句服务的实现方法
CN116701431A (zh) * 2023-05-25 2023-09-05 东云睿连(武汉)计算技术有限公司 一种基于大语言模型的数据检索方法及系统
CN116756169A (zh) * 2023-05-30 2023-09-15 淘宝(中国)软件有限公司 交互式生成数据报表的方法及计算设备
CN116629227A (zh) * 2023-07-24 2023-08-22 海信集团控股股份有限公司 一种将文本转换为sql语句的方法及设备
CN116894078A (zh) * 2023-07-28 2023-10-17 广东保伦电子股份有限公司 一种信息交互方法、装置、电子设备及介质
CN116701437A (zh) * 2023-08-07 2023-09-05 上海爱可生信息技术股份有限公司 数据转化方法、数据转化系统、电子设备及可读存储介质
CN116910221A (zh) * 2023-08-09 2023-10-20 上海深牛科技有限公司 一种基于相似度检索提升大规模语言模型响应速度的方法
CN116975927A (zh) * 2023-08-17 2023-10-31 南开大学 基于自然语言提示的llm语言用户隐私信息保护方法
CN116860949A (zh) * 2023-08-21 2023-10-10 人民网股份有限公司 问答处理方法、装置、系统、计算设备及计算机存储介质
CN117076718A (zh) * 2023-08-22 2023-11-17 北京意如图真科技有限公司 一种基于大语言模型的图数据库查询处理系统及方法
CN116955674A (zh) * 2023-09-20 2023-10-27 杭州悦数科技有限公司 一种通过LLM生成图数据库语句的方法及web装置
CN117056351A (zh) * 2023-10-07 2023-11-14 腾讯科技(深圳)有限公司 Sql语句生成方法、装置及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《PromptWE:一种融合解释的提示学习事实核查模型》;张翔然;《清华大学学报》;1-10 *
Recent Advances in Natural Language Processing via Large Pre-trained Language Models:A Survey;Bonan Min;《ACM Computing Surveys》;第56卷(第2期);1-40 *

Also Published As

Publication number Publication date
CN117251473A (zh) 2023-12-19

Similar Documents

Publication Publication Date Title
CN111813802B (zh) 一种基于自然语言生成结构化查询语句的方法
US9965547B2 (en) System and methods for automating trademark and service mark searches
CN116244410B (zh) 一种基于知识图谱和自然语言的指标数据分析方法及系统
CN115687572A (zh) 一种数据信息的检索方法、装置、设备及存储介质
CN116303537A (zh) 数据查询方法及装置、电子设备、存储介质
CN112507089A (zh) 一种基于知识图谱的智能问答引擎及其实现方法
CN117708157A (zh) 一种sql语句生成方法和装置
CN117494802A (zh) 知识库的构建方法、数据查询方法、电子设备和存储介质
CN111831624A (zh) 数据表创建方法、装置、计算机设备及存储介质
CN117251473B (zh) 车辆数据查询分析方法、系统、装置和存储介质
CN109684357B (zh) 信息处理方法及装置、存储介质、终端
CN115080603B (zh) 一种数据库查询语言转换方法、装置、设备及存储介质
CN114090620B (zh) 查询请求的处理方法及装置
CN115438142B (zh) 一种对话式交互数据分析报告系统
CN113420124B (zh) 解决语音检索多条件下的冲突方法
CN113407667B (zh) 基于语音固定条件下的查询方法
CN110955433B (zh) 一种自动化部署脚本的生成方法及装置
CN117667979B (zh) 基于大语言模型的数据挖掘方法、装置、设备及介质
CN117540004B (zh) 基于知识图谱和用户行为的工业领域智能问答方法及系统
CN108197151B (zh) 文法库的更新方法及装置
CN117216211A (zh) 生成式ai的数据构建和输出方法、系统及机器人
CN117667992A (zh) 自然语言问题转换成sql语句的方法、装置、设备、介质
CN114153946A (zh) 一种智能检索方法、装置、设备及存储介质
CN115422078A (zh) 一种生成测试功能操作步骤描述文档的方法和装置
CN113569974A (zh) 编程语句纠错方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant