CN116842036A - 数据查询方法、装置、计算机设备及存储介质 - Google Patents

数据查询方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN116842036A
CN116842036A CN202310784237.2A CN202310784237A CN116842036A CN 116842036 A CN116842036 A CN 116842036A CN 202310784237 A CN202310784237 A CN 202310784237A CN 116842036 A CN116842036 A CN 116842036A
Authority
CN
China
Prior art keywords
query
data
target
statement
structured database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310784237.2A
Other languages
English (en)
Inventor
林桂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202310784237.2A priority Critical patent/CN116842036A/zh
Publication of CN116842036A publication Critical patent/CN116842036A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及人工智能和智能医疗领域,提供一种数据查询方法、装置、设备及计算机存储介质,该方法包括:接收用于对结构化数据库进行查询的目标查询语句,所述目标查询语句是基于自然语言描述的;基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果;根据所述目标查询语句,将所述数据查询结果转换为目标回答语句,所述目标回答语句是基于自然语言描述的;基于预设的输出格式,输出所述目标回答语句,所述输出格式包括:文本、语音中的至少一者。通过大语言模型,提高基于自然语言对数据进行查询的查询效率和灵活性。

Description

数据查询方法、装置、计算机设备及存储介质
技术领域
本申请涉及人工智能和智能医疗领域,尤其涉及一种数据查询方法、装置、计算机设备及存储介质。
背景技术
随着自然语言处理技术的发展,越来越多的数据库支持通过自然语言对结构化数据库进行查询。以医疗领域为例,用户可以询问导诊机器人“口腔外科的张XX医生这周哪天有门诊?”,导诊机器人基于语义的信息抽取算法,将句子中的“口腔外科”识别为“科室”,“张XX医生”识别为“医生,“这周”识别为“本周”,“门诊”识别为“门诊”,根据识别到的四个要素在结构化数据库中进行查询:首先,定位到“门诊”排班表,约束条件为“科室”==“口腔外科”,“医生”==“张XX医生”,而时间限定在在“本周”,然后进行查询,返回张医生本周的门诊排班时间。
然而,这种自然语言查询方法的泛化能力和迁移能力有限,只能在指定的数据库表上实现,如果增减表或表结构稍有变化,则模型需要重新训练再部署,也就是说模型无法适应动态的数据变化,灵活性较差,并且对于多表联合的复杂查询效果也有待加强,亟需一种能够提高灵活程度的结构化数据查询方法。
发明内容
本申请的主要目的在于提供一种数据查询方法、装置、设备及计算机存储介质,旨在提高基于自然语言对数据进行查询的查询效率和灵活性。
第一方面,本申请提供一种数据查询方法,所述数据查询方法包括以下步骤:
接收用于对结构化数据库进行查询的目标查询语句,所述目标查询语句是基于自然语言描述的;
基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果;
根据所述目标查询语句,将所述数据查询结果转换为目标回答语句,所述目标回答语句是基于自然语言描述的;
基于预设的输出格式,输出所述目标回答语句,所述输出格式包括:文本、语音中的至少一者。
第二方面,本申请还提供一种数据查询装置,所述数据查询装置包括:
查询语句接收模块,用于接收用于对结构化数据库进行查询的目标查询语句,所述目标查询语句是基于自然语言描述的;
数据库查询模块,用于基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果;
回答语句转换模块,用于根据所述目标查询语句,将所述数据查询结果转换为目标回答语句,所述目标回答语句是基于自然语言描述的;
回答语句输出模块,用于基于预设的输出格式,输出所述目标回答语句,所述输出格式包括:文本、语音中的至少一者。
第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的数据查询方法。
第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的数据查询方法。
本申请提供一种数据查询方法、装置、设备及计算机存储介质,本申请通过接收用于对结构化数据库进行查询的目标查询语句,所述目标查询语句是基于自然语言描述的;基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果;根据所述目标查询语句,将所述数据查询结果转换为目标回答语句,所述目标回答语句是基于自然语言描述的;基于预设的输出格式,输出所述目标回答语句,所述输出格式包括:文本、语音中的至少一者。由于通过大语言模型在结构化数据库中执行数据查询操作,提高了基于自然语言对数据进行查询的查询效率和灵活性。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的一种数据查询方法的流程示意图;
图2为本申请一实施例提供的一种数据查询方法的使用场景图;
图3为本申请另一实施例提供的一种数据查询方法的流程示意图;
图4为本申请一实施例提供的一种数据查询装置的示意性框图;
图5为本申请一实施例涉及的计算机设备的结构示意框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本申请实施例提供一种数据查询方法、装置、计算机设备及计算机可读存储介质。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参照图1,图1为本申请的实施例提供的一种数据查询方法的流程示意图。该数据查询方法可以用于终端或服务器中,以实现对结构化数据库中的数据进行查询。其中,终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备;服务器可以为独立的服务器,也可以为服务器集群,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
请参照图2,图2是本申请一实施例提供的一种使用场景图。如图2所示,大语言模型根据基于自然语言描述的目标查询语句,从结构化数据库中确定数据查询结果,再将数据查询结果转换为基于自然语言描述的目标回答语句。
如图1所示,该数据查询方法包括步骤S101至步骤S104。
步骤S101、接收用于对结构化数据库进行查询的目标查询语句,所述目标查询语句是基于自然语言描述的。
示例性的,所述结构化数据库例如可以是基于SQL(Structured Query Language)存储数据信息的结构化查询语言数据库,结构化数据库中的数据信息例如可以是基于操作命令集进行存储、查询和获取的,因此在结构化数据库中进行数据查询存在一定的门槛,为没有代码基础的用户对结构化数据库中的数据进行操作带来了不便。
示例性的,为了提高用户的使用体验,使没有代码基础的用户也可以针对结构化数据库中的数据执行查询操作,本申请实施例提供的数据查询方法通过自然语言描述的目标查询语句对结构化数据库中的数据信息进行查询。
示例性的,本申请实施例提供的数据查询方法可以应用于智能医疗领域,所述结构化数据库中存储的例如可以是医疗信息,例如医院中各个科室医生的排班信息,或者医院中各个科室接诊的患者的检查结果等。
示例性的,所述目标查询语句可以是文本信息,用户通过文本输入想要进行查询的问题,例如输入“口腔外科的张XX医生这周哪天有门诊?”;或者所述目标查询语句也可以是语音信息,用户只需要通过自然语言口头表达出想要查询的问题;在此对目标查询语句的输入格式不做限定。
步骤S102、基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果。
示例性的,大语言模型(Large Language Model,LLM),是一种人工智能模型,通过在大量文本数据的基础上进行训练,能够理解和生成人类的自然语言,并且能够执行与自然语言有关的多种任务,例如文本总结、文本翻译、文本情感分析等。
示例性的,所述大语言模型例如可以是OpenAI的GPT-4.0、百度的文心一言、Google的PaLM API、微软的KOSMOS等,在此不做限定。
示例性的,由于大语言模型能够理解自然语言,可以基于大语言模型实现通过自然语言对结构化数据库进行查询。以SQL为例,可以预先通过SQL查询语句对大语言模型进行调整,例如将预设数量的SQL查询语句与对应的自然语言查询语句输入所述大语言模型,使得大语言模型能够实现通过用户基于自然语言输入的目标查询语句撰写SQL查询语句实现数据查询。当然也不限于此,在此不做限定。
在一些实施方式中,所述方法在所述基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果之前,还包括:获取所述结构化数据库中的至少一个数据表,以及所述至少一个数据表中的字段信息;基于预设的大语言模型工具链,根据所述字段信息将所述结构化数据库接入所述大语言模型。
示例性的,大语言模型工具链(LangChain)能够提供一套将大语言模型与其它程序连接的组件和接口,例如将多个数据库接入大语言模型,并对多个数据库进行集成。
示例性的,所述字段信息是结构化数据库的数据表中的序列标识,例如数据表中每行数据对应的序列标识和/或每列数据对应的序列标识。
示例性的,基于大语言模型工具链,根据数据表中的字段信息将结构化数据库接入大语言模型,使所述大语言模型能够根据数据字段获取结构化数据库中的内容,以便大语言模型根据自然语言描述的目标查询语句在结构化数据库中执行数据查询操作。
在一些实施方式中,所述目标查询语句包括历史查询语句和当前查询语句;所述基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果,包括:基于预设的大语言模型,在第一查询结果中根据所述当前查询语句确定第二查询结果,所述第一查询结果是根据所述历史查询语句确定的。
示例性的,大语言模型具有上下文学习能力,能够在根据当前查询语句执行数据查询操作时结合历史查询语句,确定数据查询结果。
示例性的,当前查询语句为当前与用户进行交互获取到的目标查询语句,历史查询语句为获取到当前查询语句之前与用户进行交互获取到的目标查询语句。
示例性的,大语言模型能够先基于历史查询语句确定第一查询结果,例如数据查询的第一范围;再在第一查询结果的基础上,基于当前查询语句确定第二查询结果作为目标查询结果,例如从第一范围中筛选出第二范围的数据。
举例而言,历史查询语句例如可以是“可以调取周五有空的医生资料吗”,根据该历史查询语句确定第一查询结果;当前查询语句例如可以是“请为我筛选出其中的女医生的资料”,根据该当前查询语句从第一查询结果中进行筛选,得到第二查询结果作为目标查询结果,使得输出的目标回答语句的逻辑性更强,用户不需要重复已经提出过的查询条件,提高了通过本申请提供的数据查询方法对结构化数据库进行查询的用户体验。
在一些实施方式中,所述基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果,包括:根据所述目标查询语句,确定查询引导词;基于所述大语言模型,根据所述查询引导词,对结构化数据库中的数据信息进行查询,得到所述数据查询结果。
示例性的,大语言模型通常是通过查询引导词(prompt)来对查询结果的范围进行限缩的。根据所述目标查询语句确定查询引导词,去除目标查询语句,例如可以是基于预设的实体识别算法对目标查询语句进行实体提取的,在此不做限定。
示例性的,将所述查询引导词输入大语言模型,实现对结构化数据库中的数据信息进行查询,得到所述数据查询结果,提高了数据查询结果的准确性以及降低了获取数据查询结果的复杂度。
步骤S103、根据所述目标查询语句,将所述数据查询结果转换为目标回答语句,所述目标回答语句是基于自然语言描述的。
示例性的,为了便于用户对数据查询结果的理解,所述目标回答语句是基于自然语言进行描述的。
示例性的,由于大语言模型还能够用于生成自然语言,将数据查询结果转换为基于自然语言描述的目标回答语句,也可以是基于大语言模型实现的,当然也不限于此,在此不做限定。
示例性的,所述目标回答语句的转换,还需要根据目标查询语句的内容执行。具体地,根据用户在目标查询语句中的提问方式,相应地在目标回答语句中进行回答,以免出现目标回答语句与用户的问题无法对应、答非所问的情况。举例而言,若用户的提问是“张XX医生下午是否有空”,则目标回答语句例如可以是“是的,张XX医生下午有空”;若用户的提问是“张XX医生今天什么时间有空”,则目标回答语句例如可以是“张XX医生今天14:00-16:00有空”,使得目标回答语句与目标查询语句的内容相适应,提高用户体验以及目标回答语句的拟人性。
步骤S104、基于预设的输出格式,输出所述目标回答语句,所述输出格式包括:文本、语音中的至少一者。
示例性的,基于预设输出格式输出目标回答语句,其中预设格式可以是文本格式,直接将步骤S103中得到的目标回答语句以文本的形式输出;预设格式也可以是语音格式,将步骤S103中得到的目标回答语句转换成语音信息后输出,当然也不限于此,所述预设格式也可以是图像,或者也可以同时输出文本格式和语音格式,在此不做限定。
在一些实施方式中,所述方法还包括:获取所述结构化数据库中数据信息对应的字段信息,所述字段信息为所述数据信息的序列标识;对所述字段信息进行向量化,得到所述字段信息对应的字段向量;根据至少一个所述字段向量,确定所述数据信息的数据向量。
示例性的,对所述字段信息进行向量化可以是在将结构化数据库接入大语言模型之前进行的,也可以是在将结构化数据库接入大语言模型之后进行的。具体地,可以是在结构化数据库中的数据信息发生改变时进行的,在此不做限定。
示例性的,为了便于对结构化数据库中的数据进行查询,可以将用于表示数据信息序列特征的字段信息进行向量化,得到字段信息对应的字段向量,而结构化数据库中的数据信息通常是根据一个或多个字段信息确定的,例如根据数据表中的数据行标识和数据列标识确定具体的数据信息,因此,可以根据至少一个字段信息的字段向量确定数据信息对应的数据向量,例如将数据信息对应的至少一个字段向量相加,得到数据信息的数据向量,以便后续根据数据向量对数据信息进行查询。
在一些实施方式中,所述基于所述大语言模型,根据所述查询引导词,对结构化数据库中的数据信息进行查询,得到所述数据查询结果,还包括:根据所述查询引导词,确定对所述结构化数据库进行查询的查询向量;基于所述大语言模型,根据所述查询向量对所述数据向量进行匹配,得到所述数据查询结果。
示例性的,对查询引导词进行向量化,得到对应的查询向量,后续可以根据查询向量对数据向量进行匹配,以便确定数据查询结果。
示例性的,所述根据所述查询向量对所述数据向量进行匹配,例如可以是根据所述查询向量和各个数据向量之间的余弦相似度确定的,当然也不限于此,在此不做限定。
在一些实施方式中,所述方法还包括:获取基于自然语言描述的微调指令;基于所述微调指令,对所述字段信息对应的字段向量进行调整。
示例性的,在用户通过自然语言与大语言模型进行交互的过程中,用户可以对大语言模型进行纠正和引导,例如“我询问的是下周五的排班信息,不是本周五的排班信息”。用于对大语言模型进行纠正和引导的语句可以作为微调指令,帮助大语言模型后续更好地理解用户意图。
示例性的,通过对字段信息对应的字段向量进行调整,提高了本申请实施例数据查询方法的准确性。
请参照图3,图3为本申请另一实施例提供的一种数据查询方法的流程示意图。
如图3所示,对目标查询语句进行抽取得到查询引导词,将查询引导词转换为查询向量,以及获取结构化数据库的字段信息,将字段信息转换为字段向量,根据字段向量确定结构化数据库中数据信息的数据向量,通过大语言模型对查询向量和数据向量进行匹配确定出数据查询结果。
上述实施例提供的数据查询方法,通过接收用于对结构化数据库进行查询的目标查询语句,所述目标查询语句是基于自然语言描述的;基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果;根据所述目标查询语句,将所述数据查询结果转换为目标回答语句,所述目标回答语句是基于自然语言描述的;基于预设的输出格式,输出所述目标回答语句,所述输出格式包括:文本、语音中的至少一者。由于通过大语言模型在结构化数据库中执行数据查询操作,提高了基于自然语言对数据进行查询的查询效率和灵活性。
请参阅图4,图4是本申请一实施例提供的一种数据查询装置的示意图,该数据查询装置可以配置于服务器或终端中,用于执行前述的数据查询方法。
如图4所示,该数据查询装置,包括:查询语句接收模块110、数据库查询模块120、回答语句转换模块130、回答语句输出模块140。
查询语句接收模块110,用于接收用于对结构化数据库进行查询的目标查询语句,所述目标查询语句是基于自然语言描述的;
数据库查询模块120,用于基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果;
回答语句转换模块130,用于根据所述目标查询语句,将所述数据查询结果转换为目标回答语句,所述目标回答语句是基于自然语言描述的;
回答语句输出模块140,用于基于预设的输出格式,输出所述目标回答语句,所述输出格式包括:文本、语音中的至少一者。
示例性的,所述数据查询装置还包括:数据表获取模块、大语言模型连接模块。
数据表获取模块,用于获取所述结构化数据库中的至少一个数据表,以及所述至少一个数据表中的字段信息;
大语言模型连接模块,用于基于预设的大语言模型工具链,根据所述字段信息将所述结构化数据库接入所述大语言模型。
示例性的,数据库查询模块120包括:上下文学习模块。
上下文学习模块,用于基于预设的大语言模型,在第一查询结果中根据所述当前查询语句确定第二查询结果,所述第一查询结果是根据所述历史查询语句确定的。
示例性的,数据库查询模块120还包括:引导词确定模块、数据库查询子模块。
引导词确定模块,用于根据所述目标查询语句,确定查询引导词;
数据库查询子模块,用于基于所述大语言模型,根据所述查询引导词,对结构化数据库中的数据信息进行查询,得到所述数据查询结果。
示例性的,所述数据查询装置还包括:字段信息获取模块、字段信息向量化模块、数据向量确定模块。
字段信息获取模块,用于获取所述结构化数据库中数据信息对应的字段信息,所述字段信息为所述数据信息的序列标识;
字段信息向量化模块,用于对所述字段信息进行向量化,得到所述字段信息对应的字段向量;
数据向量确定模块,用于根据至少一个所述字段向量,确定所述数据信息的数据向量。
示例性的,数据库查询模块120还包括:查询向量确定模块、向量匹配模块。
查询向量确定模块,用于根据所述查询引导词,确定对所述结构化数据库进行查询的查询向量;
向量匹配模块,用于基于所述大语言模型,根据所述查询向量对所述数据向量进行匹配,得到所述数据查询结果。
示例性的,所述数据查询装置还包括:微调指令获取模块、向量调整模块。
微调指令获取模块,用于获取基于自然语言描述的微调指令;
向量调整模块,用于基于所述微调指令,对所述字段信息对应的字段向量进行调整。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块、单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的方法、装置可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
示例性地,上述的方法、装置可以实现为一种计算机程序的形式,该计算机程序可以在如图5所示的计算机设备上运行。
请参阅图5,图5为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为服务器或终端。
如图5所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括存储介质和内存储器。
存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种数据查询方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种数据查询方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
接收用于对结构化数据库进行查询的目标查询语句,所述目标查询语句是基于自然语言描述的;
基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果;
根据所述目标查询语句,将所述数据查询结果转换为目标回答语句,所述目标回答语句是基于自然语言描述的;
基于预设的输出格式,输出所述目标回答语句,所述输出格式包括:文本、语音中的至少一者。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述数据查询的具体工作过程,可以参考前述数据查询控制方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请数据查询方法的各个实施例。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种数据查询方法,其特征在于,所述方法包括:
接收用于对结构化数据库进行查询的目标查询语句,所述目标查询语句是基于自然语言描述的;
基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果;
根据所述目标查询语句,将所述数据查询结果转换为目标回答语句,所述目标回答语句是基于自然语言描述的;
基于预设的输出格式,输出所述目标回答语句,所述输出格式包括:文本、语音中的至少一者。
2.根据权利要求1所述的数据查询方法,其特征在于,所述方法在所述基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果之前,还包括:
获取所述结构化数据库中的至少一个数据表,以及所述至少一个数据表中的字段信息;
基于预设的大语言模型工具链,根据所述字段信息将所述结构化数据库接入所述大语言模型。
3.根据权利要求1所述的数据查询方法,其特征在于,所述目标查询语句包括历史查询语句和当前查询语句;所述基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果,包括:
基于预设的大语言模型,在第一查询结果中根据所述当前查询语句确定第二查询结果,所述第一查询结果是根据所述历史查询语句确定的。
4.根据权利要求1-3任一项所述的数据查询方法,其特征在于,所述基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果,包括:
根据所述目标查询语句,确定查询引导词;
基于所述大语言模型,根据所述查询引导词,对结构化数据库中的数据信息进行查询,得到所述数据查询结果。
5.根据权利要求4所述的数据查询方法,其特征在于,所述方法还包括:
获取所述结构化数据库中数据信息对应的字段信息,所述字段信息为所述数据信息的序列标识;
对所述字段信息进行向量化,得到所述字段信息对应的字段向量;
根据至少一个所述字段向量,确定所述数据信息的数据向量。
6.根据权利要求5所述的数据查询方法,其特征在于,所述基于所述大语言模型,根据所述查询引导词,对结构化数据库中的数据信息进行查询,得到所述数据查询结果,还包括:
根据所述查询引导词,确定对所述结构化数据库进行查询的查询向量;
基于所述大语言模型,根据所述查询向量对所述数据向量进行匹配,得到所述数据查询结果。
7.根据权利要求5所述的数据查询方法,其特征在于,所述方法还包括:
获取基于自然语言描述的微调指令;
基于所述微调指令,对所述字段信息对应的字段向量进行调整。
8.一种数据查询装置,其特征在于,所述数据查询装置包括:
查询语句接收模块,用于接收用于对结构化数据库进行查询的目标查询语句,所述目标查询语句是基于自然语言描述的;
数据库查询模块,用于基于预设的大语言模型,根据所述目标查询语句在所述结构化数据库中执行数据查询操作,得到数据查询结果;
回答语句转换模块,用于根据所述目标查询语句,将所述数据查询结果转换为目标回答语句,所述目标回答语句是基于自然语言描述的;
回答语句输出模块,用于基于预设的输出格式,输出所述目标回答语句,所述输出格式包括:文本、语音中的至少一者。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的数据查询方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的数据查询方法的步骤。
CN202310784237.2A 2023-06-28 2023-06-28 数据查询方法、装置、计算机设备及存储介质 Pending CN116842036A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310784237.2A CN116842036A (zh) 2023-06-28 2023-06-28 数据查询方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310784237.2A CN116842036A (zh) 2023-06-28 2023-06-28 数据查询方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN116842036A true CN116842036A (zh) 2023-10-03

Family

ID=88168287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310784237.2A Pending CN116842036A (zh) 2023-06-28 2023-06-28 数据查询方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN116842036A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056351A (zh) * 2023-10-07 2023-11-14 腾讯科技(深圳)有限公司 Sql语句生成方法、装置及设备
CN117076719A (zh) * 2023-10-12 2023-11-17 北京枫清科技有限公司 一种基于大语言模型的数据库联合查询方法、装置和设备
CN118035320A (zh) * 2024-04-10 2024-05-14 北京枫清科技有限公司 融合数据库的数据查询方法、装置、设备和介质
CN118410069A (zh) * 2024-07-02 2024-07-30 浙江华是科技股份有限公司 基于大语言模型的数据联动方法、系统及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056351A (zh) * 2023-10-07 2023-11-14 腾讯科技(深圳)有限公司 Sql语句生成方法、装置及设备
CN117056351B (zh) * 2023-10-07 2024-02-09 腾讯科技(深圳)有限公司 Sql语句生成方法、装置及设备
CN117076719A (zh) * 2023-10-12 2023-11-17 北京枫清科技有限公司 一种基于大语言模型的数据库联合查询方法、装置和设备
CN117076719B (zh) * 2023-10-12 2024-04-19 北京枫清科技有限公司 一种基于大语言模型的数据库联合查询方法、装置和设备
CN118035320A (zh) * 2024-04-10 2024-05-14 北京枫清科技有限公司 融合数据库的数据查询方法、装置、设备和介质
CN118410069A (zh) * 2024-07-02 2024-07-30 浙江华是科技股份有限公司 基于大语言模型的数据联动方法、系统及装置

Similar Documents

Publication Publication Date Title
CN116842036A (zh) 数据查询方法、装置、计算机设备及存储介质
US20210117776A1 (en) Method, electronic device and computer readable medium for information processing for accelerating neural network training
WO2020253060A1 (zh) 语音识别方法、模型的训练方法、装置、设备及存储介质
CN112084789B (zh) 文本处理方法、装置、设备及存储介质
CN109408526A (zh) Sql语句生成方法、装置、计算机设备及存储介质
CN110298019A (zh) 命名实体识别方法、装置、设备及计算机可读存储介质
US10579835B1 (en) Semantic pre-processing of natural language input in a virtual personal assistant
CN111159343A (zh) 基于文本嵌入的文本相似性搜索方法、装置、设备和介质
US20220261545A1 (en) Systems and methods for producing a semantic representation of a document
CN114298121B (zh) 基于多模态的文本生成方法、模型训练方法和装置
WO2021135455A1 (zh) 语义召回方法、装置、计算机设备及存储介质
CN111274797A (zh) 用于终端的意图识别方法、装置、设备及存储介质
CN112016295A (zh) 症状数据处理方法、装置、计算机设备及存储介质
CN109657251A (zh) 用于翻译语句的方法和装置
CN112084752B (zh) 基于自然语言的语句标注方法、装置、设备及存储介质
CN110569984B (zh) 配置信息生成方法、装置、设备及存储介质
CN112836521A (zh) 问答匹配方法、装置、计算机设备及存储介质
CN112035480A (zh) 数据表管理方法、装置、设备及存储介质
CN116629235A (zh) 大规模预训练语言模型微调方法、装置、电子设备及介质
CN114020888A (zh) 文本生成的方法、装置、设备以及存储介质
CN110992956A (zh) 语音转换的信息处理方法、装置、设备和存储介质
CN116821299A (zh) 智能问答方法、智能问答装置、设备及存储介质
US20220198153A1 (en) Model training
CN111008213A (zh) 用于生成语言转换模型的方法和装置
CN111898363B (zh) 文本长难句的压缩方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination