CN116303558A

CN116303558A - 查询语句生成方法、数据查询方法及生成模型训练方法

Info

Publication number: CN116303558A
Application number: CN202310096051.8A
Authority: CN
Inventors: 惠彬原; 李金阳; 黄非; 李永彬
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2023-01-18
Filing date: 2023-01-18
Publication date: 2023-06-23

Abstract

本说明书实施例提供查询语句生成方法、数据查询方法及生成模型训练方法，其中所述查询语句生成方法包括：接收查询请求；根据目标数据库标识，确定目标数据库的数据库模式；根据查询信息和数据库模式，构建查询结构关系图；将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句。通过将查询结构关系图输入生成模型，在生成模型的编码器中对查询信息和查询结构关系图进行融合编码，有效地在编码器中注入结构信息，提高了生成模型的推理能力，准确生成目标查询语句。

Description

查询语句生成方法、数据查询方法及生成模型训练方法

技术领域

本说明书实施例涉及计算机技术领域，特别涉及一种查询语句生成方法。本说明书一个或者多个实施例同时涉及一种数据查询方法，一种生成模型训练方法，一种查询语句生成装置，一种数据查询装置，一种生成模型训练装置，一种数据查询系统，一种计算设备，一种计算机可读存储介质以及一种计算机程序。

背景技术

随着计算机技术的发展，越来越多的工作和学习任务可以实现自动化处理，计算机技术已经逐步应用于各种日常的教育、学习活动中，例如利用计算机技术实现数据查询，从而大大节省人力资源。

目前，自然语言处理(NLP，Natura l Language Process ing)技术的各种任务都可以在预训练模型的加持下得到了显著提升，然而，这种完全基于深度学习模型(transformer)的结构无法有效考虑数据之间的关联关系，导致模型缺少推理能力，无法生成准确的查询语句(SQL，Structured Query Language)，因此，亟需一种考虑数据之间的关联关系且准确性高的查询语句生成方案。

发明内容

有鉴于此，本说明书实施例提供了一种查询语句生成方法。本说明书一个或者多个实施例同时涉及一种数据查询方法，一种生成模型训练方法，一种查询语句生成装置，一种数据查询装置，一种生成模型训练装置，一种数据查询系统，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面，提供了一种查询语句生成方法，包括：

接收查询请求，其中，查询请求包括查询信息和目标数据库标识；

根据目标数据库标识，确定目标数据库的数据库模式；

根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；

将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句。

根据本说明书实施例的第二方面，提供了一种数据查询方法，包括：

接收用户通过前端输入的查询请求，其中，查询请求包括查询信息和目标数据库标识；

根据目标数据库标识，确定目标数据库的数据库模式；

将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句；

利用目标查询语句，在查询数据库中查找获得查询信息对应的查询结果；

将查询结果发送至前端，以使前端显示查询结果。

根据本说明书实施例的第三方面，提供了一种生成模型训练方法，应用于云侧设备，包括：

获取样本集，其中，样本集包括多个样本查询信息，样本查询信息携带查询标签；

将多个样本查询信息和多个样本查询信息对应的样本结构关系图输入初始生成模型，获得各样本查询信息对应的预测语句，其中，初始生成模型包括编码器和解码器，编码器用于对样本查询信息和样本结构关系图进行融合编码，解码器用于对样本融合特征解码得到预测语句；

根据预测语句和查询标签，对初始生成模型进行训练，获得训练得到的生成模型的模型参数；

向端侧设备发送训练得到的生成模型的模型参数。

根据本说明书实施例的第四方面，提供了一种查询语句生成装置，包括：

第一接收模块，被配置为接收查询请求，其中，查询请求包括查询信息和目标数据库标识；

第一确定模块，被配置为根据目标数据库标识，确定目标数据库的数据库模式；

第一构建模块，被配置为根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；

第一输入模块，被配置为将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句。

根据本说明书实施例的第五方面，提供了一种数据查询装置，包括：

第二接收模块，被配置为接收用户通过前端输入的查询请求，其中，查询请求包括查询信息和目标数据库标识；

第二确定模块，被配置为根据目标数据库标识，确定目标数据库的数据库模式；

第二构建模块，被配置为根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；

第二输入模块，被配置为将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句；

查找模块，被配置为利用目标查询语句，在查询数据库中查找获得查询信息对应的查询结果；

第一发送模块，被配置为将查询结果发送至前端，以使前端显示查询结果。

根据本说明书实施例的第六方面，提供了一种生成模型训练装置，应用于云侧设备，包括：

获取模块，被配置为获取样本集，其中，样本集包括多个样本查询信息，样本查询信息携带查询标签；

第三输入模块，被配置为将多个样本查询信息和多个样本查询信息对应的样本结构关系图输入初始生成模型，获得各样本查询信息对应的预测语句，其中，初始生成模型包括编码器和解码器，编码器用于对样本查询信息和样本结构关系图进行融合编码，解码器用于对样本融合特征解码得到预测语句；

训练模块，被配置为根据预测语句和查询标签，对初始生成模型进行训练，获得训练得到的生成模型的模型参数；

第二发送模块，被配置为向端侧设备发送训练得到的生成模型的模型参数。

根据本说明书实施例的第七方面，提供了一种数据查询系统，该数据查询系统包括客户端和服务端；

客户端，被配置为向服务端发送查询请求，其中，查询请求包括查询信息和目标数据库标识；

服务端，被配置为根据目标数据库标识，确定目标数据库的数据库模式；根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句；利用目标查询语句，在查询数据库中查找获得查询信息对应的查询结果；将查询结果发送至客户端；

客户端，还被配置为显示查询结果。

根据本说明书实施例的第八方面，提供了一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现上述第一方面或者第二方面或者第三方面所提供方法的步骤。

根据本说明书实施例的第九方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该指令被处理器执行时实现上述第一方面或者第二方面或者第三方面所提供方法的步骤。

根据本说明书实施例的第十方面，提供了一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行上述第一方面或者第二方面或者第三方面所提供方法的步骤。

本说明书一个实施例提供的查询语句生成方法，接收查询请求，其中，查询请求包括查询信息和目标数据库标识；根据目标数据库标识，确定目标数据库的数据库模式；根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句。通过将查询结构关系图输入生成模型，在生成模型的编码器中对查询信息和查询结构关系图进行融合编码，有效地在编码器中注入结构信息，提高了生成模型的推理能力，准确生成目标查询语句。

附图说明

图1a是本说明书一个实施例提供的一种查询语句生成系统的框架图；

图1b是本说明书一个实施例提供的一种数据查询系统的框架图；

图2是本说明书一个实施例提供的另一种查询语句生成系统的框架图；

图3是本说明书一个实施例提供的一种查询语句生成方法的流程图；

图4是本说明书一个实施例提供的一种查询结构关系图的示意图；

图5是本说明书一个实施例提供的一种数据查询方法的流程图；

图6是本说明书一个实施例提供的一种生成模型训练方法的流程图；

图7是本说明书一个实施例提供的一种生成模型的训练过程示意图；

图8是本说明书一个实施例提供的一种查询语句生成方法的处理过程流程图；

图9是本说明书一个实施例提供的一种数据查询界面的界面示意图；

图10是本说明书一个实施例提供的一种查询语句生成装置的结构示意图；

图11是本说明书一个实施例提供的一种数据查询装置的结构示意图；

图12是本说明书一个实施例提供的一种生成模型训练装置的结构示意图；

图13是本说明书一个实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本说明书内涵的情况下做类似推广，因此本说明书不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

首先，对本说明书一个或多个实施例涉及的名词术语进行解释。

Tab leQA：一种基于表格知识的人机交互系统

Text-to-SQL：Tab leQA的核心技术，一种语言理解(semant icpars ing)的方式，将人类的自然语句(Text)转换为SQL语句(SQL)

模式链接：特指表格中的模式和自然语言问题中的词中的对应关系

T5(Transfer Text-to-Text Transformer)模型：一种预训练模型，包括encoder和decoder两部分，每部分都由12层的Transformer结构组成。

关系型数据库作为一种重要的资源，在许多领域，如医疗保健、体育和娱乐等领域，因为大数据时代的到来而频繁出现。对于数据用户来说，通过结构化查询语言(SQL，Structured Query Language)访问数据库中的信息是非常有效的。但SQL的复杂性质导致非技术用户的学习成本极高。因此，将自然语言指令或问题转化为SQL查询的文本到SQL(text-to-SQL)，已经引起了工业界和企业界的极大关注。

目前，基于表格知识的人机对话交互系统(Tab leQA)凭借其易用性、可扩展性成为目前学术界和工业界重点关注的热点方向，Tab leQA系统的核心方法是Text-to-SQL。近些年来随着预训练模型的蓬勃发展，自然语言处理(NLP，Natura l Language Processing)技术的各种任务都在预训练模型的加持下得到了显著提升，但是这种完全基于transformer的结构虽然可以有效地利用预训练过程中学习到的丰富知识，但却忽视了文本和数据库模式之间的结构，导致训练得到的模型缺少对输入信息的推理能力，进一步无法生成准确的查询语句(SQL，Structured Query Language)，因此，亟需一种准确性高的查询语句生成方案。

基于此，本说明书实施例提供了一种向预训练模型注入结构信息的查询语句生成方案，将查询信息和数据库模式当作序列输入，比如输入的形式为：(tok1,tok2,...,tok_n,schema1,schema2...schema_n)，但无论是查询文本，还是数据库模式都是天然具有结构的。比如文本拥有句法结构、数据库模式拥有模式结构(外键信息)，而且他们之间的交互，即模式链接(特指表格中的模式和自然语言问题中的词中的对应关系)，也是以结构的方式体现。因此，可以将结构与预训练模型进行结合，提高生成查询语句的准确率，实现仅增加少量参数即可建模结构信息。

具体地，接收查询请求，其中，查询请求包括查询信息和目标数据库标识；根据目标数据库标识，确定目标数据库的数据库模式；根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句。通过将查询结构关系图输入生成模型，在生成模型的编码器中对查询信息和查询结构关系图进行融合编码，有效地在编码器中注入结构信息，提高了生成模型的推理能力，准确生成目标查询语句。

在本说明书中，提供了一种查询语句生成方法，本说明书同时涉及一种数据查询方法，一种生成模型训练方法，一种查询语句生成装置，一种数据查询装置，一种生成模型训练装置，一种数据查询系统，一种计算设备，一种计算机可读存储介质以及一种计算机程序，在下面的实施例中逐一进行详细说明。

参见图1a，图1a示出了本说明书一个实施例提供的一种查询语句生成系统的框架图，其中，查询语句生成系统包括服务端100和客户端200；

客户端200：向服务端100发送查询请求，其中，查询请求包括查询信息和目标数据库标识；

服务端100：根据目标数据库标识，确定目标数据库的数据库模式；根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句；将目标查询语句发送至客户端200；

客户端200：接收服务端100发送的目标查询语句。

应用本说明书实施例的方案，接收查询请求，其中，查询请求包括查询信息和目标数据库标识；根据目标数据库标识，确定目标数据库的数据库模式；根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句。通过将查询结构关系图输入生成模型，在生成模型的编码器中对查询信息和查询结构关系图进行融合编码，有效地在编码器中注入结构信息，提高了生成模型的推理能力，准确生成目标查询语句。

参见图1b，图1b示出了本说明书一个实施例提供的一种数据查询系统的框架图，其中，数据查询系统包括服务端100和客户端200；

服务端100：根据目标数据库标识，确定目标数据库的数据库模式；根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句；利用目标查询语句，在查询数据库中查找获得查询信息对应的查询结果；将查询结果发送至客户端200；

客户端200：接收服务端100发送的查询结果。

应用本说明书实施例的方案，接收用户通过前端输入的查询请求，其中，查询请求包括查询信息和目标数据库标识；根据目标数据库标识，确定目标数据库的数据库模式；根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句；利用目标查询语句，在查询数据库中查找获得查询信息对应的查询结果；将查询结果发送至前端，以使前端显示查询结果。通过将查询结构关系图输入生成模型，在生成模型的编码器中对查询信息和查询结构关系图进行融合编码，有效地在编码器中注入结构信息，提高了生成模型的推理能力，准确生成目标查询语句，进一步获得准确的查询结果。

参见图2，图2示出了本说明书一个实施例提供的另一种查询语句生成系统的框架图，该系统可以包括服务端100以及多个客户端200。多个客户端200之间通过服务端100可以建立通信连接，在查询语句生成场景中，服务端100即用来在多个客户端200之间提供查询语句生成服务，多个客户端200可以分别作为发送端或接收端，通过服务端100实现实时通信。

用户通过客户端200可与服务端100进行交互以接收其它客户端200发送的数据，或将数据发送至其它客户端200等。在查询语句生成场景中，可以是用户通过客户端200向服务端100发布数据流，服务端100根据该数据流生成查询语句，并将查询语句推送至其他建立通信的客户端中。

其中，客户端200与服务端100之间通过网络建立连接。网络为客户端与服务端之间提供了通信链路的介质。网络可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。客户端200所传输的数据可能需要经过编码、转码、压缩等处理之后才发布至服务端100。

客户端200可以为浏览器、APP(App l icat ion，应用程序)、或网页应用如H5(HyperText Markup Language5，超文本标记语言第5版)应用、或轻应用(也被称为小程序，一种轻量级应用程序)或云应用等，客户端200可以基于服务端提供的相应服务的软件开发工具包(SDK，Software Deve lopment Kit)，如基于实时通信(RTC，Rea l Time Communicat ion)SDK开发获得等。客户端200可以部署在电子设备中，需要依赖设备运行或者设备中的某些APP而运行等。电子设备例如可以具有显示屏并支持信息浏览等，如可以是个人移动终端如手机、平板电脑、个人计算机等。在电子设备中通常还可以配置各种其它类应用，例如人机对话类应用、模型训练类应用、文本处理类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

服务端100可以包括提供各种服务的服务器，例如为多个客户端提供通信服务的服务器，又如为客户端上使用的模型提供支持的用于后台训练的服务器，又如对客户端发送的数据进行处理的服务器等。需要说明的是，服务端100可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。服务器也可以是云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN，Content De l iveryNetwork)、以及大数据和人工智能平台等基础云计算服务的云服务器，或者是带人工智能技术的智能云计算服务器或智能云主机。

值得说明的是，本说明书实施例中提供的查询语句生成方法一般由服务端执行，但是，在本说明书的其它实施例中，客户端也可以与服务端具有相似的功能，从而执行本说明书实施例所提供的查询语句生成方法。在其它实施例中，本说明书实施例所提供的查询语句生成方法还可以是由客户端与服务端共同执行。

参见图3，图3示出了本说明书一个实施例提供的一种查询语句生成方法的流程图，具体包括以下步骤：

步骤302：接收查询请求，其中，查询请求包括查询信息和目标数据库标识。

本说明书一个或多个实施例中，可以接收查询请求，根据查询请求中携带的查询信息和目标数据库标识，确定查询请求对应的查询内容以及查询内容所在的数据库，进一步准确生成查询请求对应的查询语句。

具体地，查询信息是指用于查询目标数据库的信息，查询信息可以是多种形式，如查询文本、查询音频等等，具体根据实际情况进行选择，本说明书实施例对此不作任何限定。目标数据库标识用于唯一表示目标数据库，目标数据库标识可以是目标数据库的数据库身份标识号(I D，Ident ity Document)，如0001，还可以是目标数据库的数据库地址，具体根据实际情况进行选择，本说明书实施例对此不作任何限定。

实际应用中，接收查询请求的方式有多种，具体根据实际情况进行选择，本说明书实施例对此不作任何限定。本说明书一种可能的实现方式中，可以接收用户主动通过前端发送的查询请求。本说明书另一种可能的实现方式中，可以向前端发送查询语句生成提示，前端显示该提示，用户看到该提示之后，可以通过前端发送查询请求。

步骤304：根据目标数据库标识，确定目标数据库的数据库模式。

本说明书一个或多个实施例中，接收查询请求之后，进一步地，可以根据目标数据库标识，确定目标数据库的数据库模式。

具体地，数据库模式(Schema)也称逻辑模式，是数据库中全体数据的逻辑结构和特征的描述，特指数据库表格中的表名、列名、值等信息，一个数据库只有一个模式。

实际应用中，根据目标数据库标识，确定目标数据库的数据库模式的方式有多种，具体根据实际情况进行选择，本说明书实施例对此不作任何限定。

本说明书一种可能的实现方式中，可以直接查找目标数据库标识对应的数据库模式。

本说明书另一种可能的实现方式中，由于数据库模式的信息量较大，直接存储数据库标识与数据库模式之间的对应关系会消耗大量资源，因此，可以先根据目标数据库标识确定目标数据库，进一步提取目标数据库的数据库模式，也即，上述根据目标数据库标识，确定目标数据库的数据库模式，可以包括以下步骤：

查找目标数据库标识对应的目标数据库；

对目标数据库的数据库结构进行分析，确定目标数据库的数据库模式，其中，数据库模式包括数据库对象和数据库对象之间的关联关系。

具体地，数据库天然拥有模式结构，模式结构也可理解为外键信息，外键就是一个表中的一个字段引用了另一个表中的主键，引用的表叫做子表，被引用的表叫做主表，外键是一种约束，描述的是表之间的关系。

需要说明的是，查找目标数据库标识对应的目标数据库的方式有多种，具体根据实际情况进行选择，本说明书实施例对此不作任何限定。本说明书一种可能的实现方式中，可以依次查看所有数据库的标识，将各数据库的标识与目标数据库标识进行对比，将标识与目标数据库标识相同的数据库确定为目标数据库。本说明书另一种可能的实现方式中，可以直接根据目标数据库标识，查找标识与目标数据库标识相同的数据库，将该数据库确定为目标数据库。

进一步地，在确定目标数据库之后，可以直接获取预先存储的目标数据库的数据库模式。当然，还可以对目标数据库的数据库结构进行分析，确定目标数据库的数据库模式。具体地，可以分析数据库中各个记录的组成、相互关系、数据项的特征、数据的安全性、完整性约束条件等信息，确定目标数据库的数据库模式。

应用本说明书实施例的方案，查找目标数据库标识对应的目标数据库；对目标数据库的数据库结构进行分析，确定目标数据库的数据库模式，其中，数据库模式包括数据库对象和数据库对象之间的关联关系，实现了准确确定数据库模式，为后续构建准确的查询结构关系图做准备。

步骤306：根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系。

本说明书一个或多个实施例中，接收查询请求，根据目标数据库标识，确定目标数据库的数据库模式之后，进一步地，可以根据查询信息和数据库模式，构建查询结构关系图。

实际应用中，在确定数据库模式后，可以根据数据库模式确定数据库中的数据库对象，进一步根据查询信息的结构关系、数据库对象之间的关联关系、查询信息和数据库对象之间的关键关系构建查询结构关系图，也即，上述根据查询信息和数据库模式，构建查询结构关系图，可以包括以下步骤：

提取查询信息中的至少一个关键词；

以至少一个关键词和数据库模式中的数据库对象为节点，至少一个关键词之间的关联关系、数据库对象之间的关联关系和至少一个关键词与数据库对象之间的关联关系为边，构建查询结构关系图。

本说明书实施例中，若查询信息为音频形式，则可以将查询音频转换为查询文本，以便于确定查询信息的结构关系。其中，将查询音频转换为查询文本的方式有多种，可以利用音频文本转换工具，还可以由人工进行转换，将音频转换为文本的方式具体根据实际情况进行选择，本说明书实施例对此不作任何限定。

需要说明的是，提取查询信息中的至少一个关键词的方式有多种，具体根据实际情况进行选择，本说明书实施例对此不作任何限定。本说明书一种可能的实现方式中，可以将查询文本与预先构建的关键词库进行匹配，确定查询文本中的至少一个关键词。本说明书另一种可能的实现方式中，可以利用预先训练的关键词提取模型，从查询信息中提取至少一个关键词，其中，关键词提取模型基于多个样本信息、各样本信息对应的关键词标签训练得到。

应用本说明书实施例的方案，提取查询信息中的至少一个关键词；以至少一个关键词和数据库模式中的数据库对象为节点，至少一个关键词之间的关联关系、数据库对象之间的关联关系和至少一个关键词与数据库对象之间的关联关系为边，构建查询结构关系图，提高了查询结构关系图的准确性，进一步实现了有效地在编码器中注入结构信息，提高了生成模型的推理能力，准确生成目标查询语句。

本说明书一种可选的实施例中，以至少一个关键词和数据库模式中的数据库对象为节点，至少一个关键词之间的关联关系、数据库对象之间的关联关系和至少一个关键词与数据库对象之间的关联关系为边，构建的查询结构关系图，不一定能覆盖所有结构关系。传统方案，可以直接加入非关联(No-Match)的边来表示，但这样会导致边的数量非常多，存在(NxM)的空间复杂度，并且，边的数量多会造成运算量加剧，并且导致过拟合，其中，N为查询信息的长度，M为数据库模式的长度。为了解决上述问题，使得查询结构关系图具有更高的鲁棒性，可以引入桥接节点，也可以理解为虚拟节点，当两个节点不存在连接的时候，就和桥接节点相连，这样就将复杂度降低为了N+M，也即，上述以至少一个关键词和数据库模式中的数据库对象为节点，至少一个关键词之间的关联关系、数据库对象之间的关联关系和至少一个关键词与数据库对象之间的关联关系为边，构建查询结构关系图之后，还可以包括以下步骤：

在查询结构关系图中增加桥接节点；

通过桥接节点连接查询结构关系图中的第一节点和第二节点，获得更新后的查询结构关系图，其中，第一节点和第二节点为查询结构关系图中不存在边的两个节点。

参见图4，图4示出了本说明书一个实施例提供的一种查询结构关系图的示意图，其中，(a)为传统方案中加入No-Match获得的查询结构关系图，(b)为增加桥接节点(黑色实心圆)获得的查询结构关系图，可见，(b)比(a)更加简洁，从而可以有效降低生成模型的计算量，提高查询语句生成的效率。

应用本说明书实施例的方案，在查询结构关系图中增加桥接节点；通过桥接节点连接查询结构关系图中的第一节点和第二节点，获得更新后的查询结构关系图，其中，第一节点和第二节点为查询结构关系图中不存在边的两个节点，减少了查询结构关系图的复杂度，有效降低生成模型的计算量，提高查询语句生成的效率。

步骤308：将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句。

本说明书一个或多个实施例中，接收查询请求，根据目标数据库标识，确定目标数据库的数据库模式，根据查询信息和数据库模式，构建查询结构关系图之后，进一步地，可以将查询信息和查询结构关系图输入生成模块，获得查询信息对应的目标查询语句。

具体地，生成模型可以是包括编码器和解码器的模型，如T5(Transfer Text-to-Text Transformer)模型。目标查询语句是一种计算机语言，用来存储、检索和修改关系型数据库中存储的数据。

本说明书一种可选的实施例中，为了将查询结构关系图准确注入生成模型，在生成模型中，可以增加图处理层，在保留生成模型编码层参数的同时，增加新的结构信息，也即，上述编码器包括图处理层和多个编码层；将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，可以包括以下步骤：

将查询结构关系图输入图处理层，获得查询结构关系图对应的结构特征；

针对任一编码层，基于结构特征和上一编码层输出的查询特征，确定本层的输出，其中，第一层的输入为查询信息，最后一层的输出为融合编码特征；

将融合编码特征输入解码器中，获得查询信息对应的目标查询语句。

需要说明的是，生成模型由编码器-解码器(encoder-deocder)结构组成，编码器和解码器各由12层的transformer结构组成。

应用本说明书实施例的方案，将查询结构关系图输入图处理层，获得查询结构关系图对应的结构特征；针对任一编码层，基于结构特征和上一编码层输出的查询特征，确定本层的输出，其中，第一层的输入为查询信息，最后一层的输出为融合编码特征；将融合编码特征输入解码器中，获得查询信息对应的目标查询语句，实现了将图结构信息注入编码器中，提高了目标查询语句的准确性。

本说明书一种可选的实施例中，上述将查询结构关系图输入图处理层，获得查询结构关系图对应的结构特征，可以包括以下步骤：

将查询结构关系图输入图处理层，经图处理层的映射处理，获得初始结构特征、键向量和值向量；

根据初始结构特征、键向量和值向量，确定查询结构关系图对应的结构特征。

需要说明的是，确定查询结构关系图对应的结构特征时，是在计算键向量和值向量的过程中加入结构信息映射得到的初始结构特征，从而实现将结构信息注入到生成模型中。其中，查询结构关系图对应的结构特征的计算逻辑如下：

其中，e_i、e_j为token表示，W为可学习的参数，r_ij是结构信息，Q是查询向量，K是键向量，V为值向量，Φ将r_ij映射到一个具体向量，

为归一化因子，N_i代表i节点的邻居节点(有边相连)，Softmax，LayerNorm为函数，FFN为线性映射层。

应用本说明书实施例的方案，将查询结构关系图输入图处理层，经图处理层的映射处理，获得初始结构特征、键向量和值向量；根据初始结构特征、键向量和值向量，确定查询结构关系图对应的结构特征,提高了结构特征的准确性。

本说明书一种可选的实施例中，上述基于结构特征和上一编码层输出的查询特征，确定本层的输出，可以包括以下步骤：

将查询信息输入多个编码层中的第一层，获得查询信息对应的查询特征；

合并查询特征和结构特征，获得更新后的查询特征，并将更新后的查询特征输入下一编码层，获得下一编码层的输出的查询特征，返回执行合并查询特征和结构特征，获得更新后的查询特征的步骤，直至最后一个编码层输出融合编码特征。

需要说明的是，可以通过以下公式合并查询特征和结构特征：

其中，

为每一层编码层的输出向量，也即查询特征，/>

为结构学习的输出向量，也即结构特征。

应用本说明书实施例的方案，将查询信息输入多个编码层中的第一层，获得查询信息对应的查询特征；合并查询特征和结构特征，获得更新后的查询特征，并将更新后的查询特征输入下一编码层，获得下一编码层的输出的查询特征，返回执行合并查询特征和结构特征，获得更新后的查询特征的步骤，直至最后一个编码层输出融合编码特征，提高了融合编码特征的准确性。

本说明书一种可选的实施例中，生成模型的训练方式，可以包括以下步骤：

从样本集中提取第一样本查询信息，其中，第一样本查询信息为样本集中的任一个；

将第一样本查询信息和第一样本查询信息对应的第一样本结构关系图输入初始生成模型，获得第一样本查询信息对应的第一预测语句，其中，初始生成模型包括编码器和解码器，编码器用于对第一样本查询信息和第一样本结构关系图进行融合编码，解码器用于对样本融合特征解码得到第一预测语句；

根据第一预测语句和第一样本查询信息携带的第一查询标签，计算第一损失值；

根据第一损失值，调整初始生成模型的模型参数，并返回执行从样本集中提取第一样本查询信息的步骤，直至达到预设停止条件，获得生成模型。

实际应用中，获取样本集的方式有多种，可以是人工输入大量样本查询信息组成样本集，也可以是从其他数据获取设备或者数据库中读取大量样本查询信息组成样本集，获取样本集的方式具体根据实际情况进行选择，本说明书实施例对此不作任何限定。

进一步地，根据第一预测语句和第一样本查询信息携带的第一查询标签对初始生成模型进行训练时，可以根据第一预测语句和第一查询标签计算第一损失值，根据第一损失值，调整初始生成模型的模型参数，并返回执行从样本集中提取第一样本查询信息的步骤，在达到预设停止条件的情况下，获得训练后的生成模型的模型参数。

本说明书一种可能的实现方式中，预设停止条件包括第一损失值小于或等于第一预设阈值，其中，第一预设阈值具体根据实际情况进行选择，本说明书实施例对此不作任何限定。将第一样本查询信息和第一样本查询信息对应的第一样本结构关系图输入初始生成模型，获得第一样本查询信息对应的第一预测语句，在得到第一预测语句后，根据第一预测语句和第一查询标签，计算第一损失值，将第一损失值与第一预设阈值进行比较。

具体地，若第一损失值大于第一预设阈值，则说明第一预测语句和第一查询标签的差异较大，初始生成模型对于查询语句的预测能力较差，此时可以调整初始生成模型的模型参数，并返回执行从样本集中提取第一样本查询信息的步骤，继续对初始生成模型进行训练，直至第一损失值小于或等于第一预设阈值，说明第一预测语句和第一查询标签的差异较小，达到预设停止条件，获得完成训练的生成模型的模型参数。

本说明书另一种可能的实现方式中，除了比较第一损失值和第一预设阈值的大小关系之外，还可以结合迭代次数，确定当前的初始生成模型是否训练完成。

具体地，若第一损失值大于第一预设阈值，则调整初始生成模型的参数，并返回执行从样本集中提取第一样本查询信息的步骤，继续对初始生成模型进行训练，在达到第一预设迭代次数的情况下，停止迭代，得到完成训练的生成模型，其中，第一预设迭代次数具体根据实际情况进行选择，本说明书实施例对此不作任何限定。

实际应用中，计算第一损失值的函数有很多，如交叉熵损失函数、L1范数损失函数、最大损失函数、均方误差损失函数、对数损失函数等，具体根据实际情况进行选择，本说明书实施例对此不作任何限定。优选地，可以利用交叉熵损失函数计算第一损失值，通过利用交叉熵损失函数，计算第一预测语句和第一查询标签的交叉熵作为第一损失值，提高了计算第一损失值的效率，从而提高了初始生成模型的训练效率。

应用本说明书实施例的方案，获取样本集，其中，样本集包括多个样本查询信息，样本查询信息携带查询标签；从样本集中提取第一样本查询信息，其中，第一样本查询信息为样本集中的任一个；将第一样本查询信息和第一样本查询信息对应的第一样本结构关系图输入初始生成模型，获得第一样本查询信息对应的第一预测语句，其中，初始生成模型包括编码器和解码器，编码器用于对第一样本查询信息和第一样本结构关系图进行融合编码，解码器用于对样本融合特征解码得到第一预测语句；根据第一预测语句和第一样本查询信息携带的第一查询标签，计算第一损失值；根据第一损失值，调整初始生成模型的模型参数，并返回执行从样本集中提取第一样本查询信息的步骤，直至达到预设停止条件，获得生成模型。通过不断对初始生成模型的模型参数进行调整，使得最终得到的生成模型更加精准，并且，引入图学习中的参数，生成模型的能力没有很大的损伤，可以“缓解”灾难性遗忘。

下述结合附图5，以本说明书提供的查询语句生成方法在数据查询领域的应用为例，对所述查询语句生成方法进行进一步说明。其中，图5示出了本说明书一个实施例提供的一种数据查询方法的流程图，具体包括以下步骤：

步骤502：接收用户通过前端输入的查询请求，其中，查询请求包括查询信息和目标数据库标识。

步骤504：根据目标数据库标识，确定目标数据库的数据库模式。

步骤506：根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系。

步骤508：将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句。

步骤510：利用目标查询语句，在查询数据库中查找获得查询信息对应的查询结果。

步骤512：将查询结果发送至前端，以使前端显示查询结果。

需要说明的是，步骤502、步骤504、步骤506、步骤508的具体实现方式与上述步骤502、步骤504、步骤506、步骤508相同，本说明书实施例便不再进行赘述。

进一步地，在获得查询信息对应的目标查询语句之后，可以检查查询缓存，如果命中了缓存，则返回存储在缓存中的查询结果，将查询结果发送至前端，以使前端显示查询结果。

参见图6，图6示出了本说明书一个实施例提供的一种生成模型训练方法的流程图，生成模型训练方法应用于云侧设备，具体包括以下步骤：

步骤602：获取样本集，其中，样本集包括多个样本查询信息，样本查询信息携带查询标签。

步骤604：将多个样本查询信息和多个样本查询信息对应的样本结构关系图输入初始生成模型，获得各样本查询信息对应的预测语句。

其中，初始生成模型包括编码器和解码器，编码器用于对样本查询信息和样本结构关系图进行融合编码，解码器用于对样本融合特征解码得到预测语句。

步骤606：根据预测语句和查询标签，对初始生成模型进行训练，获得训练得到的生成模型的模型参数。

步骤608：向端侧设备发送训练得到的生成模型的模型参数。

需要说明的是，步骤602、步骤604、步骤606的具体实现方式与上述图3中所提供的生成模型的训练方式相同，本说明书实施例便不再进行赘述。

进一步地，云侧设备获得生成模型的模型参数之后，可以将生成模型的模型参数发送至端侧设备，端侧设备接收到生成模型的模型参数之后，可以根据生成模型的模型参数还原得到生成模型，进一步在本地实现查询语句的生成。

应用本说明书实施例的方案，获取样本集，其中，样本集包括多个样本查询信息，样本查询信息携带查询标签；将多个样本查询信息和多个样本查询信息对应的样本结构关系图输入初始生成模型，获得各样本查询信息对应的预测语句，其中，初始生成模型包括编码器和解码器，编码器用于对样本查询信息和样本结构关系图进行融合编码，解码器用于对样本融合特征解码得到预测语句；根据预测语句和查询标签，对初始生成模型进行训练，获得训练得到的生成模型的模型参数；向端侧设备发送训练得到的生成模型的模型参数。通过将样本结构关系图输入初始生成模型，在初始生成模型的编码器中对样本查询信息和样本查询结构关系图进行融合编码，有效地在编码器中注入结构信息，提高了初始生成模型的推理能力，从而获得准确性更高的生成模型。

本说明书一种可选的实施例中，将多个样本查询信息和多个样本查询信息对应的样本结构关系图输入初始生成模型，获得各样本查询信息对应的预测语句之前，还可以包括以下步骤：

针对任一样本查询信息，提取样本查询信息中的至少一个样本关键词；

确定样本查询信息对应的样本数据库的样本数据库模式；

以至少一个样本关键词和样本数据库模式中的样本数据库对象为节点，至少一个样本关键词之间的关联关系、样本数据库对象之间的关联关系和至少一个样本关键词与样本数据库对象之间的关联关系为边，构建样本查询信息对应的样本结构关系图。

需要说明的是，上述“提取样本查询信息中的至少一个样本关键词”的具体实现方式，与上述“提取查询信息中的至少一个关键词”的实现方式相同。上述“以至少一个样本关键词和样本数据库模式中的样本数据库对象为节点，至少一个样本关键词之间的关联关系、样本数据库对象之间的关联关系和至少一个样本关键词与样本数据库对象之间的关联关系为边，构建样本查询信息对应的样本结构关系图”的具体实现方式，与上述“以至少一个关键词和数据库模式中的数据库对象为节点，至少一个关键词之间的关联关系、数据库对象之间的关联关系和至少一个关键词与数据库对象之间的关联关系为边，构建查询结构关系图”的实现方式相同，本说明书实施例便不再进行赘述。

实际应用中，确定样本查询信息对应的样本数据库的样本数据库模式时，可以根据样本查询信息携带的样本数据库标识确定，进一步地，上述“确定样本查询信息对应的样本数据库的样本数据库模式”的具体实现方式，与上述“根据目标数据库标识，确定目标数据库的数据库模式”的实现方式相同，本说明书实施例便不再进行赘述。

应用本说明书实施例的方案，针对任一样本查询信息，提取样本查询信息中的至少一个样本关键词；确定样本查询信息对应的样本数据库的样本数据库模式；以至少一个样本关键词和样本数据库模式中的样本数据库对象为节点，至少一个样本关键词之间的关联关系、样本数据库对象之间的关联关系和至少一个样本关键词与样本数据库对象之间的关联关系为边，构建样本查询信息对应的样本结构关系图。提高了样本结构关系图的准确性，进一步实现了有效地在编码器中注入结构信息，提高了生成模型训练过程的准确性。

参见图7，图7示出了本说明书一个实施例提供的一种生成模型的训练过程示意图，获取样本集，其中，样本集包括多个样本查询信息，样本查询信息携带查询标签；针对任一样本查询信息，提取样本查询信息中的至少一个样本关键词；确定样本查询信息对应的样本数据库的样本数据库模式；以至少一个样本关键词和样本数据库模式中的样本数据库对象为节点，至少一个样本关键词之间的关联关系、样本数据库对象之间的关联关系和至少一个样本关键词与样本数据库对象之间的关联关系为边，构建样本查询信息对应的样本结构关系图。将多个样本查询信息对应的样本结构关系图输入初始生成模型的图处理层，获得各样本结构关系图对应的样本结构特征。将多个样本查询信息输入初始生成模型的多个编码层中的第一层，获得样本查询信息对应的样本查询特征；合并样本查询特征和样本结构特征，获得更新后的样本查询特征，并将更新后的样本查询特征输入下一编码层，获得下一编码层的输出的样本查询特征，返回执行合并样本查询特征和样本结构特征，获得更新后的样本查询特征的步骤，直至最后一个编码层输出样本融合编码特征。将样本融合编码特征输入解码器中的多个解码层中，获得各样本查询信息对应的预测语句；根据各样本查询信息对应的预测语句和查询标签，对初始生成模型进行训练，获得训练得到的生成模型的模型参数。

参见图8，图8示出了本说明书一个实施例提供的一种查询语句生成方法的处理过程流程图，接收查询请求，其中，查询请求包括查询信息“Find the number of dog petsthat are rai sed by fema le students”和目标数据库标识“00001”；根据目标数据库标识，确定目标数据库00001的数据库模式，其中，数据库模式包括Pets(宠物)表、Has_Pet(拥有宠物)表、Student(学生)表，Student表中包括stu I D列、Sex列、Age列，Pets表中包括Pet I D列、PetType列、Pet_age列，Has_Pet表中包括stu I D列、Pet I D列。如图8所示，直接建立fema le(女性)是sex之间的关系是困难的。但是在查询结构关系图中，fema le和student是MOD句法结构连接，student和student可以直接通过规则链接的结构连接，Student和Sex是模式结构连接(同属于一张表)，通过这样的传递，就能建立fema le和sex之间的所需的连接，进一步生成正确的SQL。也即，根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句“SELECT count(*)FROM student AS TI JOIN has pet AS T2 ON T1.stu id＝T2.stu id JOI N pets AST3 ON T2.pet id＝T3.pet id WHERE T1.sex＝'F'AND T3.pettype＝'dog'”。其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句。

参见图9，图9示出了本说明书一个实施例提供的一种数据查询界面的界面示意图，数据查询界面包括查询请求上传界面和查询结果展示界面，查询请求上传界面中包括查询请求上传框、“确定”控件以及“取消”控件，查询结果展示界面包括查询结果展示框。用户在查询请求上传框中上传查询请求，点选“确定”控件，前端将查询请求发送至服务端。服务端根据目标数据库标识，确定目标数据库的数据库模式，根据查询信息和数据库模式，构建查询结构关系图，将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，利用目标查询语句，在查询数据库中查找获得查询信息对应的查询结果，并将查询结果发送至前端，以使前端在查询结果展示框中展示查询结果。

需要说明的是，用户对控件进行操作的方式包括点击、双击、触控、鼠标悬停、滑动、长按、语音控制或摇一摇等任一方式，具体根据实际情况进行选择，本说明书实施例对此不作任何限定。

需要说明的是，上述方法实施例中所涉及的查询信息、目标数据库标识、样本查询信息、初始生成模型等信息和数据，均为经用户授权或者经过各方充分授权的信息和数据，并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准，并提供有相应的操作入口，供用户选择授权或者拒绝。

与上述查询语句生成方法实施例相对应，本说明书还提供了查询语句生成装置实施例，图10示出了本说明书一个实施例提供的一种查询语句生成装置的结构示意图。如图10所示，该装置包括：

第一接收模块1002，被配置为接收查询请求，其中，查询请求包括查询信息和目标数据库标识；

第一确定模块1004，被配置为根据目标数据库标识，确定目标数据库的数据库模式；

第一构建模块1006，被配置为根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；

第一输入模块1008，被配置为将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句。

可选地，第一确定模块1004，进一步被配置为查找目标数据库标识对应的目标数据库；对目标数据库的数据库结构进行分析，确定目标数据库的数据库模式，其中，数据库模式包括数据库对象和数据库对象之间的关联关系。

可选地，第一构建模块1006，进一步被配置为提取查询信息中的至少一个关键词；以至少一个关键词和数据库模式中的数据库对象为节点，至少一个关键词之间的关联关系、数据库对象之间的关联关系和至少一个关键词与数据库对象之间的关联关系为边，构建查询结构关系图。

可选地，第一构建模块1006，进一步被配置为在查询结构关系图中增加桥接节点；通过桥接节点连接查询结构关系图中的第一节点和第二节点，获得更新后的查询结构关系图，其中，第一节点和第二节点为查询结构关系图中不存在边的两个节点。

可选地，编码器包括图处理层和多个编码层；第一输入模块1008，进一步被配置为将查询结构关系图输入图处理层，获得查询结构关系图对应的结构特征；针对任一编码层，基于结构特征和上一编码层输出的查询特征，确定本层的输出，其中，第一层的输入为查询信息，最后一层的输出为融合编码特征；将融合编码特征输入解码器中，获得查询信息对应的目标查询语句。

可选地，第一输入模块1008，进一步被配置为将查询结构关系图输入图处理层，经图处理层的映射处理，获得初始结构特征、键向量和值向量；根据初始结构特征、键向量和值向量，确定查询结构关系图对应的结构特征。

可选地，第一输入模块1008，进一步被配置为将查询信息输入多个编码层中的第一层，获得查询信息对应的查询特征；合并查询特征和结构特征，获得更新后的查询特征，并将更新后的查询特征输入下一编码层，获得下一编码层的输出的查询特征，返回执行合并查询特征和结构特征，获得更新后的查询特征的步骤，直至最后一个编码层输出融合编码特征。

可选地，该装置还包括：生成模型训练模块，被配置为获取样本集，其中，样本集包括多个样本查询信息，样本查询信息携带查询标签；从样本集中提取第一样本查询信息，其中，第一样本查询信息为样本集中的任一个；将第一样本查询信息和第一样本查询信息对应的第一样本结构关系图输入初始生成模型，获得第一样本查询信息对应的第一预测语句，其中，初始生成模型包括编码器和解码器，编码器用于对第一样本查询信息和第一样本结构关系图进行融合编码，解码器用于对样本融合特征解码得到第一预测语句；根据第一预测语句和第一样本查询信息携带的第一查询标签，计算第一损失值；根据第一损失值，调整初始生成模型的模型参数，并返回执行从样本集中提取第一样本查询信息的步骤，直至达到预设停止条件，获得生成模型。

上述为本实施例的一种查询语句生成装置的示意性方案。需要说明的是，该查询语句生成装置的技术方案与上述的查询语句生成方法的技术方案属于同一构思，查询语句生成装置的技术方案未详细描述的细节内容，均可以参见上述查询语句生成方法的技术方案的描述。

与上述数据查询方法实施例相对应，本说明书还提供了数据查询装置实施例，图11示出了本说明书一个实施例提供的一种数据查询装置的结构示意图。如图11所示，该装置包括：

第二接收模块1102，被配置为接收用户通过前端输入的查询请求，其中，查询请求包括查询信息和目标数据库标识；

第二确定模块1104，被配置为根据目标数据库标识，确定目标数据库的数据库模式；

第二构建模块1106，被配置为根据查询信息和数据库模式，构建查询结构关系图，其中，查询结构关系图表征查询信息和数据库模式之间的关联关系；

第二输入模块1108，被配置为将查询信息和查询结构关系图输入生成模型，获得查询信息对应的目标查询语句，其中，生成模型包括编码器和解码器，编码器用于对查询信息和查询结构关系图进行融合编码，解码器用于对融合编码特征解码得到目标查询语句；

查找模块1110，被配置为利用目标查询语句，在查询数据库中查找获得查询信息对应的查询结果；

第一发送模块1112，被配置为将查询结果发送至前端，以使前端显示查询结果。

上述为本实施例的一种数据查询装置的示意性方案。需要说明的是，该数据查询装置的技术方案与上述的数据查询方法的技术方案属于同一构思，数据查询装置的技术方案未详细描述的细节内容，均可以参见上述数据查询方法的技术方案的描述。

与上述生成模型训练方法实施例相对应，本说明书还提供了生成模型训练装置实施例，图12示出了本说明书一个实施例提供的一种生成模型训练装置的结构示意图。如图12所示，该装置包括：

获取模块1202，被配置为获取样本集，其中，样本集包括多个样本查询信息，样本查询信息携带查询标签；

第三输入模块1204，被配置为将多个样本查询信息和多个样本查询信息对应的样本结构关系图输入初始生成模型，获得各样本查询信息对应的预测语句，其中，初始生成模型包括编码器和解码器，编码器用于对样本查询信息和样本结构关系图进行融合编码，解码器用于对样本融合特征解码得到预测语句；

训练模块1206，被配置为根据预测语句和查询标签，对初始生成模型进行训练，获得训练得到的生成模型的模型参数；

第二发送模块1208，被配置为向端侧设备发送训练得到的生成模型的模型参数。

可选地，该装置还包括：第三构建模块，被配置为针对任一样本查询信息，提取样本查询信息中的至少一个样本关键词；确定样本查询信息对应的样本数据库的样本数据库模式；以至少一个样本关键词和样本数据库模式中的样本数据库对象为节点，至少一个样本关键词之间的关联关系、样本数据库对象之间的关联关系和至少一个样本关键词与样本数据库对象之间的关联关系为边，构建样本查询信息对应的样本结构关系图。

上述为本实施例的一种生成模型训练装置的示意性方案。需要说明的是，该生成模型训练装置的技术方案与上述的生成模型训练方法的技术方案属于同一构思，生成模型训练装置的技术方案未详细描述的细节内容，均可以参见上述生成模型训练方法的技术方案的描述。

图13示出了本说明书一个实施例提供的一种计算设备的结构框图。该计算设备1300的部件包括但不限于存储器1310和处理器1320。处理器1320与存储器1310通过总线1330相连接，数据库1350用于保存数据。

计算设备1300还包括接入设备1340，接入设备1340使得计算设备1300能够经由一个或多个网络1360通信。这些网络的示例包括公用交换电话网(PSTN，Pub l ic SwitchedTe lephone Network)、局域网(LAN，Loca l Area Network)、广域网(WAN，Wide AreaNetwork)、个域网(PAN，Persona l Area Network)或诸如因特网的通信网络的组合。接入设备1340可以包括有线或无线的任何类型的网络接口(例如，网络接口卡(NIC，Network Interface Card))中的一个或多个，诸如I EEE802.11无线局域网(WLAN，Wi re less Local Area Networks)无线接口、全球微波互联接入(Wi-MAX，Wor ld I nteroperabi l ityfor Microwave Access)接口、以太网接口、通用串行总线(USB，Un iversa l Ser ia lBus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC，Near Fie ld Commun icat ion)接口，等等。

在本说明书的一个实施例中，计算设备1300的上述部件以及图13中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图13所示的计算设备结构框图仅仅是出于示例的目的，而不是对本说明书范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备1300可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备(例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如，智能手机)、可佩戴的计算设备(例如，智能手表、智能眼镜等)或其他类型的移动设备，或者诸如台式计算机或个人计算机(PC，Persona l Computer)的静止计算设备。计算设备1300还可以是移动式或静止式的服务器。

其中，处理器1320用于执行如下计算机可执行指令，该计算机可执行指令被处理器执行时实现上述查询语句生成方法或者数据查询方法或者生成模型训练方法的步骤。

上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的查询语句生成方法、数据查询方法和生成模型训练方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述查询语句生成方法或者数据查询方法或者生成模型训练方法的技术方案的描述。

本说明书一实施例还提供一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现上述查询语句生成方法或者数据查询方法或者生成模型训练方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的查询语句生成方法、数据查询方法和生成模型训练方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述查询语句生成方法或者数据查询方法或者生成模型训练方法的技术方案的描述。

本说明书一实施例还提供一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行上述查询语句生成方法或者数据查询方法或者生成模型训练方法的步骤。

上述为本实施例的一种计算机程序的示意性方案。需要说明的是，该计算机程序的技术方案与上述的查询语句生成方法、数据查询方法和生成模型训练方法的技术方案属于同一构思，计算机程序的技术方案未详细描述的细节内容，均可以参见上述查询语句生成方法或者数据查询方法或者生成模型训练方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-On ly Memory)、随机存取存储器(RAM，Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本说明书实施例并不受所描述的动作顺序的限制，因为依据本说明书实施例，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本说明书实施例所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书实施例的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本说明书实施例的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种查询语句生成方法，包括：

接收查询请求，其中，所述查询请求包括查询信息和目标数据库标识；

根据所述目标数据库标识，确定目标数据库的数据库模式；

根据所述查询信息和所述数据库模式，构建查询结构关系图，其中，所述查询结构关系图表征所述查询信息和所述数据库模式之间的关联关系；

将所述查询信息和所述查询结构关系图输入生成模型，获得所述查询信息对应的目标查询语句，其中，所述生成模型包括编码器和解码器，所述编码器用于对所述查询信息和所述查询结构关系图进行融合编码，所述解码器用于对融合编码特征解码得到所述目标查询语句。

2.根据权利要求1所述的方法，所述根据所述目标数据库标识，确定目标数据库的数据库模式，包括：

查找所述目标数据库标识对应的目标数据库；

对所述目标数据库的数据库结构进行分析，确定所述目标数据库的数据库模式，其中，所述数据库模式包括数据库对象和所述数据库对象之间的关联关系。

3.根据权利要求1所述的方法，所述根据所述查询信息和所述数据库模式，构建查询结构关系图，包括：

提取所述查询信息中的至少一个关键词；

以所述至少一个关键词和所述数据库模式中的数据库对象为节点，所述至少一个关键词之间的关联关系、所述数据库对象之间的关联关系和所述至少一个关键词与所述数据库对象之间的关联关系为边，构建查询结构关系图。

4.根据权利要求3所述的方法，所述以所述至少一个关键词和所述数据库模式中的数据库对象为节点，所述至少一个关键词之间的关联关系、所述数据库对象之间的关联关系和所述至少一个关键词与所述数据库对象之间的关联关系为边，构建查询结构关系图之后，还包括：

在所述查询结构关系图中增加桥接节点；

通过所述桥接节点连接所述查询结构关系图中的第一节点和第二节点，获得更新后的查询结构关系图，其中，所述第一节点和第二节点为所述查询结构关系图中不存在边的两个节点。

5.根据权利要求1所述的方法，所述编码器包括图处理层和多个编码层；所述将所述查询信息和所述查询结构关系图输入生成模型，获得所述查询信息对应的目标查询语句，包括：

将所述查询结构关系图输入所述图处理层，获得所述查询结构关系图对应的结构特征；

针对任一编码层，基于所述结构特征和上一编码层输出的查询特征，确定本层的输出，其中，第一层的输入为所述查询信息，最后一层的输出为融合编码特征；

将所述融合编码特征输入所述解码器中，获得所述查询信息对应的目标查询语句。

6.根据权利要求5所述的方法，所述将所述查询结构关系图输入所述图处理层，获得所述查询结构关系图对应的结构特征，包括：

将所述查询结构关系图输入所述图处理层，经所述图处理层的映射处理，获得初始结构特征、键向量和值向量；

根据所述初始结构特征、所述键向量和所述值向量，确定所述查询结构关系图对应的结构特征。

7.根据权利要求5所述的方法，所述基于所述结构特征和上一编码层输出的查询特征，确定本层的输出，包括：

将所述查询信息输入所述多个编码层中的第一层，获得所述查询信息对应的查询特征；

合并所述查询特征和所述结构特征，获得更新后的查询特征，并将所述更新后的查询特征输入下一编码层，获得所述下一编码层的输出的查询特征，返回执行所述合并所述查询特征和所述结构特征，获得更新后的查询特征的步骤，直至最后一个编码层输出融合编码特征。

8.根据权利要求1所述的方法，所述生成模型的训练方式，包括：

获取样本集，其中，所述样本集包括多个样本查询信息，所述样本查询信息携带查询标签；

从所述样本集中提取第一样本查询信息，其中，所述第一样本查询信息为所述样本集中的任一个；

将所述第一样本查询信息和所述第一样本查询信息对应的第一样本结构关系图输入初始生成模型，获得所述第一样本查询信息对应的第一预测语句，其中，所述初始生成模型包括编码器和解码器，所述编码器用于对所述第一样本查询信息和所述第一样本结构关系图进行融合编码，所述解码器用于对样本融合特征解码得到所述第一预测语句；

根据所述第一预测语句和所述第一样本查询信息携带的第一查询标签，计算第一损失值；

根据所述第一损失值，调整所述初始生成模型的模型参数，并返回执行所述从所述样本集中提取第一样本查询信息的步骤，直至达到预设停止条件，获得生成模型。

9.一种数据查询方法，包括：

接收用户通过前端输入的查询请求，其中，所述查询请求包括查询信息和目标数据库标识；

根据所述目标数据库标识，确定目标数据库的数据库模式；

将所述查询信息和所述查询结构关系图输入生成模型，获得所述查询信息对应的目标查询语句，其中，所述生成模型包括编码器和解码器，所述编码器用于对所述查询信息和所述查询结构关系图进行融合编码，所述解码器用于对融合编码特征解码得到所述目标查询语句；

利用所述目标查询语句，在所述查询数据库中查找获得所述查询信息对应的查询结果；

将所述查询结果发送至所述前端，以使所述前端显示所述查询结果。

10.一种生成模型训练方法，应用于云侧设备，所述方法包括：

将所述多个样本查询信息和所述多个样本查询信息对应的样本结构关系图输入初始生成模型，获得各样本查询信息对应的预测语句，其中，所述初始生成模型包括编码器和解码器，所述编码器用于对所述样本查询信息和所述样本结构关系图进行融合编码，所述解码器用于对样本融合特征解码得到所述预测语句；

根据所述预测语句和所述查询标签，对所述初始生成模型进行训练，获得训练得到的生成模型的模型参数；

向端侧设备发送所述训练得到的生成模型的模型参数。

11.根据权利要求10所述的方法，所述将所述多个样本查询信息和所述多个样本查询信息对应的样本结构关系图输入初始生成模型，获得各样本查询信息对应的预测语句之前，还包括：

针对任一样本查询信息，提取所述样本查询信息中的至少一个样本关键词；

确定所述样本查询信息对应的样本数据库的样本数据库模式；

以所述至少一个样本关键词和所述样本数据库模式中的样本数据库对象为节点，所述至少一个样本关键词之间的关联关系、所述样本数据库对象之间的关联关系和所述至少一个样本关键词与所述样本数据库对象之间的关联关系为边，构建所述样本查询信息对应的样本结构关系图。

12.一种数据查询系统，所述数据查询系统包括客户端和服务端；

所述客户端，被配置为向所述服务端发送查询请求，其中，所述查询请求包括查询信息和目标数据库标识；

所述服务端，被配置为根据所述目标数据库标识，确定目标数据库的数据库模式；根据所述查询信息和所述数据库模式，构建查询结构关系图，其中，所述查询结构关系图表征所述查询信息和所述数据库模式之间的关联关系；将所述查询信息和所述查询结构关系图输入生成模型，获得所述查询信息对应的目标查询语句，其中，所述生成模型包括编码器和解码器，所述编码器用于对所述查询信息和所述查询结构关系图进行融合编码，所述解码器用于对融合编码特征解码得到所述目标查询语句；利用所述目标查询语句，在所述查询数据库中查找获得所述查询信息对应的查询结果；将所述查询结果发送至所述客户端；

所述客户端，还被配置为显示所述查询结果。

13.一种计算设备，包括：

存储器

和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1至8任意一项或者权利要求9或者权利要求10至11任意一项所述方法的步骤。

14.一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1至8任意一项或者权利要求9或者权利要求10至11任意一项所述方法的步骤。