CN115114318A

CN115114318A - 一种生成数据库查询语句的方法和相关装置

Info

Publication number: CN115114318A
Application number: CN202210368035.5A
Authority: CN
Inventors: 向彦铮; 周德宇; 张旭; 张倩汶; 曹云波
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-04-08
Filing date: 2022-04-08
Publication date: 2022-09-27

Abstract

本申请实施例公开了一种生成数据库查询语句的方法和相关装置，应用于人工智能，将待处理自然语言语句和待查询数据库的数据库模式输入生成模型的编码器，输出待处理自然语言语句和数据库模式的第一编码向量；第一编码向量输入生成模型生成t‑1个动作后，构建t‑1个动作的第一语法树‑动作二部图，t为正整数，t≥2；将第一编码向量和第一语法树‑动作二部图输入生成模型的基于二部图的解码器，输出第t个动作，直至生成完整的候选动作序列；将候选动作序列转化为待处理自然语言语句对应的待处理数据库查询语句。在生成动作序列过程中充分考虑已生成的动作的语法树结构信息，生成更加准确的动作序列，提高生成的数据库查询语句的准确率。

Description

一种生成数据库查询语句的方法和相关装置

技术领域

本申请涉及数据处理领域，特别是涉及一种生成数据库查询语句的方法和相关装置。

背景技术

现阶段，数据库作为主要的数据存储工具，被广泛应用到各个领域中。为了通过自然语言语句实现数据库查询功能，需要基于自然语言语句生成数据库查询语句，则无需掌握数据库查询语句的相关知识，即可通过自然语言语句查询数据库。

相关技术中，基于自然语言语句生成数据库查询语句的方法主要采用编码器-解码器框架，即，通过编码器对自然语言语句和数据库模式进行编码处理得到编码向量，通过解码器对编码向量进行解码处理，以生成动作序列并转化为数据库查询语句。

然而，数据库查询语句存在一定的语法结构，但上述方式仅仅对自然语言语句和数据库模式的编码向量进行解码处理，在生成动作序列过程中无法充分考虑除自然语言语句和数据库模式的编码信息之外其他信息，导致所生成的动作序列不够准确，从而导致所生成的数据库查询语句的准确率降低。

发明内容

为了解决上述技术问题，本申请提供了一种生成数据库查询语句的方法和相关装置，能够生成更加准确的动作序列，从而提高所生成的数据库查询语句的准确率。

本申请实施例公开了如下技术方案：

一方面，本申请提供一种生成数据库查询语句的方法，所述方法包括：

通过生成模型的编码器，对待处理自然语言语句和待查询数据库的数据库模式进行编码处理，获得所述待处理自然语言语句和所述数据库模式的第一编码向量；

构建已生成的t-1个动作的第一语法树-动作二部图；所述t-1个动作是所述第一编码向量输入所述生成模型后生成的，t为正整数，t≥2；

通过所述生成模型的基于二部图的解码器，对所述第一编码向量和所述第一语法树-动作二部图进行解码处理，获得第t个动作，直至生成完整的候选动作序列；

将所述候选动作序列转化为所述待处理自然语言语句对应的待处理数据库查询语句。

另一方面，本申请提供一种生成数据库查询语句的装置，所述装置包括：编码单元、构建单元、解码单元和转化单元；

所述编码单元，用于通过生成模型的编码器，对待处理自然语言语句和待查询数据库的数据库模式进行编码处理，获得所述待处理自然语言语句和所述数据库模式的第一编码向量；

所述构建单元，用于构建已生成的t-1个动作的第一语法树-动作二部图；所述t-1个动作是所述第一编码向量输入所述生成模型后生成的，t为正整数，t≥2；

所述解码单元，用于通过所述生成模型的基于二部图的解码器，对所述第一编码向量和所述第一语法树-动作二部图进行解码处理，获得第t个动作，直至生成完整的候选动作序列；

所述转化单元，用于将所述候选动作序列转化为所述待处理自然语言语句对应的待处理数据库查询语句。

另一方面，本申请提供一种用于生成数据库查询语句的设备，所述设备包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行上述方面所述的生成数据库查询语句的方法。

另一方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行上述方面所述的生成数据库查询语句的方法。

另一方面，本申请实施例提供了一种计算机程序产品，所述计算机程序产品包括计算机程序或指令；当所述计算机程序或指令被处理器执行时，执行上述方面所述的生成数据库查询语句的方法。

由上述技术方案可以看出，首先，将待处理自然语言语句和待查询数据库的数据库模式输入生成模型的编码器，输出待处理自然语言语句和数据库模式的第一编码向量；其次，在第一编码向量输入生成模型生成t-1个动作后，构建t-1个动作的第一语法树-动作二部图，t为正整数，t≥2；然后，将第一编码向量和第一语法树-动作二部图输入生成模型的基于二部图的解码器，输出第t个动作，直至生成完整的候选动作序列；最后，将候选动作序列转化为待处理自然语言语句对应的待处理数据库查询语句。

基于此，在编码器编码自然语言语句和数据库的数据库模式得到编码向量，编码向量输入生成模型生成部分动作后，进一步构建已生成的动作的语法树-动作二部图，引入已生成的动作的语法树结构信息；在此基础上，基于二部图的解码器解码编码向量和语法树-动作二部图，生成动作序列过程中既考虑自然语言语句和数据库模式的编码向量，又考虑已生成的动作的语法树结构信息，以生成更加准确的动作序列，从而提高所生成的数据库查询语句的准确率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种生成数据库查询语句的方法的应用场景示意图；

图2为本申请实施例提供的一种第一语法树-动作二部图的示意图；

图3为本申请实施例提供的一种生成数据库查询语句的方法的流程图；

图4为本申请实施例提供的一种基于二部图的解码器的具体框架示意图；

图5为本申请实施例提供的一种候选动作序列和候选动作序列的语法树的示意图；

图6为本申请实施例提供的一种生成模型的训练方法的流程示意图；

图7为本申请实施例提供的另一种生成数据库查询语句的方法的流程图；

图8为本申请实施例提供的一种排序模型的训练方法的流程示意图；

图9为本申请实施例提供的一种生成模型和排序模型的训练方法的流程图；

图10为本申请实施例提供的一种生成数据库查询语句的方法的具体应用示意图；

图11为本申请实施例提供的一种生成数据库查询语句的装置的示意图；

图12为本申请实施例提供的一种服务器的结构示意图；

图13为本申请实施例提供的一种终端设备的结构示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述。

目前，利用自然语言语句查询数据库时，需要基于自然语言语句生成数据库查询语句；即，采用编码器-解码器框架，其中，编码器编码自然语言语句和数据库模式得到编码向量，解码器解码编码向量生成动作序列，该动作序列可转化为数据库查询语句。

然而，经过研究发现，数据库查询语句存在一定的语法结构，但上述方式仅仅解码自然语言语句和数据库模式的编码向量，在生成动作序列过程中无法充分考虑除自然语言语句和数据库模式的编码信息之外其他信息，导致所生成的动作序列不够准确，从而导致所生成的数据库查询语句的准确率降低。

有鉴于此，本申请提出一种生成数据库查询语句的方法和相关装置，在编码器编码自然语言语句和数据库的数据库模式得到编码向量，编码向量输入生成模型生成部分动作后，进一步构建已生成的动作的语法树-动作二部图，引入已生成的动作的语法树结构信息；在此基础上，基于二部图的解码器解码编码向量和语法树-动作二部图，生成动作序列过程中既考虑自然语言语句和数据库模式的编码向量，又考虑已生成的动作的语法树结构信息，以生成更加准确的动作序列，从而提高所生成的数据库查询语句的准确率。

为了便于理解本申请的技术方案，下面结合实际应用场景，对本申请实施例提供的生成数据库查询语句的方法进行介绍。

参见图1，图1为本申请实施例提供的一种生成数据库查询语句的方法的应用场景示意图。在图1所示的应用场景中，包括终端设备101和服务器102，其中，终端设备101作为输入自然语言语句的设备，服务器102作为生成数据库查询语句的设备，服务器102预先存储生成模型和数据库模式。

终端设备101的使用者通过终端设备101输入待处理自然语言语句，终端设备101获取待处理自然语言语句并发送至服务器102。服务器302通过生成模型的编码器，对待处理自然语言语句和待查询数据库的数据库模式进行编码处理，获得所述待处理自然语言语句和所述数据库模式的第一编码向量。例如，数据库模式为S＝{C，T}，C表示列集合，T表示表集合，终端设备101的使用者通过终端设备101输入待处理自然语言语句为“有多少A类别教师”，终端设备101获取待处理自然语言语句“有多少A类别教师”并发送至服务器102；服务器302利用生成模型的编码器编码待处理自然语言语句“有多少A类别教师”和数据库模式S＝{C，T}得到第一编码向量EV₁。

服务器102构建已生成的t-1个动作的第一语法树-动作二部图；t-1个动作是第一编码向量输入生成模型后生成的，t为正整数，t≥2。例如，第一编码向量EV₁输入生成模型后生成2个动作为“1：sql→sql_unit”和“2：sql_unit→(from，select)”，服务器102可以构建该已生成的2个动作的第一语法树-动作二部图，参见图2所示的一种第一语法树-动作二部图的示意图，其中，圆形节点表示语法树节点，矩形节点表示动作节点。

服务器102通过生成模型的基于二部图的解码器，对第一编码向量和第一语法树-动作二部图进行解码处理，获得第t个动作，直至生成完整的候选动作序列。服务器102利用生成模型的基于二部图的解码器解码第一编码向量EV₁和上述图2所示的第一语法树-动作二部图，得到第3个动作为“from→tab_id”，以此类推直至生成完整的候选动作序列

服务器102将候选动作序列转化为待处理自然语言语句对应的待处理数据库查询语句。基于此，服务器102可以将候选动作序列

转化为待处理自然语言语句“有多少A类别教师”对应的待处理数据库查询语句“select count(column:sort A)from table:teacher”。

可见，在编码器编码自然语言语句和数据库的数据库模式得到编码向量，编码向量输入生成模型生成部分动作后，进一步构建已生成的动作的语法树-动作二部图，引入已生成的动作的语法树结构信息；在此基础上，基于二部图的解码器解码编码向量和语法树-动作二部图，生成动作序列过程中既考虑自然语言语句和数据库模式的编码向量，又考虑已生成的动作的语法树结构信息，以生成更加准确的动作序列，从而提高所生成的数据库查询语句的准确率。

本申请实施例提供的生成数据库查询语句的方法是基于人工智能实现的，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生成出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。

在本申请实施例中，主要涉及的人工智能软件技术包括上述自然语言处理技术以及机器学习/深度学习等方向。例如，可以涉及自然语言处理(Nature Languageprocessing，NLP)中的文本处理(Text Processing)、语义理解(Semantic Understanding)等技术，还可以涉及机器学习(Machine learning，ML)中的各类人工神经网络(ArtificialNeural Network，ANN)等。

本申请提供的生成数据库查询语句的方法可以应用于具有数据处理能力的生成数据库查询语句的设备，如服务器、终端设备。其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器等，但并不局限于此；终端设备包括但不限于手机、平板、电脑、计算机、智能摄像头、智能语音交互设备、智能家电、车载终端、飞行器等，但并不局限于此。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

该生成数据库查询语句的设备可以具备实施自然语言处理的能力，自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。在本申请实施例中，当第一模态信息和第二模态信息包括视频文本信息时，生成数据库查询语句的设备可以通过自然语言处理中的文本处理、语义理解等技术，对视频文本信息进行特征提取获得语义特征。

该生成数据库查询语句的设备可以具备机器学习能力。机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。在本申请实施例中，生成数据库查询语句的方法中所采用的生成模型、排序模型等主要涉及对人工神经网络的应用，通过人工神经网络实现生成数据库查询语句的方法。

本申请实施例所提供的生成数据库查询语句的方法还可以涉及区块链，其中，分类模型、排序模型等相关的模型架构、模型参数，以及数据库模式等数据可保存于区块链上。

本申请提供的生成数据库查询语句的方法可以应用于各种场景，包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。

下面以服务器作为生成数据库查询语句的设备对本申请实施例提供的生成数据库查询语句的方法进行具体介绍。

参见图3，该图为本申请实施例提供的一种生成数据库查询语句的方法的流程图。如图3所示，该生成数据库查询语句的方法包括以下步骤：

S301：通过生成模型的编码器，对待处理自然语言语句和待查询数据库的数据库模式进行编码处理，获得所述待处理自然语言语句和所述数据库模式的第一编码向量。

本申请实施例中，为了通过自然语言语句实现数据库查询功能，在获取到待处理自然语言语句后，需要基于待处理自然语言语句生成待处理数据库查询语句；首先，可以采用生成模型实现对待处理自然语言语句和待查询数据库的数据库模式的编码。则生成模型包括编码器，将待处理自然语言语句和数据库模式输入编码器进行编码处理，输出待处理自然语言语句和数据库模式的编码向量，作为第一编码向量。

其中，数据库模式是用数据库管理系统支持的正式语言描述的结构。例如，关系数据库的数据库模式定义了表、字段、关系、视图、索引、包、过程、函数、队列、触发器、类型、序列、物化视图、同义词、数据库链接、目录、可扩展标记语言XML模式和其他元素

作为一种示例，待处理自然语言语句为“有多少A类别教师”，待查询数据库为关系数据库a，其数据库模式为S＝{C，T}；利用编码器编码待处理自然语言语句“有多少A类别教师”和数据库模式，得到第一编码向量EV₁。其中，该第一编码向量EV₁例如可以包括待处理自然语言语句“有多少A类别教师”的编码向量W＝[w₁，w₂，…，w_n]∈R^n×k、数据库模式中表集合的编码向量T＝[t₁，t₂，…，t_|t|]∈R^|t|×k和数据库模式中列集合的编码向量C＝[c₁，c₂，…，c_|c|]∈R^|c|×k；其中，k表示预设维度，|t|是表集合中表的数量，|c|是列集合中列的数量。

其中，生成模型是基于待训练自然语言语句、数据库模式以及待训练自然语言语句对应的待训练数据库查询语句所转化的待训练动作序列，预先训练生成器得到的，训练方法的具体实现方式参见下述生成模型的训练方法的实施例，在此先不做详细说明。

S302：构建已生成的t-1个动作的第一语法树-动作二部图；t-1个动作是第一编码向量输入生成模型后生成的，t为正整数，t≥2。

相关技术中，采用编码器-解码器框架基于待处理自然语言语句生成待处理数据库查询语句时，编码器编码待处理自然语言语句和数据库模式得到第一编码向量后，解码器直接解码第一编码向量生成动作序列，该动作序列可转化为待处理数据库查询语句。

然而，经过研究发现，数据库查询语句存在一定的语法结构，但上述相关技术中的方式仅仅解码待处理自然语言语句和数据库模式的第一编码向量，在生成动作序列过程中无法充分考虑除待处理自然语言语句和数据库模式的第一编码信息之外其他信息，导致所生成的动作序列不够准确，从而导致所生成的待处理数据库查询语句的准确率降低。

本申请实施例中，考虑到在生成动作序列过程中已生成的动作具有对应的语法树，语法树是源代码语法结构的一种表示，它以树状的形式表现编程语言的语法结构，树上的每个节点都表示源代码中的一种语法结构；即，已生成的动作的语法树能够表示对应的数据库查询语言的部分语法结构。

基于此，S301得到待处理自然语言语句和数据库模式的第一编码向量之后，若第一编码向量输入生成模型生成t-1个动作，t为正整数，t≥2，在t-1个动作的基础上，采用二部图构建方式，进一步构建已生成的t-1个动作的语法树-动作二部图，即，第一语法树-动作二部图，以便通过该方式引入已生成的t-1个动作的语法树结构信息。

其中，二部图是图论中一种特殊的模型，它的顶点集可以拆分成两个互不相交的子集，并且图中的每条边依附的两个顶点都分属于这两个不相交的子集，即两个子集内的顶点不相邻。即，语法树-动作二部图的节点集可以拆分成两个互不相交的语法树节点集和动作节点集，并且图中的每条边依附的语法树节点和动作节点都分属于不相交的语法树节点集和动作节点集，语法树节点集内的语法树节点不相邻，动作节点集内的动作节点不相邻。

作为一种示例，在上述示例的基础上，第一编码向量EV₁输入生成模型后生成2个动作为“1：sql→sql_unit”和“2：sql_unit→(from，select)”，构建该已生成的2个动作的第一语法树-动作二部图，该第一语法树-动作二部图可参见前述图2。

在语法树-动作二部图被定义为G＝＜V^ST，ε，V^G＞，V^ST是语法树节点集、ε边的集合，V^G是动作节点集的基础上。每一个动作节点被作为该动作的头语法树节点和子语法树节点之间的中间节点，如图2所示，动作节点“1：sql→sql_unit”为该动作的头语法树节点“sql”和子语法树节点“sql_unit”之间的中间节点，动作节点“2：sql_unit→(from，select)”为该动作的头语法树节点“sql_unit”和子语法树节点“from”之间的中间节点，以及头语法树节点“sql_unit”和子语法树节点“select”之间的中间节点。

S303：通过生成模型的基于二部图的解码器，对第一编码向量和第一语法树-动作二部图进行解码处理，获得第t个动作，直至生成完整的候选动作序列。

本申请实施例中，在S302构建已生成的t-1个动作的第一语法树-动作二部图之后，生成模型在生成动作序列过程中，不仅需要实现待处理自然语言语句和数据库模式的第一编码向量的解码，还需要实现已生成的t-1个动作的第一语法树-动作二部图的解码。则生成模型包括基于二部图的解码器，将第一编码向量和第一语法树-动作二部图输入基于二部图的解码器进行解码处理，学习已生成的t-1个动作的语法树结构信息，并融合待处理自然语言语句和数据库模式的第一编码向量，输出第t个动作，以此类推直至生成完整的动作序列，作为候选动作序列。

该方式在生成动作序列过程中既考虑待处理自然语言语句和数据库模式的第一编码向量，又考虑已生成的t-1个动作的语法树结构信息，能够生成更加准确的候选动作序列，从而提高所生成的待处理数据库查询语句的准确率。

在S303具体实现时，首先，基于二部图的解码器中需要部署用于学习已生成的t-1个动作的语法树结构信息的二部图提取器，将已生成的t-1个动作的第一语法树-动作二部图输入二部图提取器进行提取处理，输出第一语法树-动作二部图中动作节点的第一动作向量，该第一动作向量充分学习已生成的t-1个动作的语法树结构信息。

其次，基于二部图的解码器中还需要部署解码器，将第一语法树-动作二部图中动作节点的第一动作向量，以及待处理自然语言语句和数据库模式的第一编码向量输入解码器进行解码处理；在第一动作向量学习到已生成的t-1个动作的语法树结构信息的基础上，进一步融合待处理自然语言语句和数据库模式的第一编码向量以预测下一个动作，即，输出第t个动作，以此类推直至生成候选动作序列。因此，本申请提供了一种可能的实现方式，基于二部图的解码器包括二部图提取器和解码器；S303例如可以包括如下S3031-S3032：

S3031：通过二部图提取器对第一语法树-动作二部图进行提取处理，获得第一语法树-动作二部图中动作节点的第一动作向量。

在S3031具体实现时，可以先获取第一语法树-动作二部图中各个节点的初始化向量，即，语法树节点的第一初始化向量和动作节点的第二初始化向量；再将语法树节点的第一初始化向量融合至动作节点的第二初始化向量，得到第一语法树-动作二部图中动作节点的第一动作向量。因此，本申请提供了一种可能的实现方式，S3031例如可以包括如下S1-S2：

S1：获取第一语法树-动作二部图中语法树节点的第一初始化向量和动作节点的第二初始化向量。

作为一种示例，假设第一语法树-动作二部图包括h个语法树节点和t-1个动作节点。对于语法树节点，可以通过查找可训练的矩阵

获取第一初始化向量，对于动作节点，可以通过查找可训练的矩阵

获取第二初始化向量；则语法树节点的第一初始化向量和动作节点的第二初始化向量为

其中，|V^ST|是语法树节点集中语法树节点的种类数，|V^G|是动作节点集中动作节点的种类数，需要注意的是，对于一些对应于表或列的语法树节点，可以查找数据库模式中表集合或列集合的编码向量获取第一初始化向量。

S2：将第一初始化向量融合至第二初始化向量，获得第一动作向量。

其中，二部图提取器例如可以包括基于多头注意力机制的图注意力网络，则可以通过基于多头注意力机制的图注意力网络，将语法树节点的第一初始化向量融合至动作节点的第二初始化向量，获得第一语法树-动作二部图中动作节点的第一动作向量。

作为一种示例，在上述示例的基础上，通过基于多头注意力机制的图注意力网络，将第一初始化向量融合至第二初始化向量，得到第一语法树-动作二部图中动作节点的第一动作向量为

以

为例，聚合函数为：

其中，

是可训练参数，||代表矩阵的级联操作，LRelu是激活函数LeakyRelu的简写。K₁表示多头注意力机制中头的数量，L_ij＝1是指第i个节点和第j个节点之间存在着一条边。然后，采用一个注意力机制来计算每一个头的重要性程度：

其中，W_a是可训练参数，最后得到如下：

S3032：通过解码器对第一编码向量和第一动作向量进行解码处理，获得第t个动作，直至生成候选动作序列。

在S3032具体实现时，解码器是多个解码模块和全连接层堆叠构成的，每个解码模块均包括两个解码层，在第二个解码层才融合第一编码向量，多个解码模块的区别是第一个解码模块的输入是第一语法树-动作二部图中动作节点的第一动作向量和第一动作向量对应的位置向量，而其他解码模块的输入是前一个解码模块的输出，全连接层的输入是最后一个解码模块的输出；则可以在解码器部署第一解码模块、第二解码模块和全连接层，第一解码模块部署第一解码层和第二解码层，第二解码模块部署第三解码层和第四解码层。

在上述说明的基础上，首先，将第一语法树-动作二部图中动作节点的第一动作向量和第一动作向量对应的位置向量输入第一解码层进行解码处理，输出第一语法树-动作二部图中动作节点的第二动作向量；其次，将第二动作向量和待处理自然语言语句和数据库模式的第一编码向量输入第二解码层进行解码处理，输出第一语法树-动作二部图中动作节点的第三动作向量；接着，将第三动作向量输入第三解码层进行解码处理，输出第一语法树-动作二部图中动作节点的第四动作向量；然后，将第四动作向量和待处理自然语言语句和数据库模式的第一编码向量输入第四解码层进行解码处理，输出最终的解码向量作为第一解码向量；最后，将第一解码向量输入全连接层进行预测处理，输出第t个动作，直至生成候选动作序列。

即，本申请提供了一种可能的实现方式，解码器包括第一解码模块、第二解码模块和全连接层，第一解码模块包括第一解码层和第二解码层，第二解码模块包括第三解码层和第四解码层；S3032例如可以包括如下S3-S7：

S3：通过第一解码层对第一动作向量和第一动作向量对应的位置向量进行解码处理，获得第二动作向量。

其中，本申请提供了一种可能的实现方式，第一解码层包括基于多头注意力机制的第一动作注意力层。

作为一种示例，第一解码层为基于多头注意力机制的第一动作注意力层时，采用多头注意力机制，在第一语法树-动作二部图中动作节点的第一动作向量

的基础上，引入第一动作向量对应的位置向量，学习已生成的t-1个动作的位置信息，位置向量

的计算公式如下：

P_i[2j]＝sin(i/10000^2j/k)

P_i[2j+1]＝cos(i/10000^2j/k)

其中，i是第i个规则，j是向量的第j维。给定一个输入

通过基于多头注意力机制的第一动作注意力层进行解码处理，得到一个输出

其中，K₂指多头注意力机制中头的数量，

是可训练参数，

的计算公式如下：

其中，d_k＝d/K₂指向量的维度，其中Q_g、K_g、V_g的计算公式如下：

[Q_g,K_g,V_g]＝X_m[W_Qg,W_Kg,W_Vg]

S4：通过第二解码层对第一编码向量和第二动作向量进行解码处理，获得第三动作向量。

其中，本申请提供了一种可能的实现方式，第二解码层包括基于多头注意力机制的第一编码注意力层。

作为一种示例，第二解码层为基于多头注意力机制的第一编码注意力层时，采用多头注意力机制，基于多头注意力机制的第一编码注意力层进行解码处理的具体实现方式类似于基于多头注意力机制的第一动作注意力层进行解码处理的具体实现方式，只是Q_g、K_g、V_g需要更改为Q_e、K_e、V_e。其中，Q_e、K_e、V_e的计算方式是：待处理自然语言语句和数据库模式的第一编码向量EV₁＝[W，T，C]用于计算K_e、V_e，而基于多头注意力机制的第一动作注意力层的输出Y_m＝[y₁,…,y_L]用于计算Q_e；即，

S5：通过第三解码层对第三动作向量进行解码处理，获得第四动作向量。

S6：通过第四解码层对第一编码向量和第四动作向量进行解码处理，获得第一解码向量。

同理，本申请提供了一种可能的实现方式，第三解码层包括基于多头注意力机制的第二动作注意力层，第四解码层包括基于多头注意力机制的第二编码注意力层。

作为一种示例，动作可以分为选择规则动作、选择表动作和选择列动作等三种类别，若第一解码向量为

对应于选择规则动作、选择表动作和选择列动作分别得到

和

S7：通过全连接层对第一解码向量进行预测处理，获得第t个动作，直至生成候选动作序列。

此外，在上述示例的基础上，对于选择规则动作而言，其预测概率P_r计算公式如下：

P_r＝softmax(tanh(W_rH_r))

其中，W_r是全连接层的参数，用于将H_r映射到规则空间。

对于选择表动作而言，计算H_t与各个表T之间的相似度，得到相似度矩阵

进而得到其预测概率P_r计算公式如下：

P_t＝softmax(M_t)

对于选择列动作而言，计算H_c与各个列C之间的相似度，得到相似度矩阵

进而得到其预测概率P_c计算公式如下：

P_c＝softmax(M_c)

此外，本申请实施例中，获得第t个动作后，利用该第t个动作对已生成的t-1个动作的第一语法树-动作二部图进行扩展，以此类推直至生成候选动作序列。

作为一种示例，结合上述S1-S7的具体实现方式，参见图4所示的一种基于二部图的解码器的具体框架示意图，利用该基于二部图的解码器解码第一编码向量EV₁和上述图2所示的第一语法树-动作二部图，得到第3个动作为“from→tab_id”，以此类推直至生成完整的候选动作序列a；参见图5所示的一种候选动作序列和候选动作序列的语法树的示意图，其中，候选动作序列为a＝1，2，3，select table，6，7，8，select column。

S304：将候选动作序列转化为待处理自然语言语句对应的待处理数据库查询语句。

本申请实施例中，在S303生成候选动作序列之后，一个候选动作序列可以唯一转化为一个数据库查询语句，作为待处理自然语言语句对应的待处理数据库查询语句。

作为一种示例，在上述示例的基础上，结合图5所示的候选动作序列和候选动作序列的语法树，候选动作序列

可转化为待处理自然语言语句“有多少A类别教师”对应的待处理数据库查询语句“select count(column:sort A)from table:teacher”。

此外，本申请实施例中，数据库查询语句例如可以是结构化查询语言(structuredquery language，SQL)语句，SQL语句是一种数据库查询的程序设计语言语句，用于存储数据以及查询、更新和管理数据库系统；语法树例如可以是抽象语法树(Abstract SyntaxTree，AST)，AST是源代码语法结构的一种抽象表示，它以树状的形式表现编程语言的语法结构，树上的每个节点都表示源代码中的一种结构。

上述实施例提供的生成数据库查询语句的方法，首先，将待处理自然语言语句和待查询数据库的数据库模式输入生成模型的编码器，输出待处理自然语言语句和数据库模式的第一编码向量；其次，在第一编码向量输入生成模型生成t-1个动作后，构建t-1个动作的第一语法树-动作二部图，t为正整数，t≥2；然后，将第一编码向量和第一语法树-动作二部图输入生成模型的基于二部图的解码器，输出第t个动作，直至生成完整的候选动作序列；最后，将候选动作序列转化为待处理自然语言语句对应的待处理数据库查询语句。

针对上述实施例提供的生成数据库查询语句的方法中的生成模型，下面结合附图，对生成模型的训练方法进行介绍。

参见图6，图6为本申请实施例提供的一种生成模型的训练方法的流程示意图。如图6所示，该生成模型的训练方法包括以下步骤：

S601：基于数据库模式，构建待训练自然语言语句和待训练自然语言语句对应的待训练数据库查询语句。

本申请实施例中，首先需要构建用于训练生成器的训练样本，具体现实时，需要根据上述实施例中的数据库模式，先构建可以查询数据库模式对应的待查询数据库的自然语言语句，作为待训练自然语言语句；再构建待训练自然语言语句对应的数据库查询语句，作为待训练数据库查询语句。

S602：将待训练数据库查询语句转化为待训练动作序列。

本申请实施例中，由于生成器输出的是动作序列，还需要将待训练数据库查询语句转化为动作序列，作为待训练动作序列，该待训练动作序列是生成器针对待训练自然语言语句和数据库模式进行训练时的输出目标。

S603：根据待训练自然语言语句、数据库模式和待训练动作序列训练生成器，获得生成模型；生成器包括编码器和基于二部图的解码器。

本申请实施例中，生成器同样包括编码器和基于二部图的解码器，将待训练自然语言语句和数据库模式作为输入，将待训练动作序列作为输出，对生成器进行训练，训练完成的生成器即可作为生成模型。

在S603具体实现时，训练过程实际上是：首先，将待训练自然语言语句和数据库模式输入编码器进行编码处理，输出待训练自然语言语句和数据库模式的编码向量，作为第二编码向量。

其次，若第二编码向量输入生成器生成t-1个预测动作，t为正整数，t≥2，在t-1个预测动作的基础上，采用二部图构建方式，进一步构建已生成的t-1个预测动作的语法树-动作二部图，即，第二语法树-动作二部图。

然后，将第二编码向量和第二语法树-动作二部图输入基于二部图的解码器进行解码处理，学习已生成的t-1个预测动作的语法树结构信息，并融合待训练自然语言语句和数据库模式的第二编码向量，输出第t个预测动作，以此类推直至生成完整的动作序列，作为预测动作序列。

最后，判断预测动作序列与训练动作序列是否匹配，若不匹配，表示该生成器针对待训练自然语言语句和数据库模式进行训练所输出预测动作序列，不满足输出目标为训练动作序列，则需要对生成器的模型参数进行调整；基于此，调整完成的生成器即可作为生成模型。因此，本申请提供了一种可能的实现方式，S603例如可以包括如下S6031-S6034：

S6031：通过编码器对待训练自然语言语句和数据库模式进行编码处理，获得待训练自然语言语句和数据库模式的第二编码向量。

S6032：构建已生成的t-1个预测动作的第二语法树-动作二部图；t-1个预测动作是第二编码向量输入生成器后生成的。

S6033：通过基于二部图的解码器，对第二编码向量和第二语法树-动作二部图进行解码处理，获得第t个预测动作，直至获得完整的预测动作序列。

S6034：若预测动作序列与待训练动作序列不匹配，调整生成器的模型参数，将调整完成的生成器作为生成模型。

通过上述生成模型的训练方法，使得生成模型具备构建已生成的动作的语法树-动作二部图，引入已生成的动作的语法树结构信息、生成动作序列过程中既考虑自然语言语句和数据库模式的编码向量，又考虑已生成的动作的语法树结构信息能力。基于此，可以利用训练得到的生成模型，执行上述实施例中生成数据库查询语句的方法，以有效充分考虑已生成的动作的语法树结构信息，从而提高所生成的数据库查询语句的准确率。

针对上述实施例提供的生成数据库查询语句的方法，S303所生成的候选动作序列仅仅是为了得到更准确的候选动作序列，一个候选动作序列唯一转化为一个数据库查询语句；但是，候选动作序列是生成数据库查询语句的中间产物，在语义层面上与数据库查询语句存在一定差距，则仅通过一个候选动作序列转化得到待处理自然语言语句对应的待处理数据库查询语句不够准确，从而一定程度上导致所生成的数据库查询语句的准确率降低。

因此，还可以考虑结合光束搜索方式在S303生成多个候选动作序列，并得到每个候选动作序列的预测概率，光束搜索用于解决一类问题：预测序列的时候每步预测只能预测一个元素，期望预测出的整个序列的预测概率是所有元素的联合条件概率。如果每步预测都预测当前概率最大的元素，最后的序列却可能不是预测概率最大的序列；即，光束搜索在每步预测都预测多个元素以得到多个序列。

在此基础上，多个候选动作序列可转化为多个候选数据库查询语句，进一步地，将待处理自然语言语句和每个候选数据库查询语句作为一对，输入用于预测候选数据库查询语句的分数的排序模型进行排序处理，输出每个候选数据库查询语句的分数；以便可以综合考虑每个候选数据库查询语句对应的候选动作序列的预测概率，以及每个候选数据库查询语句的分数，从多个候选数据库查询语句中确定最优数据库查询语句，作为待处理自然语言语句对应的待处理数据库查询语句。

参见图7，该图为本申请实施例提供的另一种生成数据库查询语句的方法的流程图。如图7所示，该生成数据库查询语句的方法包括以下步骤：

S701：通过生成模型的编码器，对待处理自然语言语句和待查询数据库的数据库模式进行编码处理，获得所述待处理自然语言语句和所述数据库模式的第一编码向量。

S702：构建已生成的t-1个动作的第一语法树-动作二部图；t-1个动作是第一编码向量输入生成模型后生成的，t为正整数，t≥2。

S703：通过生成模型的基于二部图的解码器，对第一编码向量和第一语法树-动作二部图进行解码处理，获得第t个动作，直至生成完整的多个候选动作序列和多个候选动作序列的多个预测概率。

本申请实施例中，S701-S703的具体实现方式与上述生成数据库查询语句的方法实施例中S301-S303的具体实现方式类似，则S701-S703的具体实现方式参考S301-S303的具体实现方式，在此不再赘述。

作为一种示例，候选动作序列

的预测概率是根据候选动作序列

中各个动作的预测概率得到，计算公式如下所示：

其中，P(a_i|Q,a₁,…,a_i-1)表示候选动作序列中第i个动作的预测概率。

S704：将多个候选动作序列转化为多个候选数据库查询语句。

S705：通过排序模型对待处理自然语言语句和每个候选数据库查询语句进行排序处理，获得每个候选数据库查询语句的分数。

其中，排序模型是基于待训练自然语言语句、待训练数据库查询语句和第一分数，以及待处理自然语言语句、错误数据库查询语句和第二分数，预先训练排序器得到的，第一分数大于第二分数，训练方法的具体实现方式参见下述排序模型的训练方法的实施例，在此先不做详细说明。

S706：根据每个候选数据库查询语句对应的候选动作序列的预测概率，以及每个候选数据库查询语句的分数，从多个候选数据库查询语句中确定待处理数据库查询语句。

在S706具体实现时，首先，考虑每个候选数据库查询语句对应的候选动作序列的预测概率，可以由高至低排序多个候选数据库查询语句，然后，考虑每个候选数据库查询语句的分数，对排序后的多个候选数据库查询语句进行遍历，将每个候选数据库查询语句的分数与最优数据库查询语句的分数进行比较，若差值大于一定差值，以候选数据库查询语句替换最优数据库查询语句，遍历完成即可将最优数据库查询语句作为待处理自然语言语句对应的待处理数据库查询语句；需要注意的是，优数据库查询语句的分数的初始值为预设值。因此，本申请提供了一种可能的实现方式，S706例如可以包括如下S7061-S7063：

S7061：按照每个候选数据库查询语句对应的候选动作序列的预测概率，降序排列多个候选数据库查询语句。

S7062：遍历降序排列的多个候选数据库查询语句，若遍历到的候选数据库查询语句的分数与最优数据库查询语句的分数之间的差值大于或等于预设差值，将最优数据库查询语句替换为遍历到的候选数据库查询语句；最优数据库查询语句的分数的初始值为预设值。

其中，最优数据库查询语句的分数的初始值为预设值例如可以为0。

S7063：遍历完成后将最优数据库查询语句确定为待处理数据库查询语句。

上述实施例提供的生成数据库查询语句的方法，在生成多个候选动作序列基础上，将多个候选动作序列转化为多个候选数据库查询语句，综合考虑每个候选数据库查询语句对应的候选动作序列的预测概率，以及每个候选数据库查询语句的分数，从多个候选数据库查询语句中确定最优数据库查询语句，作为待处理自然语言语句对应的待处理数据库查询语句，使得待处理数据库查询语句准确性更高。

针对上述实施例提供的生成数据库查询语句的方法中的排序模型，下面结合附图，对排序模型的训练方法进行介绍。

参见图8，图8为本申请实施例提供的一种排序模型的训练方法的流程示意图。如图8所示，该生成模型获得方法包括以下步骤：

S801：获取待训练自然语言语句、待训练数据库查询语句和第一分数。

本申请实施例中，首先需要构建用于训练排序器的训练样本，排序器的目的是针对输入的自然语言语句-数据库查询语句对，数据库查询语句正确对应于自然语言语句时，该数据库查询语句的分数较高，数据库查询语句错误对应于自然语言语句时，该数据库查询语句的分数较低；则训练样本分为正样本和负样本。

具体现实时，构建正样本即是将S601中待训练自然语言语句和待训练自然语言语句对应的待训练数据库查询语句作为一对，并设定一个较高的第一分数，该第一分数时排序器针对待训练自然语言语句和待训练自然语言语句进行训练的输出目标。

S802：获取待训练自然语言语句、错误数据库查询语句和第二分数；错误数据库查询语句对应的错误动作序列是待训练自然语言语句输入生成器生成的、与待训练动作序列不匹配的动作序列，第一分数大于第二分数。

本申请实施例中，对应构建正样本，还需要构建负样本，前提是将待训练自然语言语句输入生成器生成的、与待训练动作序列不匹配的动作序列，作为错误动作序列，将错误动作序列转化得到的数据库查询语句，作为错误数据库查询语句。基于此，将待训练自然语言语句和错误数据库查询语句作为一对，并设定一个较低的第二分数，该第二分数时排序器针对待训练自然语言语句和错误自然语言语句进行训练的输出目标。

S803：根据待训练自然语言语句、待训练数据库查询语句和第一分数，以及待处理自然语言语句、错误数据库查询语句和第二分数训练排序器，获得排序模型。

本申请实施例中，将待训练自然语言语句和待训练数据库查询语句作为输入，将第一分数作为输出；以及待处理自然语言语句和错误数据库查询语句作为输入，将第二分数作为输出，对排序器进行训练，训练完成的排序器即可作为排序模型。

在S803具体实现时，训练过程实际上是：首先，将待处理自然语言语句和待训练数据库查询语句、以及待处理自然语言语句和错误数据库查询语句输入排序器进行排序处理，输出待训练数据库查询语句的预测分数，作为第一预测分数，并输出错误数据库查询语句的预测分数，作为第二预测分数。然后，判断第一预测分数与第一分数是否匹配，以及第二预测分数与第二分数是否匹配，若任意一个判断结果为不匹配，表示不满足待训练数据库查询语句的第一预测分数较高、错误数据库查询语句的第二预测分数较低的输出目标，则需要对排序器的模型参数进行调整；基于此，调整完成的排序器即可作为排序模型，调整过程中所采用的损失函数为交叉熵损失函数。因此，本申请提供了一种可能的实现方式，S803例如可以包括如下S8031-S8032：

S8031：通过排序器对待处理自然语言语句和待训练数据库查询语句、以及待处理自然语言语句和错误数据库查询语句进行排序处理，获得待训练数据库查询语句的第一预测分数和错误数据库查询语句的第二预测分数。

S8032：若第一预测分数与第一分数不匹配，或，第二预测分数与第二分数不匹配，调整排序器的模型参数，将调整完成的排序器作为排序模型。

此外，为了避免训练过程中，大量的待训练数据库查询语句、错误数据库查询语句中表名、列名作为输入会引入大量的噪声，考虑到每个待训练数据库查询语句、错误数据库查询语句仅仅很少和表名、列名相关，将大量的待训练数据库查询语句、错误数据库查询语句中表名、列名进行简化，其中，表名用“tab”替换，列名用“col”替换。

通过上述排序模型的训练方法，使得排序模型具备针对输入的自然语言语句-数据库查询语句对，数据库查询语句正确对应于自然语言语句时，该数据库查询语句的分数较高，数据库查询语句错误对应于自然语言语句时，该数据库查询语句的分数较低的能力。基于此，可以利用训练得到的排序模型，执行上述实施例中生成数据库查询语句的方法，能够进一步结合候选数据库查询语句的分数，确定更加准确的待处理自然语言语句对应的待处理数据库查询语句，从而进一步提高所生成的数据库查询语句的准确率。

参见图9，该图为本申请实施例提供的一种生成模型和排序模型的训练方法的流程图。如图9所示，该生成模型和排序模型的训练方法包括以下步骤：

S901：基于数据库模式，构建待训练自然语言语句和待训练自然语言语句对应的待训练数据库查询语句。

S902：将待训练数据库查询语句转化为待训练动作序列。

S903：根据待训练自然语言语句、数据库模式和待训练动作序列对生成器进行训练，获得生成模型；生成器包括编码器和基于二部图的解码器。

本申请实施例中，S901-S903的具体实现方式与上述生成数据库查询语句的方法实施例中S601-S603的具体实现方式相同，则S901-S903的具体实现方式参考S601-S603的具体实现方式，在此不再赘述。

S904：获取待训练自然语言语句、待训练数据库查询语句和第一分数。

S905：获取待训练自然语言语句、错误数据库查询语句和第二分数；错误数据库查询语句对应的错误动作序列是待训练自然语言语句输入生成器生成的、与待训练动作序列不匹配的动作序列，第一分数大于第二分数。

S906：根据待训练自然语言语句、待训练数据库查询语句和第一分数，以及待处理自然语言语句、错误数据库查询语句和第二分数对排序器进行训练，获得排序模型。

本申请实施例中，S904-S906的具体实现方式与上述生成数据库查询语句的方法实施例中S801-S803的具体实现方式相同，则S904-S906的具体实现方式参考S801-S803的具体实现方式，在此不再赘述。

上述生成模型和排序模型在公开的关系数据库问答数据集Spider的训练集上进行训练，由于其测试集未公开，在验证集上进行测试。采用了精确集匹配指标来衡量生成的数据库查询语句的正确性。此外，选择了如下模型作为对照：

IRNet是一种提出数据库模式链接来识别自然语言语句中出现的表和列，并提出一种中间表示减小自然语言语句和数据库查询语句之间的语义距离的模型；

Global-GNN是一种提出对于输出的数据库查询语句的语法结构进行全局推理，以确定使用数据库常量的模型；

RAT-SQL是一种提出将自然语言语句和数据库模式构建成一张有向图，并使用关系感知的自注意力机制进行表示学习的模型。

LGESQL是一种在上述RAT-SQL的基础上，提出使用线图来增强学习有向图中的元路径信息的模型。

测试结果如下表1所示：

表1测试结果

模型	准确性
		IRNet	53.2
Global-GNN	52.7
		RAT-SQL	62.7
LGESQL	67.6
		生成模型	69.1
生成模型-排序模型	69.8

参见图10，该图为本申请实施例提供的一种生成数据库查询语句的方法的具体应用示意图。其中，手机的使用者通过手机输入待处理自然语言语句为“有多少A类别教师”，手机获取待处理自然语言语句“有多少A类别教师”并发送至服务器，服务器采用本申请实施例提供的生成数据库查询语句的方法，得到待处理数据库查询语句“select count(column:sort A)from table:teacher”并发送至手机，以便手机显示待处理数据库查询语句“select count(column:sort A)fromtable:teacher”，服务器基于待处理数据库查询语句“select count(column:sort A)from table:teacher”查询待查询数据库得到查询结果并发送至手机，以便手机显示查询结果。

综上所述，本申请实施例提供的生成数据库查询语句的方法可以应用于对话系统中的表格问答场景，也可以应用于分析系统的数据分析场景等；在上述场景中需要将自然语言语句转换成数据库查询语句。

针对上述实施例提供的生成数据库查询语句的方法，本申请实施例还提供了一种生成数据库查询语句的装置。

参见图11，图11为本申请实施例提供的一种生成数据库查询语句的装置的示意图。如图11所示，该生成数据库查询语句的装置1100包括：编码单元1101、构建单元1102、解码单元1103和转化单元1104；

编码单元1101，用于通过生成模型的编码器，对待处理自然语言语句和待查询数据库的数据库模式进行编码处理，获得待处理自然语言语句和数据库模式的第一编码向量；

构建单元1102，用于构建已生成的t-1个动作的第一语法树-动作二部图；t-1个动作是第一编码向量输入生成模型后生成的，t为正整数，t≥2；

解码单元1103，用于通过生成模型的基于二部图的解码器，对第一编码向量和第一语法树-动作二部图进行解码处理，获得第t个动作，直至生成完整的候选动作序列；

转化单元1104，用于将候选动作序列转化为待处理自然语言语句对应的待处理数据库查询语句。

作为一种可能的实现方式，解码单元1103包括：提取子单元和解码子单元；

提取子单元，用于通过二部图提取器对第一语法树-动作二部图进行提取处理，获得第一语法树-动作二部图中动作节点的第一动作向量；

解码子单元，用于通过解码器对第一编码向量和第一动作向量进行解码处理，获得第t个动作，直至生成候选动作序列。

作为一种可能的实现方式，提取子单元，具体用于：

获取第一语法树-动作二部图中语法树节点的第一初始化向量和动作节点的第二初始化向量；

将第一初始化向量融合至第二初始化向量，获得第一动作向量。

作为一种可能的实现方式，解码器包括第一解码模块、第二解码模块和全连接层，第一解码模块包括第一解码层和第二解码层，第二解码模块包括第三解码层和第四解码层；解码子单元，具体用于：

通过第一解码层对第一动作向量和第一动作向量对应的位置向量进行解码处理，获得第二动作向量；

通过第二解码层对第一编码向量和第二动作向量进行解码处理，获得第三动作向量；

通过第三解码层对第三动作向量进行解码处理，获得第四动作向量；

通过第四解码层对第一编码向量和第四动作向量进行解码处理，获得第一解码向量；

通过全连接层对第一解码向量进行预测处理，获得第t个动作，直至生成候选动作序列。

作为一种可能的实现方式，二部图提取器包括基于多头注意力机制的图注意力网络；第一解码层包括基于多头注意力机制的第一动作注意力层，第二解码层包括基于多头注意力机制的第一编码注意力层，第三解码层包括基于多头注意力机制的第二动作注意力层，第四解码层包括基于多头注意力机制的第二编码注意力层。

作为一种可能的实现方式，装置还包括：第一训练单元；第一训练单元，用于：

基于数据库模式，构建待训练自然语言语句和待训练自然语言语句对应的待训练数据库查询语句；

将待训练数据库查询语句转化为待训练动作序列；

根据待训练自然语言语句、数据库模式和待训练动作序列训练生成器，获得生成模型；生成器包括编码器和基于二部图的解码器。

作为一种可能的实现方式，第一训练单元，具体用于：

通过编码器对待训练自然语言语句和数据库模式进行编码处理，获得待训练自然语言语句和数据库模式的第二编码向量；

构建已生成的t-1个预测动作的第二语法树-动作二部图；t-1个预测动作是第二编码向量输入生成器后生成的；

通过基于二部图的解码器，对第二编码向量和第二语法树-动作二部图进行解码处理，获得第t个预测动作，直至获得完整的预测动作序列；

若预测动作序列与待训练动作序列不匹配，调整生成器的模型参数，将调整完成的生成器作为生成模型。

作为一种可能的实现方式，解码单元1103，具体用于：

通过生成模型的基于二部图的解码器，对第一编码向量和第一语法树-动作二部图进行解码处理，获得第t个动作，直至生成完整的多个候选动作序列和多个候选动作序列的多个预测概率；

转化单元1104，具体用于：

将多个候选动作序列转化为多个候选数据库查询语句；

通过排序模型对待处理自然语言语句和每个候选数据库查询语句进行排序处理，获得每个候选数据库查询语句的分数；

根据每个候选数据库查询语句对应的候选动作序列的预测概率，以及每个候选数据库查询语句的分数，从多个候选数据库查询语句中确定待处理数据库查询语句。

作为一种可能的实现方式，转化单元1104，具体用于：

按照每个候选数据库查询语句对应的候选动作序列的预测概率，降序排列多个候选数据库查询语句；

遍历降序排列的多个候选数据库查询语句，若遍历到的候选数据库查询语句的分数与最优数据库查询语句的分数之间的差值大于或等于预设差值，将最优数据库查询语句替换为遍历到的候选数据库查询语句；最优数据库查询语句的分数的初始值为预设值；

遍历完成后将最优数据库查询语句确定为待处理数据库查询语句。

作为一种可能的实现方式，装置包括：第二训练单元；第二训练单元，用于：

获取待训练自然语言语句、待训练数据库查询语句和第一分数；

获取待训练自然语言语句、错误数据库查询语句和第二分数；错误数据库查询语句对应的错误动作序列是待训练自然语言语句输入生成器生成的、与待训练动作序列不匹配的动作序列，第一分数大于第二分数；

根据待训练自然语言语句、待训练数据库查询语句和第一分数，以及待处理自然语言语句、错误数据库查询语句和第二分数训练排序器，获得排序模型。

作为一种可能的实现方式，第二训练单元，具体用于：

通过排序器对待处理自然语言语句和待训练数据库查询语句、以及待处理自然语言语句和错误数据库查询语句进行排序处理，获得待训练数据库查询语句的第一预测分数和错误数据库查询语句的第二预测分数；

若第一预测分数与第一分数不匹配，或，第二预测分数与第二分数不匹配，调整排序器的模型参数，将调整完成的排序器作为排序模型。

上述实施例提供的生成数据库查询语句的装置，首先，将待处理自然语言语句和数据库模式输入生成模型的编码器，输出待处理自然语言语句和数据库模式的第一编码向量；其次，在第一编码向量输入生成模型生成t-1个动作后，构建t-1个动作的第一语法树-动作二部图，t为正整数，t≥2；然后，将第一编码向量和第一语法树-动作二部图输入生成模型的基于二部图的解码器，输出第t个动作，直至生成完整的候选动作序列；最后，将候选动作序列转化为待处理自然语言语句对应的待处理数据库查询语句。

针对上文描述的生成数据库查询语句的方法，本申请实施例还提供了一种用于生成数据库查询语句的设备，以使上述生成数据库查询语句的方法在实际中实现以及应用，下面将从硬件实体化的角度对本申请实施例提供的计算机设备进行介绍。

参见图12，图12是本申请实施例提供的一种服务器结构示意图，该服务器1200可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(CentralProcessing Units，CPU)1222(例如，一个或一个以上处理器)和存储器1232，一个或一个以上存储应用程序1242或数据1244的存储介质1230(例如一个或一个以上海量存储设备)。其中，存储器1232和存储介质1230可以是短暂存储或持久存储。存储在存储介质1230的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1222可以设置为与存储介质1230通信，在服务器1200上执行存储介质1230中的一系列指令操作。

服务器1200还可以包括一个或一个以上电源1226，一个或一个以上有线或无线网络接口1250，一个或一个以上输入输出接口1258，和/或，一个或一个以上操作系统1241，例如Windows Server^TM，Mac OS X^TM，Unix^TM，Linux^TM，FreeBSD^TM等等。

上述实施例中由服务器所执行的步骤可以基于该图12所示的服务器结构。

其中，CPU 1222用于执行如下步骤：

构建已生成的t-1个动作的第一语法树-动作二部图；t-1个动作是第一编码向量输入生成模型后生成的，t为正整数，t≥2；

通过生成模型的基于二部图的解码器，对第一编码向量和第一语法树-动作二部图进行解码处理，获得第t个动作，直至生成完整的候选动作序列；

将候选动作序列转化为待处理自然语言语句对应的待处理数据库查询语句。

可选的，CPU 1222还可以执行本申请实施例中生成数据库查询语句的方法任一具体实现方式的方法步骤。

参见图13，图13为本申请实施例提供的一种终端设备的结构示意图。为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该终端设备可以为包括手机、平板电脑、PDA等任意终端设备，以终端设备为手机为例：

图13示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图13，该手机包括：射频(Radio Frequency，简称RF)电路1310、存储器1320、输入单元1330、显示单元1340、传感器1350、音频电路1360、无线保真(WiFi)模块1370、处理器1380、以及电源1390等部件。本领域技术人员可以理解，图13中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图13对手机的各个构成部件进行具体的介绍：

RF电路1310可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器1380处理；另外，将设计上行的数据发送给基站。通常，RF电路1310包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier，简称LNA)、双工器等。此外，RF电路1310还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(Global System of Mobile communication，简称GSM)、通用分组无线服务(GeneralPacket Radio Service，简称GPRS)、码分多址(Code Division Multiple Access，简称CDMA)、宽带码分多址(Wideband Code Division Multiple Access，简称WCDMA)、长期演进(Long TermEvolution，简称LTE)、电子邮件、短消息服务(Short Messaging Service，简称SMS)等。

存储器1320可用于存储软件程序以及模块，处理器1380通过运行存储在存储器1320的软件程序以及模块，从而实现手机的各种功能应用以及数据处理。存储器1320可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1320可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1330可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元1330可包括触控面板1331以及其他输入设备1332。触控面板1331，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1331上或在触控面板1331附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板1331可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器1380，并能接收处理器1380发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1331。除了触控面板1331，输入单元1330还可以包括其他输入设备1332。具体地，其他输入设备1332可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元1340可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1340可包括显示面板1341，可选的，可以采用液晶显示器(LiquidCrystal Display，简称LCD)、有机发光二极管(Organic Light-Emitting Diode，简称OLED)等形式来配置显示面板1341。进一步的，触控面板1331可覆盖显示面板1341，当触控面板1331检测到在其上或附近的触摸操作后，传送给处理器1380以确定触摸事件的类型，随后处理器1380根据触摸事件的类型在显示面板1341上提供相应的视觉输出。虽然在图10中，触控面板1331与显示面板1341是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板1331与显示面板1341集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器1350，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1341的亮度，接近传感器可在手机移动到耳边时，关闭显示面板1341和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路1360、扬声器1361，传声器1362可提供用户与手机之间的音频接口。音频电路1360可将接收到的音频数据转换后的电信号，传输到扬声器1361，由扬声器1361转换为声音信号输出；另一方面，传声器1362将收集的声音信号转换为电信号，由音频电路1360接收后转换为音频数据，再将音频数据输出处理器1380处理后，经RF电路1310以发送给比如另一手机，或者将音频数据输出至存储器1320以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块1370可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图13示出了WiFi模块1370，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器1380是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器1320内的软件程序和/或模块，以及调用存储在存储器1320内的数据，执行手机的各种功能和处理数据，从而对手机进行整体控制。可选的，处理器1380可包括一个或多个处理单元；优选的，处理器1380可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1380中。

手机还包括给各个部件供电的电源1390(比如电池)，优选的，电源可以通过电源管理系统与处理器1380逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本申请实施例中，该手机所包括的存储器1320可以存储程序代码，并将所述程序代码传输给所述处理器。

该手机所包括的处理器1380可以根据所述程序代码中的指令执行上述实施例提供的生成数据库查询语句的方法。

本申请实施例还提供一种计算机可读存储介质，用于存储计算机程序，该计算机程序用于执行上述实施例提供的生成数据库查询语句的方法。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备的执行上述方面的各种可选实现方式中提供的生成数据库查询语句的方法。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质可以是下述介质中的至少一种：只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于设备及系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本申请的一种具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

1.一种生成数据库查询语句的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于二部图的解码器包括二部图提取器和解码器；所述通过所述生成模型的基于二部图的解码器，对所述第一编码向量和所述第一语法树-动作二部图进行解码处理，获得第t个动作，直至生成完整的候选动作序列，包括：

通过所述二部图提取器对所述第一语法树-动作二部图进行提取处理，获得所述第一语法树-动作二部图中动作节点的第一动作向量；

通过所述解码器对所述第一编码向量和所述第一动作向量进行解码处理，获得所述第t个动作，直至生成所述候选动作序列。

3.根据权利要求2所述的方法，其特征在于，所述通过所述二部图提取器对所述第一语法树-动作二部图进行提取处理，获得所述第一语法树-动作二部图中动作节点的第一动作向量，包括：

获取所述第一语法树-动作二部图中语法树节点的第一初始化向量和动作节点的第二初始化向量；

将所述第一初始化向量融合至所述第二初始化向量，获得所述第一动作向量。

4.根据权利要求2所述的方法，其特征在于，所述解码器包括第一解码模块、第二解码模块和全连接层，所述第一解码模块包括第一解码层和第二解码层，所述第二解码模块包括第三解码层和第四解码层；所述通过所述解码器对所述第一编码向量和所述第一动作向量进行解码处理，获得所述第t个动作，直至生成所述候选动作序列，包括：

通过所述第一解码层对所述第一动作向量和所述第一动作向量对应的位置向量进行解码处理，获得第二动作向量；

通过所述第二解码层对所述第一编码向量和所述第二动作向量进行解码处理，获得第三动作向量；

通过所述第三解码层对所述第三动作向量进行解码处理，获得第四动作向量；

通过所述第四解码层对所述第一编码向量和所述第四动作向量进行解码处理，获得第一解码向量；

通过所述全连接层对所述第一解码向量进行预测处理，获得所述第t个动作，直至生成所述候选动作序列。

5.根据权利要求4所述的方法，其特征在于，所述二部图提取器包括基于多头注意力机制的图注意力网络；所述第一解码层包括基于多头注意力机制的第一动作注意力层，所述第二解码层包括基于多头注意力机制的第一编码注意力层，所述第三解码层包括基于多头注意力机制的第二动作注意力层，所述第四解码层包括基于多头注意力机制的第二编码注意力层。

6.根据权利要求1所述的方法，其特征在于，所述生成模型的训练步骤包括：

基于所述数据库模式，构建待训练自然语言语句和所述待训练自然语言语句对应的待训练数据库查询语句；

将所述待训练数据库查询语句转化为待训练动作序列；

根据所述待训练自然语言语句、所述数据库模式和所述待训练动作序列训练生成器，获得所述生成模型；所述生成器包括所述编码器和所述基于二部图的解码器。

7.根据权利要求6所述的方法，其特征在于，所述根据所述待训练自然语言语句、所述数据库模式和所述待训练动作序列训练生成器，获得所述生成模型，包括：

通过所述编码器对所述待训练自然语言语句和所述数据库模式进行编码处理，获得所述待训练自然语言语句和所述数据库模式的第二编码向量；

构建已生成的t-1个预测动作的第二语法树-动作二部图；所述t-1个预测动作是所述第二编码向量输入所述生成器后生成的；

通过所述基于二部图的解码器，对所述第二编码向量和所述第二语法树-动作二部图进行解码处理，获得第t个预测动作，直至获得完整的预测动作序列；

若所述预测动作序列与所述待训练动作序列不匹配，调整所述生成器的模型参数，将调整完成的生成器作为所述生成模型。

8.根据权利要求6所述的方法，其特征在于，所述直至生成完整的候选动作序列，包括：

直至生成完整的多个候选动作序列和多个所述候选动作序列的多个预测概率；

所述将所述候选动作序列转化为所述待处理自然语言语句对应的待处理数据库查询语句，包括：

将多个所述候选动作序列转化为多个候选数据库查询语句；

通过排序模型对所述待处理自然语言语句和每个所述候选数据库查询语句进行排序处理，获得每个所述候选数据库查询语句的分数；

根据每个所述候选数据库查询语句对应的候选动作序列的预测概率，以及每个所述候选数据库查询语句的分数，从多个所述候选数据库查询语句中确定所述待处理数据库查询语句。

9.根据权利要求8所述的方法，其特征在于，所述根据每个所述候选数据库查询语句对应的候选动作序列的预测概率，以及每个所述候选数据库查询语句的分数，从多个所述候选数据库查询语句中确定所述待处理数据库查询语句，包括：

按照每个所述候选数据库查询语句对应的候选动作序列的预测概率，降序排列多个所述候选数据库查询语句；

遍历降序排列的多个所述候选数据库查询语句，若遍历到的候选数据库查询语句的分数与最优数据库查询语句的分数之间的差值大于或等于预设差值，将所述最优数据库查询语句替换为所述遍历到的候选数据库查询语句；所述最优数据库查询语句的分数的初始值为预设值；

遍历完成后将所述最优数据库查询语句确定为所述待处理数据库查询语句。

10.根据权利要求8所述的方法，其特征在于，所述排序模型的训练步骤包括：

获取所述待训练自然语言语句、所述待训练数据库查询语句和第一分数；

获取所述待训练自然语言语句、错误数据库查询语句和第二分数；所述错误数据库查询语句对应的错误动作序列是所述待训练自然语言语句输入所述生成器生成的、与所述待训练动作序列不匹配的动作序列，所述第一分数大于所述第二分数；

根据所述待训练自然语言语句、所述待训练数据库查询语句和所述第一分数，以及所述待处理自然语言语句、所述错误数据库查询语句和所述第二分数训练排序器，获得所述排序模型。

11.根据权利要求10所述的方法，其特征在于，所述根据所述待训练自然语言语句、所述待训练数据库查询语句和所述第一分数，以及所述待处理自然语言语句、所述错误数据库查询语句和所述第二分数训练排序器，获得所述排序模型，包括：

通过排序器对所述待处理自然语言语句和所述待训练数据库查询语句、以及所述待处理自然语言语句和所述错误数据库查询语句进行排序处理，获得所述待训练数据库查询语句的第一预测分数和所述错误数据库查询语句的第二预测分数；

若所述第一预测分数与所述第一分数不匹配，或，所述第二预测分数与所述第二分数不匹配，调整所述排序器的模型参数，将调整完成的排序器作为所述排序模型。

12.一种生成数据库查询语句的装置，其特征在于，所述装置包括：编码单元、构建单元、解码单元和转化单元；

13.一种计算机设备，其特征在于，所述设备包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行权利要求1-11中任意一项所述的生成数据库查询语句的方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行权利要求1-11中任意一项所述的生成数据库查询语句的方法。

15.一种计算机程序产品，其特征在于，包括计算机程序或指令；当所述计算机程序或指令被处理器执行时，执行权利要求1-11中任意一项所述的生成数据库查询语句的方法。