WO2023000561A1

WO2023000561A1 - 一种对数据库操作进行加速的方法和装置

Info

Publication number: WO2023000561A1
Application number: PCT/CN2021/131504
Authority: WO
Inventors: 向俊凌; 周民; 刘睿民
Original assignee: 威讯柏睿数据科技(北京)有限公司
Priority date: 2021-07-20
Filing date: 2021-11-18
Publication date: 2023-01-26
Also published as: CN113448967B; CN113448967A; US20240045868A1

Abstract

一种对数据库操作进行加速的方法和装置，应用于连接有硬件加速器的数据库中，该方法包括：当接收到由数据库发送的需要进行加速的初始执行计划树时，根据硬件加速器支持的基本操作和加速资源对初始执行计划树进行处理并生成新执行计划树（S101）；若新执行计划树的新执行代价小于初始执行计划树的初始执行代价，根据硬件加速器的组织方式和运行方式将新执行计划树分发至硬件加速器执行（S102）；根据硬件加速器返回的执行结果确定硬件加速器对数据库操作加速后的结果数据（S103）。从而实现了数据库的执行计划树与进行加速的硬件加速器的执行功能和能力相匹配并保持合理的复杂度，进而充分发挥了该硬件加速器的加速能力。

Description

一种对数据库操作进行加速的方法和装置

技术领域

本申请涉及数据库技术领域，更具体地，涉及一种对数据库操作进行加速的方法和装置。

背景技术

过去十年来移动互联网的飞速发展和各行业的数字化改造和转型，各领域都出现了大规模的数据增长，但通用计算能力的发展却面临挑战，半导体技术的改进几乎达到了物理极限，通用处理器性能再无法按照摩尔定律增长。随着5G、云计算、万物互联、人工智能时代的到来，数据的产生、传输、存储和分析处理的要求却越来越高，数据增长对计算性能的要求与处理器性能发展间的缺口越来越大。

现有技术中，在数据库应用领域，面临海量数据处理分析的性能挑战下，通常采用异构计算解决方案来满足性能需求。通常的硬件加速方案都是在部署数据库软件的服务器上扩展一块PCIe(Peripheral Component Interconnect Express，周边设备高速连接)接口的加速卡，通过将部分数据库操作卸载到加速卡中执行实现数据库处理性能的提升。如何采用硬件尽可能大的提升数据库处理性能，已经成为数据库领域一个重要的技术研究点。

通常数据库执行如图1所示，用户输入查询请求，经由解析引擎分析后生成解析树，由优化引擎处理后输出查询树并重写为执行计划树，再由执行引擎按照执行计划树实际执行，通过存储引擎读取，缓存或存储最终数据。

硬件加速通常是由数据库优化引擎输出的，将由执行引擎执行的执行计划树中的部分执行节点卸载到硬件中执行。但硬件受限于资源，功耗和复杂度，并无法实现与软件一样的数量众多的复杂执行功能，通常仅能实现一些基本的关系代数操作，比如选择，投影，连接等。另外，在某些场景下，比如存在子查询等，优化引擎输出的计划树中不同节点存在相似功能，这对硬件能力来说是一种浪费。这都导致当前软件生成的执行计划树中的执行动作并不能很好的匹配硬件的执行功能和能力。

因此，如何实现数据库的执行计划树与进行加速的硬件加速器的执行功能和能力相匹配并保持合理的复杂度，进而充分发挥该硬件加速器的加速能力，是当前需要解决的技术问题。

发明内容

本发明提供一种对数据库操作进行加速的方法，用以解决现有技术中生成的执行计划树不能很好的匹配硬件加速器的执行功能和能力的技术问题，该方法应用于连接有硬件加速器的数据库中，该方法包括：

当接收到由所述数据库发送的需要进行加速的初始执行计划树时，根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树；

若所述新执行计划树的新执行代价小于所述初始执行计划树的初始执行代价，根据所述硬件加速器的组织方式和运行方式将所述新执行计划树分发至所述硬件加速器执行；

根据所述硬件加速器返回的执行结果确定所述硬件加速器对数据库操作加速后的结果数据；

其中，所述新执行代价和所述初始执行代价是基于调用预设代价函数确定的。

在本申请一些实施例中，根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树，具体为：

根据所述基本操作将所述初始执行计划树中执行加速操作的节点进行归一映射，根据归一映射的结果生成与所述硬件加速器匹配的匹配执行计划树；

此外，加速映射模块将对应加速执行动作的节点进行归一映射的同时，还将去掉部分功能被整合的节点，再有部分节点进行预处理后再映射。

根据所述加速资源对所述匹配执行计划树中节点和输出目标列进行优化，并根据优化结果生成所述新执行计划树。

在本申请一些实施例中，所述归一映射包括归并、和/或删除、和/或新增。

在本申请一些实施例中，根据所述加速资源对所述匹配执行计划树中节点和输出目标列进行优化，具体为：

根据所述加速资源确定所述硬件加速器访问所需数据的方式、各节点执行数据访问的方式、最终输出和后继节点需要使用的列；

根据所述硬件加速器访问所需数据的方式确定所述匹配执行计划树中的可并发执行的节点，并将所述匹配执行计划树中对同一数据进行访问的不同执行节点合并为一个执行动作，并根据最终输出和后继节点需要使用的列对输出目标列进行优化；

其中，所述硬件加速器访问所需数据的方式包括基于自身内存进行访问、或基于缓存一致性协议对共享内存进行访问、或通过网络对远端存储节点进行访问。

在本申请一些实施例中，根据所述硬件加速器的组织方式和运行方式将所述新执行计划树分发至所述硬件加速器执行，具体为：

根据与所述组织方式和所述运行方式对应的数字孪生图像将一个或多个所述新执行计划树整体发送至所述硬件加速器执行、或将所述新执行计划树按单个节点依次发送至所述硬件加速器执行、或将所述新执行计划树中的多个节点组合发送至所述硬件加速器执行；

其中，所述数字孪生图像包括所述硬件加速器的执行模块数量，可执行功能节点的数量，各可执行功能节点的归属关系和可调度的执行粒度。

在本申请一些实施例中，所述方法还包括：

当接收到初始化指令并接收所述硬件加速器发送的包括组织方式和运行方式的自身信息时，根据所述自身信息生成所述数字孪生图像。

在本申请一些实施例中，所述硬件加速器为多个，各所述硬件加速器分别设置有本地存储单元，在根据所述硬件加速器返回的执行结果确定所述硬件加速器对数据库操作加速后的结果数据之前，所述方法还包括：

调整与所述执行结果对应的各所述硬件加速器的缓存和最终数据，以使各所述缓存和各所述最终数据分别保持一致。

在本申请一些实施例中，在根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树之后，所述方法还包括：

若所述新执行代价不小于所述初始执行代价，基于所述数据库执行所述初始执行计划树，并根据执行结果确定数据库操作的结果。

相应的，本发明还提供了一种对数据库操作进行加速的装置，应用于连接有硬件加速器的数据库中，所述装置包括：

加速映射模块，用于当接收到由所述数据库发送的需要进行加速的初始执行计划树时，根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树；

加速执行引擎，用于若所述新执行计划树的新执行代价小于所述初始执行计划树的初始执行代价，根据所述硬件加速器的组织方式和运行方式将所述新执行计划树分发至所述硬件加速器执行；

加速存储引擎模块，用于完成加速部分的内存和外存管理，协调多个所述硬件加速器间的缓存和最终数据的一致；

确定模块，用于根据所述硬件加速器返回的执行结果确定所述硬件加速器对数据库操作加速后的结果数据；

相应的，本发明还提出了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行如上所述的对数据库操作进行加速的方法。

通过应用以上技术方案，在连接有硬件加速器的数据库中，当接收到由所述数据库发送的需要进行加速的初始执行计划树时，根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树；若所述新执行计划树的新执行代价小于所述初始执行计划树的初始执行代价，根据所述硬件加速器的组织方式和运行方式将所述新执行计划树分发至所述硬件加速器执行；根据所述硬件加速器返回的执行结果确定所述硬件加速器对数据库操作加速后的结果数据，从而实现了数据库的执行计划树与进行硬件加速器的执行功能和能力相匹配并保持合理的复杂度，进而充分发挥了该硬件加速器的加速能力，同时在保留现有数据库系统架构的基础上实现硬件加速，保证了数据库系统的可靠性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了现有技术中数据库架构示意图；

图2示出了本发明实施例提出的一种对数据库操作进行加速的方法的流程示意图；

图3示出了本发明实施例数据库架构示意图；

图4示出了本发明实施例中扫描节点映射原理示意图；

图5示出了本发明实施例中连接节点映射原理示意图；

图6示出了本发明实施例中物化节点映射原理示意图一；

图7示出了本发明实施例中物化节点映射原理示意图二；

图8示出了本发明实施例中控制节点映射原理示意图；

图9示出了本发明实施例中加速执行引擎原理示意图；

图10示出了本发明实施例中硬件加速器结构示意图；

图11示出了本发明实施例中PostgreSQL输出的执行计划示意图；

图12示出了本发明实施例中映射后的执行计划树示意图；

图13示出了本发明实施例中合并后的执行计划树示意图；

图14示出了本发明实施例中输出列优化代码示意图；

图15示出了本发明实施例提出的一种对数据库操作进行加速的装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种对数据库操作进行加速的方法，应用于连接有硬件加速器的数据库中，如图2所示，所述方法包括以下步骤：

步骤S101，当接收到由所述数据库发送的需要进行加速的初始执行计划树时，根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树。

本实施例中，数据库连接有硬件加速器，该硬件加速器可以为外部硬件加速器，是基于硬件实现加速的设备，包括GPU(Graphics Processing Unit，图形处理器)、或FPGA(Field Programmable Gate Array，现场可编程门阵列)、或ASIC(Application Specific Integrated Circuit，专用集成电路)。数据库操作是指对数据库上的数据进行的一系列操作，包括读取数据、写数据、更新或修改数据、删除数据等。

所述初始执行计划树是数据库中优化引擎对解析引擎发送的解析树进行查询重写后生成的，解析树是解析引擎根据用户输入的查询请求生成的，也即在接收到用户输入的查询请求时，该查询请求可以为包括加速指令的查询请求，若该查询请求需要加速，解析引擎根据查询请求生成解析树并将解析树发送到优化引擎，优化引擎对解析树进行查询重写并生成需要进行加速的初始执行计划树，在接收到该初始执行计划树时，由于硬件加速器一般仅支持有限的基本操作，不同的硬件加速器有不同的加速资源，根据硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树。

为了可靠的生成新执行计划树，在本申请一些实施例中，根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树，具体为：

本实施例中，为了使新执行计划树与硬件加速器的功能匹配，根据基本操作将所述初始执行计划树中执行加速操作的节点进行归一映射，该归一映射是指将初始执行计划树中执行加速操作的节点与各基本操作形成对应关系。根据归一映射的结果生成与硬件加速器的功能相匹配的匹配执行计划树，由于不同硬件加速器的加速资源存在差异，为了更好的与硬件加速器的能力匹配，根据硬件加速器的加速资源对匹配执行计划树中节点和输出目标列进行优化，根据优化结果生成新执行计划树。

需要说明的是，以上实施例的方案仅为本申请所提出的一种具体实现方案，其他根据硬件加速器支持的基本操作和加速资源对初始执行计划树进行处理并生成新执行计划树的方式均属于本申请的保护范围。

为了准确的生成匹配计划树，在本申请一些实施例中，所述归一映射包括归并、和/或删除、和/或新增。

为了准确的对匹配执行计划树中节点和输出目标列进行优化，在本申请一些实施例中，根据所述加速资源对所述匹配执行计划树中节点和输出目标列进行优化，具体为：

本实施例中，硬件加速器可通过不同的方式访问所需数据，包括基于自身内存进行访问、或基于缓存一致性协议对共享内存进行访问、或通过网络对远端存储节点进行访问，根据硬件加速器访问所需数据的方式确定所述匹配执行计划树中的可并发执行的节点；在匹配执行计划树中存在不同节点对同一数据进行访问时，为了避免资源浪费，将匹配执行计划树中对同一数据进行访问的不同执行节点合并为一个执行动作；由于最终输出和后继节点需要使用的输出列并非所有列，根据最终输出和后继节点需要使用的列对输出目标列进行优化。

需要说明的是，以上实施例的方案仅为本申请所提出的一种具体实现方案，其他根据加速资源对匹配执行计划树中节点和输出目标列进行优化的方式均属于本申请的保护范围。

步骤S102，若所述新执行计划树的新执行代价小于所述初始执行计划树的初始执行代价，根据所述硬件加速器的组织方式和运行方式将所述新执行计划树分发至所述硬件加速器执行。

本实施例中，新执行代价为执行新执行计划树所消耗的计算资源，初始执行代价为执行初始执行计划树所消耗的计算资源，可通过调用预设代价函数分别确定新执行代价和初始执行代价，若新执行代价小于初始执行代价，说明新执行计划树优于初始执行计划树，基于不同硬件加速器有不同的组织方式和运行方式，根据与该组织方式和该运行方式将新执行计划树分发至硬件加速器执行。

为了准确的将新执行计划树分发至硬件加速器执行，在本申请一些实施中，根据所述硬件加速器的组织方式和运行方式将所述新执行计划树分发至所述硬件加速器执行，具体为：

本实施例中，硬件加速器可包括一个或多个执行模块，数字孪生图像包括所述硬件加速器的执行模块数量，可执行功能节点的数量，各可执行功能节点的归属关系和可调度的执行粒度。

根据数字孪生图像将一个或多个新执行计划树整体发送至硬件加速器执行、或将新执行计划树按单个节点依次发送至硬件加速器执行、或将新执行计划树中的多个节点组合发送至硬件加速器执行，举例来说，若硬件加速器采用FPGA实现，其实现了多套独立的关系代数操作流水线，则可一次发送多个新执行计划树给硬件加速器执行；若硬件加速器实现了分时功能，和对各个基本关系代数算子的调度能力，则可依据基本算子的资源，发送新执行计划树中的多个执行节点给硬件加速器执行。

需要说明的是，以上实施例的方案仅为本申请所提出的一种具体实现方案，其他根据硬件加速器的组织方式和运行方式将新执行计划树分发至硬件加速器执行的方式均属于本申请的保护范围。

为了准确的将新执行计划树分发至硬件加速器执行，在本申请一些实施例中，所述方法还包括：

本实施中，在初始化时，硬件加速器会提交包括组织方式和运行方式的自身信息，根据该自身信息可生成数字孪生图像。

为了保证数据库操作的可靠性，在本申请一些实施例中，在根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树之后，所述方法还包括：

本实施例中，若新执行代价不小于初始执行代价，说明执行初始执行计划树需要的计算资源更少，此时基于数据库执行初始执行计划树，并根据执行结果确定数据库操作的结果。

步骤S103，根据所述硬件加速器返回的执行结果确定所述硬件加速器对数据库操作加速后的结果数据。

本实施例中，硬件加速器执行新执行计划树后返回执行结果，从而确定硬件加速器对数据库操作加速后的结果数据。

可以理解的是，在执行步骤S103之后，该方法还包括：

若存在所述数据库同时执行所述新执行计划树的一部分，则根据所述结果数据和数据库自身的执行结果确定数据库的操作结果，否则，将所述结果数据确定为所述操作结果。

为了准确的确定硬件加速器对数据库操作加速后的结果数据，在本申请一些实施例中，所述硬件加速器为多个，各所述硬件加速器分别设置有本地存储单元，在根据所述硬件加速器返回的执行结果确定所述硬件加速器对数据库操作加速后的结果数据之前，所述方法还包括：

本实施例中，在硬件加速器执行新执行计划树时，需要对内存和外存进行管理，若硬件加速器为多个，各硬件加速器分别设置有本地存储单元，需要调整与执行结果对应的各硬件加速器的缓存和最终数据，以使各缓存和各最终数据分别保持一致。

通过应用以上技术方案，在连接有硬件加速器的数据库中，当接收到由所述数据库发送的需要进行加速的初始执行计划树时，根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树；若所述新执行计划树的新执行代价小于所述初始执行计划树的初始执行代价，根据所述硬件加速器的组织方式和运行方式将所述新执行计划树分发至所述硬件加速器执行；根据所述硬件加速器返回的执行结果确定硬件加速器对数据库操作加速后的结果数据，从而实现了数据库的执行计划树与进行硬件加速器的执行功能和能力相匹配并保持合理的复杂度，进而充分发挥了该硬件加速器的加速能力，同时在保留现有数据库系统架构的基础上实现硬件加速，保证了数据库系统的可靠性。

为了进一步阐述本发明的技术思想，现结合具体的应用场景，对本发明的技术方案进行说明。

本申请实施例提供一种对数据库操作进行加速的方法，如图3所示，新增加速部分处理流程(虚线框中部分)，与现有流程(没有虚线框的部分)共存，通过加速映射模块实现执行计划树的执行节点再映射和优化处理，来达到与硬件加速器功能的匹配，输出匹配后的新执行计划树，再由加速执行引擎模块将新执行计划树交由硬件加速器执行。

其中，硬件加速器的核心是硬件加速器，其可以是GPU，FPGA或ASIC，主要实现可加速的数据库操作，比如数据扫描，条件过滤，多表连接，分组汇聚，排序等其他硬件能合理实现的功能。除此之外，一些复杂的函数处理需一个额外的协处理器完成。或为更加高速的完成数据访问和存储，其上还可连接内存和高速磁盘。

硬件加速器将其实现的数据库操作进行组织，实现操作功能间的并发。一种可能的实现方式，考虑到实现的复杂度，实现最简单的多个相互独立的执行模块即可。即每个模块都有同样的子功能，其每个模块都可以独立完成一个计划树的执行(也许需要协处理器协助)。其结构如图10所示。

硬件加速器的具体组织不做限定，其正式执行加速处理前，需将自身的资源功能组织方式和运行方式通告给加速执行引擎模块，即在加速执行引擎处建立一个硬件加速器的数字孪生图像。这样，加速执行引擎可以高效的发挥硬件加速器的全部能力。

该方法包括以下步骤：

步骤1，加速映射模块接收经由解析引擎解析后并由优化引擎处理输出的需进行加速的初始执行计划树；

步骤2，加速映射模块依据执行节点类型的映射规则，完成对初始执行计划树中节点的再映射，得到匹配加速功能节点的匹配执行计划树；再对匹配执行计划树进行节点合并和输出目标列优化，输出新执行计划树；

加速映射模块比较新执行计划树的新执行代价和初始执行计划树的初始执行代价，如初始执行代价更小，则重新将初始执行计划树发送给执行引擎执行，否则执行步骤3；

步骤3，加速执行引擎模块根据硬件加速器的资源和能力，选择是一次发送多个或单个整个新执行计划树，还是将新执行计划树中多个或单个执行节点的组合给硬件加速器；

步骤4，硬件加速器完成接收到的节点的对应功能，返回最终结果数据集；

步骤5，加速存储引擎完成加速部分的内存和外存管理。

加速部分处理流程中各个模块可以是分散在多个硬件板卡由不同器件实现，也可以集成在一个硬件板卡由一个物理器件实现，其相互间的接口是传统的PCIe，Eth，FC(Fibre Channel，光纤通道技术)，Infiniband等接口，或是CCIX(Cache Coherent Interconnect for Accelerators，用于加速器的缓存一致性协议)，CXL(Compute Express Link，计算快速链接)等缓存一致性接口，或是其他的内部高速数据接口，本领域技术人员可灵活设定。

以下对图3中加速部分处理流程涉及的各个模块进行说明。

1、加速映射模块

现有优化引擎进行查询重写后生成的执行计划树，节点类型非常多。当前开源数据库软件PostgreSQL查询重写后输出的执行计划树，其可能的节点类型有40个，分为控制节点，扫描节点，连接节点和物化节点4大类，而硬件加速考虑到资源代价，功耗限制和实现复杂度，并无法实现如此多的复杂执行功能，其通常只实现基本的操作，具体的支持的基本操作由硬件加速器上报或提前相互确定。

以当前PostgreSQL的扫描节点为例，其总共实现了16种扫描节点类型，如采用FPGA实现加速部件，对扫描动作的支持通常就实现一种，比如顺序扫描，根据索引实现，还可能提供索引扫描。因此，加速映射模块需要将接收到的计划树中可能多达16种的不同类型的扫描节点映射归一为硬件支持的扫描动作。

如图4所示，前7个可直接映射为硬件加速器的扫描节点，后两个不会出现在执行树中，可以忽略。剩余类型的扫描节点，都需要软件配合进行额外的处理。FunctionScan,TableFuncScan视硬件是否支持对应的函数功能而映射为对应的功能调用，还是映射为软件调用一次性返回所有结果；CteScan扫描的是CTE(Common Table Expressions，通用表表达式)生成的临时表，通常可不处理，仅将生成的临时表向上层节点传递即可，但当控制节点RecursiveUnion出现时，需与WorkTableScan一同对Recursive展开后一起重映射。NamedTuplestoreScan将所扫描临时表向上层传递即可；ValuesScan,ForeignScan同样一次性返回所有结果。

如图5所示，连接节点PostgreSQL有三种，NestLoop，MergeJoin和HashJoin，对应到硬件加速器，只有一种连接动作。加速映射模块将接收到的计划树中的不同类型的连接节点映射归一为硬件支持的连接动作。如图5所示，其中HashJoin下层的Hash节点在该映射中可以直接忽略并去掉。

如图6所示，物化节点中的Sort和IncrementalSort映射到硬件加速器的Sort；如图7所示，Group节点，Agg节点，WindowAgg节点映射到硬件加速器的GroupAgg中；SetOp加上控制节点中的Append节点，MergeAppend节点已经映射为硬件加速器的集合操作。物化节点中的Limit和Unique两个节点映射为硬件加速器的一个参数即可，不再对应为一个具体的动作。

如图8所示，控制节点中处映射到集合操作中的Append和MergeAppend节点外，Gather和GatherMerge直接忽略去掉，其余bitmapAnd和bitmapOr与bitmapindexScan一道合并到硬件加速器的Scan中，RecursiveUnion进行展开处理后，与CteScan和WorkTableScan一同进行映射，ModifyTable对应硬件加速器的增删改操作，剩余的控制节点则同样一次性返回所有结果。

综上所述，加速映射模块将对应加速执行动作的节点进行归一映射，同时去掉部分功能被整合的节点，其中，部分节点进行预处理后再映射。

加速映射模块完成映射处理后，再根据硬件加速器的加速资源进行执行树的节点和输出列的优化匹配。

比如硬件加速器一种可能的方式是自己持有大容量的内存，或者通过缓存一致性协议(比如CCIX，CXL)等直接访问共享内存，或者可以通过网络访问方式访问远端存储节点的数据，因此，其可以依据所需访问数据的存储方式决定可并发的扫描节点动作；

同时，不同执行节点对同一数据的访问，可直接合并为一个执行动作。同时加速部件执行产生的中间输出，可以消除与后继处理节点和最终结果非相关的输出列的缓存。

2、加速执行引擎

加速执行引擎可自身执行部分节点功能，以postgres为例，比如Result节点，RecursiveUnion节点等，加速执行引擎还根据硬件加速器的实现方式，选择将接收到的匹配后的新执行计划树以何种方式分发给一个或多个硬件加速器执行。

初始化时，所有硬件加速器将向加速执行引擎通告包括组织方式和运行方式的自身信息，加速执行引擎自身维护一个硬件加速器的数字孪生图像。依据所述自身信息，选择如何将新执行计划树提交给硬件加速器。数字孪生图像包括硬件加速器的执行模块数量，可执行功能节点的数量，各自归属关系，能够调度的执行粒度等信息。若硬件加速器采用图10所示的架构，则该数字孪生图像包括了执行粒度最大为整个执行树，最小由其内部节点的调度方式决定，每个执行模块包括的功能节点，各自的数量，执行树内部节点的调度方式等。

一种可能的实现方式是将多个用户终端的查询请求对应的新执行计划树发送给硬件加速器。硬件加速器将其一一对应到其一个执行模块，并依次按单个节点执行，完成加速处理过程。这仅限于硬件加速器的采用如图10所示架构。如果其余架构，执行动作也会有区别。如图9中所示为加速执行引擎的原理示意图，图9中，匹配的计划树1-n即所述新执行计划树1-n，执行部件数字孪生即所述数字孪生图像。

3、加速存储引擎

加速存储引擎完成加速部分的内存和外存管理，若多个硬件加速器都有各自的本地存储单元，则还需协调多个硬件加速器间的缓存和最终数据的一致性。

以下以TPC-H的测试的Q7为例对本方案进行说明。

对应的SQL(Structured Query Language，结构化查询语言)如下：

PostgreSQL输出的执行计划如图11所示，图中箭头指示的两个scan节点，对同一表，相同条件下的扫描就可以进行节点合并。

加速映射模块进行加速映射后，执行计划树转变为如图12所示的执行计划树。其中，Index Scan和Seq Scan都映射为统一的Scan节点，Hash Join，Nested Join都被映射为Join操作，且Hash Join下层的Hash节点被去掉；同时Gather Merge也被去掉。这样，整个执行计划树重新映射为了一颗匹配硬件加速器的新的执行计划树。加速映射模块再进行节点和输出目标列的优化匹配后，执行计划树转变为如图13所示的执行计划树。

其中，对nation的扫描节点将被优化为同一节点，即只会被执行一次。通过添加verbose进一步查看执行计划，在对lineitem进行扫描时，其输出列包括了所有列，但实际在最终输出和后继节点需要使用的列仅有l_orderkey,l_suppkey,l_shipdate,l_extendedprice,l_discount和l_year 6列。故加速映射模块将进一步优化各个节点的输出列，输出列优化代码如图14所示。

加速映射模块完成新执行计划树的生成后，加速执行引擎将该新执行计划树和相关参数发送给硬件加速器执行。其可以是对整个新执行计划树进行发送，也可以是一个一个节点进行发送，也可以是多个节点发送，具体可由其所持有的硬件加速器的数字孪生图像来决定。

与本申请实施例中的一种对数据库操作进行加速的方法相对应，本申请实施例还提出了一种对数据库操作进行加速的装置，应用于连接有硬件加速器的数据库中，如图15所示，所述装置包括：

加速映射模块501，用于当接收到由所述数据库发送的需要进行加速的初始执行计划树时，根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树；

加速执行引擎502，用于若所述新执行计划树的新执行代价小于所述初始执行计划树的初始执行代价，根据所述硬件加速器的组织方式和运行方式将所述新执行计划树分发至所述硬件加速器执行；

确定模块503，用于根据所述硬件加速器返回的执行结果确定所述硬件加速器对数据库操作加速后的结果数据；

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种对数据库操作进行加速的方法，应用于连接有硬件加速器的数据库中，其特征在于，所述方法包括：

当接收到由所述数据库发送的需要进行加速的初始执行计划树时，根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树和新执行代价；

若所述新执行计划树的新执行代价小于所述初始执行计划树的初始执行代价，根据所述硬件加速器的组织方式和运行方式将所述新执行计划树分发至所述硬件加速器执行；

所述硬件加速器返回的执行结果，完成对数据库操作的加速操作；

其中，所述新执行代价和所述初始执行代价是基于调用预设代价函数确定的。
如权利要求1所述的方法，其特征在于，根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树，具体为：

根据所述基本操作将所述初始执行计划树中执行加速操作的节点进行归一映射，同时还将去掉部分功能被整合的节点，再将部分节点进行预处理后再映射，然后根据归一映射的结果生成与所述硬件加速器匹配的匹配执行计划树；

根据所述加速资源对所述匹配执行计划树中节点和输出目标列进行优化，并根据优化结果生成所述新执行计划树。
如权利要求2所述的方法，其特征在于，所述归一映射包括归并、和/或删除、和/或新增。
如权利要求2所述的方法，其特征在于，根据所述加速资源对所述匹配执行计划树中节点和输出目标列进行优化，具体为：

根据所述加速资源确定所述硬件加速器访问所需数据的方式、各节点执行数据访问的方式、最终输出和后继节点需要使用的列；

根据所述硬件加速器访问所需数据的方式确定所述匹配执行计划树中的可并发执行的节点，并将所述匹配执行计划树中对同一数据进行访问的不同执行节点合并为一个执行动作，并根据最终输出和后继节点需要使用的列对输出目标列进行优化；

其中，所述硬件加速器访问所需数据的方式包括基于自身内存进行访问、或基于缓存一致性协议对共享内存进行访问、或通过网络对远端存储节点进行访问。
如权利要求1所述的方法，其特征在于，根据所述硬件加速器的组织方式和运行方式将所述新执行计划树分发至所述硬件加速器执行，具体为：

根据与所述组织方式和所述运行方式对应的数字孪生图像将一个或多个所述新执行计划树整体发送至所述硬件加速器执行、或将所述新执行计划树按单个节点依次发送至所述硬件加速器执行、或将所述新执行计划树中的多个节点组合发送至所述硬件加速器执行；

其中，所述数字孪生图像包括所述硬件加速器的执行模块数量，可执行功能节点的数量，各可执行功能节点的归属关系和可调度的执行粒度。
如权利要求5所述的方法，其特征在于，所述方法还包括：

当接收到初始化指令并接收所述硬件加速器发送的包括组织方式和运行方式的自身信息时，根据所述自身信息生成所述数字孪生图像。
如权利要求1所述的方法，其特征在于，所述硬件加速器为多个，各所述硬件加速器分别设置有本地存储单元，在根据所述硬件加速器返回的执行结果确定所述硬件加速器对数据库操作加速后的结果数据之前，所述方法还包括：

调整与所述执行结果对应的各所述硬件加速器的缓存和最终数据，以使各所述缓存和各所述最终数据分别保持一致。
如权利要求1所述的方法，其特征在于，在根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树之后，所述方法还包括：

若所述新执行代价不小于所述初始执行代价，基于所述数据库执行所述初始执行计划树，并根据执行结果确定数据库操作的结果。
一种对数据库操作进行加速的硬件加速装置，其特征在于，所述装置包括：

加速映射模块，用于当接收到由所述数据库发送的需要进行加速的初始执行计划树时，根据所述硬件加速器支持的基本操作和加速资源对所述初始执行计划树进行处理并生成新执行计划树；

加速执行引擎模块，用于若所述新执行计划树的新执行代价小于所述初始执行计划树的初始执行代价，根据所述硬件加速器的组织方式和运行方式将所述新执行计划树分发至所述硬件加速器执行；

加速存储引擎模块，用于完成加速部分的内存和外存管理，协调多个所述硬件加速器间的缓存和最终数据的一致。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行如权利要求1-8任一项所述的对数据库操作进行加速的方法。