WO2022143685A1

WO2022143685A1 - 一种使用网络设备进行数据查询的系统、方法、及装置

Info

Publication number: WO2022143685A1
Application number: PCT/CN2021/142146
Authority: WO
Inventors: 罗旦; 张巍; 李铮; 刘玉; 伍玉叶; 冒伟; 张赞庆
Original assignee: 华为技术有限公司
Priority date: 2020-12-29
Filing date: 2021-12-28
Publication date: 2022-07-07
Also published as: US20230342399A1; EP4246340A4; CN114756730A; EP4246340A1

Abstract

本申请提供一种使用网络设备进行数据查询的系统、方法、及装置。所述系统的中心节点通过网络设备连接至工作节点。所述网络设备例如为网卡、交换机、路由器等。中心节点将用户输入的查询请求生成多个任务。在为所述多个任务分配执行设备的时候，中心节点会将一些任务的执行设备配置为网络设备，一些任务的执行设备配置为工作节点，然后发送配置指令至所配置的网络设备及工作节点，以在网络设备及工作节点上设置为其配置的任务。配置完成后，由于工作节点与中心节点之间传输的数据都要经过网络设备，所以网络设备会对经过的数据执行所设置的任务，从而以减少工作节点的运算量，减轻工作节点上处理器的负担并加速数据处理。

Description

一种使用网络设备进行数据查询的系统、方法、及装置

技术领域

本申请涉及计算机技术领域，尤其涉及一种使用网络设备进行数据查询的系统、方法、及装置。

背景技术

如今的信息时代，随着计算机、信息技术的迅速发展，产生的数据量也迅速增长，数据库中存储的数据量大到数百TB(Terabyte，太字节)(1TB＝1024GB)甚至数十至数百PB(Petabyte，千万亿字节)(1PB＝1024TB)。这些数据来源众多、数量巨大、形式各异，如何快速在数据库中查找到目标数据变得十分重要。

随着数据量的大量增长，为了保证数据的查询效率，当前的主要方式为增加处理数据的硬件资源，例如增加查询系统中各个节点的处理器(例如中央处理器(central processing unit，CPU)的处理能力及内存容量，但增加处理器的处理能力及内存容量导致产品的成本增加，另外，处理器的处理能力的增长空间有限，所以有时无法通过增强处理器的处理能力来提升查询效率。

发明内容

本申请提供一种数据查询方法及装置，用以在不增强CPU性能和/或内存容量的基础上，加速数据处理。

第一方面，本申请提供一种数据查询系统。所述系统包括中心节点、工作节点及网络设备，所述中心节点通过所述网络设备连接至所述工作节点。中心节点将用户输入的查询请求生成多个任务。在为所述多个任务分配执行设备的时候，中心节点会将一些任务的执行设备配置为网络设备，一些任务的执行设备配置为工作节点，然后发送配置指令以在网络设备及工作节点上配置相应的任务。在网络设备及工作节点设置了为其配置的任务之后，在数据流经所述网络设备时，即可对所述数据执行预先配置的任务。

通过上述设计，中心节点可以将一些任务配置给网络设备执行，这样，在数据流经网络设备时，由网络设备执行了预先配置的任务之后，再转发给其他执行设备，与相关技术中所有任务都由工作节点处理的方案相比，减少了工作节点的运算量，减轻工作节点上处理器的负担，从而可以在不增加工作节点的处理器的处理能力的基础上，加速数据处理。

在一种可能的实现方法中，在生成多个任务之后，所述中心节点用于在所述多个任务中查找可卸载任务，并将所述可卸载任务的执行设备设置为所述网络设备，所述可卸载任务为预设的卸载至所述网络设备执行的任务。

通过上述设计，可以预先配置好适宜卸载至网络设备的可卸载任务，可以方便的从所述多个任务中快速查找到可卸载任务。

在一种可能的实现方法中，所述中心节点用于将所述可卸载任务的设置指令发送至所述网络设备；所述网络设备用于根据所述设置指令设置所述可卸载任务。

在一种可能的实现方法中，所述网络设备为工作节点的网卡或者转发设备，转发设备可以是交换机、路由器。

在一种可能的实现方法中，所述转发设备包括数据端口及控制端口；所述中心节点用于将所述可卸载任务的设置指令通过转发设备的控制端口发送至转发设备；还用于将执行设备为网卡或者工作节点的任务的设置指令通过数据端口发送至转发设备；对应的，转发设备在通过控制端口接收到设置指令时，设置设置指令中所指示的可卸载任务；以及，当从数据端口接收到设置指令时，转发从数据端口接收到的设置指令。

通过上述设计，转发设备可以根据数据端口较快地区分需要转发的数据包，并转发给对应的设备，不需要对数据包进行解析，减少发送时延；以及根据控制端口区分中心节点发送的设置指令，避免误转发漏配置。

在一种可能的实现方法中，当执行可卸载任务的网络设备为工作节点中的网卡时，中心节点用于将可卸载任务的设置指令发送至所述工作节点，由工作节点根据设置指令在工作节点的网卡上设置所述可卸载任务。

通过上述设计，由工作节点根据设置指令在网卡上设置可卸载任务，当工作节点上集成有卸载策略时，还可以根据网卡的实际负载状况等确定是否卸载至网卡，这样工作节点控制网卡执行可卸载任务的方式更加灵活。

在一种可能的实现方法中，可卸载任务的设置指令包括可卸载标记；工作节点在接收到设置指令后，在确定设置指令中包括可卸载标记时，在工作节点的网卡上设置可卸载任务。

在一种可能的实现方法中，网络设备在接收到数据包之后，当确定数据包中包括该网络设备所执行的可卸载任务的标识时，对该数据包执行所述可卸载任务。

通过上述设计，网络设备可以根据可卸载任务的标识监控可卸载任务的数据包，并对该数据包执行可卸载任务，这样不需要单独的执行指令，可以快速准确的识别网络设备执行的可卸载任务，节省了开销，同时加速了数据处理。

在一种可能的实现方法中，中心节点还用于在确定所述可卸载任务之后，在确定可卸载任务符合所述可卸载任务对应的卸载策略时，发送所述可卸载任务的设置指令。

通过上述设计，可以进一步根据网络的环境等实际因素确定所述可卸载任务是否适合卸载至网络设备执行，从而进一步提高了数据查询的效率。

在一种可能的实现方法中，任务用于指示待执行的操作和操作数，操作数为被执行操作的数据；任务的设置指令可以包括任务标识和算子信息，其中，任务标识用于唯一标识一个查询请求中的一个任务，算子信息包括算子标识，算子标识唯一标识一种算子，一种操作可以运行一个或多个算子来完成，运行算子以对操作数执行任务所指示的操作。

在一种可能的实现方法中，可卸载任务是指完成该任务所需的算子均为可卸载算子；其中，可卸载算子可以是预设的；示例性地，可卸载算子包括：filter(过滤)算子、aggregation(聚合)算子、distinct(非空唯一)算子、TopN(前N个值)算子、Join(表联合)算子等；或可卸载算子为满足对应的可卸载策略的预设算子；示例性，预设算子和其对应的可卸载策略包括：filter算子，其对应的可卸载策略为在过滤列执行filter算子的选择率不低于预设阈值(例如第一预设值)；aggregation算子，其对应的可卸载策略为在聚合列执行aggregation算子时，聚合列上被执行聚合的数据的基数不超过第二预设值；distinct算子，其对应的可卸载策略为需要执行去重的列上的数据的基数不超过第三预设值；其中，第一预设值、第二预设值或第三预设值可以是完全相同的值，也可以是不完全相同的值，或者是完全不同的值。

第二方面，本申请提供一种数据查询方法，该方法可以应用于中心节点，所述中心节点通过网络设备连接至工作节点，该方法包括：中心节点将用户输入的查询请求生成多个任务。在为所述多个任务分配执行设备的时候，中心节点会将一些任务的执行设备配置为网络设备，一些任务的执行设备配置为工作节点，然后发送设置指令以在网络设备及工作节点上配置相应的任务。

在一种可能的实现方法中，当工作节点或网络设备设置完设置指令所指示的任务后，向中心节点发送反馈响应，用于指示已完成中心节点下发的任务的配置，随后，中心节点可以发送该查询请求的执行指令，该执行指令用于触发执行设备执行所设置的任务。

在一种可能的实现方法中，所述确定所述多个任务中的每个任务的执行设备包括：在生成多个任务之后，中心节点在所述多个任务中查找可卸载任务，并将所述可卸载任务的执行设备设置为网络设备，所述可卸载任务为预设的卸载至所述网络设备执行的任务。

在一种可能的实现方法中，当确定可卸载任务的执行设备为网络设备时，中心节点发送可卸载任务的设置指令至该网络设备。

在一种可能的实现方法中，该网络设备可以是工作节点的网卡或者转发设备，该转发设备可以是交换机或路由器。

在一种可能的实现方法中，当确定执行该可卸载任务的网络设备为工作节点的网卡时，中心节点将可卸载任务的设置指令发送至该工作节点，由工作节点控制在网卡中设置可卸载任务。

在一种可能的实现方法中，中心节点在确定执行可卸载任务的网络设备为转发设备时，发送所述可卸载任务的设置指令至转发设备。

在一种可能的实现方法中，设置指令中携带可卸载标记。

在一种可能的实现方法中，可卸载任务可以是预设的，中心节点在多个任务中确定出可卸载任务后，且确定该可卸载任务符合可卸载任务对应的卸载策略时，再发送该可卸载任务的设置指令至网络设备。

在一种可能的实现方法中，对于能够卸载到多个设备的可卸载任务，中心节点在确定该可卸载任务的执行设备时，还可以按照预设的可卸载任务对应的各设备的优先级来确定执行设备。

在一种可能的实现方法中，中心节点在确定该可卸载任务的执行设备时，还可以根据预设的可卸载任务对应的各设备的优先级和各设备的负载状况来确定执行设备。

关于该第二方面实现的有益效果，请参考第一方面关于中心节点执行方法的有益效果描述，在此不再赘述。

第三方面，本申请提供一种数据查询方法，可以应用于网络设备，该网络设备用于连接中心节点及工作节点，所述方法包括：网络设备接收中心节点发送的设置指令，并根据该设置指令设置对应的任务，并对流经该网络设备的数据包执行该任务。

在一种可能的实现方法中，网络设备可以为工作节点的网卡或者转发设备，例如转发设备为交换机或路由器。

在一种可能的实现方法中，转发设备包括数据端口及控制端口。转发设备可以从控制端口接收设置指令，通过控制端口接收到的数据为中心节点配置给转发设备的，转发设备根据控制端口接收到的设置指令设置可卸载任务；转发设备也可能从数据端口接收到设置指令，通过数据端口接收到的数据为中心节点配置给转发设备以外的其他设备的，转发设备转发从数据端口接收到的数据。

在一种可能的实现方法中，网络设备在接收到数据包之后，当确定数据包中包括网络设备所执行的可卸载任务的标识时，基于该数据包执行该可卸载任务。

关于该第三方面实现的有益效果，请参考第一方面关于网络设备执行方法的有益效果描述，在此不再赘述。

第四方面，本申请实施例还提供了一种数据查询界面，包括：查询命令输入区、任务显示区和执行设备显示区；

其中，查询命令输入区，用于接收用户输入的查询请求；

任务显示区，用于显示根据所述查询请求生成的执行所述查询请求的多个任务；

执行设备显示区，用于显示每个任务的执行设备，所述执行设备包括工作节点及网络设备。

在一种可能的实现方法中，所述查询命令输入区、任务显示区、及执行设备显示区在同一界面显示。

在一种可能的实现方法中，所述查询命令输入区、任务显示区、及执行设备显示区在不同界面显示。

第五方面，本申请实施例还提供了数据查询交互方法，该方法可以应用中心节点，中心节点为客户端的服务端，该方法包括：用户在客户端输入查询请求，客户端将该查询请求转发至中心节点，对应的，中心节点接收该查询请求，并基于该查询请求生成多个任务；更进一步地，中心节点生成该查询请求的执行计划，该执行计划包括每个任务的执行设备的信息，其中，中心节点可以将任务分配给工作节点执行，也可以将任务分配给网络设备执行，也就是，执行设备可以是工作节点或网络设备。中心节点可以在本地显示该多个任务的执行计划，也可以是中心节点将该执行计划发送给客户端，对应的，客户端在接收到该执行计划后，可以显示该执行计划，包括显示该多个任务以及每个任务的执行设备。

在一种可能的实现方法中，客户端上该多个任务按照执行计划以树状显示。

在一种可能的实现方法中，显示所述多个任务的执行进度。

通过上述设计，可以让用户直观的了解该查询请求的执行计划，以及查询进度，提高用户的参与度和使用体验。

第六方面，本申请实施例还提供了一种中心设备，该设备包括多个功能单元，这些功能单元可以执行第二方面的方法中各个步骤所执行的功能。这些功能单元可以通过硬件实现，也可以通过软件实现。在一个可能的设计中，该设备包括侦测单元以及处理单元。

第七方面，本申请实施例还提供了一种网络设备，该设备包括多个功能单元，这些功能单元可以执行第三方面的方法中各个步骤所执行的功能。这些功能单元可以通过硬件实现，也可以通过软件实现。在一个可能的设计中，该设备包括侦测单元以及处理单元。

第八方面，本申请实施例还提供了一种中心设备，该设备包括处理器、存储器和收发机，所述存储器中存储有程序指令，所述处理器运行所述存储器中的程序指令，通过收发机与其他设备通信，以实现第二方面所提供的方法。

第九方面，本申请实施例还提供了一种网络设备，该设备包括至少一个处理器和接口电路，所述处理器用于通过所述接口电路与其它装置通信，以实现第三方面所提供的方法。

其中，所述处理器可以为可编程门阵列(field programmable gate array，FPGA)、数据处理单元(data processing unit,DPU)、图形处理器(graphics processing unit，GPU)、特殊应用集成电路(application specific integrated circuit，ASIC)、系统级芯片(system on chip，SOC)。

第十方面，本申请还提供一种计算机可读存储介质，计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第二方面所提供的方法或第三方面所提供的方法。

附图说明

图1为本申请实施例提供的一种系统架构示意图；

图2为本申请实施例提供的一种查询系统架构示意图；

图3为本申请实施例提供的一种工作节点的内部结构示意图；

图4为本申请实施例提供的一种网络架构示意图；

图5为本申请实施例提供的另一种网络架构示意图；

图6为本申请实施例提供的一种数据查询方法所对应的示意图；

图7为本申请实施例提供的一种执行计划的界面示意图；

图8为本申请实施例提供的另一种执行计划的界面示意图；

图9为本申请实施例提供的一种网卡资源分配的示意图；

图10为本申请实施例提供的另一种数据查询方法所对应的流程示意图；

图11为本申请实施例提供的一种设备结构示意图；

图12为本申请实施例提供的一种网络设备的装置结构示意图。

具体实施方式

为了使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施例作进一步地详细描述。

本发明实施例描述的网络架构以及业务场景是为了更加清楚的说明本发明实施例的技术方案，并不构成对于本发明实施例提供的技术方案的限定，本领域普通技术人员可知，随着网络架构的演变和新业务场景的出现，本发明实施例提供的技术方案对于类似的技术问题，同样适用。

参见图1，为本申请实施例可能适用的一种系统架构示意图。该系统包括客户端10，查询系统20和数据源30。

其中，客户端10是用户侧的一种计算设备，例如为台式计算机、笔记本电脑等。在硬件层面，客户端10中设置有处理器和内存(图1中未示出)。在软件层面，客户端10上运行有客户端程序。客户端程序用于接收由用户触发的查询请求，并且与查询系统20交互，例如向查询系统20发送该查询请求。对应的，查询系统20上运行有服务端程序，用于与客户端程序进行交互，例如接收客户端10发送的查询请求，查询系统20还用于从数据源30中获取查询请求所请求进行查询的原始数据，并对该原始数据进行计算或处理等以得到查询结果(或者说目标数据)，后续，查询系统20将得到的查询结果返回给客户端10。

数据源30，可以是指数据库或者数据库服务器。在本实施例中，是指查询系统可以分析的数据源，例如MySQL数据源，Oracle数据源，HIVE数据源，其中数据的存储格式可以是HDFS(hadoop distributed file system，Hadoop分布式文件系统)文件，ORC(Optimized Row Columna，)文件，CSV(comma-separated values，逗号分隔值)文件，也可以是XML(eXtensible markup language，可扩展标记语言)，Json(javascript object notation，对象简谱)等半结构化数据。当然，上述列举仅为示例，本申请实施例对数据源以及数据存储格式不做限定。数据源可以采用分布式存储，对应的在硬件层面上，数据源可以包括一个或多个存储节点，其中存储节点可以是存储服务器、台式计算机或者存储阵列的控制器、硬盘等。

为了提高查询效率，查询系统可以采用大规模并行处理(massively parallel processing，MPP)架构，例如，Presto查询引擎，Presto查询引擎是一种开源的MPP SQL(structured query language，结构化查询语言)查询引擎，即分布式SQL查询引擎，用于查询分布在一个或多个不同数据源中的大数据集合，适用于交互式分析查询。具体的，MPP架构是指将任务并行的分散到多个服务器或节点上，在每个服务器或节点上并行执行任务，举例来说，某学生信息表包含学生的姓名、年龄、学号等信息，用户触发查询请求，请求查询该学生信息表中姓名为“小明”的学生，则在MPP架构的查询系统中，可以让多个节点分别基于该学生信息表中的部分行进行查询，这样便能够缩短查询时间，从而减少总查询耗时，提高查询效率。应理解，参与查询的节点越多，则同一个查询请求所需的查询时间越短。

如下以MPP架构为例，对本申请实施例提供的查询系统进行具体介绍。

请参考图2，本实施例中的查询系统主要包括：中心节点集群和工作节点集群。如图2所示，中心节点集群包括一个或多个中心节点(图2中仅示出两个中心节点100和101，但本申请对中心节点的数量不做限定)。工作节点集群包括一个或多个工作节点(图2中示出了三个工作节点20a、20b和20c，但本申请不限于三个工作节点)。

其中，中心节点，用于接收客户端发送的查询请求，并将接收到的查询请求解析为一个或多个任务，随后，将该一个或多个任务并行的下发到多个工作节点上，多个工作节点可以并行处理被分配的任务。应理解，中心节点可以将任务并行分配至查询系统中的部分工作节点，也可以分配至全部工作节点，另外，每个工作节点被分配的任务可以完全相同，也可以不完全相同，或者也可以完全不同，本申请实施例对此也不做限定。需要说明的是，中心节点可以是各个工作节点从工作节点中选举出一个节点让它承担中心节点的职能，也可以是特定的设备。另外，当查询系统中存在多个中心节点时，客户端所发送的一个查询请求会被路由到多个中心节点中的任意一个中心节点上。这样，查询系统中的多个中心节点可以同时响应多个查询请求，该多个查询请求可以是多个客户端发送的，也可以是一个客户端发送的。

工作节点，用于接收中心节点发送的任务，并执行任务。示例性地，执行的任务包括从数据源获取待查询的数据和对所获取的数据进行各种计算处理等。由于各个任务可以由各个工作节点并行处理，所以并行处理后的结果最终汇总后反馈给客户端。

继续参见图2，在硬件上，中心节点和工作节点至少包括处理器、存储器和网卡。接下来以工作节点20a为例对上述硬件的连接关系和工作方式进行具体介绍。

如下以工作节点20a为例进行描述，请参见图3，图3为工作节点20a的内部结构示意图。如图3所示，工作节点20a主要包括处理器201，存储器202，以及网卡203。处理器201，存储器202，以及网卡203通过通信总线完成相互间的通信。

其中，处理器201可以是中央处理器(central processing unit，CPU)，可以用于对数据进行计算或处理等。存储器202，是指用于存储数据的装置，存储器包括内存、硬盘。其中，内存可以被随时读写数据，而且读取速度很快，可以作为正在运行中的程序的临时数据存储器。内存包含至少两种类型的存储器，例如随机存取存储器(Random Access Memory，RAM)、只读存储器(Read Only Memory,ROM)。与内存相比，硬盘读写数据的速度较慢，通常用于持久性地存储数据。硬盘类型至少包括固态硬盘(solid state disk或solid state drive，SSD)、机械硬盘(mechanical hard disk，HDD)或者其他类型的硬盘。一般的，硬盘中的数据需要先读入到内存中，处理器201或计算单元221从内存中获取数据。其中，处理器230的内存资源和计算单元221的内存资源可以是共享的，也可以是互相独立的，本申请实施例对此不作限定。

网卡203，用于实现数据交互和数据处理。在硬件层面，网卡203至少包括通信单元220和计算单元221(图3是以一个计算单元为例示出，但本申请对此不做限定)。其中，通信单元220可以提供高效的网络传输能力，用于接收从外部设备输入的数据或发送本设备输出的数据。计算单元221包括但不限于：可编程门阵列(field programmable gate array，FPGA)、数据处理单元(data processing unit,DPU)、图形处理器(graphics processing unit，GPU)、特殊应用集成电路(application specific integrated circuit，ASIC)、系统级芯片(system on chip，SOC)。本实施例以FPGA为例予以说明。FPGA具有CPU的通用性和可编程性，但更具有专用性，可以在网络数据包，存储请求或分析请求上高效运行。FPGA通过较大程度的并行性(需要处理大量请求)与CPU区别开来。

本申请中，工作节点或中心节点可以部署在至少一个物理节点上，例如，一个工作节点和一个中心节点可以部署在同一个服务器上，再示例性地，一个中心节点和一个工作节点可以分别部署在互相独立的两个服务器上，此处不再一一列举。另外，存储节点也可以是一个独立的装置，例如存储服务器，需要说明的是，上述节点可以部署在物理机上，也可以部署在虚拟机，本申请对此也不做限定。

在实际应用中，图1所示的系统中还包括转发设备，例如交换机或路由器，为方便描述下文以交换机为例，交换机可以用于进行数据转发，在本实施例中，任意两个节点之间，例如中心节点和工作节点之间，中心节点和存储节点之间，工作节点与工作节点之间，以及工作节点与存储节点之间可以互联，实现彼此协同计算。

请参见图4，为本申请实施例提供的查询系统实际应用场景中的物理架构示意图。在图4所示的查询系统中，工作节点集群除了图3中的包括工作节点20a、工作节点20b、及工作节点20c，还包括工作节点20d、工作节点20e；中心节点集群只包括中心节点100；数据源包括存储节点30a、存储节点30b、存储节点30c；转发设备包括交换机10、交换机20、交换机30和交换机40。

如图4所示，中心节点、工作节点、存储节点均为互相独立的物理机。其中，工作节点20a、工作节点20b、中心节点100和交换机10安装于架子1(rack 1)上；工作节点20c、工作节点20d、工作节点20e和交换机20安装于架子2上；存储节点30a、存储节点30b、存储节点30c和交换机30安装于架子3上。

其中，同一架子内的节点之间可以通过架子内的交换机交互。举例来说，架子1内，中心节点100可以通过交换机10与架子1内的其他任意一个节点，例如与工作节点20a进行数据交互。示例性地，本申请实施例中，中心节点和工作节点之间交互的数据至少包括包头部分和数据部分，其中，包头部分包括源IP地址和目的IP地址，数据部分为需要传输的数据本身。示例性地，中心节点100向工作节点20a发送数据的过程可以包括：中心节点100向工作节点20a发送数据，该数据中的源IP地址为中心节点100的IP地址，目的IP地址为工作节点20a的IP地址，具体的，中心节点100发出该数据时，该数据首先被路由到交换机10上，交换机10根据该数据携带的目的IP将该数据转发至工作节点20a。

图4还包括交换机40，其中，交换机40为该系统中的核心交换机(core switch)，相对于核心交换机来说，交换机10、交换机20或交换机30又可以称为各自架子内的顶部交换机(tor swtich)。核心交换机可以用于实现不同架子上的节点之间的数据交互。举例来说，架子1上的节点与架子3上的节点进行数据交互时，可以通过交换机10、核心交换机40和交换机30实现。举例来说，工作节点20a向存储节点30a发送数据时，该数据的传输路径为：该数据首先被路由至交换机10，交换机10查看目的IP地址与自身的IP地址不在同一网段，则将该数据转发至核心交换机40，核心交换机40将该数据转发至与该目的IP地址同一网段的交换机30，交换机30将该数据转发至该目的IP地址对应的存储节点30a。该交换机40的安装位置不限定，例如可以安装于图4中的任一架子上。

本申请实施例中的交换机，除了具有数据转发功能之外，还具有计算、数据处理能力，例如可编程交换机。

需要说明的是，图4所示的系统架构仅为举例，请参见图5，为本申请实施例提供了另一种系统架构示意图，其中，存储节点也可以部署在工作节点上，例如，数据源中的数据可以存储在工作节点的硬盘中，本申请实施例对系统架构，以及各节点的部署形式不做限定。

总体来说，为解决背景技术中提到的问题，本申请提供了一种数据查询方法，中心节点接收客户端发送的查询请求，并将该查询请求解析为一个或多个任务，之后，中心节点可以将其中的一些任务卸载至网络设备进行处理，例如网络设备为工作节点的网卡或转发设备，相对于将任务分配至工作节点处理的方式，减轻了工作节点的计算量，减少了工作节点的CPU负担，从而可以在不增强工作节点的硬件资源的基础上，提高数据处理速度。

下面结合具体的附图和实施例对本申请实施例提供数据查询方法进行具体说明。

请参见图6，为本申请实施例提供的数据查询方法的流程示意图。在本实施例中，中心节点在多个任务中确定出可卸载任务，并指示工作节点将可卸载任务卸载至网卡进行处理。该方法可以应用于图4或图5所示的系统架构中，该方法主要包括如下步骤：

步骤601，客户端向中心节点发送查询请求，对应的，中心节点接收客户端发送的查询请求。

查询请求是用户在客户端触发的，例如，查询系统为MPP SQL引擎，查询请求可以是SQL语句，如下以SQL语句为例，对查询请求进行介绍，实际上，本申请实施例对查询请求的语句不做限定。

首先介绍如下两个列表，该两个列表为用户触发的查询请求中请求查询的原始数据，其中，表1(名称为factTbl)，为某商家的商品销售记录，用于记录该商家的流水。表2(名称为dimTbl)，为商品名称表，用于记录该商家出售的商品的标识和商品名称。应理解，表1和表2仅示出了部分数据。

表1.factTbl

Id(商品标识)	Sale(销售额)/元	Data(日期)
1	100	2020.01.01
2	150	2020.01.01
1	100	2020.01.02
3	200	2020.01.02
…	…	…

表2.dimTbl

Id(商品标识)	Name(商品名称)
1	水杯A
2	水杯B
3	水杯C

4	水杯D
…	…

假设查询请求为，用户要查询表1中日期为2020/01/02这一天，表2中每一种商品分别的销售总额。示例性地，该查询请求对应的SQL语句如下：

SELECT dimTbl.name,sum(factTbl.sale)

FROM factTbl JOIN dimTbl

ON factTbl.ID＝dimTbl.ID

WHERE factTbl.day＝‘20200102’

GROUP BY dimTbl.name。

步骤602，中心节点将该查询请求解析为一个或多个任务。

在本实施例中，查询请求可以拆分为一个或多个任务，具体的，任务包括下列信息中的部分或全部：待操作数据的信息、算子信息、操作规则。其中，待操作数据的信息用于指示待操作数据，待操作数据为被操作的对象；算子信息包括算子的标识，该标识用于指示算子，一种算子表示一种执行操作；操作规则是指执行操作的规则，也可以理解为算子的规则。例如，上述SQL语句中“WHERE factTbl.day＝‘20200102’”可以解析出过滤任务，该过滤任务中待操作数据为表1(factTbl)，算子标识为filter(过滤)算子的标识，filter算子表示的执行操作为过滤，在该任务中该filter算子的规则为data＝20200102。

下面对本申请实施例可能应用的一些算子进行解释说明。

1，tablescan(顺序表扫描)算子

tablescan算子，表示扫描操作，用于按照行在数据库中的存储顺序来读取表上所有页中的所有行。

2，Filter算子

Filter算子，表示过滤操作，用于按照操作规则(或过滤条件)对表中的过滤列进行过滤，得到符合过滤条件的行。其中，过滤列是指需要过滤的一列或多列。例如，过滤条件是过滤表1中Data＝2020/01/02的数据，则表1中的Data列即为过滤列。具体的，在执行任务1时，可以在读取表1的每一行的同时根据过滤条件对每一行进行过滤，也可以读取部分行后，再基于该部分行执行过滤。

3，Join(表联合)算子

Join算子，表示表联合操作，用于根据某一列或多列的条件对两表进行重组联合，多用于按照小表(数据量相对较小的表，例如表2)中的某一项或多项数据来过滤大表(数据量相对较大的表，例如表1)中的数据，还可以将小表中的数据和大表中的数据相结合。

示例性地，使用Join算子的流程包括：在需要Join的小表的On条件上的列(例如表2的ID列)维护一个布隆过滤器(BloomFilter，BF)，然后再扫描大表，在扫描大表的时候，将扫描出的每一行中On条件上的列(例如表1的ID列)的值与BF匹配，如果不存在于BF中，就丢弃这一行，如果存在，就保留。Jion算子可以用于将小表中的某些列与大表的某些列组合，例如，例如基于表1和表2中相同的ID值，将表1和表2的name列组合。

具体的，jion算子包括broadcast jion和hash jion，其中，假设需要jion的数据包括表2，broadcast jion的操作流程为，1个工作节点读取完整的表2，然后将该完整的表2广播至其他执行jion算子的每个工作节点处。而hash jion可以是，多个工作节点分别读取表2的一个或多个分片(下文会对分片进行详细介绍)，然后将各自读取的分片分别发送至其他工作节点处，这样每个工作节点便可以基于其他工作节点读取的表2的分片得到完整的表2，之后执行基于表2的jion。

4，group by(分组)算子

group by算子，表示分组操作，用于按照某条件进行分组，例如按照商品名称进行分组。

5，aggregation算子

aggregation算子，表示聚合操作，主要包括：Sum聚合算子、Min聚合算子、Max聚合算子、count聚合算子、AVG聚合算子，其中Sum聚合算子用于对需要聚合的值进行求和；Min聚合算子用于在需要聚合的值中维护最小值；Max聚合算子用于在需要聚合的值中维护最大值；count聚合算子用于对需要聚合的值的数量进行计数；AVG聚合算子用于在需要聚合的值中维护累积和的均值。举例来说，使用aggregation算子的执行流程为：首先根据group by列做分组，比如，group by dimTbl.name，即根据表2的name列做分组，然后对分组后的数据做sum、min、max、conut或Avg等操作。本实施例中是做sum操作。

6，distinct(非空唯一)算子

Distinct算子，表示去重操作，用于挑选出非空唯一列，或者说用于去掉重复数据。具体的，根据ditinct列上有数据(非空)的各行进行去重。举例来说，在确定表2中包含多少种商品时，表2中的name列为ditinct列，逐行扫描每一行中的name列，如果是未出现的name则记录该name，后续，如果该name再次出现，则不再重复记录，即name列中每种商品名称仅记录一次，这样便可以统计出表2共包含多个种商品。

7，TopN算子

TopN算子，表示维护最大N值操作，具体的，用于维护当前最大的N个值，当有新值进来时，如果该新值大于当前最大N个值中的最小值时，就替换当前最大值中的最小值。

接下来继续以上述步骤601中的SQL语句为例对任务进行阐述。应理解，执行SQL语句是按照一定顺序，分操作(或者说步骤)完成的，这些用来执行SQL语句的操作/步骤的组合就被称为执行计划。执行计划也可以用于表示SQL语句的完整执行过程。在软件层面，示例性地，中心节点接收客户端发送的SQL语句后，可以对该SQL语句进行语法解析，生成该SQL语句的执行计划，然后基于执行计划来解析得到一个或多个任务。示例性地，一个任务可以包括执行SQL语句的一个或多个操作，即一个任务可以使用一个或多个算子来执行。

示例性地，上述SQL语句的执行计划包括：(1)扫描表2，读取表2中的所有行；(2)扫描表1，读取表1中的所有行；(3)筛选出表1中日期为2020/01/02的行数据；(4)筛选出表1中ID列中与表2的ID值相同的行；按照相同的ID值，将表1中日期为2020/01/02的行与表2中的name列进行组合；(5)基于组合后的行数据，按照name进行分组，得到多组商品，分别计算每一组商品的总销售额。

更进一步地，结合任务被分配的工作节点，执行计划又可以被划分为多个阶段(stage)，一个stage可以包括一个或多个任务。示例性地，可以按照节点之间是否需要进行交互来划分stage，同一stage包含的任务不需要依赖其他节点的结果。

请参见图7，为解析上述SQL语句生成的一种执行计划示意图。在用户输入查询语句后，即可生成图7所示的执行计划，具体的，用户可以在客户端的数据查询界面的查询命令输入区(图7未示出)输入查询语句。如图7所示执行计划可以通过中心节点或客户端的显示界面显示给用户。所述执行计划可以在用户输入查询指令后，直接显示给用户，也可以在用户需要查看执行计划时，通过输入显示执行计划的指令，然后通过界面显示所述执行计划给用户。进一步的，所述执行计划中还会显示每个任务的执行设备，例如为网卡、工作节点、路由器、或者交换机等。所述执行计划可以跟所述任务同时显示，也可以在用户点击任务的时候，再显示所述执行设备。用户输入查询指令的界面与显示所述执行计划的界面可以为同一界面，也可以为不同界面。

如图7所示，该执行计划包括stage1，stage2，stage3，stage4。其中，stage3和stage4是并列关系，可以同步执行；stage2是stage3(或stage4)的下一个stage，对应的，stage3(或stage4)是stage2的上一个stage；stage1是stage2的下一个stage，对应的，stage1是stage2的上一个stage，依此类推。

基于上述SQL语句的执行计划可以拆分出如下任务：

任务1：扫描表1，并过滤出表1中日期为2020/01/02的行数据。其中，任务1可以使用tablescan算子和Filter算子来完成，tablescan算子执行操作为扫描。Filter算子执行操作为过滤操作，表1为待操作数据，过滤条件为表1data列中data＝2020/01/02的数据。

任务2：读取表2。任务2可以使用tablescan算子来完成。

任务3：将表1和表2联合，具体的，执行任务3以在表1中日期为2020/01/02的行中筛选出ID列与表2的ID值相同的行；按照相同的ID值，分别与表2中的name列进行组合。其中，任务3可以使用Jion算子来完成。

任务4：分组任务，基于任务3得到的结果，按照商品名称进行分组。任务4可以使用group by(分组)算子完成。

任务5：部分聚合(partial aggregation)：基于任务4的分组结果，对每一组商品的销售额进行求和，分别得到每一组商品的销售总额。任务5可以使用aggeration(聚合)算子来完成。应理解，每个工作节点会被分配处理表1中的一个或多个分片(下文会对分片进行详细介绍，此处不做重点介绍)，也就是，每个执行任务5的工作节点仅是基于表1的部分数据对一组商品的销售额进行汇总，因此，任务5也可以理解为部分聚合。

任务6：最终聚合(final aggregation)，即基于所有部分聚合结果确定最终的查询结果。在上述示例中为，待操作数据为每个被分配任务5的工作节点执行任务5的结果，执行操作为求和，执行规则是基于每个执行任务5的工作节点执行任务5的结果，对同一种商品的销售额进行求和计算，得到最终的查询结果。

继续参考图7举例来说，任务之间的逻辑关系为，任务3为任务1和任务2的下一个任务，任务1和任务2分别是任务3的上一个任务，任务4为任务3的下一个任务，对应的，任务3是任务4的上一个任务；即任务1和任务2的输出数据为任务3的输入数据，任务3的输出数据为任务4的输入数据，依次类推。对应的，执行下一个任务的节点为本节点的下一级节点，例如，执行任务3的节点为执行任务1的节点的下一级节点，依此类推。

如下对任务进行具体介绍。

在本申请实施例中，不同的任务具有不同的任务标识(request ID)。任务标识，用于唯一标识一个任务，在同属于一个查询请求的多个任务中，每个任务的任务标识均不相同。对于任务的执行设备来说，输入数据为本任务待计算的数据，可以根据任务标识来识别，具体的，包含本任务的任务标识的数据为输入数据。基于输入数据执行任务的结果为任务的输出数据，输出数据的任务标识为下一个任务的任务标识，具体的，携带输出数据的数据包中同时携带下一个任务的任务标识。

其中，同一个任务可以使用一个或多个算子来执行，当需要使用多个算子来执行时，任务中算子的排列顺序表示算子的执行顺序。任务的执行设备根据算子的顺序来执行对应的操作，不同算子之间不需要使用任务标识来传递算子的执行结果，对于当前算子的执行结果，执行设备可以直接使用下一个算子对该执行结果进行处理。例如，任务1，tablecan算子之后为filter算子，则任务1的执行设备首先读取表1，之后使用filter算子，基于filter算子的过滤条件对表1进行过滤。任务中的最后一个算子的执行结果为该任务的输出数据。

步骤603，中心节点确定该一个或多个任务中的可卸载任务，并确定可卸载任务的执行设备。

为了实现并行处理，后续，中心节点生成任务调度计划，将上述任务分配至多个执行设备，由多个执行设备并行执行一个或多个任务。例如，将任务1分配给多个工作节点，每个工作节点分别读取表1的一个或多个分片，其中，分片，是指将待查询的数据划分为等大小的分片，例如，表1包括10000行，每2000行顺序划分为一个分片，则表1可以划分为5个分片。这就是所谓的并行处理，以此提高任务的执行效率。

在本申请实施例中，任务包括可卸载任务、不可卸载任务，不同类型的任务的执行设备可以是不同的。示例性地，不可卸载任务可以由工作节点处理，可卸载任务可以卸载至网络设备处理，例如网络设备为工作节点的网卡，这样便减少了工作节点的工作量，同时也减轻了工作节点的CPU的运算量和CPU负担。

示例性地，本实施例中可卸载任务可以为包含可卸载算子的任务，可卸载算子可以是预设的，或协议预定的。其中，可卸载算子包括但不限于：tablescan算子、filter算子、jion算子、aggregation算子、TopN算子、distinct算子等。需要说明的是，上述可卸载算子仅为举例，本申请实施例对可卸载算子的类型或数量不作限定。另外，若任务包含多个算子，且其中部分算子不是可卸载算子，则该任务可以定义为不可卸载任务。在实际应用中，对于需要使用不可卸算子执行的任务可以定义为一个单独的任务。也就是说，本实施例中的可卸载任务涉及的算子全部为可卸载算子。

举例来说，基于上述可卸载算子，对于任务1至任务6，任务3包含可卸载算子，因此，任务1是可卸载任务，任务1的执行设备可以是工作节点的网卡。任务4使用的算子为不可卸载算子，因此任务4为不可卸载任务，任务4的执行设备可以是工作节点本身。

接下来对如何生成分片进行说明：

应理解，并不是每个任务都需要去数据源获取数据，也即不是每个任务都需要生成分片信息。对于需要读表的任务，例如需要使用tablescan算子的任务，中心节点在为这类任务分配执行设备时，还可以为每个执行设备分配读取的分片。以表1为例，对生成表1的分片信息的过程可以是：中心节点从数据源获取表1的存储信息，例如，表1存储在哪些存储节点上，以及每个存储节点存储的表1的数据大小，表1的数据在每个存储节点上的存储位置，该存储节点的IP地址等信息。中心节点基于该存储信息生成表1的分片信息，每个分片的分片信息包括该分片所在的存储节点的IP地址、存储位置等信息。

举个例子，假设表1包含10000行，表1中第1行至第4000行存储在存储节点1上，第4001行至第8000行存储在存储节点2上，第8001行至第10000行存储在存储节点3上。给定每个分片为2000行，则表1可以划分为5个分片，例如分别为分片1至分片5，对应的，分片1的分片信息包括但不限于下列中的部分或全部：分片1的标识，存储节点1的IP地址，存储位置(表1的第1行至第2000行存储在存储节点1的地址空间，例如，可以表示为所述地址空间的首地址及第1行至第2000行的长度)；分片2的分片信息包括但不限于下列中的部分或全部：分片2的标识，存储节点1的IP地址，存储位置(表1的第2001行至第4000行存储在存储节点1的地址空间，例如，可以表示为所述地址空间的首地址及第2000行至第4000行的长度)，依此类推，此处不一一展开描述，当然，上述仅为举例，表1也可以仅存储在一个存储节点上，本申请实施例对此不做限定。

接下来对如何生成任务调度计划进行说明：

示例性地，中心节点基于SQL包括的多个任务(或者上述执行计划)的信息、工作节点的信息、分片信息等生成任务调度计划。

其中，任务的信息包括任务标识，或者任务的信息包括任务标识和卸载标记等。其中，卸载标记，用于指示第一设置指令里携带的任务标识对应的任务是否为可卸载任务，示例性地，卸载标记可以是1bit，例如，该1bit的比特值为1表示为可卸载任务，若为0则表示为不可卸载任务。再示例性地，卸载标记为一固定值，可卸载任务中携带该卸载标记，不可卸载任务中不携带卸载标记。

工作节点的信息包括工作节点的数量、地址(例如IP地址、端口)、工作节点的标识等信息；其中，工作节点的标识可以为全局唯一的，所谓全局唯一，是指它所指示的工作节点在查询系统中是唯一的，并且每个工作节点以及中心节点都知道该标识的含义。该标识可以是该工作节点的IP地址、设备标识或设备名称、或者是中心节点为查询系统中每个工作节点生成的唯一标识等。交换机的信息包括交换机的地址(例如IP地址、端口等)、是否具备处理可卸载任务的能力、交换机的标识等信息。分片信息请参见前文的介绍，这里不再赘述。

具体的，任务调度计划包括下列中的部分或全部：任务标识、卸载标记、任务被分配的工作节点的标识、任务对应的分片信息等等。参见表3，为本申请实施例针对上述SQL语句提供的一种的任务调度计划的具体示例，这里以将任务全部分配至工作节点处理为例。假设分配工作节点20a读取完整的表2，后续，工作节点20a将表2广播至其他每个工作节点。

表3

示例性地，基于表3可以得出，中心节点将任务1至任务4分别分配到工作节点20a至20e，并分配工作节点20a读取分片1，让工作节点20b读取分片2，让工作节点20c读取分片3，让工作节点20d读取分片4，让工作节点20e读取分片5。这样，每个工作节点分别执行任务1时，能够并行读取表1的部分行，且互不干扰，并基于读取到的数据执行后续任务，直至任务5得到部分聚合结果，最后由执行任务6的节点(工作节点20a)对工作节点20a至20e的部分聚合结果进行汇总，得到最终的查询结果。

作为一种可实施的方式，查询请求执行的过程中，用户也可以随时查看查询请求的执行进度，如图8所示，在选中执行计划中的任一个任务后，可以显示当前任务的具体执行信息，例如该任务被分配至哪些节点上，是否为可卸载任务，可卸载任务的执行设备，节点或执行设备的信息(假设工作节点20a至工作节点20e的IP地址分别为76.75.70.14-18)，执行状态(例如包括未启动执行、正在执行中、执行完成)等。需要说明的是，图7和图8所示的界面仅为一种示意，也可以是其他方式显示，本申请实施例对此不做限定。

步骤604，中心节点发送可卸载任务的第一设置指令至工作节点，该工作节点的网卡被设置为可卸载任务的执行设备。

中心节点根据任务调度计划，将各任务的第一设置指令分别发送至被设置处理该任务的工作节点上。

示例性地，中心节点可以以任务为粒度，基于任务调度计划为每个工作节点生成第一设置指令，并向工作节点发送可卸载任务的第一设置指令。对应的，工作节点接收中心节点发送的第一设置指令。示例性地，该第一设置指令包括但不限于下列信息中的部分或全部：任务标识、卸载标记、算子信息。如下表4所示，为本实施例提供的一种第一设置指令的格式示例。

表4

其中，算子信息包括但不限于下列中的部分或全部：

算子标识、算子的执行规则、算子的输入信息、算子的输出信息。其中，算子的输入信息，用于指示执行任务所需的输入数据，该输入数据所在的节点的信息，例如地址信息、存储信息、表名称等；例如，上文表1的分片信息，为任务1的输入信息。算子的输出信息，包括Request ID对应的任务的下一个任务的任务标识，下一级节点的信息等。

类似的，不可卸载任务的第一设置指令与可卸载任务的第一设置指令可以是相似的，不同之处在于，可卸载任务的卸载标记指示该任务为可卸载任务，不可卸载任务的卸载标记指示该任务为不可卸载任务，或者只有可卸载任务的第一设置指令中携带卸载标记，不可卸载任务的第一设置指令中不携带卸载标记，以此来区分两者。

参见表5，以工作节点20a为例，表5列举了发送给工作节点20a的各任务的第一设置指令的具体示例，其中，各算子的执行规则参见上文介绍，表5中不再重复说明，另外假设Flags为1表示可卸载任务，Flags为0表示不可卸载任务。

表5

需要说明的是，上述第一设置指令的格式仅为举例，实际上，第一设置指令可以包含比表5更多或更少的信息，本申请实施例对此不做限定。例如，中心节点还可以不确定任务是否为可卸载任务，由每个工作节点根据预设算子来确定，则对应的，第一设置指令中可以不包括卸载标记。又例如，第一配置信还可以包含填充数据(Magic bytes)，填充数据可以是已知比特的数据，例如0或1，以使第一设置指令的长度为预设长度。

步骤605，工作节点判断接收到的任务是否为可卸载任务，如果是，则执行步骤606，否则，该任务由工作节点处理。

如下以一个工作节点为例进行描述。

请结合表5理解，一种可实施的方式，工作节点对于接收到的任意一个第一设置指令，可以根据第一设置指令中携带的卸载标记判断该任务是否为可卸载任务，如果是，则在网卡中设置可卸载任务的信息，后续由网卡处理该可卸载任务。另一种可实施的方式，工作节点也可以根据是否携带卸载标记来区分可卸载任务和不可卸载任务。当然，这里是以中心节点来识别可卸载任务为例，如果如上文所述中心节点不识别可卸载任务，则不论可卸载任务还是不可卸载任务，第一设置指令中均不会携带卸载标记。这种情况下，工作节点可以根据预设的可卸载算子来识别可卸载任务，本申请实施例对此不做限定。

步骤606，工作节点将可卸载任务卸载至本节点的网卡，即在网卡中设置可卸载任务的信息。

具体的，工作节点在网卡中设置可卸载任务的信息时，可以向网卡发送任务的第二设置指令，网卡根据第二设置指令获取并记录可卸载任务的信息。

示例性地，该第二设置指令可以包括头部和数据部分，其中，头部可以包括控制指令、任务标识，数据部分可以包含该任务的算子信息。示例性地，参见表6，为本实施例提供的一种第二设置指令的格式。

表6

其中，Command，用于表示命令类型，或者说用于指示执行什么操作。示例性地，Command可以是但不限于下列几种类型：卸载命令(init command)、读命令(read command)、结束命令(end command)。其中，卸载命令，用于指示卸载Request ID所对应的任务。执行指令，用于指示启动tablescan任务，读取Request ID对应的任务的输入数据。一般的，读取待查询的数据为执行SQL的起点，因此，该命令可以称为读命令或执行指令。结束命令，当任务执行完毕后，可以通过结束命令指示执行设备释放用于处理Request ID对应的任务的资源，或者也可以理解为指示该任务已结束，分配给该任务的资源可以释放了。为方便描述，下文将command为init command的第二设置指令称为卸载命令；将command为read command的第二设置指令称为执行指令；将command为end command的第二设置指令称为结束命令。payload，包括任务的算子信息，算子信息在前面已经介绍过了，这里不再重复说明。

接下来对工作节点在网卡设置可卸载任务的信息流程可以包括：

以任务1为例，工作节点20a确定任务1为可卸载任务后，向工作节点20a自身的网卡发送任务1的卸载命令，如下表7所示。

表7

示例性地，网卡接收到该卸载命令后，首先检查该卸载命令的包头，查看包头，如果是init command，则网卡确定任务1(Request ID为1)为可卸载任务，为任务1分配(或者说保留)网卡资源，该网卡资源被配置用于处理任务1。

下面对网卡资源进行介绍。如图9所示，本实施例可以将用于处理可卸载任务的网卡资源(例如包括计算单元)和内存资源划分为多份，每一份称可以为一个处理引擎(processing engine，PE)，一个PE可以被配置处理一个可卸载任务。

继续参考图9，以任务1为例，在网卡中设置可卸载任务的信息可以包括如下过程：网卡接收到任务1的卸载命令后，如果有空闲的PE，则网卡将任务1分配到一个空闲的PE上，该PE记录任务1的Request ID和算子信息等。相应的，网卡记录该PE与该PE处理的可卸载任务第一对应关系，以记录PE被分配执行哪个任务，具体的，第一对应关系包括PE标识和可卸载任务的Request ID。后续，当网卡接收到包含相同Request ID的数据包后，可以根据第一对应关系确定该Request ID对应的PE，并将该数据包路由至对应的PE处理。例如，在执行任务1时，工作节点20a的网卡向分片1对应的存储节点发送用于读取分片1的读请求，该读请求携带任务1的Request ID，存储节点向网卡发送任务1的反馈数据包，并且这些反馈数据包中也携带任务1的Request ID，这样网卡便可以根据该第一对应关系，确定存储节点返回的数据包对应的PE，并将该数据包路由至确定的PE上，PE根据记录的算子信息使用对应的算子对该数据包进行处理。

应理解，PE的数量是有限的，示例性地，网卡中还可以设置循环队列，一种可实施的方式，循环队列中能够放置的可卸载任务的数量可以与PE的数量相等，当有新的可卸载任务进来，且循环队列未满时，则将可卸载任务放入循环队列，并为该可卸载任务分配一个空闲的PE；当循环队列满了时，网卡向发送该卸载命令的设备发送响应，该响应用于指示网卡不能处理该可卸载任务，还可以包括不能处理的原因，例如网卡没有处理可卸载任务的资源等。举例来说，工作节点20a的处理器向本地网卡发送任务1的卸载命令之后，循环队列已满，网卡确定没有空闲的PE处理该任务时，向工作节点20a的处理器发送响应，指示网卡不能执行该任务1，后续，可以由工作节点20a执行该任务1，以此减少时延，提高任务的处理速度。另一种可能的实施方式，网卡将接收到的全部可卸载任务均放置到循环队列中，所有的可卸载任务均可以放置到循环队列中，若可卸载任务的数量多于PE的数量时，则当出现空闲的PE时，在循环队列中选择一个还未分配PE的可卸载任务分配该空闲的PE。

上述是以任务1为例，介绍了将可卸载任务卸载至网卡的过程，类似的，工作节点20a依照相同的方式将任务2、任务3、任务5、任务6分别卸载至工作节点20a自身的网卡上。应理解的是，其他工作节点的卸载流程与工作节点20a类似，这里不再重复说明。

步骤607a，中心节点向工作节点的网卡发送执行指令，对应的，工作节点的网卡接收执行指令。

在本申请中，某些任务需要接收到的执行指令后才可以执行，例如，需要使用tablescan算子的任务，即上述示例中的任务1和任务2。对于这类任务，中心节点可以发送该任务的执行指令来触发执行设备执行该任务。

示例性地，这里的执行指令可以是上述的读命令，中心节点向工作节点发送任务1和任务2的读命令。第一种实施方式，一个读命令中可以携带多个任务的Request ID，例如该读命令的Request ID中携带任务1的Request ID和任务2的Request ID。也就是说，任务2和任务1的读命令可以是同一个。另一种实施方式，每个任务的读命令是独立的，例如，任务1的读命令中仅携带任务1的Request ID，同理，任务2的读命令中仅携带任务2的Request ID。本申请实施例对此不做限定。

为便于描述，如下以第二种实施方式为例进行描述。以任务1的读命令为例，参见表8，为本申请实施例针对任务1提供的一种读命令的具体示例。

表8

Command	Request ID	Payload
Read command	1	分片1的分片信息

需要说明的是，表8仅为举例，如果任务1的卸载命令中携带了任务1的分片信息，则任务1的读命令中可以不重复携带任务1的分片信息，以此减少需要传输的数据量，避免重复传输，节省网络资源。或者，不论卸载命令中是否包含分片信息，读命令中均可以携带分片信息，并且执行设备以读命令中的分片信息为准，以达到动态、灵活调整分片信息的作用，提高数据命中率。

可选的，当工作节点根据第一设置指令设置完成任务的信息后，可以向中心节点发送完成响应，中心节点接收到完成响应后再发送执行指令。或者，中心节点也可以直接发送执行指令，当工作节点根据第一设置指令设置完成任务的信息后，直接启动执行对应的任务，以实现后续任务的自动执行。

步骤607b，工作节点的网卡接收本工作节点或其他节点的数据。类似的，这里的其他节点可以是本节点以外的其他工作节点、中心节点、存储节点或转发设备。例如，对于工作节点20a，网卡接收其他工作节点执行的任务5得到的结果。需要说明的是，该步骤607b为可选的步骤，并非为必须执行的步骤，且步骤607b与步骤607a没有严格是时序限定。

步骤608，网卡判断接收到的数据是否卸载至本网卡的任务的，如果是，则执行步骤609；否则，执行步骤610。

后续，任务被启动执行后，网卡监控接收到的数据是否为设置自身处理的可卸载任务的输入数据，如果是，则对该数据进行运算，否则，将该数据转发至工作节点。

这里的数据包括各种设置指令和待运算的数据。结合步骤607a，网卡接收到执行指令时，判断接收到该执行指令是否为卸载至本网卡的任务的，如果是，则网卡启动执行对应的任务；否则，网卡将该执行指令发送至工作节点，由工作节点启动执行对应的任务。

同理，各任务的执行设备对接收到的数据进行监测，并判断该数据是否为卸载至本网卡的任务的数据，例如，若该数据包含本网卡的任务的request ID，则该数据为该任务的数据。若该数据为执行指令，则网卡执行该执行指令。若该数据为任务的输入数据，则网卡使用该任务的算子和执行规则对该数据进行处理。如果不是，则确定该数据不是该任务的，将该数据发送至工作节点进行处理。

步骤609，网卡执行对应的任务，并返回结果至执行计划的下一级节点或下一个任务的执行设备。

步骤610，网卡将该数据发送至工作节点。

步骤611，工作节点根据该数据执行对应的任务，并将结果返回给执行计划的下一个任务的执行设备或下一级节点。

需要说明的是，步骤608至步骤611可能为循环执行的步骤，直至得到最终的查询结果，即任务6的结果为止。

举例来说，结合表3所示，以工作节点20a为例，假设工作节点20a将任务1、任务2、任务3、任务5、任务6分别卸载至本地网卡的PE0至PE5处理，即第一对应关系为：PE0对应任务1，PE1对应任务2，以此类推，PE4对应任务6。任务4由工作节点20a处理，如下对工作节点20a执行任务1至任务6的流程进行描述：

工作节点20a的网卡接收到该任务1的执行指令后，根据上述第一对应关系确定任务1对应的PE，即PE0；将该任务1的执行指令路由到PE0上，PE0执行任务1：即根据任务1的(分片1的)分片信息向对应的存储节点发送读请求。示例性地，该读请求可以是现有实现机制中的读请求也可以是其他格式的读请求。具体的，PE0可以将任务1的读请求转发到分片1对应的存储节点，存储节点接收到该读命令后，向网卡返回任务1对应的分片1的数据，如前所述，存储节点返回的数据中包含与读请求相同的Request ID。

网卡从存储节点1接收到任务1的数据包后，根据第一对应关系，将该数据包发送至对应的PE0上。PE0接收到数据包后，根据任务1的算子信息确定tablescan算子的下一个算子为filter算子，并基于filter算子的执行规则(data＝2020/01/02)对该数据包中携带的分片1中的过滤列(data列)进行过滤。

具体的，过滤结果可以以过滤列对应的bitmap来表示，bitmap中的每一位顺序对应于读取的分片中的每一行，并通过比特位上的不同比特值来表示该行是否满足过滤条件。参见如下表9，假设表9为表1的分片1中的一部分数据。

表9

Id	sale	Data
…	…	2020.01.02
…	…	2020.01.01
…	…	2020.01.01
…	…	2020.01.01
…	…	2020.01.02

PE0判断读取的数据列是否为过滤列，如果是过滤列，则使用过滤条件对读取的过滤列上的每一行的数据进行过滤，根据任务1的过滤条件Data＝2020/01/02，可以确定，Data为过滤列，假设比特值为1表示满足过滤条件，比特值为0表示不满足过滤条件，则表9所示的过滤列对应的bitmap为10001。

网卡还可以存储Request ID和bitmap的第二对应关系，例如，Request ID＝1，bitma为10001。之后，根据任务1的bitmap可以快速确定表9中仅第一行和第五行符合条件，这样，可以将过滤后的数据发送至下一级节点，能够减少传输的数据量，同时工作节点不需要执行该可卸载任务，也减少了工作节点的运行量和处理时间。

对于任务1的输出数据，其中该输出数据携带任务1的下一个任务的request ID，即request ID 3，以及任务1过滤后的数据。网卡继续根据第一对应关系，确定request ID3对应的PE，即PE2，将任务1的输出数据路由至PE2。

可选的，当任务执行完成后，网卡可以向工作节点发送指示信息，该指示信息用于指示该任务执行完成，工作节点接收到该指示信息后，工作节点可以向网卡发送结束命令，以使网卡释放处理该可卸载任务的相应的网卡资源(例如PE)、内存资源等。

如下以任务1的结束命令为例，请参见表10，为本申请实施例针对任务1提供的一种结束命令的具体示例。

表10

Command	Request ID	Payload
end command	1	NULL

举例来说，当网卡上任务1执行完成后，工作节点20a向网卡发送如下表10所示的结束命令，对应的，网卡接收到该结束命令，释放处理任务1的PE以及内存资源等，被释放的资源可以用于处理其他卸载到网卡上的可卸载任务。或者，网卡也可以自行决定何时释放PE，例如，存储节点向网卡发送任务1的最后一个数据包时，在该最后一个数据包中携带用于表示该数据包为最后一个数据包的标识，网卡确定PE处理完任务1的最后一个数据包后，释放用于处理任务1的相应资源。下文类似之处，不再重复说明。

后续，类似的，中心节点向工作节点20a的网卡发送任务2的执行指令，网卡根据第一对应关系确定request ID2对应的PE，即PE1，PE1可以基于表5所示的任务2的第一设置指令，根据表2的存储信息(包括存储节点的IP地址、存储位置等信息)获取完整的表2，并将读取的表2分别发送给工作节点20b、工作节点20c、工作节点20d和工作节点20e。同时，把表2路由至任务2的下一个任务，即任务3对应的PE2。

当任务3的输入数据全部到达时，PE2执行任务3，即PE2基于任务3对应的算子和执行规则对任务1和任务2的输出数据进行处理，得到任务3的输出数据。

PE2将任务3的输出数据(包含request ID 4)发送至任务4的执行设备，由于任务4为不可卸载任务，任务4的执行设备为工作节点本身，因此，该网卡可以将任务3的输出数据发送至工作节点20a的处理器，由工作节点20a来处理。

后续，工作节点20a将任务4的输出数据(包含request ID 5)发送至任务5的执行设备，具体的，工作节点20a将任务4的输出数据发生至网卡，网卡根据第一对应关系确定request ID 5对应的PE，即PE3，网卡将任务4的输出数据路由至PE3，依次类推，直至工作节点20a得到最终的查询结果。

需要说明的是，其他工作节点，例如工作节点20b，还需要将任务5的输出数据包发送至工作节点20a的网卡，当工作节点20a至工作节点20e上的任务5的输出数据包全部到达后，PE4执行任务6，得到最终的查询结果。其中，输出数据分为多个数据包传输时，最后一个数据包中还可以携带结束标识，通过结束标识来指示该数据包是否为当前request ID的最后一个数据包，接收端以此来判断对端工作节点上的数据是否传输完毕。

需要说明的是，上述第二设置指令的格式仅为举例，实际上，第二设置指令可以包含比上文所举的示例中更多或更少的内容，本申请实施例对此不做限定。例如，第二设置指令可以包括填充数据，以使第二设置指令的长度为预设长度。

另一种可实施的方式，对于可卸载任务，中心节点还可以根据任务调度计划，直接将可卸载任务的卸载命令发送被设置执行该任务的各执行设备，例如工作节点的网卡或转发设备。下面提供本实施例的另一种数据查询方法。

请参见图10，图10为本实施例提供的另一种数据查询方法所对应的流程示意图。在本发明实施例中，除了第一实施例中所描述的工作节点的网卡可以作为可卸载任务的执行设备外，网络中的转发设备，例如交换机及路由器也可以被设置为可卸载任务的执行设备。对于在工作节点的网卡中设置可卸载任务的方式与图6所示的实施例相同，即本实施例中的步骤1001至步骤1006、步骤1013至步骤1016可分别参考图6中步骤601至步骤606、步骤608至步骤611的相关描述，在此不再赘述，以下仅就不同之处进行说明。

下面将重点对可卸载任务为转发设备时，进行可卸载任务的设置方式进行描述。下文为便于说明，将以转发设备为交换机为例进行介绍。

本实施例还以图6的实施例中的SQL语句为例进行描述。如下表11所示，为针对上述步骤602中的SQL语句生成的另一种任务调度计划，该任务调度计划的可卸载任务的执行设备包括交换机，例如任务1的执行设备分别为交换机30，任务6的执行设备为交换机40。

表11

任务标识	可卸载任务	执行设备	存储信息
任务1	是	交换机30	NULL
任务2	是	工作节点20a的网卡	表2的存储信息
任务3	是	工作节点20a的网卡至工作节点20e的网卡	NULL
任务4	否	工作节点20a至工作节点20e	NULL
任务5	是	工作节点20a的网卡至工作节点20e的网卡	NULL
任务6	是	交换机40	NULL

应理解表11仅为一种示例，并不构成对本申请任务调度计划的限定。

对于在步骤S1003中确定的可卸载任务的执行设备为交换机时，中心节点对可卸载任务的设置请参考步骤1007及步骤1008的描述。

步骤1007：中心节点将可卸载任务的设置指令发送至交换机，该交换机被设置为可卸载任务的执行设备。

实际上，中心节点、存储节点或工作节点发出的数据包均会首先路由到各自对应的网段的交换机上。为了区分要转发的数据包和配置给交换机的数据包，在本实施例中，交换机包含至少两个端口，分别为数据端口和控制端口，当交换机通过数据端口接收到数据包时，则表示该数据包为需要转发的数据包，交换机根据数据包的目标IP地址将其转发至目的IP地址对应的设备上。若交换机通过控制端口接收到数据包，则说明该数据包为中心节点配置给交换机的数据包，需要交换机根据该数据包进行配置，例如中心节点给交换机发送的任务的设置指令。

结合表11所示，中心节点会将任务1的设置指令发送至交换机30；中心节点将任务6的设置指令发送至交换机40。

示例性地，中心节点可以将可卸载任务的第一设置指令发送至交换机的控制端口，以指示交换机根据该第一设置指令设置可卸载任务的信息。再示例性地，中心节点可以将可卸载任务的第二设置指令(卸载命令)发送至交换机的控制端口，以指示交换机根据该卸载命令设置可卸载任务的信息。如下以设置指令为卸载命令为例进行描述。

步骤1008：交换机设置可卸载任务的信息。

对应的，交换机30通过自身的控制端口接收到任务1的卸载命令时，根据该卸载命令记录任务1的信息(包括任务1的算子信息和request ID 1等)。同理，交换机40通过控制端口接收到任务6的卸载命令时，根据该卸载命令记录任务6的信息(包括任务6的算子信息和request ID 6等)等。后续，被设置处理可卸载任务的交换机监控接收到的每一个数据包的Request ID是否为卸载至本地的任务的，如果是，则由交换机对该数据进行处理；否则，交换机将该数据转发至该数据的目的IP地址处。

步骤1009a，中心节点发送任务1、任务2的执行指令。

这里的执行指令可以是上文中的启动命令。

如前所述，中心节点、存储节点或工作节点发出的数据包均会首先路由到各自对应的网段的交换机上。也即中心节点发送的执行指令也会首先被路由至交换机上。

步骤1009b，交换机接收其他节点的数据。

其他节点可以是工作节点、中心节点、存储节点或其他转发设备。

步骤1010，交换机判断接收到的数据是否为卸载至交换机的任务的，如果是，则执行步骤1011，否则，执行步骤1012a。

交换机接收到的数据包括设置指令、执行指令、存储节点发送的表1或表2的分片数据，或其他工作节点执行任务得到的输出数据。其中，步骤1010可以参考步骤608中网卡执行具体操作，此处不再赘述。

应理解，这里交换机会首先接收到中心节点发送的任务1、任务2的执行指令，交换机判断任务1和任务2是否为卸载至交换机的任务，如果不是，则将任务1、任务2的执行指令分别转发至目的IP地址对应的设备处。

应理解，步骤1010也可能为循环执行的步骤，直至该查询系统得到最终的查询结果。

步骤1011，交换机执行该任务，并返回任务的执行结果至执行计划中的下一级节点。

下面对交换机执行任务的流程进行简要说明：

以任务1为例，首先参见如下配置：(工作节点20a，分片1)、(工作节点20b，分片2)、 (工作节点20c，分片3)、(工作节点20d，分片4)、(工作节点20e，分片5)。

中心节点基于上述配置，分别向工作节点20a发送任务1的第一执行指令，通过第一执行指令指示工作节点20a读取分片1的数据；类似的，向工作节点20b发送任务1的第二执行指令，通过第二执行指令指示工作节点20b读取分片2的数据，依次类推。

以工作节点20a为例，工作节点20a接收到第一执行指令，根据分片1的分片信息向分片1对应的存储节点发送读请求(包含request ID 1)，请结合图4理解，该读请求的传输路径为工作节点20a→交换机10→交换机40→交换机30→存储节点。

对应的，存储节点响应该读请求，发送该分片1的反馈数据包(包含request ID 1)，该反馈数据包的目的IP地址为工作节点20a。同理，存储节点发出后，该数据包首先被路由到交换机30上，交换机30检测该反馈数据包是否为卸载至交换机30的任务的数据，即任务1的数据，如果是，则交换机30基于该反馈数据包执行任务1，否则，交换机30将该数据包发送至该数据包对应的目的IP地址处。

显然，交换机30接收到存储节点发出的分片1的数据包后，确定该数据包为任务1的数据包，随后，根据任务1的算子信息，基于filter算子的执行规则，使用filter算子对该数据包中的数据执行过滤操作，得到过滤结果也即任务1的输出数据，交换机30将该输出数据封装于输出数据包中，如前所述，该输出数据包中携带任务1的下一个任务的request ID，即request ID3，并根据从存储节点接收到的分片1的数据包中携带的目的IP地址，将该输出数据包发送至该目的IP地址处，即工作节点20a。

同理，对于交换机30与其他任一工作节点的交互方式，这里不再赘述。需要说明的是，上述通过执行指令设置算子信息的方式仅为举例，本实施例也可以将各工作节点与分片信息的对应关系通过任务1的设置指令，例如卸载命令发送给交换机30，由交换机30对表1各分片的过滤结果进行分布，以达到与上述示例相同的效果。

步骤1012a，交换机转发数据至对应的工作节点的网卡。

步骤1012b，工作节点的网卡接收本工作节点的数据。需要说明的是，该步骤1012b为可选的步骤，并非为必须执行的步骤，且步骤1012b与步骤1012a没有严格是时序限定。后续步骤S1013～S1016与图6中的步骤S608～S611相同，在此不再赘述。

对于表11所示的执行流程，其中，对于任务1及任务5的执行过程可以参见上文相关描述，此处不再赘述。执行任务6的交换机40为工作节点20a至工作节点20e的下一级节点，工作节点20a至工作节点20e分别将各自的任务5的输出数据(携带request ID 6)发送至交换机40，如果交换机40接收到所述数据，判断需要对所述数据执行任务6，则，根据任务6对应的算子和执行规则对该数据进行处理，得到最终的查询结果。之后，交换机40将得到的查询结果发送至中心节点，中心节点将该查询结果返回给客户端。

通过上述设计，将可卸载任务卸载至网络设备处理，减轻了工作节点的处理器的负担，进一步地，还可以减少在网传输的数据量。

需要说明的是，上述确定可卸载任务的方式仅为举例，本申请实施例对此不作限定。对于适合卸载至网卡或转发设备处理的任务，卸载至工作节点的网卡或者转发设备处理，可以减轻工作节点的处理器的负担，减少在网传输的数据量，但是在一些场景中，将任务卸载至网卡或交换机处理，可能会影响执行效率，所以在本发明另一种实施方式中，对于中心节点中预设的卸载任务，可进一步设置卸载策略，根据所设置卸载策略判断该卸载任务是否可以进行卸载，对于满足所述卸载策略的任务，才设置为可卸载任务。

为便于理解下列任务的卸载策略，首先说明一点：

数据源可以对存储的数据表进行分析，得到数据表的数据分布信息，其中，数据分布信息包括数据表中某一列数据的数据总量n，以及用于指示数据表中某一列数据在不同区间的数据分布信息，例如，某人员登记表中包含年龄列，则该表中年龄列的数据分布可以是年龄段1-10岁的人员数量(记为数量a)，年龄段11-20岁的人员数量(记为数量b)，年龄段21-30岁的人员数量(记为数量c)。

中心节点可以向数据源获取待查询的数据表的数据分布信息的请求，对应的，存储节点将中心节点所请求的数据分布信息发送给中心节点。基于该数据分布信息，中心节点可以粗略计算出filter算子的选择率、aggregation算子的聚合列的基数等，例如，某filter算子的执行规则为年龄在1-30岁的人员，则该filter算子的选择率为(a+b+c)/n。当然，这个数据分布情况是一个比较粗略的统计，据此得到的选择率或聚合列的基数并不是精确的选择率。下文涉及到该相关内容之处不再重复说明。

下面针对具体的任务分别进行举例说明。

1，filter算子；

在中心节点将filter算子设置为可卸载算子时，则相应的为filter算子设置的卸载策略可以为：filter算子的选择率较低例如低于第一预设值时，该filter算子所属的任务为可卸载任务。其中，选择率可以是根据满足过滤条件的行与待查询的原始数据包含的所有行的比值确定的。举例来说，以任务1为例，假设表1有10000行，其中满足日期为2020/01/02的行仅为10行，则选择率为10/10000*100％＝0.1％。若第一预设值为1％，任务1的选择率低于第一预设值，则确定任务1为可卸载任务。应理解，第一预设值仅为举例，本实施例中所列举的所有具体数值均为举例，也对此不做限定。

如果选择率比较低，中心节点可以将该任务卸载至存储节点的网卡或交换机处理，这样可以减少在网传输的数据量。例如，存储节点和工作节点部署在不同的设备上时，中心节点还可以将任务1卸载至存储节点的网卡处理，存储节点仅需要向工作节点发送10行数据，并不需要将读取到的全部表1发送给工作节点，这样存储节点发送给工作节点的数据量就比较少，即网络中传输的数据量少，从而在减轻CPU的负担的基础上，还可以避免占用大量的网络带宽。或者，任务1还可以卸载至工作节点的网卡上处理，由工作节点的网卡执行过滤，不需要工作节点的CPU来执行该任务，从而减轻了CPU的负担，另外，网卡也不需要向CPU发送大量的数据，也减少了工作节点内的数据交互。

2，aggregation算子；

在中心节点将aggregation算子设置为可卸载算子时，则相应的为aggregation算子设置的卸载策略可以为：如果需要聚合的列的基数比较少，例如不超过第二预设值，则确定该aggregation算子所属的任务为可卸载任务。

举例来说，在计算表1中商品A的销售额时，sale列则为需要聚合的列，如果商品A有10行销售记录，则需要对该10行的sale值进行聚合，则该10行可以理解为需要聚合的列的基数。比如，若第二预设值为100时，则可以确定使用该aggregation算子执行的任务为可卸载任务。

对于aggregation算子类型的可卸载任务，可以卸载至工作节点的网卡，也可以卸载至交换机处理，例如，当aggregation任务需要聚合的列的基数比较少时，可以卸载至交换机来处理，这样即不会占用交换机较多计算资源，也可以减少网络中传输的数据量。

3，distinct算子

distinct算子的卸载策略与aggregation算子的卸载策略相似，具体的，distinct算子的卸载策略是基于distinct列的基数的大小，例如distinct列的基数不超过第三预设值，该distinct算子所属的任务为可卸载任务。distinct算子与aggregation算子的卸载策略的不同之处在于，aggregation算子是基于group by列做分组，然后对分组后的数据做sum、min、max、conut或Avg等操作。而distinct算子只需要对distinct列做分组就可以了。

对于distinct算子类型的可卸载任务，可以卸载至工作节点的网卡，也可以卸载至交换机处理。

4，动态过滤算子

动态过滤算子是指jion算子中两表联合时，通过小表对大表的筛选过滤。

下面以任务3为例，结合图4和图5所示的两种场景分别对任务3的Jion算子在这两种场景中动态过滤算子执行流程进行介绍。

如前所述，中心节点为工作节点分配了读取表1的一个分片，各工作节点执行任务1的流程参见前文的描述，这里不再重复说明。

由于表2需要与表1进行联合，即需要根据表2中的ID列上的值对表1中的ID列上的值进行筛选，查询表1中ID列上的值是否存在于表2中ID列中，因此每个工作节点均需要知道表2的每一行中的ID列的值，那么中心节点可以不将表2划分为不同的分片，让每个工作节点分别读取完整的表2。当然，为了提高查询效率，中心节点也可以将表2划分为不同的分片，让每个工作节点读取表2的一个或多个分片，之后，各工作节点可以将读取到的分片中的ID列发送给中心节点，由中心节点综合各工作节点返回的ID列，得到完整的表2中的ID列。

场景一：存储节点和工作节点融合的场景，即存储节点和工作节点部署在同一物理节点上，如图5所示的场景。

该场景中，该动态过滤算子更适宜卸载至工作节点的网卡，即工作节点的网卡为动态过滤算子的执行设备。示例性地，请结合图5理解，在该场景中，使用Jion算子对表1和表2进行联合的流程包括如下步骤：

1)被分配了任务2的每个工作节点，分别读取表2中的一个分片，并在该分片的数据的on条件上的列上创建BF，得到BF列并将得到的BF列发送给中心节点，该BF列可以包含重复的ID值，也可以用distinct算子对ID列进行去重，本申请实施例对此不做限定。

假设表2的分片也有5个，例如命名为分片11至分片12，工作节点20a至工作节点20e分别读取一个，在上述示例中，具体的过程可以是，工作节点20a读取分片11，并在读取到的分片11的数据的On条件上的列创建BF，并将得到的BF发送给中心节点100；工作节点20b读取分片12，并在读取到的分片12的数据的On条件上的列创建BF，并将得到的BF发送给中心节点100；工作节点20c读取分片13，并在读取到的分片13的数据的On条件上的列创建BF，并将得到的BF发送给中心节点100；依次类推。

2)中心节点合并各工作节点发送的BF，合并后得到完整表2的ID列。具体的，中心节点100接收来自工作节点20a至工作节点20e的各表2的分片的BF列，对各分片的BF列进行合并，得到完整表2的BF列，即ID列。

3)中心节点将得到的完整的表2的ID列发送给工作节点的网卡。

由于任务2的输出结果为任务3的输入数据，因此，中心节点可以将完整表2的BF列分别发送至任务3的各执行设备，例如，任务3的执行设备为工作节点20a至工作节点20e的网卡，则中心节点可以将完整表2的ID列分别发送给工作节点20a的网卡，工作节点20b 的网卡，工作节点20c的网卡，工作节点20d的网卡，工作节点20e的网卡。

需要说明的是，若该场景下任务3的执行设备为一个或多个交换机，则中心节点100可以将完整表2的BF列发送至该一个或多个交换机。下文为方便描述，以任务3的执行设备为网卡为例进行描述。

4)工作节点的网卡执行任务1，读取表1的一个或多个分片，并对读取的数据进行过滤得到data＝20200102的行。

应理解，步骤4)与步骤1)至步骤3)是并行任务，这里的步骤不表示时序关系。

5)工作节点的网卡根据表2的BF列，再次过滤data＝20200102的行中ID存在于表2的ID列中的行。

场景二：存储节点和工作节点分离部署的场景，即存储节点和工作节点分别部署在不同的物理节点上，如图4所示的场景。

该场景中，由于工作节点要与存储节点交互数据必须要经过两者之间的交换机，因此，该场景下，可以由该交换机对经过的数据进行过滤，减少在网传输的数据量，即交换机为该动态过滤算子的执行设备。

示例性地，请结合图4理解，假设任务1卸载到存储节点的网卡执行，任务3中的动态过滤卸载到交换机30执行，在图4所示的场景中，使用Jion算子对表1和表2进行表联合的流程包括如下步骤：

1)工作节点向存储节点发送任务2和任务1的读请求；

2)存储节点将工作节点读取的任务2的数据发送至交换机30，将工作节点读取的任务1的数据进行过滤后发送给交换机30；

3)交换机30基于各存储节点返回的任务2的数据创建BF，得到完整表2的BF列，以及，根据该BF列对接收到的表1过滤后的数据再次进行过滤，得到data＝20200102的行中ID列等于表2的BF列的行。

4)交换机30将得到的data＝20200102的行中，ID列等于表2的BF列的行发送给对应的工作节点。

5)工作节点使用交换机30过滤后的数据进行Jion。

上述步骤即为jion算子的动态过滤过程。在上述场景中，jion算子中的动态过滤可以卸载至工作节点的网卡执行，也可以卸载中心节点与工作节点的交互过程中经过的交换机执行，卸载策略是对大表过滤时的选择率确定。

在本实施例中，对于能够卸载到多个设备的可卸载任务，中心节点在确定该可卸载任务的执行设备时，还可以按照预设的可卸载任务对应的各设备的优先级来确定执行设备，例如，该执行设备可以为该可卸载任务对应设备中优先级最高的设备。比如，包括filter算子的可卸载任务，对应的设备的优先级排序为：存储节点的网卡、存储节点所在架子的交换机、工作节点所在架子的交换机、核心交换机、工作节点的网卡等。则基于此排序，可以确定存储节点的网卡可以是该任务1的执行设备。

需要说明的是，上述确定执行设备的方式仅为举例，也可以结合优先级和设备的负载状况来确定，例如，上述可卸载任务中虽然存储节点的网卡的优先级最高，但是若存储节点的性能比较低或负载比较高时，也可以不将任务1卸载至存储节点的网卡，并按照优先级顺次判断下一个设备是否可以作为执行设备。另外，将可卸载任务卸载至存储节点的网卡处理的方式可以参见上文工作节点将可卸载任务卸载至工作节点的本地网卡的具体流程介绍，下文不再重复说明。

当然，为了减轻网卡的负载，工作节点也可以基于预设的卸载策略选择性地将部分可卸载任务卸载至网卡，例如工作节点上预设的卸载策略可以是基于负载均衡原则制定的等等，这里不做重点说明。

基于与方法实施例同一发明构思，本申请实施例还提供了一种设备，用于执行上述方法实施例中图6或图10中中心节点执行的功能，如图11所示，该设备包括生成单元1101、处理单元1102和通信单元1103。

生成单元1101，用于接收客户端发送的查询请求，并将用户输入的查询请求解析为多个任务。具体实现方式请参见图6中的步骤601、602及图10中的步骤1001及1002的描述，此处不再赘述。

处理单元1102，用于确定多个任务中的可卸载任务，并确定可卸载任务的执行设备。所述网络设备可以是工作节点的网卡或者转发设备，转发设备包括：交换机、路由器。确定可卸载任务及可卸载任务的执行设备的具体方法请参考图6中的步骤603及图10中的步骤1003的描述，此处不再赘述。

通信单元1103，还用于发送每个任务的设置指令，以在每个执行设备上设置其所执行的任务，对于图6中的实施例，具体实现可参考步骤S604的相关描述，对于图10的实施例，可参考步骤S1004及1007的相关描述。

通信单元1103在通过发送每个任务的设置指令在每个执行设备上设置后对应的任务之后，即可发送该查询请求的执行指令，该执行指令用于触发执行设备执行所设置的任务，具体请参见图6中的步骤S607a及图10中的步骤1009a中的描述，此处不再赘述。

基于与方法实施例同一发明构思，本申请实施例还提供了一种网络设备，用于执行上述方法实施例图6或图10中网络设备(交换机、路由器或工作节点的网卡)执行的功能，如图12所示，该设备包括通信单元1201和处理单元1202。

通信单元1201，用于接收中心节点发送的设置指令，该设置指令用于在网络设备上设置执行查询请求时需要网络设备执行任务。当网络设备为网卡时，具体流程请参见图6中步骤607a、步骤610及步骤1012a、步骤1015的相关描述。当网络设备为转发设备时，具体流程请参见图6中步骤1009a、步骤1012a的相关描述。

图10中步骤1004的描述，此次不再赘述。

处理单元1202，用于根据设置指令设置任务，以及对流经网络设备的数据执行所述任务。当网络设备为网卡时，对于图6中的实施例，具体实现可参考步骤S608、步骤609的相关描述，对于图10的实施例，可参考步骤S1013及1014的相关描述。当网络设备为转发设备时，对于图10的实施例，可参考步骤S1010及1011的相关描述。

尽管结合具体特征及其实施例对本申请进行了描述，显而易见的，在不脱离本申请的精神和范围的情况下，可对其进行各种修改和组合。相应地，本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明，且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包括这些改动和变型在内。

Claims

一种数据查询系统，包括中心节点、工作节点及网络设备，所述中心节点通过所述网络设备连接至所述工作节点，其特征在于：

所述中心节点用于根据查询请求生成执行所述查询请求的多个任务，确定所述多个任务中的每个任务的执行设备，所述多个任务的执行设备包括所述工作节点及所述网络设备，发送所述每个任务的设置指令，所述设置指令用于在每个执行设备上设置其所执行的任务；

所述工作节点及所述网络设备，用于执行所设置的任务。
如权利要求1所述的系统，其特征在于，所述中心节点在用于确定所述多个任务中的每个任务的执行设备时具体用于，查找所述多个任务中的可卸载任务，确定所述可卸载任务的执行设备为所述网络设备，所述可卸载任务为预设的卸载至所述网络设备执行的任务。
如权利要求2所述的系统，其特征在于，所述中心节点用于将所述可卸载任务的设置指令发送至所述网络设备；

所述网络设备用于根据所述设置指令设置所述可卸载任务。
如权利要求1-3任意一项所述的系统，其特征在于，所述网络设备为工作节点的网卡或者转发设备，所述转发设备包括：交换机、路由器。
如权利要求4任意一项所述的系统，其特征在于，所述转发设备包括数据端口及控制端口，所述中心节点用于将执行设备为所述转发设备的可卸载任务的设置指令通过所述控制端口发送至所述转发设备；将执行设备为所述网卡或者所述工作节点的任务的设置指令通过所述数据端口发送至所述转发设备；

所述转发设备用于根据从所述控制端口接收的设置指令设置所述可卸载任务，转发从所述数据端口接收的设置指令。
如权利要求4所述的系统，其特征在于，当执行所述可卸载任务的网络设备为所述工作节点的网卡时，所述中心节点用于将所述可卸载任务的设置指令发送至所述工作节点；

所述工作节点根据所述设置指令在所述工作节点的网卡上设置所述可卸载任务。
如权利要求6所述的系统，其特征在于，所述可卸载任务的设置指令包括可卸载标记；

所述工作节点在接收到所述设置指令后，在确定所述设置指令中包括所述可卸载标记时，在所述工作节点的网卡上设置所述可卸载任务。
如权利要求2-7任意一项所述的系统，其特征在于，所述网络设备在接收到数据包之后，当确定所述数据包中包括所述网络设备所执行的可卸载任务的标识时，则基于述数据包执行所述可卸载任务。
如权利要求3-7任意一项所述的系统，其特征在于，所述中心节点在用于发送所述可卸载任务的设置指令至所述网络设备时具体用于：在确定所述可卸载任务后，在确定所述可卸载任务符合所述可卸载任务对应的卸载策略时，发送所述可卸载任务的设置指令至所述网络设备。
一种数据查询方法，应用于中心节点，所述中心节点通过网络设备连接至工作节点，其特征在于，所述方法包括：

根据查询请求生成执行所述查询请求的多个任务；

确定所述多个任务中的每个任务的执行设备，所述多个任务的执行设备包括所述工作节点及所述网络设备；发送所述每个任务的设置指令，所述设置指令用于在每个执行设备上设置其所执行的任务。
如权利要求10所述的方法，其特征在于，所述确定所述多个任务中的每个任务的执行设备包括：查找所述多个任务中的可卸载任务，确定所述可卸载任务的执行设备为所述网络设备，所述可卸载任务为预设的卸载至所述网络设备执行的任务。
如权利要求11所述的方法，其特征在于，所述可卸载任务的执行设备为所述网络设备时，所述发送所述每个任务的设置指令，包括：发送所述可卸载任务的设置指令至所述网络设备。
如权利要求11所述的方法，其特征在于，当确定执行所述可卸载任务的网络设备为所述工作节点的网卡时，所述发送每个任务的设置指令包括：将所述可卸载任务的设置指令发送至所述工作节点，指示所述工作节点为所述工作节点的网卡设置所述可卸载任务。
如权利要求13所述的方法，其特征在于，所述设置指令中包括可卸载标记，所述可卸载标记用于标记所述设置指令所设置的任务为可卸载任务。
如权利要求12-14任意一项所述的方法，其特征在于，所述发送所述可卸载任务的设置指令至所述网络设备包括：确定所述可卸载任务后，在确定所述可卸载任务符合所述可卸载任务对应的卸载策略时，发送所述可卸载任务的设置指令至所述网络设备。
一种数据查询方法，应用于网络设备，所述网络设备用于连接中心节点及工作节点，其特征在于，所述方法包括：

接收设置指令，所述设置指令用于在所述网络设备上设置执行查询请求时需要所述网络设备执行的任务；

根据所述设置指令设置所述任务；

对流经所述网络设备的数据执行所述任务。
如权利要求16所述的方法，其特征在于，所述网络设备为工作节点的网卡或者转发设备，所述转发设备包括：交换机、路由器。
如权利要求17所述的方法，其特征在于，所述转发设备包括数据端口及控制端口；所述方法还包括：

根据从所述控制端口接收的设置指令，在所述转发设备上设置所述设置指令所指示的可卸载任务；转发从所述数据端口接收的设置指令。
如权利要求16-18任一项所述的方法，其特征在于，所述对流经所述网络设备的数据执行所述任务包括：

在接收到数据包之后，当确定所述数据包中包括网络设备所执行的所述可卸载任务的标识时，则基于所述数据包执行所述可卸载任务。
一种数据查询界面，其特征在于，包括：

查询命令输入区，用于接收用户输入的查询请求；

任务显示区，用于显示根据所述查询请求生成的执行所述查询请求的多个任务；

执行设备显示区，用于显示每个任务的执行设备，所述执行设备包括工作节点及网络设备。
如权利要求20所述的界面，其特征在于；

所述查询命令输入区、任务显示区、及执行设备显示区在同一界面显示。
如权利要求20所述的界面，其特征在于；

所述查询命令输入区、任务显示区、及执行设备显示区在不同界面显示。
一种中心节点，其特征在于，所述中心节点包括用于执行权利要求10-16任意一项所述方法的步骤的至少一个单元。
一种网络设备，其特征在于，该设备包括用于执行权利要求17-20任意一项所述方法的步骤的至少一个单元。
一种中心节点，其特征在于，包括存储器及处理器；所述存储器存储有程序指令，所述处理器运行所述程序指令，以执行权利要求10-15任一所述的方法。
一种网络设备，其特征在于，该设备包括处理单元和存储单元，所述存储单元中存储有可执行代码，所述处理单元执行所述可执行代码以实现权利要求16-19任意一项所述的方法。
一种网络设备，其特征在于，该设备包括：

通信接口，用于与中心节点及工作节点进行数据传输；

处理单元，用于对所述通信接口接收的数据进行处理，以执行权利要求16-19任意一项所述的方法。