WO2014040426A1

WO2014040426A1 - 查询处理方法和装置

Info

Publication number: WO2014040426A1
Application number: PCT/CN2013/076366
Authority: WO
Inventors: 曹莉; 吴向阳
Original assignee: 华为技术有限公司
Priority date: 2012-09-14
Filing date: 2013-05-29
Publication date: 2014-03-20
Also published as: CN103678368A; CN103678368B

Abstract

本发明实施例提供一种查询处理方法和装置。方法包括：向系统中各个数据节点发送执行客户端查询请求的第一步骤信息；接收至少一个数据节点发送的失败消息，失败消息用于表示执行第一步骤失败或异常；根据预先设定的可恢复信息，确定执行查询请求的第二步骤，第二步骤为重新执行查询请求的起始步骤，可恢复信息中包括重新执行查询请求时无需重复执行的步骤；向各个数据节点发送第二步骤信息。本发明实施例提供的查询处理方法和装置，可以提高并行数据库查询处理的效率。

Description

查询处理方法和装置技术领域本发明实施例涉及数说据库技术，尤其涉及一种查询处理方法和装置。背景技术并行数据库是通过将数据均衡分布书在多个数据节点上，查询时在多个数据节点上并行执行，从而加速数据查询处理的数据管理技术。并行数据库主要应用于海量数据存储，随着数据节点个数的增多，查询处理过程中出现异常的概率就越高。

图

现有技术中，并行数据库在执行用户的查询请求处理过程中，如果出现异常，则控制各个数据节点执行查询操作的控制节点放弃数据库正在执行的查询处理，待纠错处理结束后，控制节点重新控制各数据节点执行用户的查询请求。

但是，由于并行数据库的存储容量通常都比较大，数据库重新执行用户的查询请求，导致查询请求的处理效率低，系统资源浪费。发明内容本发明实施例提供一种查询处理方法和装置，用以提高并行数据库查询处理的效率。

一方面，本发明实施例提供一种查询处理方法，包括：

向系统中各个数据节点发送执行客户端查询请求的第一步骤信息；接收至少一个所述数据节点发送的失败消息，所述失败消息用于表示执行所述第一步骤失败或异常；

根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，所述第二步骤为重新执行所述查询请求的起始步骤，所述可恢复信息中包括重新执行所述查询请求时无需重复执行的步骤；

向所述各个数据节点发送所述第二步骤信息。结合第一方面 ,所述向系统中各个数据节点发送执行客户端查询请求的第一步骤信息之前，还包括：

根据所述数据节点执行所述查询请求的各个步骤对应的资源消耗，生成所述可恢复信息。

结合第一方面，所述可恢复信息中包括至少一个可恢复点信息，所述可恢复点后续距离最近的下一步骤作为重新执行所述查询请求的起始步骤。结合第一方面，所述向系统中各个数据节点发送执行客户端查询请求的第一步骤信息之前，还包括：

向所述各个数据节点发送执行所述查询请求的第三步骤信息；

接收所述各个数据节点发送的第一成功消息，所述第一成功消息用于表示执行所述第三步骤成功；

记录位于所述第三步骤之前且距所述第三步骤最近的第一可恢复点信息。结合第一方面，所述根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：

将所述第一可恢复点后续距离最近的下一步骤作为所述第二步骤。

结合第一方面，所述记录位于所述第三步骤之前且距所述第三步骤最近的第一可恢复点信息之后，所述向系统中各个数据节点发送执行客户端查询请求的第一步骤信息之前，还包括：

向所述各个数据节点发送执行所述查询请求的第四步骤信息；

接收所述各个数据节点发送的第二成功消息，所述第二成功消息用于表示执行所述第四步骤成功；

记录位于所述第四步骤之前且距所述第四步骤最近的第二可恢复点信息。结合第一方面，所述根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：

将所述第二可恢复点后续距离最近的下一步骤作为所述第二步骤。

另一方面，本发明实施例提供一种控制节点，包括：

第一发送模块，用于向系统中各个数据节点发送执行客户端查询请求的第一步骤信息；

接收模块，用于接收至少一个所述数据节点发送的失败消息，所述失败消息用于表示执行所述第一步骤失败或异常；

处理模块，用于根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，所述第二步骤为重新执行所述查询请求的起始步骤，所述可恢复信息中包括重新执行所述查询请求时无需重复执行的步骤；

第二发送模块，用于向所述各个数据节点发送所述第二步骤信息。

结合第二方面，所述处理模块，还用于根据所述数据节点执行所述查询请求的各个步骤对应的资源消耗，生成所述可恢复信息。

结合第二方面，所述控制节点还包括：存储模块，用于存储所述可恢复信息，所述可恢复信息中至少一个可恢复点信息，所述可恢复点后续距离最近的下一步骤作为重新执行所述查询请求的起始步骤。

结合第二方面，所述第一发送模块，还用于向所述各个数据节点发送执行所述查询请求的第三步骤信息；

所述接收模块，还用于接收所述各个数据节点发送的第一成功消息，所述第一成功消息用于表示执行所述第三步骤成功；

所述存储模块，还用于记录位于所述第三步骤之前且距所述第三步骤最近的第一可恢复点信息。

结合第二方面，所述处理模块，根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：将所述第一可恢复点后续距离最近的下一步骤作为所述第二步骤。

结合第二方面，所述第一发送模块，还用于向所述各个数据节点发送执行所述查询请求的第四步骤信息；

所述接收模块，还用于接收所述各个数据节点发送的第二成功消息，所述第二成功消息用于表示执行所述第四步骤成功；

所述存储模块，还用于记录位于所述第四步骤之前且距所述第四步骤最近的第二可恢复点信息。

结合第二方面，所述处理模块，根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：将所述第二可恢复点后续距离最近的下一步骤作为所述第二步骤。

再一方面，本发明实施例提供一种控制节点，包括：发送器，用于向系统中各个数据节点发送执行客户端查询请求的第一步骤信息；

接收器，用于接收至少一个所述数据节点发送的失败消息，所述失败消息用于表示执行所述第一步骤失败或异常；

处理器，用于根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，所述第二步骤为重新执行所述查询请求的起始步骤，所述可恢复信息中包括重新执行所述查询请求时无需重复执行的步骤；

所述发送器，还用于向所述各个数据节点发送所述第二步骤信息。

结合第三方面，所述处理器，还用于根据所述数据节点执行所述查询请求的各个步骤对应的资源消耗，生成所述可恢复信息。

结合第三方面，所述控制节点还包括：存储器，用于存储所述可恢复信息，所述可恢复信息中至少一个可恢复点信息，所述可恢复点后续距离最近的下一步骤作为重新执行所述查询请求的起始步骤。

结合第三方面，所述发送器，还用于向所述各个数据节点发送执行所述查询请求的第三步骤信息；

所述接收器，还用于接收所述各个数据节点发送的第一成功消息，所述第一成功消息用于表示执行所述第三步骤成功；

所述存储器，还用于记录位于所述第三步骤之前且距所述第三步骤最近的第一可恢复点信息。

结合第三方面，所述处理器，根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：将所述第一可恢复点后续距离最近的下一步骤作为所述第二步骤。

结合第三方面，所述发送器，还用于向所述各个数据节点发送执行所述查询请求的第四步骤信息；

所述接收器，还用于接收所述各个数据节点发送的第二成功消息，所述第二成功消息用于表示执行所述第四步骤成功；

所述存储器，还用于记录位于所述第四步骤之前且距所述第四步骤最近的第二可恢复点信息。

结合第三方面，所述处理器，根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：将所述第二可恢复点后续距离最近的下一步骤作为所述第二步骤。

本发明实施例提供的技术方案，控制节点控制系统中各数据节点进行执行查询处理过程中，当某步骤执行失败时，通过对错误信息进行分析，控制节点可以根据当前保存的可恢复信息，确定重新执行查询请求的起始步骤，实现查询过程中的某一步骤执行失败后无需从头执行，提高了并行数据库查询处理的效率。附图说明为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以才艮据这些附图获得其他的附图。

图 1为本发明查询处理方法实施例一的流程图；

图 2为本发明查询处理方法实施例二的流程图；

图 3为本发明查询处理方法实施例三的流程图；

图 4为本发明查询处理方法实施例四的流程图；

图 5为本发明查询处理方法实施例五的原理图；

图 6为本发明查询处理方法实施例五的流程图；

图 7为本发明控制节点实施例一的结构示意图；

图 8为本发明控制节点实施例二的结构示意图；

图 9为本发明控制节点实施例三的结构示意图；

图 10为本发明控制节点实施例四的结构示意图。具体实施方式为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图 1为本发明查询处理方法实施例一的流程图。如图 1所示，本实施例的方法可以包括：

S 101、向系统中各个数据节点发送执行客户端查询请求的第一步骤信息。具体的，控制节点可以根据客户端的查询请求生成执行计划步骤，在执行每一步骤前，控制节点将该步骤信息发送给系统中的各个数据节点。上述第一步骤指在执行查询任务过程中，控制节点向数据节点发送的任一步骤。

5102、接收至少一个数据节点发送的失败消息。

失败消息可以用于表示执行第一步骤失败或异常。具体的，控制节点下发任一执行步骤任务到系统中的各个数据节点，数据节点执行控制节点下发的执行步骤任务，执行成功后，将执行结果发送给控制节点；当出现执行异常时，发送失败消息给控制节点。当控制节点收到任一数据节点发送的失败消息时，即表示该步任务步骤执行失败。

5103、根据预先设定的可恢复信息，确定执行查询请求的第二步骤。具体的，控制节点收到数据节点发送的失败消息后，分析错误信息，并根据当前保存的可恢复信息，确定重新执行查询请求的起始步骤。上述第二步骤即为重新执行查询请求的起始步骤，可恢复信息中包括重新执行查询请求时无需重复执行的步骤。

5104、向各个数据节点发送第二步骤信息。

控制节点确定重新执行查询请求的起始步骤为第二步骤后，向系统中各个数据节点发送第二步骤信息。

本实施例中，控制节点收到任一数据节点发送的失败消息后，通过对错误信息进行分析，控制节点可以根据当前保存的可恢复信息，确定重新执行查询请求的起始步骤，实现查询过程中的某一步骤执行失败后无需从头执行，提高了并行数据库查询处理的效率。

图 2为本发明查询处理方法实施例二的流程图。如图 2所示，在图 1所示本发明方法实施例一的基础上，控制节点根据查询请求步骤，评估执行查询处理任务的成本，生成可恢复信息，因此，在控制节点向系统中各个数据节点发送执行客户端查询请求的第一步骤信息之前，还可以包括下述操作：

S201、根据数据节点执行查询请求的各个步骤对应的资源消耗，生成可恢复信息。

具体的，控制节点根据客户端的查询请求生成执行计划步骤，每一步骤描述了特定的数据库操作，如对数据表的扫描、连接等，控制节点评估执行查询请求各个步骤对应的资源消耗，如根据检索数据时的系统资源消耗，检索条件的数据集大小等，并依据一定的算法，决策生成可恢复信息，其中，可恢复信息可以包括可恢复点的数量、位置等信息。

本实施例中，控制节点通过评估数据节点执行查询请求的各个计划步骤对系统的资源消耗，生成执行步骤的可恢复点数量、位置等可恢复信息，控制节点控制系统中各数据节点在执行查询请求任务的过程中，当出现某一执行步骤失败时，通过分析错误信息，并根据当前保存的可恢复信息，确定重新执行查询请求的起始步骤，实现执行失败后无需从头执行，提高了并行数据库查询处理的效率。

如上的查询处理方法，其中，可恢复信息中可以包括至少一个可恢复点信息，可恢复点后续距离最近的下一步骤作为重新执行查询请求的起始步骤。

具体的，控制节点评估执行查询请求各个步骤对应的资源消耗，至少设置一个可恢复点，当执行某个步骤失败时，控制节点分析错误信息，从已保存有执行结果的可恢复点中，查找出离该执行步骤最近的可恢复点，并选择该可恢复点的下一步骤作为重新执行查询请求的起始步骤。

本实施例中，通过设置可恢复点，实现在执行某个步骤失败时，从已保存有执行结果的可恢复点中，查找出离该执行步骤最近的可恢复点，并选择该可恢复点的下一步骤作为重新执行查询请求的起始步骤，避免了执行失败后从头执行的过程，提高了并行数据库查询处理的效率。

图 3为本发明查询处理方法实施例三的流程图。如图 3所示，在图 2所示本发明方法实施例二的基础上，在执行第一步骤失败或异常之前，还可以存在其它执行步骤，因此，向系统中各个数据节点发送执行客户端查询请求的第一步骤信息之前，还可以包括下述操作：

S301、向各个数据节点发送执行查询请求的第三步骤信息。具体的，第三步骤为第一步骤之前的任一步骤，控制节点向系统中各个数据节点发送执行查询请求的步骤信息，并等待数据节点发送执行结果信息。

5302、接收各个数据节点发送的第一成功消息。

具体的，第一成功消息用于表示执行第三步骤成功，系统中各个数据节点将执行结果发送给控制节点。

5303、记录位于第三步骤之前且距第三步骤最近的第一可恢复点信息。具体的，在第三步骤执行成功后，控制节点记录位于第三步骤之前且距第三步骤最近的第一可恢复点信息，该可恢复点信息包含其已执行步骤的具体结果，从而在后续步骤执行失败时，可以选择该可恢复点的下一步骤作为重新执行查询请求的起始步骤。

本实施例中，通过在第一步骤之前设置第一可恢复点，实现在第一可恢复点的后续步骤执行失败时，可以根据第一可恢复点信息，选择第一可恢复点的下一步骤作为重新执行查询请求的起始步骤，避免了执行失败后从头执行的过程，提高了并行数据库查询处理的效率。

如上的查询处理方法，其中，根据预先设定的可恢复信息，确定执行查询请求的第二步骤，包括：将第一可恢复点后续距离最近的下一步骤作为第二步骤。

具体的，第一可恢复点信息为位于第三步骤之前且距第三步骤最近的可恢复点信息，第三步骤为第一步骤之前的任一步骤，因此，当第一步骤执行失败时，可以选择第一可恢复点的下一步骤作为第二步骤，即选择第一可恢复点的下一步骤作为重新执行查询请求的起始步骤。

本实施例中，通过在第一步骤之前设置第一可恢复点，实现在第一步骤执行失败时，可以选择第一可恢复点的下一步骤作为第二步骤，即选择第一可恢复点的下一步骤作为重新执行查询请求的起始步骤，避免了执行失败后从头执行的过程，提高了并行数据库查询处理的效率。

图 4为本发明查询处理方法实施例四的流程图。如图 4所示，在图 3所示本发明方法实施例三的基础上，在第一可恢复点之后，在第一步骤之前，还可以更新记录第二可恢复点，因此，记录位于第三步骤之前且距第三步骤最近的第一可恢复点信息之后，向系统中各个数据节点发送执行客户端查询请求的第一步骤信息之前，还可以包括下述操作：

S401、向各个数据节点发送执行查询请求的第四步骤信息。

具体的，第四步骤为第一步骤之前，且位于第一可恢复点之后的步骤，控制节点向系统中各个数据节点发送执行查询请求的步骤信息，并等待数据节点发送执行结果信息。

5402、接收各个数据节点发送的第二成功消息。

具体的，第二成功消息用于表示执行第四步骤成功，系统中各个数据节点将执行结果发送给控制节点。

5403、记录位于第四步骤之前且距第四步骤最近的第二可恢复点信息。具体的，在第四步骤执行成功后，控制节点记录位于第四步骤之前且距第四步骤最近的第二可恢复点信息，该可恢复点信息包含其已执行步骤的具体结果，从而在后续步骤执行失败时，可以选择该可恢复点的下一步骤作为重新执行查询请求的起始步骤。

由于第二可恢复点位于第一可恢复点之后，第二可恢复点信息包括第一可恢复点信息中记录的执行步骤的具体结果，因此，可以用第二可恢复点信息覆盖第一可恢复点信息。

本实施例中，通过在第一可恢复点之后更新记录第二可恢复点，实现在第二可恢复点的后续步骤执行失败时，可以根据第二可恢复点信息，选择第二可恢复点的下一步骤作为重新执行查询请求的起始步骤，避免了执行失败后重新执行一些查询处理步骤，提高了并行数据库查询处理的效率。

如上的查询处理方法，其中，根据预先设定的可恢复信息，确定执行查询请求的第二步骤，包括：将第二可恢复点后续距离最近的下一步骤作为第二步骤。

具体的，第二可恢复点信息为位于第四步骤之前且距第四步骤最近的可恢复点信息，第四步骤为第一步骤之前，且位于第一可恢复点之后的步骤，因此，当第一步骤执行失败时，可以选择第二可恢复点的下一步骤作为第二步骤，即选择第二可恢复点的下一步骤作为重新执行查询请求的起始步骤。

本实施例中，通过在第一可恢复点之后设置第二可恢复点，实现在第一步骤执行失败时，可以选择第二可恢复点的下一步骤作为第二步骤，即选择第二可恢复点的下一步骤作为重新执行查询请求的起始步骤，避免了执行失败后重新执行一些查询处理步骤，提高了并行数据库查询处理的效率。

图 5为本发明查询处理方法实施例五的原理图。如图 5所示，控制节点 500根据客户端的查询请求生成执行计划步骤 503 , 并通过评估各个步骤对应的资源消耗，生成可恢复点信息，其中第 1可恢复点 501和第 2可恢复点 502 分别对应步骤 B和步骤 D。具体执行步骤 504如下：

1 )控制节点先下发步骤 A任务到每个数据节点，如果每个数据节点执行步骤 A都成功，控制节点下发步骤 B任务；

2 )如果每个数据节点执行步骤 B成功，则控制节点先记录第 1可恢复点 501的信息，并下发步骤 C任务到每个节点；

3 )如果数据节点在执行步骤 C的过程中出现异常或失败，则控制节点通过分析错误信息，以及根据当前保存的第 1可恢复点 501的信息，重新下发步骤 C任务到每个数据节点，而不是从步骤 A开始从头执行；

4 )控制节点下发步骤 D任务到每个数据节点，如果执行成功，则控制节点先记录第 2可恢复点 502的信息，并将第 2可恢复点 502的信息覆盖；而如果执行失败，则从步骤 C开始再次执行；

5 ) 当数据节点执行步骤 E出现异常时，控制节点根据当前最新记录的第 2可恢复点 502的信息，再次执行步骤 E, 而不是从步骤 C开始执行，也不是从步骤 A开始执行。

图 6为本发明查询处理方法实施例五的流程图。如图 6所示，本实施例中，控制节点上存储了执行计划的可恢复点信息和当前执行任务的可恢复点状态，其中，第 1可恢复点 501和第 2可恢复点 502分别对应步骤 B和步骤 D。 4叚定执行步骤 E失败，客户端，控制节点，数据节点之间的交互流程如下：

5601、客户端向控制节点发送查询请求消息。

5602、控制节点生成执行计划步骤和可恢复点信息。

控制节点根据客户端的查询请求生成执行计划步骤，并通过评估各个步骤对应的资源消耗生成可恢复信息，其中，可恢复信息包括可恢复点的数量、位置等。

5603、控制节点发送步骤 A信息到每个数据节点。控制节点发送执行步骤 A的任务消息到每个数据节点。

5604、数据节点执行步骤 A。

各个数据节点执行任务步骤 A。

5605、数据节点发送步骤 A的执行结果到控制节点。

各个数据节点发送执行结果到控制节点。

5606、控制节点发送步骤 B信息到每个数据节点。

控制节点发送执行步骤 B的任务消息到每个数据节点。

5607、数据节点执行步骤 B。

各个数据节点执行任务步骤 B。

5608、数据节点发送执行结果到控制节点。

各个数据节点发送步骤 B的执行结果到控制节点。

5609、控制节点记录可恢复点状态 =B。

控制节点记录第 1可恢复点执行成功，并存储执行步骤的具体结果数据。

5610、控制节点发送步骤 C信息到每个数据节点。

控制节点发送执行步骤 C的任务消息到每个数据节点。

5611、数据节点执行步骤 C。

各个数据节点执行任务步骤 C。

5612、数据节点发送执行结果到控制节点。

各个数据节点发送步骤 C的执行结果到控制节点。

5613、控制节点发送步骤 D信息到每个数据节点。

控制节点发送执行步骤 D的任务消息到每个数据节点。

5614、数据节点执行步骤 D。

各个数据节点执行任务步骤 D。

5615、数据节点发送执行结果到控制节点。

各个数据节点发送步骤 D的执行结果到控制节点。

5616、控制节点更新可恢复点状态 =D。

控制节点更新可恢复点信息，记录第 2可恢复点的信息，并将第 1可恢复点的信息覆盖。

5617、控制节点发送步骤 E信息到每个数据节点。控制节点发送执行步骤 E的任务消息到每个数据节点。

5618、数据节点执行步骤 E。

各个数据节点执行任务步骤 E。

5619、数据节点执行步骤 E失败，返回控制节点失败信息。

各个数据节点发送执行结果到控制节点，控制节点收到任何一个数据节点发送的步骤 E执行失败消息，即判定步骤 E执行失败。

5620、控制节点根据记录的可恢复点状态 D, 分析错误原因后，从 D开始重新执行步骤£。

当某个步骤执行失败或出现异常时，数据节点根据最新可恢复点状态信息，决策距离最近的步骤开始执行，因此，在步骤 E执行失败时，控制节点根据记录的可恢复点状态 D, 分析错误原因后，从 D开始重新执行步骤 E, 而不是从 B开始执行步骤 C, 也不是从头开始执行步骤 A。

5621、控制节点重新发送步骤 E信息到每个数据节点。

控制节点重新发送执行步骤 E的任务消息到每个数据节点。

5622、数据节点重新执行步骤£。

各个数据节点重新执行任务步骤 E。

5623、数据节点发送执行结果到控制节点。

各个数据节点发送步骤 E的执行结果到控制节点。

5624、控制节点将结果返回给客户端。

控制节点将最终查询处理结果返回给客户端。

本实施例中，控制节点在生成执行计划的同时，生成执行步骤的可恢复点信息，并记录管理可恢复点状态。在出现执行失败时，控制节点根据可恢复点状态信息，决策最近的可恢复点，以这个恢复点开始执行，避免海量数据的重复执行，提高了并行数据库查询处理的效率。

为了更清楚地说明本发明实施例的技术方案，下面给出并行数据库查询处理的样例。

假定有两个表： student表和 sc表。 student表有 sid, name, sex三个字段, sc表有 sid, cn, score三个字段，表定义可以参照如下语句：

create table student (sid int,name varchar(20) , sex varchar(20)) partitioning key sid on all;

create table sc (sid int,cn varchar(20) , score float) partitioning key cn on all; 表 1 为 student表，具体表数据如表 1所示；表 2为 sc表，具体表数据如表 2所示。表数据存储在三个数据节点上，查询语句可以参照如下语句：

Select student.name,sc.cn,sc. score from student, sc where student. sid

表 3为查询处理表。对 student表和 sc表的查询计划分为 4个步骤，查询语句可以参照图 3所示。

表 3查询处理表

SELECT isProducer = true 首先创建临时数 student.name as name, isConsumer = true 据库 TMPTT1 _ 1 , 然 student, sid as sid nodeld = 2 后执行查询语句， FROM student isProducer = true 并将结果广播到 targetTable = TMPTTl l isConsumer = true 其他数据节点上。 targetSchema = nodeld = 3

CREATE TABLE isProducer = true

"TMPTTl l " isConsumer = true

( "name" VARCHAR (20),

"sid" INT)

WITHOUT OIDS

destType =

DEST— TYPE— BROADCAST

queryString = nodeld = 1 在各底层数据节 SELECT isProducer = true 点上执行 join查

TMPTT1 1.name as name, isConsumer = false 询。

scl .cn as cn, nodeld = 2

scl . score as score isProducer = true

FROM isConsumer = false

TMPTTl l nodeld = 3

INNER join scl on (scl .sid = isProducer = true

TMPTTl l .sid) isConsumer = false

destType =

DEST— TYPE— COORD— FINAL

Final Result Set construct Master 由控制节点将各数据节点返回的多个 Resul tSe t封装为外部的一个 Resul tSet 4 Dro 临时表 TMPTT1— 1 nodeld = 1,2,3 在向客户端返回结果结束后，控制节点通知各数据节点删除临时表。控制节点处理过程为:

1 )先执行步骤 1 ,如果执行成功，则控制节点记录可恢复点状态为步骤 1 , 否则控制节点分析异常原因 , 决策重新执行或报错；

2 )执行步骤 2时，如果执行失败，则控制节点分析异常原因后，根据当前最新的可恢复点状态，重新执行步骤 2, 否则控制节点覆盖可恢复点状态为步骤 2; 继续执行后面的步骤 3、步骤 4;

3 ) 当执行步骤 3、步骤 4 出现异常时，控制节点分析异常原因后，根据存储的最新可恢复点信息，直接执行步骤 3;

4 )所有步骤执行完成后，控制节点删除可恢复点信息。

本实施例中，步骤 1主要是创建临时表，扫描底层数据表，并存储到临时表中，步骤 2是临时表与 sn表进行连接运算，两个步骤都很耗时，也是当数据节点数量增多时最容易出现异常的步骤，因此可以将步骤 1和步骤 2设置为可恢复点，避免在查询处理过程中对海量数据的重复操作，提高了并行数据库查询处理的效率。

图 7为本发明控制节点实施例一的结构示意图。如图 7所示，本实施例的控制节点可以包括：第一发送模块 701、接收模块 702、处理模块 703和第二发送模块 704。其中，第一发送模块 701用于向系统中各个数据节点发送执行客户端查询请求的第一步骤信息；接收模块 702用于接收至少一个数据节点发送的失败消息，失败消息用于表示执行第一步骤失败或异常；处理模块 703 用于根据预先设定的可恢复信息，确定执行查询请求的第二步骤，第二步骤为重新执行查询请求的起始步骤，可恢复信息中包括重新执行查询请求时无需重复执行的步骤；第二发送模块 704用于向各个数据节点发送第二步骤信息。

本实施例的控制节点，可以用于执行图 1所示方法实施例的方法，其实现原理和所要达到的技术效果类似，其执行查询处理方法的具体过程可参见图 1 所示方法实施例中的相关描述，在此不再赘述。本实施例中，控制节点收到任一数据节点发送的失败消息后，通过对错误信息进行分析，控制节点可以根据当前保存的可恢复信息，确定重新执行查询请求的起始步骤，实现查询过程中的某一步骤执行失败后无需从头执行，提高了并行数据库查询处理的效率。

如上的控制节点，其中，处理模块 703还可以用于根据数据节点执行查询请求的各个步骤对应的资源消耗，生成可恢复信息。

本实施例的控制节点，可以用于执行图 2所示方法实施例的方法，其实现原理和所要达到的技术效果类似，其执行查询处理方法的具体过程可参见图 2 所示方法实施例中的相关描述，在此不再赘述。

图 8为本发明控制节点实施例二的结构示意图。如图 8所示，在图 7所示本发明控制节点实施例一的基础上，本实施例的控制节点还可以包括存储模块 801。

本实施例中，存储模块 801还可以用于存储可恢复信息，可恢复信息中至少一个可恢复点信息，可恢复点后续距离最近的下一步骤作为重新执行查询请求的起始步骤。

具体的，处理模块 703评估执行查询请求各个步骤对应的资源消耗，至少设置一个可恢复点，当执行某个步骤失败时，处理模块 703分析错误信息，从存储模块 801已存储有执行结果的可恢复点中，查找出离该执行步骤最近的可恢复点，并选择该可恢复点的下一步骤作为重新执行查询请求的起始步骤。

本实施例中，通过设置可恢复点，实现在执行某个步骤失败时，从已保存有执行结果的可恢复点中，查找出离该执行步骤最近的可恢复点，并选择该可恢复点的下一步骤作为重新执行查询请求的起始步骤，避免了执行失败后从头执行的过程，提高了并行数据库查询处理的效率。如上的控制节点，其中，第一发送模块 701还可以用于向各个数据节点发送执行查询请求的第三步骤信息；接收模块 702还可以用于接收各个数据节点发送的第一成功消息，第一成功消息用于表示执行第三步骤成功；存储模块 801 还可以用于记录位于第三步骤之前且距第三步骤最近的第一可恢复点信息。

本实施例的控制节点，可以用于执行图 3所示方法实施例的方法，其实现原理和所要达到的技术效果类似，其执行查询处理方法的具体过程可参见图 3 所示方法实施例中的相关描述，在此不再赘述。

如上的控制节点，其中，处理模块 703根据预先设定的可恢复信息，确定执行查询请求的第二步骤，具体可以包括：将第一可恢复点后续距离最近的下一步骤作为第二步骤。

具体的，第一可恢复点信息为位于第三步骤之前且距第三步骤最近的可恢复点信息，第三步骤为第一步骤之前的任一步骤，因此，当第一步骤执行失败时，处理模块 703可以选择第一可恢复点的下一步骤作为第二步骤，即选择第一可恢复点的下一步骤作为重新执行查询请求的起始步骤。

如上的控制节点，其中，第一发送模块 701还可以用于向各个数据节点发送执行查询请求的第四步骤信息；接收模块 702还可以用于接收各个数据节点发送的第二成功消息，第二成功消息用于表示执行第四步骤成功；存储模块 801 还可以用于记录位于第四步骤之前且距第四步骤最近的第二可恢复点信息。

本实施例的控制节点，可以用于执行图 4所示方法实施例的方法，其实现原理和所要达到的技术效果类似，其执行查询处理方法的具体过程可参见图 4 所示方法实施例中的相关描述，在此不再赘述。

如上的控制节点，其中，处理模块 703根据预先设定的可恢复信息，确定执行查询请求的第二步骤，具体可以包括：将第二可恢复点后续距离最近的下一步骤作为第二步骤。

具体的，第二可恢复点信息为位于第四步骤之前且距第四步骤最近的可恢复点信息，第四步骤为第一步骤之前，且位于第一可恢复点之后的步骤，因此，当第一步骤执行失败时，处理模块 703可以选择第二可恢复点的下一步骤作为第二步骤，即选择第二可恢复点的下一步骤作为重新执行查询请求的起始步骤。

图 9为本发明控制节点实施例三的结构示意图。如图 9所示，本实施例的控制节点可以包括：发送器 901、接收器 902和处理器 903。其中，发送器 901 用于向系统中各个数据节点发送执行客户端查询请求的第一步骤信息；接收器 902用于接收至少一个数据节点发送的失败消息，失败消息用于表示执行第一步骤失败或异常；处理器 903用于根据预先设定的可恢复信息，确定执行查询请求的第二步骤，第二步骤为重新执行查询请求的起始步骤，可恢复信息中包括重新执行查询请求时无需重复执行的步骤；发送器 901还用于向各个数据节点发送第二步骤信息。

如上的控制节点，其中，处理器 903还可以用于根据数据节点执行查询请求的各个步骤对应的资源消耗，生成可恢复信息。

图 10为本发明控制节点实施例四的结构示意图。如图 10所示，在图 9 所示本发明控制节点实施例一的基础上，本实施例的控制节点还可以包括存储器 1001。

本实施例中，存储器 1001还可以用于存储可恢复信息，可恢复信息中至少一个可恢复点信息，可恢复点后续距离最近的下一步骤作为重新执行查询请求的起始步骤。

具体的，处理器 903评估执行查询请求各个步骤对应的资源消耗，至少设置一个可恢复点，当执行某个步骤失败时，处理器 903分析错误信息，从存储器 1001 已存储有执行结果的可恢复点中，查找出离该执行步骤最近的可恢复点，并选择该可恢复点的下一步骤作为重新执行查询请求的起始步骤。

本实施例中，通过设置可恢复点，实现在执行某个步骤失败时，从已保存有执行结果的可恢复点中，查找出离该执行步骤最近的可恢复点，并选择该可恢复点的下一步骤作为重新执行查询请求的起始步骤，避免了执行失败后从头执行的过程，提高了并行数据库查询处理的效率。如上的控制节点，其中，发送器 901还可以用于向各个数据节点发送执行查询请求的第三步骤信息；接收器 902还可以用于接收各个数据节点发送的第一成功消息，第一成功消息用于表示执行第三步骤成功；存储器 1001还可以用于记录位于第三步骤之前且距第三步骤最近的第一可恢复点信息。

如上的控制节点，其中，处理器 903根据预先设定的可恢复信息，确定执行查询请求的第二步骤，具体可以包括：将第一可恢复点后续距离最近的下一步骤作为第二步骤。

具体的，第一可恢复点信息为位于第三步骤之前且距第三步骤最近的可恢复点信息，第三步骤为第一步骤之前的任一步骤，因此，当第一步骤执行失败时，处理器 903可以选择第一可恢复点的下一步骤作为第二步骤，即选择第一可恢复点的下一步骤作为重新执行查询请求的起始步骤。

如上的控制节点，其中，发送器 901还可以用于向各个数据节点发送执行查询请求的第四步骤信息；接收器 902还可以用于接收各个数据节点发送的第二成功消息，第二成功消息用于表示执行第四步骤成功；存储器 1001还可以用于记录位于第四步骤之前且距第四步骤最近的第二可恢复点信息。

本实施例的控制节点，可以用于执行图 4所示方法实施例的方法，其实现原理和所要达到的技术效果类似，其执行查询处理方法的具体过程可参见图 4 所示方法实施例中的相关描述，在此不再赘述。本实施例中，通过在第一可恢复点之后更新记录第二可恢复点，实现在第二可恢复点的后续步骤执行失败时，可以根据第二可恢复点信息，选择第二可恢复点的下一步骤作为重新执行查询请求的起始步骤，避免了执行失败后重新执行一些查询处理步骤，提高了并行数据库查询处理的效率。

如上的控制节点，其中，处理器 903根据预先设定的可恢复信息，确定执行查询请求的第二步骤，具体可以包括：将第二可恢复点后续距离最近的下一步骤作为第二步骤。

具体的，第二可恢复点信息为位于第四步骤之前且距第四步骤最近的可恢复点信息，第四步骤为第一步骤之前，且位于第一可恢复点之后的步骤，因此，当第一步骤执行失败时，处理器 903可以选择第二可恢复点的下一步骤作为第二步骤，即选择第二可恢复点的下一步骤作为重新执行查询请求的起始步骤。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括： ROM, RAM,磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

权利要求书

1、一种查询处理方法，其特征在于，包括：

向所述各个数据节点发送所述第二步骤信息。

2、根据权利要求 1所述的方法，其特征在于，所述向系统中各个数据节点发送执行客户端查询请求的第一步骤信息之前，还包括：

3、根据权利要求 1或 2所述的方法，其特征在于，所述可恢复信息中包括至少一个可恢复点信息，所述可恢复点后续距离最近的下一步骤作为重新执行所述查询请求的起始步骤。

4、根据权利要求 3所述的方法，其特征在于，所述向系统中各个数据节点发送执行客户端查询请求的第一步骤信息之前，还包括：

记录位于所述第三步骤之前且距所述第三步骤最近的第一可恢复点信息。

5、根据权利要求 4所述的方法，其特征在于，所述根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：

6、根据权利要求 4所述的方法，其特征在于，所述记录位于所述第三步骤之前且距所述第三步骤最近的第一可恢复点信息之后，所述向系统中各个数据节点发送执行客户端查询请求的第一步骤信息之前，还包括：

向所述各个数据节点发送执行所述查询请求的第四步骤信息；接收所述各个数据节点发送的第二成功消息，所述第二成功消息用于表示执行所述第四步骤成功；

记录位于所述第四步骤之前且距所述第四步骤最近的第二可恢复点信息。

7、根据权利要求 6所述的方法，其特征在于，所述根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：

8、一种控制节点，其特征在于，包括：

9、根据权利要求 8所述的控制节点，其特征在于，所述处理模块，还用于根据所述数据节点执行所述查询请求的各个步骤对应的资源消耗，生成所述可恢复信息。

10、根据权利要求 8或 9所述的控制节点，其特征在于，所述控制节点还包括：存储模块，用于存储所述可恢复信息，所述可恢复信息中至少一个可恢复点信息，所述可恢复点后续距离最近的下一步骤作为重新执行所述查询请求的起始步骤。

1 1、根据权利要求 10所述的控制节点，其特征在于，所述第一发送模块，还用于向所述各个数据节点发送执行所述查询请求的第三步骤信息；

12、根据权利要求 1 1所述的控制节点，其特征在于，所述处理模块，根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：将所述第一可恢复点后续距离最近的下一步骤作为所述第二步骤。

13、根据权利要求 1 1所述的控制节点，其特征在于，

所述第一发送模块，还用于向所述各个数据节点发送执行所述查询请求的第四步骤信息；

14、根据权利要求 13所述的控制节点，其特征在于，所述处理模块，根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：将所述第二可恢复点后续距离最近的下一步骤作为所述第二步骤。

15、一种控制节点，其特征在于，包括：

发送器，用于向系统中各个数据节点发送执行客户端查询请求的第一步骤信息；

16、根据权利要求 15所述的控制节点，其特征在于，所述处理器，还用于根据所述数据节点执行所述查询请求的各个步骤对应的资源消耗，生成所述可恢复信息。

17、根据权利要求 15或 16所述的控制节点，其特征在于，所述控制节点还包括：存储器，用于存储所述可恢复信息，所述可恢复信息中至少一个可恢复点信息，所述可恢复点后续距离最近的下一步骤作为重新执行所述查询请求的起始步骤。

18、根据权利要求 17所述的控制节点，其特征在于，所述发送器，还用于向所述各个数据节点发送执行所述查询请求的第三步骤信息；

19、根据权利要求 18所述的控制节点，其特征在于，所述处理器，根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：将所述第一可恢复点后续距离最近的下一步骤作为所述第二步骤。

20、根据权利要求 18所述的控制节点，其特征在于，

所述发送器，还用于向所述各个数据节点发送执行所述查询请求的第四步骤信息；

21、根据权利要求 20所述的控制节点，其特征在于，所述处理器，根据预先设定的可恢复信息，确定执行所述查询请求的第二步骤，包括：将所述第二可恢复点后续距离最近的下一步骤作为所述第二步骤。