WO2021046750A1

WO2021046750A1 - 数据重分布方法、装置及系统

Info

Publication number: WO2021046750A1
Application number: PCT/CN2019/105357
Authority: WO
Inventors: 佟强
Original assignee: 华为技术有限公司
Priority date: 2019-09-11
Filing date: 2019-09-11
Publication date: 2021-03-18
Also published as: US11860833B2; EP3885929A1; US20210334252A1; EP3885929A4; CN112789606A

Abstract

一种数据重分布方法、装置及系统，应用于数据库领域，用于数据存储。该方法包括：确定分布式数据库中与第一数据表分别关联的第一节点集和第二节点集，第一节点集包括在第一数据表的数据被数据重分布之前用于存储第一数据表中的数据的数据节点，第二节点集包括从第一数据表的数据被数据重分布开始用于存储第一数据表中的数据的数据节点；将第一数据表的数据从第一节点集迁移至第二节点集；在迁移第一数据表的数据的过程中，当接收到对第一数据表的目标业务请求时，在第一节点集和第二节点集中确定用于响应目标业务请求的第三节点集；将目标业务请求发送至第三节点集中的数据节点。能够降低在线数据重分布的复杂度。

Description

数据重分布方法、装置及系统

技术领域

本申请涉及数据库领域，特别涉及一种数据重分布方法、装置及系统。

背景技术

在线数据重分布是指在不中断用户业务的情况下完成数据重新分布。目前越来越多的数据库都在应用该技术。

在关系型数据库中，数据库的多个节点中维护有一个或多个数据表的数据。通常采用创建临时表的方式来实现数据的在线重分布。例如，对于需要进行数据重分布的第一数据表，先为该表创建临时表。然后将该第一数据表对应节点上部署的第一数据表的所有数据对应复制至临时表对应节点中，在完成数据复制后，交换临时表的数据和第一数据表的数据(该过程称为数据切换)，交换完成后，删除临时表和临时表的数据，至此即完成了数据重分布。

在上述数据重分布过程中，需要保证源表(即第一数据表)和临时表的数据一致性，还需要执行数据切换过程，因此，在线数据重分布的复杂度较高。

发明内容

本申请实施例提供一种数据重分布方法、装置及系统，可以降低在线数据重分布的复杂度。

第一方面，提供一种数据重分布方法，包括：

确定分布式数据库中与第一数据表分别关联的第一节点集和第二节点集，第一节点集包括在第一数据表的数据被数据重分布之前用于存储第一数据表中的数据的数据节点，第二节点集包括从第一数据表的数据被数据重分布开始用于存储第一数据表中的数据的数据节点；

将第一数据表的数据从第一节点集迁移至第二节点集；

在迁移所述第一数据表的数据的过程中，当接收到对第一数据表的目标业务请求时，在第一节点集和第二节点集中确定用于响应目标业务请求的第三节点集；

将目标业务请求发送至第三节点集中的数据节点，目标业务请求用于供第三节点集中每个节点基于目标业务请求进行业务处理。

本申请实施例提供的数据重分布方法，无需建立临时表，即可进行目标任务的执行，实现在线数据重分布，这样无需进行表间数据迁移，仅需进行表内数据迁移，从而降低了在线数据重分布的复杂度。

在一种可能实现中，在第一节点集和第二节点集中确定用于响应目标业务请求的第三节点集，包括：当目标业务请求为数据添加请求时，在第二节点集中确定用于响应所述数据添加请求的第三节点集。

将新增数据直接写入重分布后的节点，可以有效降低重分布的复杂度，提高数据迁移效率

例如，在第二节点集中确定用于响应所述数据添加请求的第三节点集，包括：根据数据添加请求所携带的新增数据的键值计算哈希值；在第二节点集中确定所述哈希值对应的数据节点，确定的数据节点属于第三节点集。

采用哈希分布规则进行数据分布可以实现负载均衡。

在一种可能实现中，在第一节点集和第二节点集中确定用于响应目标业务请求的第三节点集，包括：

当所述目标业务请求为数据删除请求或者数据修改请求或者与第一数据表关联的数据查询请求时，在所述第一节点集中确定用于响应所述目标业务请求的数据节点，并在所述第二节点集中确定用于响应所述目标业务请求的数据节点，由从所述第一节点集中确定的数据节点和从所述第二节点集中确定的数据节点组成所述第三节点集。

在一种可能实现中，将第一数据表的数据从第一节点集迁移至第二节点集，包括：在第一节点集存储的第一数据表的数据中筛选待迁移数据，所述待迁移数据为所述第二节点集在迁移前没有存储的所述第一数据表的数据；将待迁移数据从第一节点集迁移至第二节点集。

由于在一些场景中，例如扩容场景中，一些数据可能无需进行迁移，这些数据可以称之为无效迁移数据。例如，在迁移前和迁移后在数据节点中部署的位置不变的数据和/或在迁移动作前已经删除的数据，对这些数据执行迁移动作，不仅占用数据资源，还会影响迁移的效率。因此可以通过筛选操作剔除无效迁移数据，将实际需要进行迁移的数据作为待迁移数据，进行数据迁移。也即是该待迁移数据包括第一数据表的数据中除无效迁移数据之外的数据。这样可以实现表数据的部分迁移，减少迁移的数据量，减少数据资源占用，提高迁移效率。

示例的，在第一节点集存储的第一数据表的数据中筛选待迁移数据，包括：获取第一数据表中的数据与第一节点集的数据节点的第一映射关系；获取第一数据表中的数据与第二节点集的数据节点的第二映射关系；对于所述第一数据表中的目标数据，在基于所述第一映射关系确定的与所述目标数据对应的数据节点与基于所述第二映射关系确定的与所述目标数据对应的数据节点不同时，在基于所述第一映射关系确定的与所述目标数据对应的数据节点中，将所述目标数据确定为所述待迁移数据。

在一种可能实现中，通过串行执行的多个分布式事务，分别将所述第一数据表的不同数据从所述第一节点集迁移至所述第二节点集。

由于采用串行执行的多个分布式事务进行数据迁移，虽然迁移第一数据表的总耗时不一定减短，但每次分布式事务的资源消耗少，单次迁移时间短，由于已经迁移成功的事务的数据，是不需要再重新迁移的，因此，如果一次迁移失败后重新进行数据迁移的代价较低，资源消耗较小，减少了对同时执行的其他用户作业的影响。

在一种可能实现中，所述通过串行执行的多个分布式事务，分别将所述第一数据表的不同数据从所述第一节点集迁移至所述第二节点集，包括：

在串行执行所述多个分布式事务时，通过当前执行到的分布式事务，从所述第一节点集中的所述第一数据表的未迁移数据中选择满足迁移条件的待迁移数据，并将选择的所述待迁移数据从所述第一节点集迁移至所述第二节点集，选择的所述待迁移数据在被迁移过程中被加锁；

其中，所述迁移条件包括：通过当前执行到的分布式事务迁移的所述待迁移数据的数据量小于或等于指定数据量阈值，和/或，通过当前执行到的分布式事务迁移的迁移时长小于或等于指定时长阈值。

在一种可能实现中，所述在串行执行所述多个分布式事务时，通过当前执行到的分布式事务，从所述第一节点集中的所述第一数据表的未迁移数据选择满足迁移条件的待迁移数据，并将选择的所述待迁移数据从所述第一节点集迁移至所述第二节点集，包括：

基于所述当前执行到的分布式事务，为n个数据节点分别生成n个分布式计划，所述第一节点集包括所述n个数据节点，所述n个数据节点与所述n个分布式计划一一对应，n为正整数；

指示所述n个数据节点分别执行所述n个分布式计划来并行从所述n个数据节点中的所述第一数据表的未迁移数据中选择满足子迁移条件的待迁移数据、并将选择的满足所述子迁移条件的所述待迁移数据从所述n个数据节点发送至所述第二节点集，所述子迁移条件是根据所述迁移条件确定的。

在一种可能实现中，该方法还包括：在迁移所述第一数据表的数据的过程中，若检测到回滚触发事件，将通过所述多个分布式事务已迁移的数据进行回滚。

在一种可能实现中，该方法还包括：在迁移所述第一数据表的数据的过程中，若检测到回滚触发事件，将通过当前执行到的分布式事务已迁移的数据进行回滚。

其中，回滚触发事件可以是第一数据表关联的数据节点故障(如宕机)，数据传输错误，网络错误，或接收到回滚指令等。

本申请实施例中，前述分布式事务保证了迁移过程的数据一致性和持久性，当分布式事务有多个时，针对第一数据表的整体的数据迁移过程拆分成通过多个分布式事务的迁移过程，若检测到回滚触发事件，只需将当前工作的一个分布式事务的所有操作进行回滚，在再次满足迁移条件后可以继续发起新的分布式事务进行数据迁移。因此，降低了回滚的数据粒度以及回滚的数据量，减少重复迁移的数据量，减少回滚对该数据迁移过程整体上影响，避免资源浪费，提高数据库的容错性。

在一种可能实现中，所述方法包括：为所述第一节点集上的所述第一数据表中的已迁移数据设置删除标识。

即迁移后的数据被删除后，实质上作为历史版本记录在相应的数据节点上，后续分布式事务进行数据扫描时，跳过该历史版本的数据即可(即跳过设置有删除标记的数据)。这样，可以保证数据迁移过程中，用户针对该历史版本的数据的数据查询操作有效执行。

第二方面，提供一种数据重分布装置，所述装置可以包括至少一个模块，该至少一个模块可以用于实现上述第一方面或者第一方面的各种可能实现提供的所述数据重分布方法。

第三方面，本申请提供一种计算设备，该计算设备包括处理器和存储器。该存储器存储计算机指令；该处理器执行该存储器存储的计算机指令，使得该计算设备执行上述第一方面或者第一方面的各种可能实现提供的方法，使得该计算设备部署上述第二方面或者第二方面的各种可能实现提供的该数据重分布装置。

第四方面，本申请提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机指令，该计算机指令指示该计算设备执行上述第一方面或者第一方面的各种可能实现提供的方法，或者该计算机指令指示该计算设备部署上述第二方面或者第二方面的各种可能实现提供的数据重分布装置。

第五方面，本申请提供一种计算机程序产品，该计算机程序产品包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算设备的处理器可以从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算设备执行上述第一方面或者第一方面的各种可能实现提供的方法，使得该计算设备部署上述第二方面或者第二方面的各种可能实现提供的数据重分布装置。

第六方面，提供一种分布式数据库系统，包括：管理节点和数据节点，所述管理节点包括第二方面或者第二方面的各种可能实现所述的数据重分布装置或第三方面所述的计算设备。

第七方面，提供一种芯片，所述芯片可以包括可编程逻辑电路和/或程序指令，当所述芯片运行时用于实现如第一方面任一所述的数据重分布方法。

附图说明

图1是相关技术提供的一种数据重分布方法的示意图；

图2是本申请实施例提供的一种数据重分布方法涉及的应用场景的示意图；

图3是本申请实施例提供的一种数据重分布方法的流程示意图；

图4是本申请实施例提供的一种数据重分布方法涉及的数据节点的示意图；

图5是本申请实施例提供的一种待迁移数据的筛选方法的流程示意图；

图6是本申请实施例提供的一种映射关系示意图；

图7是本申请实施例提供的一种数据迁移的流程示意图；

图8是本申请实施例提供的一种数据迁移的执行场景示意图；

图9是本申请实施例提供的一种数据迁移的用户业务场景示意图；

图10是本申请实施例提供的一种数据重分布装置的框图；

图11是本申请实施例提供的一种第二确定模块的框图；

图12是本申请实施例提供的一种迁移模块的框图；

图13是本申请实施例提供的另一种数据重分布装置的框图；

图14是本申请实施例提供的又一种数据重分布装置的框图；

图15是本申请实施例提供的一种计算设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

很多分布式数据库(Distributed Database，DDB)都支持数据重分布技术，比如在系统扩容、缩容或数据迁移等场景均可以应用数据重分布技术。在线数据重分布是指在不中断用户业务的情况下完成数据重分布。

分布式数据库可以包括关系型数据库(Relational database)，关系型数据库是指采用了关系模型来组织数据的数据库，其以行和列的形式存储数据，通常一行数据是数据读写的最小单位，也称为一条记录。关系型数据库中，一系列的行和列被称为数据表，一个数据表可以视为一个二维表。关系模型可以简单理解为二维表格模型。关系型数据库包括一个或多个数据表以及数据表之间的关系描述信息。每个数据表包括表数据和表信息，表数据是该数据表内部署在数据节点中的数据，即前述以行和列的形式存储的数据，表信息是描述数据表的信息，例如描述数据表的定义和架构的信息，数据表的表信息可以存储在表数据所部署的各个数据节点，也可以由单独的节点保存。

在关系型数据库中，按照结构化的方式存储数据，每个数据表的各个字段均按照预先设置的规则定义好(也即是表的结构是预先定义的)，再根据数据表的结构存入数据。这样，由于数据的形式和内容在存入数据表之前就已经定义好了，所以整个数据表的可靠性和稳定性都比较高。

在关系型数据库中，数据库的多个数据节点中部署有一个或多个数据表的数据。通常采用创建临时表的方式来实现数据的在线重分布。例如，请参考图1，对于需要进行数据重分布的第一数据表T1(可以称为源表)，先为该表创建临时表T2。然后将该第一数据表T1对应数据节点(图1以3个数据节点：节点1至3为例)上部署的第一数据表的所有数据：数据1至9，复制至临时表对应数据节点(图1以4个数据节点：节点1至4为例)中，将数据表中的全部数据一次性复制的方式称为全量数据迁移。在完成数据复制过程后，交换临时表T2的数据和第一数据表的数据，在交换完成后，删除临时表的数据和第一数据表的数据，至此即完成了数据重分布的完整过程。示例的，关系型数据库可以为greenplum数据库(Database，DB)或者GaussDB。其中，greenplum DB简称gpdb。

数据从源表所在节点复制到临时表所在节点(也称数据重分布)的过程中，如果执行数据的增加、删除和/或修改等数据的更新操作，可能会导致临时表和源表的数据不一致，因此通过对源表加独占锁来暂时禁止数据更新，当数据切换过程完成后再解锁。

示例的，在gpdb中，为了避免数据重分布过程出现数据的增加、删除和/或修改等数据的更新操作，正在进行数据复制的表会被加锁，不允许对该表中的数据进行数据添加操作(也称数据插入操作)、数据删除操作和数据修改操作，只允许对该表中的数据进行数据查询操作。

在GaussDB中，假设需要进行数据重分布的是第一数据表，在建立了临时表后，为了能够在数据重分布过程中允许数据更新，例如数据的增加、删除和/或修改，GaussDB在接收到数据更新请求(例如数据添加请求或数据删除请求)后，采用指定文件记录更新的数据，以便在完成一次全量数据迁移后，可以找到该全量数据迁移过程中更新的数据，并基于该更新的数据执行增量数据迁移。该增量数据迁移过程指的是，检查指定文件是否有更新的记录(包括全量数据迁移过程中的删除的记录，修改的记录和插入的记录等)，如果有更新的记录，则基于更新的记录再次执行更新的数据的复制。由于更新操作可能总是会存在，因此执行几次增量数据迁移过程后如果指定文件还有更新的记录，最后一次应该对第一数据表加锁(如独占锁)，并执行数据复制，在数据复制后，执行第一数据表和临时表的交换过程，最后释放锁。

在上述数据重分布过程中，需要保证源表和临时表的数据一致性，还需要执行数据切换过程，因此。在线数据重分布的复杂度较高。并且，数据表全量迁移耗时长，资源消耗大(包括中央处理器(CPU，central processing unit)、内存、输入/输出(input/output，IO)资源等多种资源的消耗均较大)，而同时执行的其他用户作业就可能由于资源不足而受到影响。

请参考图2，图2是本申请实施例提供的一种数据重分布方法所涉及的分布式数据库系统(Distributed Database System，DDBS)的应用环境的示意图。该DDBS可以为一个服务器或者由多个服务器组成的服务器集群，该DDBS包括分布式数据库管理系统(Distributed Database Management System，DDBMS)和DDB。在分布式数据库系统中，一个应用程序可以通过DDBS对DDB进行透明操作，DDB中的数据分别在不同的局部数据库中存储、由一个或多个DDBMS进行管理、在不同的机器上运行、由不同的操作系统支持，并被不同的通信网络连接在一起。其中，DDBS10包括：管理节点(也称数据库引擎，协调数据节点，coordinator)101和数据节点102。DDBMS可以部署在管理节点101上，DDB可以部署在多个数据节点(datanode)102上。该分布式数据库可以基于share-nothing架构建立，即数据库的所有数据都分布在数据节点上，数据节点之间的数据不共享。

管理节点101用于管理相应的数据节点102,并实现应用程序20对数据节点102的操作，例如执行数据添加操作、数据删除操作、数据修改操作或数据查询操作等。

本申请实施例中，管理节点101可以为单独一个节点，或者多个数据节点102中指定数据节点或者选举得到的数据节点，其可以为一个服务器或者由多个服务器组成的服务器集群。每个数据节点表征DDBS的一个设定的最小处理单元。示例的，每个数据节点可以为管理和/或存储数据的一个应用实例或一个数据库执行进程。该DDBS可以部署在一个服务器或者由多个服务器组成的服务器集群。分布式数据库可以具有多个数据表，每个数据表的数据记录根据用户定义的分布规则来分布到各个数据节点上，数据分布规则通常为哈希(Hash)分布，即键-值(key-value)分布。

为了便于读者理解，本申请实施例对哈希分布原理进行简单介绍。哈希分布是基于哈希函数的一种数据分布方法，哈希函数也可以称为散列函数。哈希函数是基于数据的键(key，也称键值，在分布式系统中也称分布键值)，得到值(value，也称哈希值)的一种函数。即value＝f(key)，函数f即为哈希函数。以表1为例，假设哈希函数为f(key)＝key mod 5，“mod”表示取模，即该哈希函数为取模运算(Module Operation)函数。则假设key分别为1、2、3、4、5、6、7、8和9，则对应的value分别为1、2、3、4、0、1、2、3和4。

表1

key	1	2	3	4	5	6	7	8	9
value	1	2	3	4	0	1	2	3	4

由上可知，key为1和6时，value都为1。因此，采用哈希函数确定value可能存在不同的key对应相同的value的情况，这种情况称为哈希冲突。哈希桶算法是一种特殊的哈希算法，其能够解决哈希冲突。哈希桶为放置不同key链表(也称哈希表)的容器，该哈希桶也称f(key)集合，或value集合。同一哈希桶对应的value相同。参考前述例子，可以设置哈希桶的个数为模数(也称模)的值，即5。多个value值与多个哈希桶一一对应。示例的，可以采用value值作为哈希桶的索引或编号，每个哈希桶存放具有相同value的key，同一个哈希桶中冲突的key之间用单向链表进行存储，这样就解决了哈希冲突。在查找与key对应的数据时，只需要通过key索引到对应value的哈希桶，然后从哈希桶的首地址对应的节点开始查找，即按照链表顺序查找，对比key的值，直到找到对应key，再基于查找到的key索引到对应的数据。如表1所示，key为1和6时，存储在哈希桶1中，key为2和7时，存储在哈希桶2中；key为3和8时，存储在哈希桶3中；key为4和9时，存储在哈希桶4中；key为5时，存储在哈希桶0中。

需要说明的是，前述实施例仅以哈希函数为取模的函数为例进行说明，实际上该哈希函数还可以为取余的函数(此时，该哈希函数为取余运算(Complementation)函数，哈希桶的个数为模数的值)，或者其他函数，本申请实施例对此不做限定。

本申请实施例提供一种数据重分布方法，可以应用于图2所示的应用环境中的分布式数据库，可以简化在线数据重分布的复杂度，该方法的全部或部分可以由前述管理节点执行。如图3所示，本申请实施例假设第一数据表为待迁移数据表，也即是待进行数据重分布的数据表，该方法包括：

步骤301、管理节点确定分布式数据库中与第一数据表分别关联的第一节点集和第二节点集。

分布式数据库的运维人员会根据数据库的负载情况等信息进行数据节点的调节，当分布式数据库增加了新的数据节点(扩容场景)或需要删除部分数据节点(缩容场景)或需要进行一些数据节点的存储数据的调整(数据迁移场景)，或需要进行数据节点的组间的数据表调整(组间数据表调整场景)，运维人员可以向管理节点输入数据重分布指令，管理节点接收到该数据重分布指令，并基于该数据重分布指令控制数据节点进行数据重分布，该数据重分布指令为用于指示进行数据重分布的结构化查询语言(Structured Query Language，SQL)，其包括一条或多条SQL语句。其中，在组间数据表调整场景，分布式数据库中的数据节点划分为不同的数据节点组，每个数据节点组包含相同或不同数量的数据节点，当用户希望将某个数据节点组上创建的表迁移到其他的数据节点组上，需要将表数据在新的数据节点组上重新分布，从而产生该场景。

在不同数据重分布场景中，数据重分布内容不同。例如，在扩容场景中，重分布后的数据节点会包含所有重分布前的数据节点，数据重分布指令为扩容指令，用于指示扩容操作所涉及的数据表(在本实施例中为第一数据表)，还用于指示扩容操作所增加的数据节点；在缩容场景中，重分布前的数据节点会包含所有重分布后的数据节点，数据重分布指令为缩容指令，用于指示缩容操作所涉及的数据表(在本实施例中为第一数据表)，还用于指示缩容操作所减少的数据节点；在数据迁移场景，重分布后的数据节点和重分布前的数据节点之间可能有数据节点重叠，也可能没有重叠；数据重分布指令为数据迁移指令，用于指示数据迁移操作所涉及的数据表(在本实施例中为第一数据表)，还用于指示数据迁移操作所迁移的目标数据节点。在组间数据表调整场景中，通常重分布后的数据节点和重分布前的数据节点之间没有数据节点重叠；数据重分布指令为数据迁移指令，用于指示数据迁移操作所涉及的数据表(在本实施例中为第一数据表)，还用于指示数据迁移操作所迁移的目标数据节点组。

值得说明的是，数据重分布还可以有其他场景，本申请实施例只是示意性说明，并不对此进行限定。在数据重分布指令触发数据重分布过程之后，为了能够有效识别第一数据表在当前是否处于数据重分布过程中，管理节点可以为该第一数据表添加重分布标志，该重分布标志用于标识该第一数据表处于数据重分布过程。后续，管理节点在接收到用户的业务请求后，可以通过查询业务请求所涉及的数据表是否添加有重分布标志，来执行相应动作。

管理节点可以基于该数据重分布指令(即解析该数据重分布指令中的SQL语句)，获取第一节点集和第二节点集。该第一节点集包括在第一数据表的数据被数据重分布之前用于存储第一数据表中的数据的数据节点，也即是第一节点集为当前(即步骤301执行时，步骤302之前)第一数据表中的数据所部署的数据节点的集合；该第二节点集包括从第一数据表的数据被数据重分布开始用于存储第一数据表中的数据的数据节点，也即是第二节点集为后续经过数据迁移后(即步骤302之后)，第一数据表中的数据所部署的数据节点的集合。在本申请实施例中，第一节点集和第二节点集均包括一个或多个数据节点。

第一节点集的获取方式可以有多种。在一种可选方式中，可以直接查询当前第一数据表中的数据所部署的数据节点，得到第一节点集。在另一种可选方式中，分布式数据库中可以维护有当前每个数据表的数据与其部署的节点集的数据节点的映射关系，每个映射关系可以基于对应的数据表的数据的部署位置实时更新，从而可以通过查询该映射关系得到第一数据表所对应的第一节点集；例如，第一数据表中的数据与第一节点集的数据节点的映射关系，称为第一映射关系，通过查询该第一映射关系可以确定第一节点集。在又一种可选方式中，数据重分布指令可以携带该第一节点集的标识，基于该标识获取第一节点集。

第二节点集的获取方式也可以有多种。第二节点集可以直接通过数据重分布指令获取；例如，在扩容场景中，将第一节点集以及扩容操作所增加的数据节点确定为第二节点集包括的数据节点。如图2所示，图2以扩容场景为例，则第一节点集共4个数据节点，第二节点集共6个数据节点；在缩容场景中，将第一节点集中除缩容操作所减少的数据节点之外的数据节点确定为第二节点集；在数据迁移场景，将数据迁移操作所迁移的目标数据节点确定为第二节点集；在组间数据表调整场景中，将数据迁移操作所迁移的目标数据节点组确定为第二节点集。

值得说明的是，第一节点集和第二节点集的确定方式还可以是其他方式，本申请实施例只是示意性说明，并不对此进行限定。

如图4所示，图4假设第一节点集包括数据节点N1至N6，第二节点集包括数据节点N2至N5，以及N7至N9，则此次数据重分布所涉及的数据节点包括数据节点N1至N9。

在步骤302的第一数据表的数据迁移过程之前，可以预先将数据重分布所涉及的数据节点统一编号排序，采用哈希分布规则确定出第一数据表的数据与第一节点集的数据节点的第一映射关系，以及第一数据表的数据和第二节点集的数据节点的第二映射关系，第一映射关系和第二节映射关系可以依据最小移动数量的原则(也称数据最小移动原则)来确定。若分布式系统预先存储有第一数据表的数据与第一节点集的数据节点的第一映射关系，可以直接获取该映射关系，不再重新进行哈希计算。通过获取第一映射关系和第二映射关系，可以对表数据分布的映射关系进行组织。这样便于找到数据在后续数据迁移过程中的移动方向。同时也便于在迁移第一数据表的数据的过程中，为生成分布式计划(也称分布式执行计划)做准备。

简言之，前述确定第一节点集和第二节点集的过程是确定数据重分布前后涉及哪些数据节点的过程，确定映射关系的过程是确定各个数据重分布前后数据具体分布在哪个数据节点的过程。

步骤302、管理节点将第一数据表的数据从第一节点集迁移至第二节点集。

在本申请实施例中，迁移动作的原理类似于数据剪切，指的是将一个数据从一个节点移动到另一节点的动作。将第一数据表的数据从第一节点集迁移至第二节点集的过程，即为将第一数据表的数据从第一节点集移动至第二节点集的过程。可选地，从第一节点集移动后的数据不再存储于该第一节点集中。

该第一数据表的数据迁移过程，也即是数据重分布的过程，可以有多种实现方式，本申请实施例中，以以下几种可选的实现方式为例进行说明，但对此并不进行限定：

第一种可选的实现方式，将第一数据表的所有数据直接从第一节点集迁移至第二节点集。也即是将第一数据表的所有数据作为待迁移数据。这样一次迁移过程即为全量迁移过程。

第二种可选的实现方式，在第一节点集存储的第一数据表的数据中筛选待迁移数据，该待迁移数据为第二节点集在迁移前没有存储的第一数据表的数据；将待迁移数据从第一节点集迁移至第二节点集。

由于在一些场景中，例如扩容场景中，一些数据可能无需进行迁移，这些数据可以称之为无效迁移数据。例如，在迁移前和迁移后在数据节点中部署的位置不变的数据和/或在迁移动作前已经删除的数据，对这些数据执行迁移动作，不仅占用数据资源，还会影响迁移的效率。因此可以通过筛选操作剔除无效迁移数据，将实际需要进行迁移的数据作为待迁移数据。也即是该待迁移数据包括第一数据表的数据中除无效迁移数据之外的数据。这样可以实现表数据的部分迁移，减少迁移的数据量，减少数据资源占用，提高迁移效率。

值得说明的是，在第一节点集和第二节点集中存在相同的数据节点(即第一节点集和第二节点集的数据节点存在交集)时，才可能会出现迁移前和迁移后在数据节点中部署的位置不变的数据的情况。如果第一节点集和第二节点集中的数据节点完全不同(在数据迁移场景可能会出现这种情况)，通常不会出现迁移前和迁移后在数据节点中部署的位置不变的数据的情况；这种情况下，第一节点集中的数据节点所部署的第一数据表的数据需要全部迁移至第二节点集中的数据节点中，也即是待迁移数据是第一节点集中的数据节点所部署的第一数据表的全部数据。因此，在本申请实施例中，在第一节点集存储的第一数据表的数据中筛选待迁移数据之前，还可以检测第一节点集和第二节点集中是否存在相同的数据节点；当第一节点集和第二节点集中存在相同的数据节点时，再在第一节点集存储的第一数据表的数据中筛选待迁移数据；当第一节点集和第二节点集中不存在相同的数据节点时，不执行筛选动作。由于待迁移数据的筛选过程较前述检测过程的计算量要大，这样可以避免额外的待迁移数据的筛选，从而降低计算复杂度，提高数据迁移的效率。

示例的，如图5所示，在第一节点集存储的第一数据表的数据中筛选待迁移数据的过程，可以包括：

步骤3021、管理节点获取第一数据表中的数据与第一节点集的数据节点的第一映射关系。

分布式数据库中，数据的分布遵循负载均衡原则。参考前述介绍，为了保证数据的均匀分布，实现负载均衡，通常采用哈希分布规则，来在各个数据节点上分布数据。进一步的，为了避免哈希冲突，还可以通过引入哈希桶算法来进行数据分布，在引入哈希桶算的的分布式数据库中，通常以哈希桶为单位来在各个数据节点上分布数据，以达到负载均衡。通常情况下，一个数据节点可以部署一个或多个哈希桶对应的数据。

在采用哈希分布规则进行数据分布时，第一映射关系可以采用哈希值和第一节点集中数据节点的标识的映射关系表征。进一步的，在应用有哈希桶算法的分布式数据库中，由于在哈希桶算法中，哈希值与哈希桶标识一一对应，第一映射关系也可以采用哈希桶标识和第一节点集中数据节点的标识的映射关系表征。其中，数据节点的标识可以由一个或多个字符(如数字)组成，用于标识数据节点；该数据节点的标识可以为数据节点名称(如N1或N2)或数据节点编号。哈希桶标识可以由一个或多个字符(如数字)组成，用于标识哈希桶；该哈希桶标识可以为计算得到的哈希值的数值，也可以为哈希桶编号，如1或2。

第一映射关系可以实时计算。若分布式数据库预先记录有该第一映射关系，也可以直接获取预先记录的该第一映射关系。该第一映射关系可以以关系图、关系表或者关系索引的方式表征。示例的，第一映射关系可以为如图6所示的关系图，在该关系图中，假设第一映射关系可以采用哈希桶编号和第一节点集中数据节点的名称的映射关系表征，则如图6所示，基于该第一映射关系可知，哈希桶编号为1至6的数据与数据节点名称为N1至N6的数据节点分别对应，哈希桶编号为7至12的数据与数据节点名称为N1至N6的数据节点分别对应，哈希桶编号为13至17的数据与数据节点名称为N1至N5的数据节点分别对应。由此可知，第一映射关系中，数据节点N1与哈希桶编号为1、7和13的哈希桶对应；数据节点N2与哈希桶编号为2、8和14的哈希桶对应；数据节点N3与哈希桶编号为3、9和15的哈希桶对应；数据节点N4与哈希桶编号为4、10和16的哈希桶对应；数据节点N5与哈希桶编号为5、11和17的哈希桶对应；数据节点N6与哈希桶编号为6和12的哈希桶对应。在图6所示的第一映射关系中，数据节点的名称与哈希桶编号为一对多的关系。

步骤3022、管理节点获取第一数据表中的数据与第二节点集的数据节点的第二映射关系。

与第一映射关系同理，第二映射关系可以以多种方式和多种形式表征。在采用哈希分布规则进行数据分布时，第二映射关系可以采用哈希值和第二节点集中数据节点的标识的映射关系表征。进一步的，在应用有哈希桶算法的分布式数据库中，第二映射关系可以采用哈希桶标识和第二节点集中数据节点的标识的映射关系表征。其中，数据节点的标识可以由一个或多个字符(如数字)组成，用于标识数据节点；该数据节点的标识可以为数据节点名称(如N1或N2)或数据节点编号。哈希桶标识可以由一个或多个字符(如数字)组成，用于标识哈希桶；该哈希桶标识可以为计算得到的哈希值的数值，也可以为哈希桶编号，如1或2。第二映射关系可以实时计算，例如基于第一映射关系以及最小移动数量的原则确定。若分布式数据库预先记录有该第二映射关系，也可以直接获取预先记录的该第二映射关系。第二映射关系可以以关系图、关系表或者关系索引的方式表征。

示例的，第二映射关系可以为如图6所示的关系图，在该关系图中，假设第二映射关系可以采用哈希桶编号和第二节点集中数据节点的名称的映射关系表征，则如图6所示，基于该第二映射关系可知，哈希桶编号为1至6的数据与数据节点名称为N7、N2、N3、N4、N5和N8的数据节点分别对应，哈希桶编号为7至12的数据与数据节点名称为N9、N2、N3、N4、N7和N8的数据节点分别对应，哈希桶编号为13至17的数据与数据节点名称为N9、N2、N3、N7和N5的数据节点分别对应。由此可知，第二映射关系中，数据节点N2与哈希桶编号为2、8和14的哈希桶对应；数据节点N3与哈希桶编号为3、9和15的哈希桶对应；数据节点N4与哈希桶编号为4和10的哈希桶对应；数据节点N5与哈希桶编号为5和17的哈希桶对应；数据节点N7与哈希桶编号为1、11和16的哈希桶对应；数据节点N8与哈希桶编号为6和12的哈希桶对应；数据节点N9与哈希桶编号为7和13的哈希桶对应。在图6所示的第二映射关系中，数据节点的名称与哈希桶编号为一对多的关系。

值得说明的是，第一映射关系和第二映射关系可以采用同一关系图、关系表或者关系索引表征，也可以分别采用各自的关系图、关系表或者关系索引表征。图6以第一映射关系和第二映射关系可以采用同一关系图表征为例进行说明，但并不对此进行限定。

步骤3023、管理节点基于第一映射关系和第二映射关系，在第一节点集存储的第一数据表的数据中筛选待迁移数据。

参考前述内容可知，待迁移数据为迁移(即数据重分布)前和迁移后在数据节点中部署的位置改变的数据，即有效迁移数据，该待迁移数据为第二节点集在迁移前没有存储的第一数据表的数据。

在一种可选示例中，可以遍历第一数据表中每个数据，并通过对比该第一映射关系和第二映射关系，在第一节点集存储的第一数据表的数据中筛选待迁移数据。具体地，对于第一数据表中的目标数据，在基于第一映射关系确定的与目标数据对应的数据节点与基于第二映射关系确定的与目标数据对应的数据节点不同时，在基于第一映射关系确定的与该目标数据对应的数据节点中，将该目标数据确定为待迁移数据。

以图6为例，假设哈希值与哈希桶编号相同，对于第一数据表中的目标数据X，计算其哈希值，假设计算得到的哈希值为1，则该目标数据X的哈希值存储在哈希桶1中，目标数据X即为哈希桶编号为1的数据。基于第一映射关系可知该目标数据X对应的数据节点为N1；基于第二映射关系可知该目标数据X对应的数据节点为N7。可知，目标数据X在数据迁移前后的数据节点不同，则数据节点N1中的目标数据X确定为待迁移数据。

在另一种可选示例中，通过对比该第一映射关系和第二映射关系，将两个映射关系中存储的数据节点不同的数据作为待迁移数据。具体地，该对比过程包括：对于第一节点集中的每个数据节点，查询第一映射关系，获取该数据节点对应的第一数据集；查询第二映射关系，获取该数据节点对应的第二数据集；将第一数据集的数据中，和第二数据集的数据中不同的数据作为与该数据节点对应的待迁移数据。获取的第一节点集中的各个数据节点对应的待迁移数据组成最终的待迁移数据。值得说明的是，对于第一节点集中的某一数据节点，第二节点集中可能不存在该数据节点，若第二节点集中不存在该某一数据节点，该某一数据节点对应的第二数据集为空。

以图6为例，对于第一节点集中的数据节点N1，查询第一映射关系，获取该数据节点对应的第一数据集包括哈希桶编号为1、7和13的数据；查询第二映射关系，获取该数据节点N1对应的第二数据集为空；则数据节点N1对应的待迁移数据为哈希桶编号为1、7和13的数据。对于第一节点集中的数据节点N2，查询第一映射关系，获取该数据节点对应的第一数据集为哈希桶编号为2、8和14的数据；查询第二映射关系，获取该数据节点对应的第二数据集包括哈希桶编号为2、8和14的数据；则数据节点N2对应的待迁移数据为空。其他数据节点的待迁移数据的获取方法类似，本申请实施例不再赘述。最终第一节点集对应的待迁移数据包括哈希桶编号为1、11和16的数据(后续分别从数据节点N1、N5和N4迁移到数据节点N7)，哈希桶编号为6和12的数据(后续从数据节点N6迁移到数据节点N8)以及哈希桶编号为7和13的数据(后续从数据节点N1迁移数据节点N9)。

传统的数据重分布过程中，数据从源表迁移到临时表的过程中，通过对源表加独占锁来暂时禁止数据更新，在gpdb中，由于采用全量数据迁移，整个迁移过程，源表均需要被加锁。若迁移的数据较多，例如几十吉(giga，G)或几十太(tera，T)的数据，则会引起几十分钟甚至几小时的用户业务阻塞。在GaussDB中，将整体迁移过程划分为全量迁移和多次增量迁移，若迁移的数据较多，例如几十G或几十T的数据，则会引起几十分钟的用户业务阻塞。

而本申请实施例中，虽然仍然采用全量数据迁移，但在扩容或缩容等场景中，通过前述步骤3023的待迁移数据的筛选过程，可以减少大量的无效迁移数据的迁移，从而降低业务阻塞时长，提高迁移效率。

在一种可选实施例中，前述将第一数据表的数据从第一节点集迁移至第二节点集的过程可以通过一个或多个分布式事务(Distributed Transaction)执行。

分布式数据库中的事务均可以称为分布式事务。本申请实施例中的分布式事务涉及管理节点和多个数据节点。分布式事务通常包括事务开始阶段、事务执行阶段和事务提交阶段共三个阶段。其中，在执行该分布式事务的过程中，在事务开始阶段，管理节点需要为后续事务执行阶段进行一定的语句准备；在事务执行阶段，管理节点执行分布式事务所涉及的一个或多个动作，该多个动作可以并行执行。在本申请实施例中，分布式事务包括的动作可以是扫描动作，也可以是迁移动作。其中，迁移动作可以涉及一条或多条SQL语句，分布式事务包括的动作还可以是生成分布式计划，以及发送分布式计划；在事务提交阶段遵循2阶段提交(Two-Phase Commit，2PC)协议或3阶段提交(Three-Phase Commit，3PC)协议，以保持事务在管理节点以及该多个数据节点执行的一致性。

在另一种可选实施例中，前述将第一数据表的数据从第一节点集迁移至第二节点集的过程可以通过串行执行的多个分布式事务实现。本申请实施例中，管理节点可以串行执行该多个分布式事务，以控制第一节点集和第二节点集中的数据节点实现数据迁移。

具体地，在串行执行该多个分布式事务时，管理节点通过当前执行到的分布式事务，从该第一节点集中的第一数据表的未迁移数据中选择满足迁移条件的待迁移数据(该待迁移数据的确定方式可以参考前述步骤3021至3023)，并将选择的该待迁移数据从该第一节点集迁移至该第二节点集。选择的待迁移数据在被迁移过程中被加锁，通常在用于迁移该待迁移数据的分布式事务提交成功时，该待迁移数据被解锁。

其中，该迁移条件包括：通过当前执行到的分布式事务迁移的该待迁移数据的数据量小于或等于指定数据量阈值，和/或，通过当前执行到的分布式事务迁移的迁移时长小于或等于指定时长阈值。

待迁移数据的数据量可以采用记录的条数表征，一条记录的数据也即是数据表的一行数据，是数据迁移的最小单位。相应的，指定数据量阈值可以由指定条数阈值表征。

前述数据量阈值和指定时长阈值，分别可以是固定设置的值，或者分别可以是动态变化的值。示例的，在步骤302之前，可以基于第一数据表的数据量，和/或，分布式数据库当前的负载信息，确定数据量阈值；和/或,基于第一数据表的数据量，和/或，分布式数据库使用的当前资源(如CPU、内存或IO资源中的一种或多种资源)的负载信息确定指定时长阈值。其中，第一数据表的数据量与数据量阈值正相关，与指定时长阈值正相关，分布式数据库当前的负载信息与数据量阈值负相关，与指定时长阈值负相关。也即是，第一数据表的数据量越大，数据量阈值越大，时长阈值越长；分布式数据库当前的负载越大，数据量阈值越小，时长阈值越小。

管理节点在通过当前执行到的每个分布式事务迁移其对应的待迁移数据后，可以将第一节点集中数据节点存储的第一数据表的被迁移过的数据删除，以便后续在扫描数据时，区分哪些数据已经被迁移，哪些数据没有被迁移。

值得说明的是，用户业务阻塞的时长实际就是数据被加锁的时长，由于通过每个分布式事务迁移的数据不同，则对于每个被迁移的数据，其被加锁的时长即为对应的分布式事务的迁移过程的时长。本申请实施例中，表数据迁移采用串行的多个事务批量执行，通过限制每个分布式事务的迁移的数据量和/或迁移时长，避免在执行每个分布式事务时的资源消耗过大，减少了每个分布式事务对应的加锁时长。

传统的数据重分布过程中，在gpdb中，由于采用全量数据迁移，每个被迁移的数据被加锁的时长等于整个增量迁移过程的迁移时长；在GaussDB中，虽然将整体迁移过程划分为全量迁移和多次增量迁移，每个被迁移的数据被加锁的时长相对缩短，但是整体的业务阻塞时长仍然较长。

而本申请实施例中，通过限制每个分布式事务的迁移的数据量和/或迁移时长，每个被迁移的数据被加锁的时长远远小于传统的数据重分布过程中的加锁时长。整体的业务阻塞时长可以降低到1分钟左右，通常用户无感知，因此相对于传统的数据重分布方法，能够有效降低业务阻塞时长，保证业务顺畅，提高用户体验。并且，对被迁移的数据添加的锁为写锁，避免其迁移过程中，对该数据的更改和删除操作，但是对该数据的查询操作仍然可以执行。

在本申请实施例中，管理节点可以基于确定的第一节点集和第二节点集，依次发起串行的多个分布式事务，在执行每个分布式事务时生成一个或多个分布式计划，并指示第一节点集和/或第二节点集中的数据节点执行生成的分布式计划，从而实现前述第一数据表中的数据迁移。其中，每个分布式计划与一个或多个数据节点对应。该分布式计划包括一个或多个SQL语句，其用于指示对应的数据节点执行的动作，以及执行动作的先后顺序等。例如，该执行的动作可以是扫描动作，也可以是迁移动作。该分布式计划可以携带前述迁移条件，或者基于该迁移条件确定的子迁移条件。可选地，在每次发起分布式事务时，管理节点还可以结合当前系统资源情况调整分布式计划的内容，例如调整迁移条件或子迁移条件。该分布式计划可以通过在对应的数据节点中执行事务或者任务来实现。例如，一个数据节点接收到该分布式计划时，可以发起一个事务(也称本地事务)或者任务以按照分布式计划中指示的先后顺序，执行该分布式计划中所指示的动作。

在第一种可选方式中，管理节点基于当前执行到的分布式事务，生成多个分布式计划以指示多个数据节点进行第一数据表中的数据迁移。假设，第一节点集包括n个数据节点，n为正整数；第二节点集包括m个数据节点，m为正整数。如图7所示，该迁移过程包括：

步骤3024、管理节点基于当前执行到的分布式事务，为n个数据节点分别生成n个分布式计划，n个数据节点与n个分布式计划一一对应；管理节点指示n个数据节点分别执行n个分布式计划来并行从n个数据节点中的第一数据表的未迁移数据中选择满足子迁移条件的待迁移数据、并将选择的满足子迁移条件的待迁移数据从n个数据节点发送至第二节点集。

具体地，对于当前执行到的分布式事务，管理节点将基于该分布式事务生成的n个分布式计划中的每个分布式计划发送至对应的数据节点。由该对应的数据节点执行该分布式计划。当各个数据节点执行完成对应的分布式计划后，管理节点执行下一次分布式事务，再生成新的n个分布式计划，并分别发送至对应的数据节点，以此类推。如果第一数据表的所有数据都已经完成迁移，管理节点取消表重分布标志，并准备下一个数据表的数据迁移。

前述子迁移条件是根据迁移条件确定的。可选地，该分布式计划还可以携带前述迁移子条件。例如，当该迁移条件为通过当前执行到的分布式事务迁移的该待迁移数据的数据量小于或等于指定数据量阈值时，对应的，子迁移条件为通过执行对应的分布式计划迁移的该待迁移数据的数据量小于或等于子数据量阈值。该子数量阈值小于该指定数量阈值。n个分布式计划对应的子数量阈值可以相等也可以不等。例如n个分布式计划对应的子数量阈值可以等于指定数量阈值的n分之一。当该迁移条件为通过当前执行到的分布式事务迁移的迁移时长小于或等于指定时长阈值时，对应的，子迁移条件为通过当前执行到的分布式事务迁移的迁移时长小于或等于子时长阈值。该子时长阈值小于或等于指定时长阈值，且n个分布式计划对应的子时长阈值的最大值为前述指定时长阈值。n个分布式计划对应的子时长阈值可以相等也可以不等。通常情况下，n个分布式计划对应的子时长阈值均等于指定时长阈值。

对于n个数据节点中的每个数据节点，其获取的分布式计划可以通过在该数据节点中执行事务或者任务来实现。假设第一数据节点为n个数据节点中的任一数据节点，以该第一数据节点执行本地事务来实现分布式计划为例。例如，为该第一数据节点生成的分布式计划可以包括一个或多个SQL语句，其用于指示第一数据节点执行扫描动作、迁移动作，且扫描动作、迁移动作并行执行，数据迁移的目标数据节点为第二数据节点(即第二节点集中的数据节点)，且该分布计划携带子迁移条件。则基于该分布式计划，该第一数据节点可以通过本地事务扫描(也称表扫描)第一数据节点中存储的第一数据表的未迁移数据，以选择满足子迁移条件的待迁移数据、并将选择的满足子迁移条件的待迁移数据从第一数据节点发送至第二节点集中的第二数据节点。

例如，当采用前述第一种可选的实现方式，将第一数据表的所有未迁移数据作为待迁移数据时，第一数据节点通过本地事务，可以遍历第一数据节点中存储的第一数据表的未迁移数据，将遍历得到的数据作为待迁移数据。

当采用前述第二种可选的实现方式，待迁移数据是在第一数据表的数据中筛选得到的，第一数据节点通过本地事务，遍历第一数据节点中第一数据表中的未迁移数据，筛选得到满足迁移子条件的待迁移数据。该筛选过程可以参考前述步骤3023。

当某一分布式事务为数据重分布过程中首次发起的分布式事务时，n个数据节点扫描得到的未迁移数据即为该第一数据表的所有数据，当某一分布式事务为数据重分布过程中非首次发起的分布式事务时，n个数据节点扫描得到的未迁移数据为该第一数据表的未通过之前的分布式事务所迁移的数据。

在第一种可选的实现方式中，第一数据节点通过本地事务可以扫描第一数据节点中存储的第一数据表的全部记录来获取未迁移的数据，即从第一数据节点中存储的第一数据表的开头开始从上往下扫描。采用该第一种可选的实现方式提供的扫描方式，在管理节点执行到的每个分布式事务时，指示第一数据节点均扫描第一数据节点中存储的第一数据表的全部记录，可以避免待迁移数据的遗漏。

可选地，如果采用第二种可选的实现方式扫描未迁移的数据，第一数据节点通过本地事务可以将本次扫描结束的位置记录下来，在管理节点执行到的下一个分布式事务时，指示第一数据节点基于对应的分布式计划，从第一数据节点中存储的第一数据表的记录的最新次已结束的位置向后扫描来获取未迁移的数据。这样可以避免第一数据节点中前面已经被扫描的记录再被扫描。

可选地，如果采用第二种可选的实现方式扫描未迁移的数据，为了避免更新的数据存储在管理节点在本次分布式事务之前的分布式事务控制数据节点扫描过的数据记录中，管理节点可以通过最后一次执行的分布式事务生成n个分布式计划，每个分布式计划指示对应的数据节点一次性扫描完该数据节点上存储的第一数据表的数据，从而避免数据遗漏，或者通过多个分布式事务控制n个数据节点同时分别扫描第一数据表的不同数据。

本申请实施例中，在管理节点执行到当前的分布式事务时，前述步骤3023和步骤3024可以嵌套执行，也即是前述步骤3023的具体动作是管理节点通过分布式计划指示数据节点执行的。

步骤3025、管理节点基于当前执行到的分布式事务为m个数据节点分别生成m个分布式计划，m个数据节点与m个分布式计划一一对应；管理节点指示m个数据节点分别执行m个分布式计划来并行接收并存储从第一节点集发送的第一数据表的数据。

对于m个数据节点中的每个数据节点，其获取的分布式计划可以通过在该数据节点中执行事务或者任务来实现。假设第二数据节点为m个数据节点中的任一数据节点，以该第二数据节点执行本地事务来实现分布式计划为例。例如，为该第二数据节点生成的分布式计划可以包括一个或多个SQL语句，其用于指示第二数据节点执行接收动作、存储动作，且接收动作、存储动作并行执行，数据的源数据节点为第一数据节点。则基于该分布式计划，该第二数据节点可以通过本地事务接收并存储从第一节点集发送的第一数据表的数据。

可选地，对于第一节点集中的每个数据节点，该数据节点部署用于执行管理节点下发的分布式计划的本地事务。具体地，该数据节点执行的本地事务可以包括两个线程，两个线程用于分别执行前述扫描动作和迁移动作。示例的，每个本地事务包括扫描线程和发送线程，扫描线程用于扫描第一节点集对应数据节点中的第一数据表的未迁移数据(也即是扫描第一数据表的数据时，跳过已删除数据)得到待迁移数据，确定待迁移数据的过程可以参考前述步骤3023；发送线程用于将待迁移数据发送至第二节点集中的目标数据节点。两个线程可以并行执行，提高数据重分布效率。对于第二节点集中的每个数据节点，该数据节点部署用于执行管理节点下发的分布式计划的本地事务。具体地，该数据节点执行的本地事务可以包括一个接收线程，用于接收其他数据节点发送的数据，并将接收的数据写入本地数据节点。由于第一节点集中的数据节点也可能收到其他节点的数据，因此，第一节点集中的每个数据节点执行的本地事务还也可以包括一个接收线程。同理，由于第二节点集中的数据节点也可能向其他节点发送数据，因此，第二节点集中的每个数据节点执行的本地事务也可以包括一个发送线程。可选地，当一个数据节点需要同时发起发送线程和接收线程时，为了节约对线程的占用，该数据节点可以通过执行本地事务发起一个收发线程(即该本地事务包括一个收发线程)，用于完成前述发送线程和接收线程的功能，例如接收和发送数据。

值得说明的是，第一节点集中数据节点在完成本地数据节点上存储的第一数据表的待迁移数据的迁移后，可以向该待迁移数据所迁移至的第二节点集中的目标数据节点发送迁移完成通知(也称结束标记)；对于第二节点集中的任一数据节点，当该数据节点接收到对应的各个源数据节点(该数据节点对应的源数据节点可以记载在分布式计划中)的迁移完成通知后，确定完成对应的分布式计划的执行，停止执行对应的分布式计划。

通过基于分布式事务生成多个分布式计划，可以指示多个数据节点并行执行多个分布式计划，以并行进行数据迁移，这样可以有效节约每个分布式事务的执行时长，提高执行分布式事务的效率。

如图8所示，假设第一节点集包括数据节点N1至N3，第二节点集包括数据节点N4，管理节点通过串行执行的两个分布式事务进行待迁移数据的迁移。其中，假设该两个分布式事务包括第一分布式事务和第二分布式事务，基于第一分布式事务生成的3个分布式计划，分别由第一节点集中3个数据节点的事务1a至1c实现，基于第二分布式事务生成的3个分布式计划，分别由第一节点集中3个数据节点的事务2a至2c。假设采用记录条数表征迁移数据量，每个分布式计划中对应的指定数据量阈值为1条，则执行事务1a至1c中每个事务，以扫描对应数据节点未迁移的多条记录的数据后，完成1条记录的数据的迁移。以管理节点执行第一分布式事务为例，每个数据节点执行对应分布式计划，使得每个数据节点通过其事务在本地数据节点上进行数据扫描，找到待迁移数据，并将待迁移数据发送到目标数据节点(图8中是数据节点N4)，并同时删除本地数据节点由该事务迁移过的已迁移数据。通过执行事务1a至1c并行执行扫描和迁移动作，直到满足前述迁移条件，或者每个数据节点满足对应的子条件。之后管理节点提交第一分布式事务，完成这批数据的迁移。其中，找到待迁移数据的过程可以参考前述步骤302中对应过程。事务2a至2c的执行过程参考前述事务1a至1c的执行过程，本申请实施例对此不做赘述。进一步的，基于第一分布式事务还可以生成一个与数据节点N4对应的分布式计划，数据节点N4通过执行事务(图8中未示出)来实现该分布式计划，从而接收数据节点N1至N3发送的数据，并将接收的数据存储到数据节点N4。

在第二种可选方式中，管理节点基于当前执行到的分布式事务，生成一个分布式计划，并指示第一节点集中的数据节点和第二节点集中的数据节点执行该分布式计划，以从第一节点集中的第一数据表的未迁移数据选择满足迁移条件的待迁移数据，并将选择的待迁移数据从第一节点集迁移至第二节点集。

该分布式计划与第一节点集和第二节点集中的多个数据节点对应，其可以视为前述第一种可选方式中，n个分布式计划和m个分布式计划的整合计划。该分布式计划包括一个或多个SQL语句，其用于指示第一节点集和第二节点集中每个数据节点执行的动作，以及执行动作的先后顺序等。例如，该执行的动作可以包括扫描动作、迁移动作、接收动作和/或存储动作。可选地，该分布式计划还可以携带前述迁移条件。每个数据节点接收到该分布式计划后，可以确定自身所需执行的动作，还可以基于该迁移条件确定与自身对应的子迁移条件，该迁移条件确定过程可以参考前述第一种可选方式。

该分布式计划可以通过在数据节点中执行事务或者任务来实现。第一节点集和第二节点集中每个数据节点执行分布式计划中自身所需执行的动作的过程可以参考前述第一种可选方式中该数据节点执行与对应分布式计划的过程，本申请实施例对此不再赘述。

本申请实施例中，分布式数据库采用多版本并发控制机制(Multiversion concurrency control，MVCC)进行数据存储。在多版本并发机制中，从某一数据节点上删除的数据并没有从该数据节点物理上移除，只是作为历史版本也同样存储在该数据节点上。例如，在执行前述步骤3025后，管理节点为第一节点集上的第一数据表中的已迁移数据设置删除标识(或者通过分布式计划控制数据节点设置删除标识)，该删除标识指示已迁移数据转化为历史版本的数据。则前述步骤3025中所述的迁移后的数据被删除，实质上是将数据作为历史版本记录在相应的数据节点上，后续通过执行分布式事务，以进行数据扫描时，跳过该历史版本的数据即可(即跳过设置有删除标记的数据)。这样，可以保证数据迁移过程中，用户针对该历史版本的数据的数据查询操作有效执行。

值得说明的是，数据迁移过程中，由于正在被迁移的数据被加锁，针对该被迁移的数据只能执行数据查询操作，不能执行数据修改和删除操作。一旦该数据的迁移完成，第一节点集上的该数据会被设置删除标识，该数据就变成了历史版本数据(实际上并未在第一节点集中真正删除)，最新版本数据已经迁移到第二节点集中的新节点上。这些历史版本的数据只支持数据查询操作。当用于迁移该数据的分布式事务提交后，新的用户事务也不会再查询这些历史版本的数据了。当针对第一节点集中历史版本的数据的并发事务(例如用于查询历史版本的数据的数据查询操作)全部结束后，这些历史版本的数据就不再会被访问，可以被物理删除。分布式数据库基于其运行的周期的数据清理机制，会将这些历史版本的数据从第一数据表的数据中清除，也即从分布式数据库中物理性移除(该过程为数据的过期清理过程)。

步骤303、管理节点在迁移第一数据表的数据的过程中，当接收到对第一数据表的目标业务请求时，在第一节点集和第二节点集中确定用于响应目标业务请求的第三节点集。

在该数据迁移过程中，由于用户的不同需求，可以产生多种类型的用户业务。

用户业务在不同场景中有多种，例如数据查询业务、数据添加业务(也称数据插入业务)、数据删除业务和数据修改业务，对应的业务请求分别为数据查询请求、数据添加请求(也称数据插入请求)、数据删除请求和数据修改请求。其中，数据查询请求用于请求进行数据的数据查询操作，数据添加请求用于请求进行数据添加操作，数据删除请求用于请求进行数据删除操作，数据修改请求用于请求进行数据修改操作。其中，数据查询业务又基于其与数据表的关联性划分为与一个数据表关联的数据查询业务和与多个数据表关联的数据查询业务，与一个数据表关联的数据查询业务对应的数据查询请求所指示的数据查询操作仅需要查询一个数据表中的数据，与多个数据表关联的数据查询业务对应的数据查询请求所指示的数据查询操作需要查询多个数据表中的数据。例如，数据查询请求为：“查询公司X中的女员工信息”，假设公司X的女员工信息记录在第一数据表中，则查询操作只涉及一个数据表，该数据查询请求即为与一个数据表关联的数据查询业务对应的数据查询请求；又例如，数据查询请求为：“查询公司X的客户公司的女员工信息”，假设公司X的客户公司记录在第二数据表中，不同客户公司的女员工信息记录在不同的数据表中，则查询操作指示先查询第二数据表得到公司X的客户公司的标识，再基于获取的标识查询对应的公司的数据表，得到公司X的客户公司的女员工信息。该数据查询请求涉及多个数据表，该数据查询请求即为与多个数据表关联的数据查询业务对应的数据查询请求。

本申请实施例，数据重分布方法可以应用于多种场景，则该目标业务请求可以为数据查询请求、数据添加请求(也称插入请求)、数据删除请求或数据修改请求，该目标业务请求可以针对一条或多条记录的数据。如图9所示，由于数据迁移过程中，同一目标业务所针对的业务数据可能涉及数据重分布前的数据节点和/或数据重分布后的数据节点。例如，当数据按照哈希桶的方式进行哈希分布，同一哈希桶的数据会通过串行执行的多个分布式事务来移动，因此在迁移过程中会存在同一个哈希桶的数据同时分布在两个数据节点上(已经迁移的数据分布在第二节点集的数据节点上，没有迁移的数据分布在第一节点集的数据节点上，且该哈希桶对应的所有新增数据都直接写入在第二节点集的数据节点上)。因此针对不同的目标业务，最终确定的第三节点集不同，该第三节点集包括一个或多个数据节点。本申请实施例以以下几种实现场景为例，对该第三节点集的确定过程进行说明：

在第一种实现场景中，当目标业务请求为数据添加请求时，在第二节点集中确定用于响应所述数据添加请求的第三节点集。

示例的，根据数据添加请求所携带的新增数据的键值计算哈希值；根据哈希值在第二节点集中确定用于响应所述数据添加请求的第三节点集。例如，将哈希值所对应的第二节点集中的数据节点确定为第三节点集的数据节点。例如，可以确定哈希值所对应哈希桶，将第二节点集中哈希桶所对应的数据节点确定为第三节点集中的数据节点。例如，可以通过查询前述第二映射关系表，将查询得到的数据节点确定为第三节点集中的数据节点。

如图9所示，假设接收到数据添加请求，该请求指示数据添加操作对应新增数据D，则通过哈希分布规则确定新增数据D所存储的第三节点集为数据节点N4，将该新增数据D存储在数据节点N4。

对于传统的数据重分布方法，考虑到源表和临时表的一致性，如果源表的新增数据速率大于数据迁移速率，会导致数据迁移无法结束，如果强行锁表进行迁移，可能会使锁表的时间比较长而影响用户业务。而本申请实施例，由于无需建立临时表，将新增数据直接添加到第二节点集的数据节点(即第三节点集)中，则数据迁移过程中，无需迁移这些新增数据，也无需记录这些新增数据，可以快速实现新增数据的存储，有效减少数据迁移的数量，简化数据迁移过程，提高数据迁移效率，减少对用户业务的影响。

在第二种实现场景中，当目标业务请求为数据删除请求或者数据修改请求或者与第一数据表关联的数据查询请求时，在该第一节点集中确定用于响应该目标业务请求的数据节点，并在该第二节点集中确定用于响应该目标业务请求的数据节点，由从该第一节点集中确定的数据节点和从该第二节点集中确定的数据节点组成该第三节点集。

在一种可选方式中，当目标业务请求包括数据删除请求时，在第一节点集中查询用于响应数据删除请求的数据节点(即该数据删除请求所请求删除的数据所在数据节点)，并在第二节点集中查询用于响应数据删除请求的数据节点，合并分别查询得到的数据节点来组成第三节点集。如图9所示，在第一节点集(包括数据节点N1至N3)中查询数据删除请求所请求删除的数据B所在数据节点，得到数据节点N2；在第二节点集(包括数据节点N4)中查询数据B所在的数据节点，得到数据节点N4；由查询得到的数据节点组成的第三节点集包括数据节点N2和N4。

示例的，对于数据删除请求，如果可以基于键值来进行删除，由键值计算哈希值后，基于前述第一映射关系表在第一节点集中确定第四节点集，基于前述第二映射关系表在第二节点集中确定第五节点集。被删除的数据在两个节点集中都可能存在，因此将第四节点集和第五节点集的并集确定为第三节点集，即第三节点集包括第四节点集和第五节点集。其中第四节点集和第五节点集均包括一个或多个数据节点。

在另一种可选方式中，当目标业务请求包括数据修改请求时，在第一节点集中查询用于响应数据修改请求的数据节点(即该数据修改请求所请求修改的数据所在数据节点)，并在第二节点集中查询用于响应数据修改请求的数据节点，合并分别查询得到的数据节点来组成第三节点集。如图9所示，在第一节点集(包括数据节点N1至N3)中查询数据修改请求所请求修改的数据C所在的数据节点，得到数据节点N3；并在第二节点集(包括数据节点N4)中查询数据C所在的数据节点，得到数据节点N4；由查询得到的数据节点组成的第三节点集包括数据节点N3和N4。

示例的，对于数据修改请求，如果可以基于键值来进行修改，由键值计算哈希值后，基于前述第一映射关系表在第一节点集中确定第六节点集，基于前述第二映射关系表在第二节点集中确定第七节点集。被修改的数据在两个节点集中都可能存在，因此将第六节点集和第七节点集的并集确定为第三节点集。其中第六节点集和第七节点集均包括一个或多个数据节点。

在又一种可选方式中，当数据查询请求包括与第一数据表关联的数据查询请求时，在第一节点集中查询用于响应数据查询请求的数据节点(即该数据查询请求所请求查询的数据所在的数据节点)，并在第二节点集中查询用于响应数据查询请求的数据节点，合并分别查询得到的数据节点来组成第三节点集。如图9所示，在第一节点集(包括数据节点N1至N3)中查询数据修改请求所请求修改的数据A所在的数据节点，得到数据节点N1，并在第二节点集(包括数据节点N4)中查询数据A所在的数据节点，得到数据节点N4，则由查询得到的数据节点组成的第三节点集包括数据节点N1和N4。

示例的，对于数据查询请求，如果可以基于键值来进行查询，由键值计算哈希值后，基于前述第一映射关系表在第一节点集中确定第八节点集，基于前述第二映射关系表在第二节点集中确定第九节点集。被查询的数据在两个节点集中都可能存在，因此将第八节点集和第九节点集的并集确定为第三节点集。其中第八节点集和第九节点集均包括一个或多个数据节点。

需要说明的是，与第一数据表关联的数据查询请求可以为仅与第一数据表关联的数据查询请求，也可以为与包括第一数据表的多个数据表关联的数据查询请求。若查询请求为与包括第一数据表的多个数据表关联的数据查询请求时，对于该查询请求所关联的每个数据表，用于响应该查询请求的该数据表对应的第三节点集的获取方式参考数据查询请求为仅与第一数据表关联的数据查询请求时，第一数据表对应的第三节点集的获取方式，本申请实施例对此不做赘述。后续该数据查询请求需要发送至该多个数据表对应的第三节点集。发送过程可以参考后续步骤304。

第二种实现场景中，通过执行前述查询数据节点的操作，可以减少第三节点集中数据节点的数量，减少与第三节点集后续交互的信息量，节约通信开销。

如前所述，目标业务请求所针对的数据可以是一条或多条记录的数据，当其针对一条记录的数据时，由于一条记录的数据不可能同时存在于两个数据节点上，因此同一条记录只能在其中一个数据节点被处理成功。如果不是基于键值进行第三节点集的确定，目标业务请求需要发给数据重分布前后涉及的所有数据节点。因为数据迁移过程中，所有数据节点都可能存在满足目标业务请求所请求的条件的记录。由此可知，前述第二种实现场景中，也可以不执行查询数据节点的操作，直接将第一节点集和第二节点集的并集确定为第三节点集。例如，目标业务请求为数据查询请求，该数据查询请求用于请求查询第一数据表中指定数据范围或指定时间范围的数据，该指定数据范围可以为符合指定条件的数据的范围，该指定时间范围可以为早于或晚于指定时间点的时间范围，则由于该数据查询请求所针对的数据在第一数据表的数据迁移过程中，可能一部分位于数据重分布前的数据节点，另一部分位于数据重分布后的数据节点，通常需要遍历数据重分布前的数据节点和数据重分布后的数据节点，以避免遗漏查询的数据，因此可以直接将第一节点集和第二节点集的并集确定为第三节点集。并且，直接将第一节点集和第二节点集的并集确定为第三节点集还可以减少查询数据节点的时延，提高业务执行效率。

步骤304、管理节点将目标业务请求发送至第三节点集中的数据节点。

该目标业务请求用于供第三节点集中每个数据节点基于目标业务请求进行业务处理，第三节点集中的每个数据节点在接收了目标业务请求后，进行相应的业务处理。例如，假设第一数据节点为第三节点集中的任一个数据节点，则该第一数据节点执行以下过程：

当第一数据节点接收到数据查询请求，检测本数据节点是否存储有数据查询请求所请求查询的数据，如果本数据节点存储有数据查询请求所请求查询的数据，获取该数据的信息，并向管理节点发送数据查询响应，该数据查询响应包括查询到的数据；如果本数据节点未存储有数据查询请求所请求查询的数据，停止动作，或者向管理节点发送数据查询响应，该数据查询响应指示未查询到所请求的数据。

当第一数据节点接收到数据添加请求，直接在本数据节点添加新增数据。可选地，第一数据节点可以向管理节点发送添加成功响应。

当第一数据节点接收到数据修改请求，检测本数据节点是否存储有数据修改请求所请求修改的数据，如果本数据节点存储有数据修改请求所请求修改的数据，根据数据修改请求修改该数据。可选地，向管理节点发送数据修改响应，该数据修改响应包括修改后的数据，或者指示修改成功；如果本数据节点未存储有数据修改请求所请求修改的数据，停止动作，或者向管理节点发送数据修改响应，该数据修改响应指示不存在所请求的数据。

当第一数据节点接收到数据删除请求，检测本数据节点是否存储有数据删除请求所请求删除的数据，如果本数据节点存储有数据删除请求所请求删除的数据，根据该数据删除请求删除该数据。可选地，向管理节点发送数据删除响应，该数据删除响应指示删除成功；如果本数据节点未存储有数据删除请求所请求删除的数据，停止动作，或者向管理节点发送数据删除响应，该数据删除响应指示不存在所请求的数据。

如前所述，由于本申请实施例的前述数据重分布过程中，数据在迁移之后不再存储于其迁移前的数据节点，因此保证同一条记录的数据仅会存储在分布式数据库的一个数据节点上，而不会存储于两个数据节点上，从而可以保证前述目标业务请求不会出现冲突响应的情况。

步骤305、管理节点在迁移第一数据表的数据的过程中，若检测到回滚触发事件，将通过多个分布式事务已迁移的数据进行回滚(rollback)。

回滚触发事件可以是在第二节点集中第一数据表关联的的数据节点故障(如宕机)，或者是在第二节点集中与第一数据表关联的数据节点发生数据传输错误，或者是在第二节点集中与第一数据表关联的数据节点发生网络错误，或者是在第二节点集中与第一数据表关联的数据节点接收到回滚指令，或者第一数据表关联的分布式事务提交失败等。

在一种可能实现方式中，在该分布式数据库中检测到回滚触发事件后，将通过多个分布式事务已迁移的数据进行回滚，可以将分布式数据库恢复到之前的能够正常运行的状态，以便于后续过程中达到回滚触发事件的结束条件后，分布式数据库仍然能够正常执行在线业务以及数据重分布等业务。

在一种可能实现方式中，前述步骤305可以替换为：在迁移第一数据表的数据的过程中，若检测到回滚触发事件，将通过当前执行到的分布式事务已迁移的数据进行回滚。

传统的分布式数据库中，通过一次分布式事务迁移数据表中的数据，若检测到回滚触发事件，将当前所迁移的数据全部进行回滚，即撤销了该一次分布式事务的所对应的所有已执行动作。回滚的数据量较大，所有已迁移的数据均失效，达到再次迁移条件后，需要重新再迁移，导致数据的重复迁移，造成资源的浪费，数据库的容错性差。

而本申请实施例中，前述分布式事务保证了迁移过程的数据一致性和持久性，当分布式事务有多个时，整体的数据迁移过程拆分成串行执行的多个分布式事务的迁移过程，若检测到回滚触发事件，只需将当前执行到的一个分布式事务对应的所有操作进行回滚，在再次满足迁移条件后可以继续发起新的分布式事务进行数据迁移。因此，降低了回滚的数据粒度以及回滚的数据量，减少重复迁移的数据量，减少回滚对数据迁移过程整体上影响，避免资源浪费，提高数据库的容错性。

值得说明的是，在迁移第一数据表的数据的过程中，除了前述数据查询业务、数据添加业务等数据操作语言(data manipulation language，DML)业务，还可以产生其他类型的用户业务。如数据定义语言(data definition language，DDL)业务，该DDL业务包括创建表信息、修改表信息和删除表信息等业务，DDL业务所请求操作的对象是表信息，即表的定义和架构。

在传统的数据重分布方法中，由于需要保证源表和临时表的数据一致性，因此在数据迁移过程中，不允许执行DDL业务。

而本申请实施例中，由于无需建立临时表，数据迁移过程发生在数据表内，而不是源表和临时表之间，因此，在数据迁移过程中，支持前述DDL业务。例如支持修改表元信息，允许修改表名，增加或删除数据表中的字段等等。

值得说明的是，前述实施例是以一个数据表需要进行数据重分布为例进行说明的，本申请实施例在实际实现时，多个数据表可以同时执行上述数据重分布过程，提高数据重分布的效率，增加并发度。

综上所述，本申请实施例提供的数据重分布方法，无需建立临时表，即可进行目标任务的执行，实现在线数据重分布，这样无需进行表间数据迁移，仅需进行表内数据迁移，从而降低了在线数据重分布的复杂度。

并且，由于采用串行执行的多个分布式事务进行数据迁移，单次迁移耗时较短，资源消耗较小，减少了对同时执行的其他用户作业的影响。

进一步的，由于将新增数据直接写入数据重分布后的数据节点，有效减少了迁移的数据量，从而降低资源消耗减少了对同时执行的其他用户作业的影响。

示例的，以前述图6为例，若采用传统的数据重分布方法，哈希桶编号为1至17的数据均需要从第一节点集迁移至第二节点集；而本申请实施例中，哈希桶编号为1的数据需要从数据节点N1移动到数据节点N7，哈希桶编号为2的数据不需要移动，哈希桶编号为7的数据需要从数据节点N1移动到数据节点N9等等。总体需要迁移的仅有哈希桶编号为1、6、7、11、12、13和16的数据(图6中第二节点集中需要接收前述迁移的数据的数据节点N7、N8和N9采用了阴影表示)，有效减少了数据迁移量。

本申请实施例，在有并发用户作业的场景下，采用了表内数据迁移和分布式多版本并发控制技术来实现数据迁移。不需要考虑并发作业的插入和删除操作导致的数据追增，允许按数据量和执行时间分批多次进行迁移，保证数据重分布对系统资源的消耗是可控的，可以有效的控制迁移的资源消耗和锁冲突影响，对用户作业的影响大大减少。利用本申请实施例来实现分布式数据库的在线扩容，可以避免停机扩容导致的长时间业务阻塞，对在线作业影响很小，即使在数据节点故障和网络故障情况下也可以很容易重新恢复重分布操作，对数据迁移的影响也很小。

本申请实施例提供一种数据重分布装置40，该数据重分布装置40可以部署在管理节点上。如图10所示，数据重分布装置40包括：

第一确定模块401，用于执行前述步骤301；

迁移模块402，用于执行前述步骤302；

第二确定模块403，用于执行前述步骤303；

发送模块404，用于执行前述步骤304。

综上所述，本申请实施例提供的数据重分布装置，无需建立临时表，即可进行目标任务的执行，实现在线数据重分布，这样无需进行表间数据迁移，仅需进行表内数据迁移，从而降低了在线数据重分布的复杂度。

可选地，如图11所示，所述第二确定模块403，包括：

确定子模块4031，用于当所述目标业务请求为数据添加请求时，在所述第二节点集中确定用于响应所述数据添加请求的所述第三节点集。

可选地，所述确定子模块4031，用于：

根据所述数据添加请求所携带的新增数据的键值计算哈希值；

在所述第二节点集中确定所述哈希值对应的数据节点，确定的数据节点属于所述第三节点集。

可选地，所述第二确定模块403，用于：

可选地，如图12所示，所述迁移模块402，包括：

筛选子模块4021，用于在所述第一节点集存储的所述第一数据表的数据中筛选待迁移数据，所述待迁移数据为所述第二节点集在迁移前没有存储的所述第一数据表的数据；

迁移子模块4022，用于将所述待迁移数据从所述第一节点集迁移至所述第二节点集。

可选地，所述筛选子模块4021，用于：

获取所述第一数据表中的数据与所述第一节点集的数据节点的第一映射关系；

获取所述第一数据表中的数据与所述第二节点集的数据节点的第二映射关系；

对于所述第一数据表中的目标数据，在基于所述第一映射关系确定的与所述目标数据对应的数据节点与基于所述第二映射关系确定的与所述目标数据对应的数据节点不同时，在基于所述第一映射关系确定的与所述目标数据对应的数据节点中，将所述目标数据确定为所述待迁移数据。

可选地，所述迁移子模块4022，用于：

通过串行执行的多个分布式事务，分别将所述第一数据表的不同数据从所述第一节点集迁移至所述第二节点集。

可选地，所述迁移子模块4022，用于：

可选地，如图13所示，所述装置40还包括：

回滚模块405，用于在迁移所述第一数据表的数据的过程中，若检测到所述分布式数据库达到回滚触发事件，将当前工作的分布式事务所迁移的数据进行回滚。

或者，回滚模块405，用于在在迁移所述第一数据表的数据的过程中，若检测到回滚触发事件，将通过当前执行到的分布式事务已迁移的数据进行回滚。

可选地，如图14所示，所述装置40还包括：

设置模块406，用于为所述第一节点集上的所述第一数据表中的已迁移数据设置删除标识。

可选地，图15示意性地提供本申请所述计算设备的一种可能的基本硬件架构。

参见图15，计算设备500包括处理器501、存储器502、通信接口503和总线504。

计算设备500中，处理器501的数量可以是一个或多个，图15仅示意了其中一个处理器501。可选地，处理器501，可以是中央处理器(central processing unit，CPU)。如果计算设备500具有多个处理器501，多个处理器501的类型可以不同，或者可以相同。可选地，计算设备500的多个处理器501还可以集成为多核处理器。

存储器502存储计算机指令和数据；存储器502可以存储实现本申请提供的数据重分布方法所需的计算机指令和数据，例如，存储器502存储用于实现数据重分布方法的步骤的指令。存储器502可以是以下存储介质的任一种或任一种组合：非易失性存储器(例如只读存储器(ROM)、固态硬盘(SSD)、硬盘(HDD)、光盘)，易失性存储器。

通信接口503可以是以下器件的任一种或任一种组合：网络接口(例如以太网接口)、无线网卡等具有网络接入功能的器件。

通信接口503用于计算设备500与其它计算设备或者终端进行数据通信。

总线504可以将处理器501与存储器502和通信接口503连接。这样，通过总线504,处理器501可以访问存储器502，还可以利用通信接口503与其它计算设备或者终端进行数据交互。

在本申请中，计算设备500执行存储器502中的计算机指令,使得计算设备500实现本申请提供的数据重分布方法，或者使得计算设备500部署数据重分布装置。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器，上述指令可由服务器的处理器执行以完成本发明各个实施例所示的表情图片推荐方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本申请实施例提供一种分布式数据库系统，包括：管理节点和数据节点，所述管理节点包括前述任一所述的数据重分布装置40或前述计算设备500。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现，所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机的可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质，或者半导体介质(例如固态硬盘)等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

在本申请中，术语“第一”和“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上，除非另有明确的限定。A参考B，指的是A与B相同或者A为B的简单变形。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的示例性实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种数据重分布方法，其特征在于，包括：

确定分布式数据库中与第一数据表分别关联的第一节点集和第二节点集，所述第一节点集包括在所述第一数据表的数据被数据重分布之前用于存储所述第一数据表中的数据的数据节点，所述第二节点集包括从所述第一数据表的数据被数据重分布开始用于存储所述第一数据表中的数据的数据节点；

将所述第一数据表的数据从所述第一节点集迁移至所述第二节点集；

在迁移所述第一数据表的数据的过程中，当接收到对所述第一数据表的目标业务请求时，在所述第一节点集和所述第二节点集中确定用于响应所述目标业务请求的第三节点集；

将所述目标业务请求发送至所述第三节点集中的数据节点。
根据权利要求1所述的方法，其特征在于，所述在所述第一节点集和所述第二节点集中确定用于响应所述目标业务请求的第三节点集，包括：

当所述目标业务请求为数据添加请求时，在所述第二节点集中确定用于响应所述数据添加请求的所述第三节点集。
根据权利要求2所述的方法，其特征在于，所述在所述第二节点集中确定用于响应所述数据添加请求的所述第三节点集，包括：

根据所述数据添加请求所携带的新增数据的键值计算哈希值；

在所述第二节点集中确定所述哈希值对应的数据节点，确定的数据节点属于所述第三节点集。
根据权利要求1所述的方法，其特征在于，所述在所述第一节点集和所述第二节点集中确定用于响应所述目标业务请求的第三节点集，包括：

当所述目标业务请求为数据删除请求或者数据修改请求或者与第一数据表关联的数据查询请求时，在所述第一节点集中确定用于响应所述目标业务请求的数据节点，并在所述第二节点集中确定用于响应所述目标业务请求的数据节点，由从所述第一节点集中确定的数据节点和从所述第二节点集中确定的数据节点组成所述第三节点集。
根据权利要求1至4任一所述的方法，其特征在于，所述将所述第一数据表的数据从所述第一节点集迁移至所述第二节点集，包括：

在所述第一节点集存储的所述第一数据表的数据中筛选待迁移数据，所述待迁移数据为所述第二节点集在迁移前没有存储的所述第一数据表的数据；

将所述待迁移数据从所述第一节点集迁移至所述第二节点集。
根据权利要求5所述的方法，其特征在于，所述在所述第一节点集存储的所述第一数据表的数据中筛选待迁移数据，包括：

获取所述第一数据表中的数据与所述第一节点集的数据节点的第一映射关系；

获取所述第一数据表中的数据与所述第二节点集的数据节点的第二映射关系；

对于所述第一数据表中的目标数据，在基于所述第一映射关系确定的与所述目标数据对应的数据节点与基于所述第二映射关系确定的与所述目标数据对应的数据节点不同时，在基于所述第一映射关系确定的与所述目标数据对应的数据节点中，将所述目标数据确定为所述待迁移数据。
根据权利要求1至6任一所述的方法，其特征在于，所述将所述第一数据表的数据从所述第一节点集迁移至所述第二节点集，包括：

通过串行执行的多个分布式事务，分别将所述第一数据表的不同数据从所述第一节点集迁移至所述第二节点集。
根据权利要求7所述的方法，其特征在于，所述通过串行执行的多个分布式事务，分别将所述第一数据表的不同数据从所述第一节点集迁移至所述第二节点集，包括：

在串行执行所述多个分布式事务时，通过当前执行到的分布式事务，从所述第一节点集中的所述第一数据表的未迁移数据中选择满足迁移条件的待迁移数据，并将选择的所述待迁移数据从所述第一节点集迁移至所述第二节点集，选择的所述待迁移数据在被迁移过程中被加锁；

其中，所述迁移条件包括：通过当前执行到的分布式事务迁移的所述待迁移数据的数据量小于或等于指定数据量阈值，和/或，通过当前执行到的分布式事务迁移的迁移时长小于或等于指定时长阈值。
根据权利要求8所述的方法，其特征在于，

所述在串行执行所述多个分布式事务时，通过当前执行到的分布式事务，从所述第一节点集中的所述第一数据表的未迁移数据选择满足迁移条件的待迁移数据，并将选择的所述待迁移数据从所述第一节点集迁移至所述第二节点集，包括：

基于所述当前执行到的分布式事务，为n个数据节点分别生成n个分布式计划，所述第一节点集包括所述n个数据节点，所述n个数据节点与所述n个分布式计划一一对应，n为正整数；

指示所述n个数据节点分别执行所述n个分布式计划来并行从所述n个数据节点中的所述第一数据表的未迁移数据中选择满足子迁移条件的待迁移数据、并将选择的满足所述子迁移条件的所述待迁移数据从所述n个数据节点发送至所述第二节点集，所述子迁移条件是根据所述迁移条件确定的。
根据权利要求7至9任一所述的方法，其特征在于，所述方法还包括：

在迁移所述第一数据表的数据的过程中，若检测到回滚触发事件，将通过所述多个分布式事务已迁移的数据进行回滚。
根据权利要求7至9任一所述的方法，其特征在于，所述方法还包括：

在迁移所述第一数据表的数据的过程中，若检测到回滚触发事件，将通过当前执行到的分布式事务已迁移的数据进行回滚。
根据权利要求1至11任一所述的方法，其特征在于，所述方法包括：

为所述第一节点集上的所述第一数据表中的已迁移数据设置删除标识。
一种数据重分布装置，其特征在于，包括：

第一确定模块，用于确定分布式数据库中与第一数据表分别关联的第一节点集和第二节点集，所述第一节点集包括在所述第一数据表的数据被数据重分布之前用于存储所述第一数据表中的数据的数据节点，所述第二节点集包括从所述第一数据表的数据被数据重分布开始用于存储所述第一数据表中的数据的数据节点；

迁移模块，用于将所述第一数据表的数据从所述第一节点集迁移至所述第二节点集；

第二确定模块，用于在迁移所述第一数据表的数据的过程中，当接收到对所述第一数据表的目标业务请求时，在所述第一节点集和所述第二节点集中确定用于响应所述目标业务请求所的第三节点集；

发送模块，用于将所述目标业务请求发送至所述第三节点集中的数据节点。
根据权利要求13所述的装置，其特征在于，所述第二确定模块，包括：

确定子模块，用于当所述目标业务请求为数据添加请求时，在所述第二节点集中确定用于响应所述数据添加请求的所述第三节点集。
根据权利要求14所述的装置，其特征在于，所述确定子模块，用于：

根据所述数据添加请求所携带的新增数据的键值计算哈希值；

在所述第二节点集中确定所述哈希值对应的数据节点，确定的数据节点属于所述第三节点集。
根据权利要求13所述的装置，其特征在于，所述第二确定模块，用于：

当所述目标业务请求为数据删除请求或者数据修改请求或者与第一数据表关联的数据查询请求时，在所述第一节点集中确定用于响应所述目标业务请求的数据节点，并在所述第二节点集中确定用于响应所述目标业务请求的数据节点，由从所述第一节点集中确定的数据节点和从所述第二节点集中确定的数据节点组成所述第三节点集。
根据权利要求13至16任一所述的装置，其特征在于，所述迁移模块，包括：

筛选子模块，用于在所述第一节点集存储的所述第一数据表的数据中筛选待迁移数据，所述待迁移数据为所述第二节点集在迁移前没有存储的所述第一数据表的数据；

迁移子模块，用于将所述待迁移数据从所述第一节点集迁移至所述第二节点集。
根据权利要求17所述的装置，其特征在于，所述筛选子模块，用于：

获取所述第一数据表中的数据与所述第一节点集的数据节点的第一映射关系；

获取所述第一数据表中的数据与所述第二节点集的数据节点的第二映射关系；

对于所述第一数据表中的目标数据，在基于所述第一映射关系确定的与所述目标数据对应的数据节点与基于所述第二映射关系确定的与所述目标数据对应的数据节点不同时，在基于所述第一映射关系确定的与所述目标数据对应的数据节点中，将所述目标数据确定为所述待迁移数据。
根据权利要求13至18任一所述的装置，其特征在于，所述迁移子模块，用于：

通过串行执行的多个分布式事务，分别将所述第一数据表的不同数据从所述第一节点集迁移至所述第二节点集。
根据权利要求19所述的装置，其特征在于，所述迁移子模块，用于：

在串行执行所述多个分布式事务时，通过当前执行到的分布式事务，从所述第一节点集中的所述第一数据表的未迁移数据中选择满足迁移条件的待迁移数据，并将选择的所述待迁移数据从所述第一节点集迁移至所述第二节点集，选择的所述待迁移数据在被迁移过程中被加锁；

其中，所述迁移条件包括：通过当前执行到的分布式事务迁移的所述待迁移数据的数据量小于或等于指定数据量阈值，和/或，通过当前执行到的分布式事务迁移的迁移时长小于或等于指定时长阈值。
根据权利要求20所述的装置，其特征在于，所述迁移子模块，用于：

基于所述当前执行到的分布式事务，为n个数据节点分别生成n个分布式计划，所述第一节点集包括所述n个数据节点，所述n个数据节点与所述n个分布式计划一一对应，n为正整数；

指示所述n个数据节点分别执行所述n个分布式计划来并行从所述n个数据节点中的所述第一数据表的未迁移数据中选择满足子迁移条件的待迁移数据、并将选择的满足所述子迁移条件的所述待迁移数据从所述n个数据节点发送至所述第二节点集，所述子迁移条件是根据所述迁移条件确定的。
根据权利要求19至21任一所述的装置，其特征在于，所述装置还包括：

回滚模块，用于在迁移所述第一数据表的数据的过程中，若检测到所述分布式数据库达到回滚触发事件，将当前工作的分布式事务所迁移的数据进行回滚。
根据权利要求19至21任一所述的装置，其特征在于，所述装置还包括：

回滚模块，用于在在迁移所述第一数据表的数据的过程中，若检测到回滚触发事件，将通过当前执行到的分布式事务已迁移的数据进行回滚。
根据权利要求13至23任一所述的装置，其特征在于，所述装置还包括：

设置模块，用于为所述第一节点集上的所述第一数据表中的已迁移数据设置删除标识。
一种计算机设备，其特征在于，包括：

处理器和存储器；

所述存储器，用于存储计算机指令；

所述处理器，用于执行所述存储器存储的计算机指令，使得所述计算设备执行权利要求1至12任一所述的数据重分布方法。
一种分布式数据库系统，其特征在于，包括：管理节点和数据节点，所述管理节点包括权利要求13至24任一所述的数据重分布装置。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括计算机指令，所述计算机指令指示计算设备执行权利要求1至12任一所述的数据重分布方法。