CN108132949A

CN108132949A - 数据库集群中数据迁移的方法及装置

Info

Publication number: CN108132949A
Application number: CN201611090677.4A
Authority: CN
Inventors: 许中清; 胡森; 李跃森; 刘煜宏
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2016-12-01
Filing date: 2016-12-01
Publication date: 2018-06-08
Anticipated expiration: 2036-12-01
Also published as: US11243922B2; CN108132949B; US20190179808A1; WO2018099397A1

Abstract

本公开涉及了一种数据库集群中数据迁移的方法及装置。所述方法包括：获取源数据节点的快照，并根据所述快照中备份的待迁移数据分片中的存量数据，记录所述待迁移数据分片中的增量数据；将备份的存量数据迁移至目标数据节点；对记录的增量数据进行迁移，在迁移过程中，当未迁移的增量数据满足预设写锁条件时，通知所述源数据节点对所述待迁移数据分片执行写锁操作，并将所述未迁移的增量数据迁移至所述目标数据节点；待所述增量数据迁移完毕，通知所述协调节点将所述待迁移数据分片对应的路由从所述源数据节点切换至所述目标数据节点。采用本公开所提供的数据库集群中数据迁移的方法及装置能够在数据迁移过程中避免数据库服务被中断。

Description

数据库集群中数据迁移的方法及装置

技术领域

本公开涉及计算机应用技术领域，尤其涉及一种数据库集群中数据迁移的方法及装置。

背景技术

当某个应用的用户访问量较大时，仅使用一台服务器为用户提供数据库服务势必影响用户体验，这就需要多台服务器共同为用户提供数据库服务，从而形成了所谓的数据库集群。

随着用户访问量的逐步增加，数据库集群的存储能力和处理能力也将达到集群能力的上限，这就需要通过数据迁移的方式缓解原有服务器的存储压力和负载压力。

然而，现有的数据迁移过程必须停止客户端对正在迁移的数据的访问，即必须停止数据库服务，才能够保证数据迁移的一致性，这必然影响用户的访问效率，而导致用户的访问体验差。

发明内容

基于此，本公开的一个目的在于提供一种数据库集群中数据迁移的方法，用于解决现有技术在数据迁移过程中需要停止数据库服务的问题。

此外，本公开的另一个目的在于提供一种数据库集群中数据迁移的装置，用于解决现有技术在数据迁移过程中需要停止数据库服务的问题。

为了解决上述技术问题，本公开所采用的技术方案为：

一种数据库集群中数据迁移的方法，所述数据库集群由至少一个协调节点和若干个数据节点组成，所述方法包括：获取源数据节点的快照，并根据所述快照中备份的待迁移数据分片中的存量数据，记录所述待迁移数据分片中的增量数据；将备份的存量数据迁移至目标数据节点；对记录的增量数据进行迁移，在迁移过程中，当未迁移的增量数据满足预设写锁条件时，通知所述源数据节点对所述待迁移数据分片执行写锁操作，并将所述未迁移的增量数据迁移至所述目标数据节点；待所述增量数据迁移完毕，通知所述协调节点将所述待迁移数据分片对应的路由从所述源数据节点切换至所述目标数据节点。

一种数据库集群中数据迁移的装置，所述数据库集群由至少一个协调节点和若干个数据节点组成，所述装置包括：增量数据记录模块，用于获取源数据节点的快照，并根据所述快照中备份的待迁移数据分片中的存量数据，记录所述待迁移数据分片中的增量数据；存量数据迁移模块，用于将备份的存量数据迁移至目标数据节点；增量数据迁移模块，用于对记录的增量数据进行迁移，在迁移过程中，当未迁移的增量数据满足预设写锁条件时，通知所述源数据节点对所述待迁移数据分片执行写锁操作，并将所述未迁移的增量数据迁移至所述目标数据节点；路由切换模块，用于待所述增量数据迁移完毕，通知所述协调节点将所述待迁移数据分片对应的路由从所述源数据节点切换至所述目标数据节点。

与现有技术相比，本公开具有以下有益效果：

通过在数据迁移过程中，当未迁移的增量数据满足预设写锁条件时，通知源数据节点对待迁移数据分片执行写锁操作，当待迁移数据分片上当前所有的写操作完成时，将未迁移的增量数据迁移至目标数据节点。

虽然对待迁移数据分片执行写锁操作之后，客户端对待迁移数据分片所进行的写操作会失败或者阻塞，但是满足预设写锁条件的未迁移的增量数据是极少的，使得写操作失败或者阻塞时间极短，相对客户端而言是无感知的，避免在数据迁移过程中停止数据库服务，从而有效地提高了用户的访问效率，提高了用户的访问体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并于说明书一起用于解释本公开的原理。

图1是根据本公开所涉及的实施环境的示意图；

图2是根据一示例性实施例示出的一种服务端的框图；

图3是根据一示例性实施例示出的一种数据库集群中数据迁移的方法的流程图；

图4是图3对应实施例中根据所述快照中备份的待迁移数据分片中的存量数据，记录所述待迁移数据分片中的增量数据步骤在一个实施例的流程图；

图5是通过切换若干个所述记录文件对所述增量数据进行迭代迁移步骤在一个实施例的流程图；

图6是通过切换若干个所述记录文件对所述增量数据进行迭代迁移步骤在另一个实施例的流程图；

图7是一应用场景中一种数据库集群中数据迁移的方法的具体实现示意图；

图7a是图7所涉及的数据节点新增的示意图；

图8是根据一示例性实施例示出的一种数据库集群中数据迁移的装置的框图；

图9是图8对应实施例中增量数据记录模块在一个实施例的框图；

图10是迭代迁移单元在一个实施例的框图。

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述，这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

这里将详细地对示例性实施例执行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

如前所述，随着用户访问量的逐步增加，数据库集群需要通过数据迁移的方式，来缓解原有服务器的存储压力和负载压力。

目前，通用的数据库包括键值(Key-Value)数据库、基于PostgreSQL的数据库等等。

对于键值数据库而言，通过多副本机制能够实现对用户几乎无感知的数据迁移、数据再平衡等功能。但是由于键值数据库不支持完整的数据事务(ACID)，也不具备分布式事务的能力，这就使得应用需要在业务逻辑上保证事务，进而保证数据迁移的一致性，而这对于绝大多数的应用开发者来说是无法接受的。此外，多副本机制仅适用于同构数据库内部实现数据迁移，而无法实现异构数据库之间的数据迁移。

基于此，基于PostgreSQL的数据库被广泛地使用，例如，开源数据库集群Postgres-xc、Postgres-xl、Postgres-x2等，具备数据自动分发、数据自动聚合的能力。在数据迁移的过程中，尤其是针对数据库集群扩容的场景，无法实现部分数据的迁移，只能将原服务器上的所有数据全量导出之后，再将导出的所有数据全部导入到新增的服务器上，方可达到数据重新分布的目的。然而，这种数据迁移方案必须停止数据库服务来保证数据迁移的一致性，若原服务器上的数据量很大，还将导致数据库服务停止的时间会非常漫长，严重影响了用户的访问效率。

又例如，基于PostgreSQL的数据库中间件pg_shard、citusdata，具备数据分片(sharding)的能力，可以通过搬迁分片(shard)来实现部分数据的迁移。但是，在数据迁移过程中，仍然需要停止数据库服务，即停止客户端对正在迁移的数据的访问，才能保证数据迁移的一致性。

因此，为了避免数据迁移过程中数据库服务被中断，特提出了一种数据库集群中数据迁移的方法。

图1为上述数据库集群中数据迁移的方法所涉及的实施环境。该实施环境包括数据库集群100、服务端200和客户端300。

其中，数据库集群100由若干台服务器组成。至少一台服务器作为协调节点101，为客户端300提供数据自动分发、数据自动聚合。若干台服务器作为数据节点103，用于存储可供访问的数据。

协调节点101负责接收客户端300进行的写操作，并将写操作所对应的待写入数据导入到数据库集群100中的数据节点103所拥有的数据分片上。即，按照预设规则(例如哈希算法、路由算法等)计算该待写入数据的分片号，并通过预置的路由映射表查找到该分片号对应的数据节点103，进而将该待写入数据转发至数据节点103所拥有的相应的数据分片上进行存储。

当用户进行数据访问，即客户端300对数据库集群100中的数据进行查询时，协调节点101将根据查询条件计算出待查询数据的分片号，并通过预置的路由映射表查找到该分片号对应的数据节点103，进而由一个或者多个数据节点103所拥有的相应的数据分片上获取到待查询数据并返回至客户端300。

当数据库集群100的存储能力和处理能力达到集群能力的上限时，服务端200通过与数据库集群100中协调节点101和数据节点103的交互，将控制数据库集群100进行数据迁移，例如，将分片号为0的数据分片上的数据由数据节点a迁移至数据节点c，以此缓解数据节点a的存储压力和负载压力。

其中，服务端200可以内嵌于数据库集群100中，也可以独立于数据库集群100设置。客户端300则是指应用客户端。

图2是根据一示例性实施例示出的一种服务端的框图。该硬件结构只是一个适用本公开的示例，不能认为是对本公开的使用范围的任何限制，也不能解释为本公开需要依赖于该服务端200。

该服务端200可因配置或者性能的不同而产生较大的差异，如图2所示，服务端200包括：电源210、接口230、至少一存储介质250、以及至少一中央处理器(CPU，CentralProcessing Units)270。

其中，电源210用于为服务端200上的各硬件设备提供工作电压。

接口230包括至少一有线或无线网络接口231、至少一串并转换接口233、至少一输入输出接口235以及至少一USB接口237等，用于与外部设备通信。

存储介质250作为资源存储的载体，可以是随机存储介质、磁盘或者光盘等，其上所存储的资源包括操作系统251、应用程序253及数据255等，存储方式可以是短暂存储或者永久存储。其中，操作系统251用于管理与控制服务端200上的各硬件设备以及应用程序253，以实现中央处理器270对海量数据255的计算与处理，其可以是Windows ServerTM、MacOS XTM、UnixTM、LinuxTM、FreeBSDTM等。应用程序253是基于操作系统251之上完成至少一项特定工作的计算机程序，其可以包括至少一模块(图示未示出)，每个模块都可以分别包含有对服务端200的一系列操作指令。数据255可以是存储于磁盘中的文件、图片等等。

中央处理器270可以包括一个或多个以上的处理器，并设置为通过总线与存储介质250通信，用于运算与处理存储介质250中的海量数据255。

如上面所详细描述的，适用本公开的服务端200将控制数据库集群进行数据迁移，即通过中央处理器270读取存储介质250中存储的一系列操作指令的形式来实现数据库集群中的数据迁移，以解决现有技术在数据迁移过程中需要停止数据库服务的问题。

此外，通过硬件电路或者硬件电路结合软件指令也能同样实现本公开，因此，实现本公开并不限于任何特定硬件电路、软件以及两者的组合。

请参阅图3，在一示例性实施例中，一种数据库集群中数据迁移的方法适用于图1所示实施环境的服务端200，该种数据库集群中数据迁移的方法可以由服务端200执行，可以包括以下步骤：

步骤310，获取源数据节点的快照，并根据快照中备份的待迁移数据分片中的存量数据，记录待迁移数据分片中的增量数据。

应当理解，某个数据节点中的数据远多于其余数据节点，即数据库集群中发生了数据偏斜，为了使数据能够在各数据节点中分布的更加均匀，可以进行数据迁移，即将数据由负载压力较大(即用户访问量较大)的数据节点迁移至负载压力较小(即用户访问量较小)的数据节点上。

又例如，当数据库集群的存储能力和处理能力即将达到集群能力的上限时，可以通过扩容，即增加数据节点的方式来提高数据库集群的集群能力，此时，也需要进行数据迁移，以此降低数据库集群中原有数据节点的存储压力和负载压力。

由此，服务端可以通过对数据库集群的运行状态进行监测，来判断数据库集群是否需要进行数据迁移。该数据库集群的运行状态可以通过数据库集群中各数据节点的负载能力(即用户访问量)来表示，还可以通过数据库集群中各数据节点的CPU占用率来表示。

举例来说，若监测到数据库集群中某个数据节点的用户访问量远大于其余数据节点，即表示数据库集群中发生了数据偏斜，则判定数据库集群需要进行数据迁移。又或者，若监测到数据库集群中所有数据节点的CPU占用率均超过了预设阈值(例如80％)，即表示数据库集群的集群能力即将达到上限，则判定数据库集群需要进行数据迁移。

在数据迁移过程中，数据库服务并未停止，客户端仍然会对数据节点中数据分片上的数据进行写操作，例如，该写操作包括数据新增、数据删除、数据修改等。基于此，数据迁移包括存量数据的迁移和增量数据的迁移。其中，存量数据指的是进行数据迁移之前的数据，增量数据指的是数据迁移过程中由写操作而产生的新数据或者由写操作而产生的变更的存量数据。

快照被定义为对某个指定数据集合中数据的拷贝，该拷贝包括该数据在某个时间点(例如拷贝开始的时间点)的映像。本实施例中，通过源数据节点的快照的获取，来区别源数据节点中待迁移数据分片上的存量数据和增量数据。

具体地，在准备进行数据迁移的时间点，对源数据节点所拥有的数据分片上的所有数据进行拷贝，得到源数据节点的快照。相应地，源数据节点的快照中备份的数据即包括待迁移数据分片中的存量数据。基于该待迁移数据分片中的存量数据，数据迁移过程中对该待迁移数据分片进行的所有写操作都将被记录，从而产生该待迁移数据分片中的增量数据。换而言之，在数据迁移过程中，任何与该待迁移数据分片中的存量数据有所区别的数据，都将被视为该迁移数据分片中的增量数据。

进一步地，该增量数据可以被记录于若干个记录文件中，以利于后续增量数据的迁移。

步骤330，将备份的存量数据迁移至目标数据节点。

在获取到源数据节点的快照之后，即可得到快照中备份的待迁移数据分片中的存量数据，以此进行存量数据的迁移。

其中，存量数据的迁移可以直接由源数据节点迁移至目标数据节点，还可以先由源数据节点导入至预设存储空间，再由预设存储空间中导出至目标数据节点。

以直接迁移为例，在源数据节点和目标数据节点之间建立一个持续的连接，通过该连接从源数据节点向目标数据节点传输存量数据流。

步骤350，对记录的增量数据进行迁移，在迁移过程中，当未迁移的增量数据满足预设写锁条件时，通知源数据节点对待迁移数据分片执行写锁操作，并将未迁移的增量数据迁移至目标数据节点。

待存量数据迁移完毕之后，即可开始进行增量数据的迁移。

值得一提的是，由于增量数据的迁移是在存量数据的迁移之后进行的，即进行增量数据迁移时，目标数据节点上已经存储有存量数据，而增量数据是指数据迁移过程中由写操作而产生的新数据或者由写操作而产生的变更的存量数据，因此，增量数据迁移至目标数据节点实际上是在目标数据节点上根据增量数据所对应的写操作重做增量数据。

例如，若增量数据是由写操作产生的新数据，则目标数据节点上将生成相应的新数据；若增量数据是由写操作产生的变更的存量数据，则目标数据节点上将对已存储的存量数据进行相应的变更，从而生成变更的存量数据。

进一步地，增量数据的迁移可以直接由源数据节点迁移至目标数据节点，也可以先由源数据节点导入至预设存储空间，再由预设存储空间中导出至目标数据节点。

以直接迁移为例，在源数据节点和目标数据节点之间建立一个持续的连接，通过该连接从源数据节点向目标数据节点传输增量数据流。此外，由于源数据节点产生增量数据的速度可能与目标节点重做增量数据的速度不一致，即增量数据的读写速度不一致，因此，该连接将具有一定大小的数据缓存能力，以此适应增量数据的读写速度不一致的应用场景，从而提高了增量数据迁移的适用性。

可以理解，由于数据迁移过程中数据库服务并未停止，客户端仍然会对源数据节点中待迁移数据分片上的数据进行写操作，若不锁住源数据节点上对待迁移数据分片的写操作，增量数据将源源不断地产生，将无法保证增量数据的完全迁移。

因此，在迁移过程中，通过判断未迁移的增量数据是否满足预设写锁条件，来进一步判断是否需要对待迁移数据分片执行写锁操作。

其中，写锁操作会导致客户端对待迁移数据分片所进行的写操作失败或者阻塞，故而，预设写锁条件是根据如何使客户端对写操作失败或者阻塞毫无感知而预先设置的，例如，该预设写锁条件可以是未迁移的增量数据的数据量、未迁移的增量数据的重做时间等等。可以理解，若未迁移的增量数据的数据量极少、或者未迁移的增量数据的重做时间极短，都能够使得客户端对数据迁移过程中的写操作失败或者阻塞毫无感知。

若未迁移的增量数据不满足预设写锁条件，则在继续进行增量数据迁移的同时，保持客户端对待迁移数据分片中数据的写操作。

反之，若未迁移的增量数据满足预设写锁条件，则通知源数据节点对待迁移数据分片执行写锁操作，此时，客户端对该待迁移数据分片所进行的新的写操作将失败或者阻塞，而之前所进行的写操作仍将继续。基于此，在等待该待迁移数据分片上之前所有的写操作完成之后，将未迁移的增量数据迁移至目标数据节点，从而保证了增量数据迁移的完整性。

步骤370，待增量数据迁移完毕，通知协调节点将待迁移数据分片对应的路由从源数据节点切换至目标数据节点。

在协调节点完成待迁移数据分片对应路由的切换之后，客户端对该待迁移数据分片上数据的读写操作即由源数据节点更改至目标数据节点上。至此，数据迁移完成。

通过如上所述的过程，实现了客户端无感知的数据迁移，避免数据迁移过程中数据库服务被中断，有效地提高了用户的访问效率，提供了用户的访问体验。

此外，上述数据库集群中数据迁移的方法不仅能够支持完整的数据事务，以此保证数据迁移的一致性，而且能够支持异构数据库之间的数据迁移，有效地扩展了数据迁移的应用场景。

请参阅图4，在一示例性实施例中，步骤310可以包括以下步骤：

步骤311，基于存量数据，接收客户端对待迁移数据分片进行的若干次写操作。

如前所述，相应地，源数据节点的快照中备份的数据即包括待迁移数据分片中的存量数据。该源数据节点的快照是在准备进行数据迁移的时间点生成的。

为此，基于存量数据，即在准备进行数据迁移的时间点之后，记录客户端对待迁移数据分片所进行的所有写操作，以利于后续在目标节点上根据该所有写操作进行增量数据的重做。

步骤313，根据若干次写操作生成若干个记录文件，通过若干个记录文件记录待迁移数据分片中的增量数据。

应当理解，每一个记录文件中所记录的增量数据的数据量是有限的。本实施例中，所有写操作被记录于若干个记录文件中，进而通过若干个记录文件形成待迁移数据分片中的增量数据，即目标数据节点能够根据该若干个记录文件中记录的所有写操作进行增量数据的重做，从而实现待迁移数据分片中的增量数据的迁移，以此保证数据迁移的一致性。

进一步地，每一个记录文件中为记录的增量数据的数据量设置阈值，例如，阈值设置为记录100条增量数据，则当同一次写操作所产生的增量数据超过该阈值，该次写操作将被记录在至少两个记录文件中，又譬如，当同一次写操作所产生的增量数据未超过该阈值，则同一个记录文件中将记录由至少两次写操作所产生的增量数据，以此保证记录文件的存储效率。

相应地，步骤350中对记录的增量数据进行迁移的步骤可以包括以下步骤：

通过切换若干个记录文件对增量数据进行迭代迁移。

如前所述，增量数据直接迁移时，在源数据节点和目标数据节点之间需要建立一个持续的连接，并且由于源数据节点产生增量数据的速度可能与目标节点重做增量数据的速度不一致，该连接还需要具有一定大小的数据缓存能力。

这不仅会使得数据库集群需要对该连接的整个生命周期进行维护，对数据库集群的内核代码具有一定的侵入性，而且该连接所具备的数据缓存能力需要占用数据库集群自身的存储空间，可能在进行数据流传输的漫长过程中导致系统磁盘空间不足，而影响系统的稳定性。

基于此，本实施例中，以迭代迁移的方式进行增量数据的迁移。

具体地，数据迁移过程中，客户端对待迁移数据分片所进行的所有写操作将被记录在若干个不同的记录文件中，以在每一个记录文件中记录形成待迁移数据分片中的增量数据。相应地，目标数据节点即可根据每一个记录文件完成每一次增量数据的迭代迁移。

进一步地，每一个记录文件中所记录的增量数据的数据量不一致。较优地，每一次迭代所使用的记录文件中记录的增量数据的数据量都会比上一次迭代所使用的记录文件中记录的增量数据的数据量有所减少，换而言之，最后一次迭代所使用的记录文件中记录的增量数据的数据量最少。

更进一步地，每一个记录文件中所记录的增量数据的数据量的减少由服务端控制，可以随机减少，也可以按照预设数据量减少。

进一步地，请参阅图5，在一示例性实施例中，所述通过切换若干个记录文件对增量数据进行迭代迁移的步骤可以包括以下步骤：

步骤410，以上一次迭代迁移时记录的增量数据结束位置作为本次迭代迁移的增量数据起始位置，根据本次迭代迁移的增量数据起始位置切换至对应的记录文件。

每一个记录文件所记录的增量数据都有对应的增量数据起始位置和增量数据结束位置，并且该增量数据起始位置和增量数据结束位置对应的是该记录文件所在的迭代轮次。可以理解，由于记录文件是依序生成的，相应地，本次迭代迁移的增量数据结束位置同时也是下一次迭代迁移的增量数据起始位置，即记录文件中本次迭代迁移的增量数据结束位置之前的增量数据将在本次迭代中完成迁移，而该增量数据结束位置之后的增量数据都将在后续迭代迁移中进行迁移。

基于此，在得到上一次迭代迁移时记录的增量数据结束位置之后，即可确定本次迭代迁移的增量数据起始位置，进而得到本次迭代所对应的记录文件。

步骤430，由记录文件中获取本次迭代迁移的增量数据，并记录本次迭代迁移的增量数据结束位置。

在切换至本次迭代迁移的增量数据起始位置对应的记录文件之后，即可获取到其中记录的增量数据，以此作为本次迭代迁移的增量数据。

进一步地，由于每一个记录文件中所记录的增量数据的数据量不一致，即每一个记录文件中的增量数据起始位置和增量数据结束位置都不同，因此，在本次迭代迁移的增量数据完成迁移时，还将记录本次迭代迁移的增量数据结束位置，以供后续迭代迁移时使用。

步骤450，将获取到的增量数据迁移至目标数据节点。本实施例中，增量数据的迁移将通过预设存储空间完成，即将获取到的增量数据由源数据节点导入至预设存储空间，再由预设存储空间导出至目标数据节点。

其中，预设存储空间是独立于数据库集群设置的，以此避免占用数据库集群自身的存储空间，有利于减轻系统磁盘空间的饥饿症状，有利于提高系统的稳定性，而且能够实现数据迁移与数据库集群的解耦，避免数据迁移过程中数据库服务被中断，进一步有效地提高了用户的访问效率，提高用户的访问体验。

请参阅图6，在一示例性实施例中，所述通过切换若干个记录文件对增量数据进行迭代迁移的步骤还可以包括以下步骤：

步骤510，判断本次迭代迁移的增量数据的数据量或者该增量数据的迁移时间是否不大于预设阈值。

如前所述，由于数据迁移过程中数据库服务并未停止，客户端仍然会对源数据节点中待迁移数据分片上的数据进行写操作，若不锁住源数据节点上对待迁移数据分片的写操作，增量数据将源源不断地产生，将无法保证增量数据的完全迁移。

若是直接迁移，则可以通过某一时刻源数据节点与目标数据节点之间建立的连接的缓存空间中未迁移的增量数据，来判断是否需要锁住源数据节点上对待迁移数据分片的写操作。例如，某一时刻，当缓存空间中未迁移的增量数据的数据量小于预设阈值，则判定需要对待迁移数据分片执行写锁操作。

然而，在迭代迁移过程中，由于在进行本次迭代迁移时，并未停止将增量数据记录于记录文件中，即记录文件仍不断地生成，使得服务端无法知悉未迁移的增量数据究竟还有多少，进而无法直接通过未迁移的增量数据来判断是否需要对待迁移数据分片执行写锁操作。

再如前所述，若每一次迭代所使用的记录文件中记录的增量数据的数据量都比上一次迭代所使用的记录文件中记录的增量数据的数据量有所减少，则最后一次迭代所使用的记录文件中记录的增量数据的数据量最少。

基于此，本实施例中，预设写锁条件被设置为本次迭代迁移的增量数据的数据量不大于预设阈值。也就是说，通过本次迭代迁移的增量数据来间接地判断未迁移的增量数据是否满足预设写锁条件，进而判断是否需要对待迁移数据分片执行写锁操作。

若本次迭代迁移的增量数据的数据量不大于预设阈值，则最后一次迭代迁移的增量数据，即未迁移的增量数据的数据量势必也不大于预设阈值，此时，进入步骤530，判定未迁移的增量数据满足预设写锁条件。

可以理解，最后一次迭代迁移所需切换的记录文件可能仅有一个，也可能有若干个。

否则，返回步骤410，继续进行增量数据的迭代迁移。

或者，也可以将预设写锁条件设置为本次迭代迁移的增量数据的迁移时间不大于预设阈值，该迁移时间指的是目标数据节点重做增量数据所消耗的时间，其是通过计算本次迭代迁移的增量数据的数据量与目标数据节点重做增量数据的速度的比值得到的。例如，使客户端毫无感知的典型写锁时长为10ms至30ms，则预设写锁条件可以设置为本次迭代迁移的增量数据的重做时间不大于10ms。

若本次迭代迁移的增量数据的迁移时间不大于预设阈值，则最后一次迭代迁移的增量数据，即未迁移的增量数据的迁移时间势必也不大于预设阈值，此时，进入步骤530，判定未迁移的增量数据满足预设写锁条件。

否则，返回步骤410，继续进行增量数据的迭代迁移。

在一示例性实施例中，如上所述的方法还可以包括以下步骤：

当待迁移数据分片对应的路由切换完毕，通知源数据节点对待迁移数据分片执行解锁操作，并停止记录待迁移数据分片中的增量数据。

通过对待迁移数据分片执行解锁操作，即可解除对待迁移数据分片所执行的写锁操作，使得待迁移数据分片上的读写恢复，即后续客户端对该待迁移数据分片所进行的读写操作将由源数据节点更改至目标数据节点。

进一步地，在完成更改之后，源数据节点中将不再产生关于该待迁移数据分片的增量数据，因此，源数据节点也可以不必继续基于快照记录该待迁移数据分片中的增量数据。至此，增量数据迁移完毕。

图7是一应用场景中一种数据库集群中数据迁移的方法的具体实现示意图，图7a是图7所涉及的数据节点新增的示意图。现结合图7所示的具体应用场景和图7a所示的数据节点新增的示意图，以数据库集群扩容，即新增数据节点d为例，对本公开各实施例中数据库集群中数据迁移的过程进行描述。

服务端通过执行步骤601，获取源数据节点a的快照，并基于该快照，通过执行步骤602开始记录源数据节点a中待迁移数据分片3上的增量数据。同时，通过执行步骤603，开始从源数据节点a上到处待迁移数据分片3中的存量数据。

在完成上述步骤之后，即可开始数据迁移。

首先，通过执行步骤604至步骤605，将待迁移数据分片3中的存量数据由源数据节点a迁移至目标数据节点d。

然后，以迭代迁移的方式对待迁移数据分片3中的增量数据进行迁移。

通过执行步骤606至步骤607，完成待迁移数据分片3中增量数据的本次迭代迁移。待本次迭代迁移完成，通过执行步骤608至步骤609，判断是否进入最后一次迭代迁移。

若为否，则返回步骤606继续增量数据非最后一次的迭代迁移。

反之，若为是，则通过执行步骤610，对待迁移数据分片3执行写锁操作，并通过执行步骤611至步骤612，等待该待迁移数据分片3上当前的所有写操作完成之后，完成待迁移数据分片3中增量数据的最后一次迭代迁移。

最后，通过执行步骤613至步骤615，通知协调节点101将待迁移数据分片3对应的路由从源数据节点a切换至目标数据节点d，并恢复对待迁移数据分片3的读写，使得客户端后续对待迁移数据分片3所进行的读写操作均由源数据节点a更改至目标数据节点d。

至此，数据库集群完成目标数据节点d的扩容，数据完成由源数据节点a至目标数据节点d的迁移。

在该具体应用场景中，不仅在数据库集群的存储能力或者处理能力不足以应对用户的访问需求时，能够支持客户端无感知的数据扩容，即数据库集群扩容时，其所进行的数据迁移不必停止数据库服务，有效地提高了用户的访问效率，提高了用户的访问体验，而且能够支持完整的事务，保证数据迁移的一致性。

下述为本公开装置实施例，可以用于执行本公开所涉及的数据库集群中数据迁移的方法。对于本公开装置实施例中未披露的细节，请参照本公开所涉及的数据库集群中数据迁移的方法实施例。

请参阅图8，在一示例性实施例中，一种数据库集群中数据迁移的装置700包括但不限于：增量数据记录模块710、存量数据迁移模块730、增量数据迁移模块750和路由切换模块770。

其中，增量数据记录模块710用于获取源数据节点的快照，并根据快照中备份的待迁移数据分片中的存量数据，记录待迁移数据分片中的增量数据。

存量数据迁移模块730用于将备份的存量数据迁移至目标数据节点。

增量数据迁移模块750用于对记录的增量数据进行迁移，在迁移过程中，当未迁移的增量数据满足预设写锁条件时，通知源数据节点对待迁移数据分片执行写锁操作，并将未迁移的增量数据迁移至目标数据节点。

路由切换模块770用于待增量数据迁移完毕，通知协调节点将待迁移数据分片对应的路由从源数据节点切换至目标数据节点。

请参阅图9，在一示例性实施例中，增量数据记录模块710包括但不限于：写操作接收单元711和记录文件生成单元713。

其中，写操作接收单元711用于基于存量数据，接收客户端对待迁移数据分片进行的若干次写操作。

记录文件生成单元713用于根据若干次写操作生成若干个记录文件，通过若干个记录文件记录待迁移数据分片中的增量数据。

相应地，增量数据迁移模块750包括：迭代迁移单元。

其中，迭代迁移单元用于通过切换若干个记录文件对增量数据进行迭代迁移。

请参阅图10，在一示例性实施例中，迭代迁移单元751包括但不限于：记录文件获取单元7511、增量数据获取单元7513和迁移单元7515。

其中，记录文件获取单元7511用于以上一次迭代迁移时记录的增量数据结束位置作为本次迭代迁移的增量数据起始位置，根据本次迭代迁移的增量数据起始位置切换至对应的记录文件。

增量数据获取单元7513用于由记录文件中获取本次迭代迁移的增量数据，并记录本次迭代迁移的增量数据结束位置。

迁移单元7515用于将获取到的增量数据迁移至目标数据节点。

在一示例性实施例中，迭代迁移单元751还包括但不限于：判断单元。

其中，判断单元用于判断本次迭代迁移的增量数据的数据量或者该增量数据的迁移时间是否不大于预设阈值。

在一示例性实施例中，如上所述的装置还包括但不限于：解锁模块。

其中，解锁模块用于当待迁移数据分片对应的路由切换完毕，通知源数据节点对待迁移数据分片执行解锁操作，并停止记录待迁移数据分片中的增量数据。

需要说明的是，上述实施例所提供的数据库集群中数据迁移的装置在进行数据库集群中的数据迁移时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即数据库集群中数据迁移的装置的内部结构将划分为不同的功能模块，以完成以上描述的全部或者部分功能。

另外，上述实施例所提供的数据库集群中数据迁移的装置与数据库集群中数据迁移的方法的实施例属于同一构思，其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述，此处不再赘述。

上述内容，仅为本公开的较佳示例性实施例，并非用于限制本公开的实施方案，本领域普通技术人员根据本公开的主要构思和精神，可以十分方便地进行相应的变通或修改，故本公开的保护范围应以权利要求书所要求的保护范围为准。

Claims

1.一种数据库集群中数据迁移的方法，所述数据库集群由至少一个协调节点和若干个数据节点组成，其特征在于，所述方法包括：

获取源数据节点的快照，并根据所述快照中备份的待迁移数据分片中的存量数据，记录所述待迁移数据分片中的增量数据；

将备份的存量数据迁移至目标数据节点；

对记录的增量数据进行迁移，在迁移过程中，当未迁移的增量数据满足预设写锁条件时，通知所述源数据节点对所述待迁移数据分片执行写锁操作，并将所述未迁移的增量数据迁移至所述目标数据节点；

待所述增量数据迁移完毕，通知所述协调节点将所述待迁移数据分片对应的路由从所述源数据节点切换至所述目标数据节点。

2.如权利要求1所述的方法，其特征在于，所述根据所述快照中备份的待迁移数据分片中的存量数据，记录所述待迁移数据分片中的增量数据的步骤包括：

基于所述存量数据，接收客户端对所述待迁移数据分片进行的若干次写操作；

根据若干次所述写操作生成若干个记录文件，通过若干个所述记录文件记录所述待迁移数据分片中的增量数据；

相应地，所述对记录的增量数据进行迁移的步骤包括：

通过切换若干个所述记录文件对所述增量数据进行迭代迁移。

3.如权利要求2所述的方法，其特征在于，所述通过切换若干个所述记录文件对所述增量数据进行迭代迁移的步骤包括：

以上一次迭代迁移时记录的增量数据结束位置作为本次迭代迁移的增量数据起始位置，根据本次迭代迁移的增量数据起始位置切换至对应的所述记录文件；

由所述记录文件中获取本次迭代迁移的增量数据，并记录本次迭代迁移的增量数据结束位置；

将获取到的所述增量数据迁移至所述目标数据节点。

4.如权利要求3所述的方法，其特征在于，所述通过切换若干个所述记录文件对所述增量数据进行迭代迁移的步骤还包括：

判断本次迭代迁移的增量数据的数据量或者该增量数据的迁移时间是否不大于预设阈值；

若为是，则判定所述未迁移的增量数据满足预设写锁条件；

否则，继续进行所述增量数据的迭代迁移。

5.如权利要求1所述的方法，其特征在于，所述方法还包括：

当所述待迁移数据分片对应的路由切换完毕，通知所述源数据节点对所述待迁移数据分片执行解锁操作，并停止记录所述待迁移数据分片中的增量数据。

6.一种数据库集群中数据迁移的装置，所述数据库集群由至少一个协调节点和若干个数据节点组成，其特征在于，所述装置包括：

增量数据记录模块，用于获取源数据节点的快照，并根据所述快照中备份的待迁移数据分片中的存量数据，记录所述待迁移数据分片中的增量数据；

存量数据迁移模块，用于将备份的存量数据迁移至目标数据节点；

增量数据迁移模块，用于对记录的增量数据进行迁移，在迁移过程中，当未迁移的增量数据满足预设写锁条件时，通知所述源数据节点对所述待迁移数据分片执行写锁操作，并将所述未迁移的增量数据迁移至所述目标数据节点；

路由切换模块，用于待所述增量数据迁移完毕，通知所述协调节点将所述待迁移数据分片对应的路由从所述源数据节点切换至所述目标数据节点。

7.如权利要求6所述的装置，其特征在于，所述增量数据记录模块包括：

写操作接收单元，用于基于所述存量数据，接收客户端对所述待迁移数据分片进行的若干次写操作；

记录文件生成单元，用于根据若干次所述写操作生成若干个记录文件，通过若干个所述记录文件记录所述待迁移数据分片中的增量数据；

相应地，所述增量数据迁移模块包括：

迭代迁移单元，用于通过切换若干个所述记录文件对所述增量数据进行迭代迁移。

8.如权利要求7所述的装置，其特征在于，所述迭代迁移单元包括：

记录文件获取单元，用于以上一次迭代迁移时记录的增量数据结束位置作为本次迭代迁移的增量数据起始位置，根据本次迭代迁移的增量数据起始位置切换至对应的所述记录文件；

增量数据获取单元，用于由所述记录文件中获取本次迭代迁移的增量数据，并记录本次迭代迁移的增量数据结束位置；

迁移单元，用于将获取到的所述增量数据迁移至所述目标数据节点。

9.如权利要求8所述的装置，其特征在于，所述迭代迁移单元还包括：

判断单元，用于判断本次迭代迁移的增量数据的数据量或者该增量数据的迁移时间是否不大于预设阈值。

10.如权利要求6所述的装置，其特征在于，所述装置还包括：

解锁模块，用于当所述待迁移数据分片对应的路由切换完毕，通知所述源数据节点对所述待迁移数据分片执行解锁操作，并停止记录所述待迁移数据分片中的增量数据。