WO2021238701A1

WO2021238701A1 - 数据迁移方法以及装置

Info

Publication number: WO2021238701A1
Application number: PCT/CN2021/094094
Authority: WO
Inventors: 李鑫; 潘岳; 张浩然; 郑博文; 李飞飞
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2020-05-29
Filing date: 2021-05-17
Publication date: 2021-12-02
Also published as: CN111813760A; CN111813760B; US20230087447A1

Abstract

数据迁移方法以及装置，其中所述数据迁移方法包括：获取针对源数据库的迁移请求，创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库，读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步，根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置。

Description

数据迁移方法以及装置

本申请要求2020年05月29日递交的申请号为202010477729.3、发明名称为“数据迁移方法以及装置”中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本说明书实施例涉及数据库技术领域，特别涉及一种数据迁移方法。本说明书一个或者多个实施例同时涉及一种数据迁移装置，一种计算设备，以及一种计算机可读存储介质。

背景技术

随着科技的发展，互联网已经深入到社会生活的方方面面，给人们的工作、生活和学习等带来了巨大的便利。在互联网业务运营中，在某些特定的时间段，往往会遇到数据流量激增(数据库容量需求大幅增加)或的数据流量骤减(数据库容量需求减少)的情况。

在分布式数据库中，为了满足弹性需求，一般需要具备横向节点扩缩容的线性能力。扩缩容过程中，为了满足存储和计算负载的均衡，需要在节点间进行数据迁移，而数据迁移效率影响线性扩缩期间系统的可用性和性能，例如，若使用通信链路直接发送数据块，由于通信链路要求延时短，因此会限制其数据分片的大小，缺乏灵活性；或者，当数据集较大时，可能阻塞同步和通信链路，影响数据同步效率。因此，亟需一种数据迁移方法，以克服此类问题。

发明内容

有鉴于此，本说明书实施例提供了一种数据迁移方法。本说明书一个或者多个实施例同时涉及一种数据迁移装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面，提供了一种数据迁移方法，包括：

获取针对源数据库的迁移请求；

创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库；

读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步；

根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置。

可选地，所述源数据库由所述主副本数据库以及至少一个从副本数据库组成；所述目标数据库由至少两个副本数据库组成。

可选地，所述数据迁移日志通过以下方式向所述目标数据库同步：

基于所述主副本数据库、所述至少一个从副本数据库以及所述至少两个副本数据库建立日志同步链路；

按照所述日志同步链路中各个节点的上下游连接关系，向所述目标数据库同步所述数据迁移日志。

可选地，所述按照所述日志同步链路中各个节点的上下游连接关系，向所述目标数据库同步所述数据迁移日志，包括：

将所述数据迁移日志由所述主副本数据库同步至所述至少一个从副本数据库；

将所述数据迁移日志由所述至少一个从副本数据库同步至所述至少两个副本数据库。

可选地，所述根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置，包括：

将所述目标数据库中包含的任意一个副本数据库确定为所述目标主副本数据库；

根据所述主副本数据库的路由规则为所述目标主副本数据库进行路由配置。

可选地，所述目标主副本数据库通过以下方式确定：

基于所述至少两个副本数据库的标识信息向所述源数据库发起选举；所述选举用于从所述至少两个副本数据库中选举出所述目标主副本数据库；

获取所述主副本数据库以及至少一个从副本数据库提交的投票结果；

对所述投票结果进行统计，将所述至少两个副本数据库中首个获得投票数大于预设阈值的副本数据库确定为所述目标主副本数据库。

可选地，所述创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库，包括：

创建所述源数据库的主副本数据库或任意一个从副本数据库中全量待迁移数据的快照；

按照预设迁移方式将所述快照迁移至所述目标数据库。

可选地，所述读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步步骤执行之后，所述根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置步骤执行之前，还包括：

判断所述数据迁移日志中同步完成的日志条目数值是否满足预设阈值；

若是，则确定所述数据迁移日志的同步进度满足预设进度阈值，执行所述根据所述源数据库中主副本数据库的路由规则为所述目标数据库的目标主副本数据库进行路由配置的步骤。

可选地，所述根据所述源数据库中主副本数据库的路由规则为所述目标数据库的目标主副本数据库进行路由配置步骤执行之后，还包括：

接收数据读写请求；

根据所述数据读取请求中的请求数据标识，查找对应的目标主副本数据库；

根据所述目标主副本数据库的数据读写路由规则，对所述目标主副本数据库执行数据读写操作。

根据本说明书实施例的第二方面，提供了一种数据迁移装置，包括：

获取模块，被配置为获取针对源数据库的迁移请求；

创建模块，被配置为创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库；

读取模块，被配置为读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步；

配置模块，被配置为根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置。

根据本说明书实施例的第三方面，提供了一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令：

获取针对源数据库的迁移请求；

根据本说明书实施例的第四方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该指令被处理器执行时实现所述数据迁移方法的步骤。

本说明书一个实施例通过获取针对源数据库的迁移请求，创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库，读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步，根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置；

实现了通过快照导出方式将源数据库中的待迁移数据全量迁移至目标数据库，另外，以增量同步的方式同步数据迁移日志，在日志同步过程中进行路由切换，一方面，不会阻塞用于增量同步的同步链路，有利于提高日志同步的效率；另一方面，在全量迁移过程中未进行路由切换，因此，在全量迁移过程中可正常进行数据读写，有利于提高数据读写效率。

附图说明

图1是本说明书一个实施例提供的一种数据迁移方法的处理流程图；

图2是本说明书一个实施例提供的一种数据库扩容过程的示意图；

图3是本说明书一个实施例提供的一种数据迁移方法的处理过程流程图；

图4是本说明书一个实施例提供的一种数据迁移装置的示意图；

图5是本说明书一个实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本说明书内涵的情况下做类似推广，因此本说明书不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

首先，对本说明书一个或多个实施例涉及的名词术语进行解释。

Raft算法：一种共识算法，提供了一种在计算系统集群中分布状态机的通用方法，确保集群内每个节点可以达成相同的状态转换。

数据镜像备份工具：一种有效数据传输和文件同步工具，使用C语言编写，被广泛集成和使用在类Unix操作系统中。

在本说明书中，提供了一种数据迁移方法，本说明书同时涉及一种数据迁移装置，一种计算设备，以及一种计算机可读存储介质，在下面的实施例中逐一进行详细说明。

图1示出了根据本说明书一个实施例提供的一种数据迁移方法的处理流程图，包括步骤102至步骤108。

步骤102，获取针对源数据库的迁移请求。

在分布式数据库中，为了满足弹性需求，一般需要具备横向节点扩缩容的线性能力。扩缩容过程中，为了满足存储和计算负载的均衡，需要在节点间进行数据迁移，而数据迁移效率影响线性扩缩期间系统的可用性和性能。

基于此，本说明书实施例提供的数据迁移方法，应用于分布式数据库系统，通过快照导出方式将源数据库中的待迁移数据全量迁移至目标数据库，另外，以增量同步的方式同步数据迁移日志，在日志同步过程中进行路由切换，一方面，不会阻塞用于增量同步的同步链路，有利于提高日志同步的效率；另一方面，在全量迁移过程中未进行路由切换，因此，在全量迁移过程中可正常进行数据读写，有利于提高数据读写效率。

为保证分布式数据库系统线性扩缩容过程中的高可用，本说明书实施例提供的数据迁移方法，利用全量加增量的数据迁移方式，使得整个迁移过程以及路由切换过程均不影响系统可用性。

具体的，所述数据迁移即将源数据库中的数据迁移至目标数据库；源数据库由所述主副本数据库以及至少一个从副本数据库组成，目标数据库由至少两个副本数据库组成；在获取针对源数据库的迁移请求后，可创建源数据库中的全量数据的快照，并通过快照迁移的方式将源数据库中的数据全量迁移至目标数据库。

步骤104，创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库。

具体的，由于源数据库中包含一个主副本数据库以及至少一个从副本数据库，因此，具体实施时，在获取针对源数据库的迁移请求后，创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库，即创建所述源数据库的主副本数据库或任意一个从副本数据库中全量待迁移数据的快照，并按照预设迁移方式将所述快照迁移至所述目标数据库。

进一步的，由于所述源数据库中的主副本数据库以及至少一个从副本数据库中存储的数据相同，因此，在数据迁移过程中，只需将源数据库中的主副本数据库或至少一个从副本数据库中任意一个副本数据库中存储的数据进行同步即可，因此，创建所述源数据库中待迁移数据的快照，即创建所述源数据库的主副本数据库或任意一个从副本数据库中全量待迁移数据的快照；创建快照后，按照预设迁移方式将快照并行迁移至目标数据库的至少两个副本数据库，具体实施时，所述预设迁移方式可以是数据镜像备份工具(rsync工具)，即利用rsync工具进行数据全量迁移。

在未完成数据迁移之前，由源数据库提供数据读写功能，因此，在将路由从源数据库切换至目标数据库之前，源数据库中的主副本数据库以及至少一个从副本数据库的状态为active(主动处理数据读写请求)，而目标数据库中的至少两个副本数据库的状态为passive(空闲状态)，以为其状态变为active做准备。

步骤106，读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步。

具体的，由于数据迁移日志是一个与数据库文件分开的文件。它存储对数据库进行的所有更改，并全部记录插入、更新、删除、提交、回退和数据库模式变化，数据迁移日志是进行数据/文件备份和恢复的重要组件，因此，在将源数据库中的数据全量迁移至目标数据库后，还需将数据迁移日志增量迁移(同步)至目标数据库。

具体实施时，可采用raft算法进行数据迁移日志的同步，raft算法将分布式数据库系统中的角色分为领导者(leader节点)、跟从者(follower节点)和候选人(candidate节点)，本说明书实施例中，源数据库中包含的主副本数据库即为leader节点，源数据库中包含的至少一个从副本数据库即为follower节点，由于在向目标数据库同步数据迁移日志之前，目标数据库中不存在目标主副本数据库，因此，在未将数据迁移日志同步至目标数据库之前，目标数据库中包含的至少两个副本数据库均为passive状态，将数据迁移日志同步至目标数据库后，并且目标数据库中的至少两个副本数据库的状态由passive转换为active之后，所述至少两个副本数据库可作为leader节点的切换目标(即所述至少两个副本数据库可作为candidate节点)。

其中，leader节点用于接收客户端发送的数据读写请求，并向follower节点同步数据迁移日志，当数据迁移日志同步到大多数节点上后，leader节点可向follower节点发送提交日志的提示信息；follower节点用于接收并持久化leader节点同步的数据迁移日志，在接收到leader节点发送的提交日志的提示信息之后，提交日志；candidate节点是leader节点选举过程中的临时角色。

源数据库中的leader节点和follower节点的状态为active，目标数据库中的至少两个副本数据库的状态为passive，在未将数据迁移日志同步至目标数据库之前，目标数据库中包含的至少两个副本数据库均为passive状态，将数据迁移日志同步至目标数据库后，并且目标数据库中的至少两个副本数据库的状态由passive转换为active之后，所述至少两个副本数据库即可作为candidate节点，源数据库中的leader节点和follower节点用于在日志同步进度满足预设阈值的情况下，对目标数据库中的至少两个副本数据库进行选举，即在candidate节点中选举产生目标主副本数据库。

实际应用中，可使用raft-log的同步机制进行数据迁移日志的同步，由于raft分布式数据库系统中最多只能有一个leader节点，日志只能从leader节点复制到follower节点上，而raft算法的一个应用场景为复制状态机，client(参与者)向复制状态机发送用于在状态机上执行的命令，raft算法负责将命令以log的形式复制给其他的状态机，若不同的状态机按照一致的顺序来执行这些命令，即可获得相同的输出结果，因此，可利用共识算法保证被同步的数据迁移日志的内容和顺序一致。

具体实施时，可通过日志同步链路进行数据迁移日志的同步，因此，在同步日志之前，需建立日志同步链路，并通过所述日志同步链路向目标数据库同步日志，具体可通过以下方式实现：

进一步的，按照所述日志同步链路中各个节点的上下游连接关系，向所述目标数据库同步所述数据迁移日志，具体可通过以下方式实现：

具体的，由于数据迁移日志是一个与数据库文件分开的文件。它存储对数据库进行的所有更改，并将对数据库中数据的插入、更新、删除、提交、回退和数据库模式变化等进行记录，数据迁移日志是进行数据/文件备份和恢复的重要组件，并且日志存储在leader节点中，由leader节点将日志同步至follower节点，再由follower节点同步至目标数据库的至少两个副本数据库，因此，在进行数据迁移日志的同步之前，需基于主副本数据库、至少一个从副本数据库、至少两个副本数据库以及数据迁移日志在各节点间的同步顺序建立日志同步链路，在所述日志同步链路建立完成后，可按照链路中各个节点的上下游连接关系，向目标数据库同步数据迁移日志。

步骤108，根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置。

具体的，由于数据迁移日志由有序编号(log index)的日志条目组成，因此，数据迁移日志的同步实际是日志中各日志条目的同步，在同步完成的日志条目的数目满足预设阈值的情况下，可为目标数据库的副本数据库配置路由，即将源数据库中主副本数据库的路由切换至目标数据库的目标主副本数据库，所述路由可提供数据读写功能。

具体实施时，由于数据迁移日志由日志条目组成，因此，数据迁移日志的同步进度可通过以下方式确定：

若是，则确定所述数据迁移日志的同步进度满足预设进度阈值，根据所述源数据库中主副本数据库的路由规则为所述目标数据库的目标主副本数据库进行路由配置。

具体的，由于数据迁移日志的同步实际是日志中各日志条目的同步，因此，判断数据迁移日志中同步完成的日志条目数值是否满足预设阈值这一过程，可在向所述目标数据库同步数据迁移日志的过程中同时进行，若判断同步完成的日志条目数值满足预设阈值，则可在日志同步的过程中，进行路由的切换，即由源数据库切换至目标数据库；若判断同步完成的日志条目数值不满足预设阈值，则继续进行日志同步即可。

以client发起了三次写请求为例，leader节点在收到这些请求之后，首先以日志的形式将请求批量同步至follower节点，在接收到follower节点对日志复制成功的响应之后，更新日志位点，并调用接口，执行请求中的计数运算，将client发来的指令加到计数器当中。

更新日志位点后，表示在该日志位点之前(包括该位点)的日志均已复制到了系统半数以上的节点之中。若位点在“2”这个位置，表示“0-2”的日志都已经复制到了半数以上节点之中，若leader继续将“3”、“4”两条日志批量的复制到了follower节点上，则位点滑动到“4”的位置，表示“0-4”的日志都已经复制到了半数以上节点之中。

当目标数据库中的至少一个副本数据库的日志位点与源数据库中主副本数据库的日志位点间的差值小于预设阈值(100)，则由源数据库中的leader节点发起成员变更操作，即将源数据库中的至少一个从副本数据库的状态由active切换为passive，并将目标数据库中的至少两个副本数据库的状态由passive切换为active，并将所述至少两个副本数据库的角色变为follower节点。

另外，目标数据库的目标主副本数据库可通过选举确定，具体可通过以下方式实现：

具体的，对投票结果的统计是随着投票过程动态进行的，源数据库中的主副本数据库以及至少一个从副本数据库对目标数据库中的至少两个副本数据库进行投票，根据投票结果确定目标数据库中的目标主副本数据库，即在投票过程中，对目标数据库中至少两个副本数据库的得票数进行动态统计，并将至少两个副本数据库中第一个得票数大于预设阈值的副本数据库确定为所述目标主副本数据库。

实际应用中，raft使用心跳(heartbeat)触发leader选举，将目标数据库中至少两个副本数据库的角色初始化为follower节点，并由源数据库中的主副本数据库以及至少一个从副本数据库作为投票成员，对目标数据库中的follower节点进行选举，产生目标数据库中的目标主副本数据库。

在获取投票成员的投票结果后，对所述投票结果进行统计，并将目标数据库中首个获得投票数大于预设阈值的follower节点确定为leader节点；实际应用中，所述预设阈值可根据源数据库中副本数据库的个数确定，例如，若所述源数据库中包3个副本数据库(1个主副本数据和2个从副本数据库)，则预设阈值可设置为2(得票率大于50％)，并将目标数据库中首个获得投票数大于2的follower节点确定为leader节点。

投票的依据可以是各个节点中数据迁移日志的同步进度，即同步完成的日志条目最多的follower节点成为leader节点的概率更高。

另外，由于leader节点用于接收客户端的数据读写请求，因此将路由切换至目标数据库的目标主副本数据库(leader节点)后，所述目标主副本数据库可用于接收客户端的数据读写请求，针对所述数据读写请求的处理过程具体可通过以下方式实现：

接收数据读写请求；

具体的，为目标数据库的目标主副本数据库配置路由后，目标主副本数据库(leader节点)可提供数据读写服务；leader节点把请求作为日志条目(log entries)加入到它的日志中，然后并行的向其他follower节点同步日志条目。当这条日志被同步到大多数follower节点上，leader节点将这条日志应用到它的状态机并向客户端返回执行结果。

具体的，本说明书实施例以源数据库中包含3个副本数据库为例进行说明，分布式数据库系统的扩容过程的示意图如图2所示，图2所示的分布式数据库系统中包含四个源数据库，分别为DB1、DB2、DB3和DB4，并以DB2的数据迁移过程为例进行示意性说明，DB1、DB3和DB4的数据迁移过程与DB2的数据迁移过程类似，在此不再赘述。

图2中，源数据库DB2和目标数据库DB2-1中均包含3个副本数据库，在未对目标数据库进行路由配置之前，源数据库中的一个副本数据库为主副本数据库(leader节点)，剩余两个副本数据库为从副本数据库(follower节点)，在获取针对源数据库DB2的数据迁移请求后，创建主副本数据库或任意一个从副本数据库中全量待迁移数据的快照，并通过rsync工具将快照并行迁移至目标数据库的3个副本数据库中；迁移完成后，该数据片raft具有6个副本数据库，其中，源数据库中的3个副本数据库仍是active状态，目标数据库中的3个副本为passive状态；读取源数据库中leader节点的数据迁移日志，并将数据迁移日志增量迁移至目标数据库，增量迁移使用raft-log的同步机制，数据迁移日志通过日志同步链路，由源数据库的副本数据库同步至目标数据库。当目标数据库中任意一个副本数据库的日志位点与源数据库的主副本数据库(leader节点)的位点接近时(位点差值小于100)，由leader节点发起成员变更操作，将源数据库中另外2个follower节点的状态由active切换为passive，将目标数据库的3个副本数据库的状态由passive切换为active，并将3个副本数据库的角色切换为follower节点。

源数据库以及目标数据库中各副本数据库的状态变更后，由leader节点基于所述目标数据库中任意一个副本数据库(follower节点)的标识信息向所述源数据库发起选举，并将所述任意一个副本数据库确定为目标主副本数据库，即由源数据库中主副本数据库主动将leader迁移到目标数据库的任意一个副本数据库上，迁移之后，所述任意一个副本数据库即由follower节点转换为leader节点。

在从3个follower节点中确定目标主副本数据库(新的leader节点)后，根据源数据库的leader节点的路由规则，对目标主副本数据库进行路由配置。

控制器(contoroller)用于管理读写路由，即用于确定待读/写的分片数据具体落在哪个节点上，contoroller用于接收数据读写请求，在有读写请求发送到contoroller后，contoroller进行读写任务分配，所以读写路由的信息只要保存在contoroller上，contoroller均可找到与读写请求相关的副本数据库，因此，当路由切换后，新的leader节点立即发起一次心跳，告知contoroller关于路由切换的结果，contoroller可基于此更新自身的路由信息。

本说明书一个实施例通过获取针对源数据库进行数据迁移的迁移请求，创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库，读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步，在所述数据迁移日志的同步进度满足预设进度阈值的情况下，根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置；

实现了通过快照导出方式将源数据库中的数据全量迁移至目标数据库，另外，以增量同步的方式同步数据迁移日志，在日志同步过程中进行路由切换，一方面，不会阻塞用于增量同步的同步链路，有利于提高日志同步的效率；另一方面，在全量迁移过程中未进行路由切换，因此，在全量迁移过程中可正常进行数据读写，有利于提高数据读写效率。

下述结合附图3，以本说明书提供的数据迁移方法的应用为例，对所述数据迁移方法进行进一步说明。其中，图3示出了本说明书一个实施例提供的一种数据迁移方法的处理过程流程图，具体步骤包括步骤302至步骤316。

步骤302，获取针对源数据库的迁移请求。

步骤304，创建所述源数据库中主副本数据库或任意一个从副本数据库中全量待迁移数据的快照。

步骤306，按照预设迁移方式将所述快照迁移至目标数据库中的至少一个副本数据库。

步骤308，读取所述源数据库的主副本数据中存储的数据迁移日志。

步骤310，基于所述主副本数据库、所述至少一个从副本数据库以及所述至少两个副本数据库建立日志同步链路。

步骤312，按照所述日志同步链路中各个节点的上下游连接关系，向所述目标数据库同步所述数据迁移日志。

具体的，将所述数据迁移日志由所述主副本数据库同步至所述至少一个从副本数据库，并将所述数据迁移日志由所述至少一个从副本数据库同步至所述至少两个副本数据库。

步骤314，判断所述数据迁移日志中同步完成的日志条目数值是否满足预设阈值；若是，则执行步骤316。

具体的，若判断数据迁移日志中同步完成的日志条目数值不满足预设阈值，则继续进行日志同步；若判断数据迁移日志中同步完成的日志条目数值满足预设阈值，则可在日志同步的同时进行路由切换，即将源数据库中主副本数据库的读写路由切换至目标数据库的目标主副本数据库。

步骤316，将所述目标数据库中包含的任意一个副本数据库确定为所述目标主副本数据库，并根据所述主副本数据库的路由规则为所述目标主副本数据库进行路由配置。

本说明书实施例通过快照导出方式将源数据库中的数据全量迁移至目标数据库，另外，以增量同步的方式同步数据迁移日志，在日志同步过程中进行路由切换，一方面，不会阻塞用于增量同步的同步链路，有利于提高日志同步的效率；另一方面，在全量迁移过程中未进行路由切换，因此，在全量迁移过程中可正常进行数据读写，有利于提高数据读写效率。

与上述方法实施例相对应，本说明书还提供了数据迁移装置实施例，图4示出了本说明书一个实施例提供的一种数据迁移装置的示意图。如图4所示，该装置包括：

获取模块402，被配置为获取针对源数据库的迁移请求；

创建模块404，被配置为创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库；

读取模块406，被配置为读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步；

配置模块408，被配置为根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置。

可选地，所述读取模块406，包括：

建立子模块，被配置为基于所述主副本数据库、所述至少一个从副本数据库以及所述至少两个副本数据库建立日志同步链路；

同步子模块，被配置为按照所述日志同步链路中各个节点的上下游连接关系，向所述目标数据库同步所述数据迁移日志。

可选地，所述同步子模块，包括：

第一同步单元，被配置为将所述数据迁移日志由所述主副本数据库同步至所述至少一个从副本数据库；

第二同步单元，被配置为将所述数据迁移日志由所述至少一个从副本数据库同步至所述至少两个副本数据库。

可选地，所述配置模块408，包括：

确定子模块，被配置为将所述目标数据库中包含的任意一个副本数据库确定为所述目标主副本数据库；

配置子模块，被配置为根据所述主副本数据库的路由规则为所述目标主副本数据库进行路由配置。

可选地，所述目标主副本数据库通过以下方式确定：

可选地，所述创建模块404，包括：

创建子模块，被配置为创建所述源数据库的主副本数据库或任意一个从副本数据库中全量待迁移数据的快照；

迁移子模块，被配置为按照预设迁移方式将所述快照迁移至所述目标数据库。

可选地，所述数据迁移装置，还包括：

判断模块，被配置为判断所述数据迁移日志中同步完成的日志条目数值是否满足预设阈值；

若所述判断模块的运行结果为是，则确定所述数据迁移日志的同步进度满足预设进度阈值，执行所述根据所述源数据库中主副本数据库的路由规则为所述目标数据库的目标主副本数据库进行路由配置的步骤。

可选地，所述数据迁移装置，还包括：

接收模块，被配置为接收数据读写请求；

查找模块，被配置为根据所述数据读取请求中的请求数据标识，查找对应的目标主副本数据库；

执行模块，被配置为根据所述目标主副本数据库的数据读写路由规则，对所述目标主副本数据库执行数据读写操作。

上述为本实施例的一种数据迁移装置的示意性方案。需要说明的是，该数据迁移装置的技术方案与上述的数据迁移方法的技术方案属于同一构思，数据迁移装置的技术方案未详细描述的细节内容，均可以参见上述数据迁移方法的技术方案的描述。

图5示出了根据本说明书一个实施例提供的一种计算设备500的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接，数据库550用于保存数据。

计算设备500还包括接入设备540，接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如，网络接口卡(NIC))中的一个或多个，诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口，等等。

在本说明书的一个实施例中，计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图5所示的计算设备结构框图仅仅是出于示例的目的，而不是对本说明书范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备500可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备(例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如，智能手机)、可佩戴的计算设备(例如，智能手表、智能眼镜等)或其他类型的移动设备，或者诸如台式计算机或PC的静止计算设备。计算设备500还可以是移动式或静止式的服务器。

其中，所述存储器510用于存储计算机可执行指令，处理器520用于执行如下计算机可执行指令：

获取针对源数据库进行数据迁移的迁移请求；

创建所述源数据库中数据的快照，并将所述快照迁移至目标数据库；

上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的数据迁移方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述数据迁移方法的技术方案的描述。

本说明书一实施例还提供一种计算机可读存储介质，其存储有计算机指令，该指令被处理器执行时以用于实现所述数据迁移方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的数据迁移方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述数据迁移方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本说明书实施例并不受所描述的动作顺序的限制，因为依据本说明书实施例，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本说明书实施例所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书实施例的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本说明书实施例的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims

一种数据迁移方法，包括：

获取针对源数据库的迁移请求；

创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库；

读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步；

根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置。
根据权利要求1所述的数据迁移方法，所述源数据库由所述主副本数据库以及至少一个从副本数据库组成；所述目标数据库由至少两个副本数据库组成。
根据权利要求2所述的数据迁移方法，所述数据迁移日志通过以下方式向所述目标数据库同步：

基于所述主副本数据库、所述至少一个从副本数据库以及所述至少两个副本数据库建立日志同步链路；

按照所述日志同步链路中各个节点的上下游连接关系，向所述目标数据库同步所述数据迁移日志。
根据权利要求3所述的数据迁移方法，所述按照所述日志同步链路中各个节点的上下游连接关系，向所述目标数据库同步所述数据迁移日志，包括：

将所述数据迁移日志由所述主副本数据库同步至所述至少一个从副本数据库；

将所述数据迁移日志由所述至少一个从副本数据库同步至所述至少两个副本数据库。
根据权利要求2所述的数据迁移方法，所述根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置，包括：

将所述目标数据库中包含的任意一个副本数据库确定为所述目标主副本数据库；

根据所述主副本数据库的路由规则为所述目标主副本数据库进行路由配置。
根据权利要求2所述的数据迁移方法，所述目标主副本数据库通过以下方式确定：

基于所述至少两个副本数据库的标识信息向所述源数据库发起选举；所述选举用于从所述至少两个副本数据库中选举出所述目标主副本数据库；

获取所述主副本数据库以及至少一个从副本数据库提交的投票结果；

对所述投票结果进行统计，将所述至少两个副本数据库中首个获得投票数大于预设阈值的副本数据库确定为所述目标主副本数据库。
根据权利要求1所述的数据迁移方法，所述创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库，包括：

创建所述源数据库的主副本数据库或任意一个从副本数据库中全量待迁移数据的快照；

按照预设迁移方式将所述快照迁移至所述目标数据库。
根据权利要求1所述的数据迁移方法，所述读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步步骤执行之后，所述根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置步骤执行之前，还包括：

判断所述数据迁移日志中同步完成的日志条目数值是否满足预设阈值；

若是，则确定所述数据迁移日志的同步进度满足预设进度阈值，执行所述根据所述源数据库中主副本数据库的路由规则为所述目标数据库的目标主副本数据库进行路由配置的步骤。
根据权利要求1所述的数据迁移方法，所述根据所述源数据库中主副本数据库的路由规则为所述目标数据库的目标主副本数据库进行路由配置步骤执行之后，还包括：

接收数据读写请求；

根据所述数据读取请求中的请求数据标识，查找对应的目标主副本数据库；

根据所述目标主副本数据库的数据读写路由规则，对所述目标主副本数据库执行数据读写操作。
一种数据迁移装置，包括：

获取模块，被配置为获取针对源数据库的迁移请求；

创建模块，被配置为创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库；

读取模块，被配置为读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步；

配置模块，被配置为根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置。
一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令：

获取针对源数据库的迁移请求；

创建所述源数据库中待迁移数据的快照，并将所述快照迁移至目标数据库；

读取所述源数据库的主副本数据库中存储的数据迁移日志，并向所述目标数据库同步；

根据所述主副本数据库的路由规则，对所述目标数据库的目标主副本数据库进行路由配置。
一种计算机可读存储介质，其存储有计算机指令，该指令被处理器执行时实现权利要求1至9任意一项所述数据迁移方法的步骤。