WO2018113580A1

WO2018113580A1 - 一种数据管理方法及服务器

Info

Publication number: WO2018113580A1
Application number: PCT/CN2017/116144
Authority: WO
Inventors: 郭庆南; 李跃森
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2016-12-19
Filing date: 2017-12-14
Publication date: 2018-06-28
Also published as: US20190197027A1; US11500832B2

Abstract

一种数据管理方法及服务器，其中方法包括如下步骤：获取第一业务数据集合中待迁移的基础数据，生成与所述基础数据相同的镜像数据，并将所述基础数据迁移至第二业务数据集合中（S101）；记录所述基础数据的迁移过程中针对所述基础数据所获取的增量数据（S102）；在所述基础数据的迁移过程完成时，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中（S103）；当所述增量数据的迁移过程完成时，清除所述第一业务数据集合中的所述镜像数据和所述增量数据（S104）。

Description

一种数据管理方法及服务器

本申请要求于2016年12月19日提交中国专利局、申请号为201611178078.8、申请名称为“一种数据管理方法及其设备”的中国专利申请的优先权。同时，本申请要求于2016年12月19日提交中国专利局、申请号为201611178079.2、申请名称为“一种数据同步方法以及装置”的中国专利申请的优先权。其全部内容通过引用结合在本申请中。

技术领域

本发明涉及互联网技术领域，尤其涉及一种数据管理方法及服务器。

发明背景

随着互联网技术不断的开发和完善，各种业务数据(例如：交易流水数据、通话记录数据等)的数据量日趋庞大，需要采用后台的数据库系统进行存储。

现有的数据库系统提出了热数据和冷数据的管理方式，即针对具有时效性的业务数据，通过以时间范围为分界线，将近期产生的业务数据(例如：近4个月的业务数据等)和除了近期以外的业务数据(例如：4个月以前的业务数据等)分别进行存储。

发明内容

本发明实施例提供一种数据管理方法及服务器，可以实现在线对业务数据进行迁移，提高对业务数据的查询及修改等数据处理的效率，进而保证业务服务的质量。

本发明实施例第一方面提供了一种数据管理方法，可包括：

获取第一业务数据集合中待迁移的基础数据，生成与所述基础数据相同的镜像数据，并将所述基础数据迁移至第二业务数据集合中；

记录所述基础数据的迁移过程中针对所述基础数据所获取的增量数据；

在所述基础数据的迁移过程完成时，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中；

当所述增量数据的迁移过程完成时，清除所述第一业务数据集合中的所述镜像数据和所述增量数据；

其中，所述第一业务数据集合为预设时间段内存储的当前业务数据集合，所述第二业务数据集合为除所述预设时间段外所存储的历史业务数据集合。

本发明实施例第二方面提供了一种服务器，包括处理器和存储器，所述存储器中存储可被所述处理器执行的指令，当执行所述指令时，所述处理器用于：

本发明实施例第三方面提供了一种计算机可读存储介质，存储有计算机可读指令，可以使至少一个处理器执行如上所述的方法。

附图简要说明

为了更清楚的说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来说，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。其中，

图1是本发明实施例提供的一种数据管理系统的架构图；

图2是本发明实施例提供的一种数据管理方法的流程示意图；

图3是本发明实施例提供的另一种数据管理方法的流程示意图；

图4是本发明实施例提供的又一种数据管理方法的流程示意图；

图5是本发明实施例提供的另一种数据管理方法的流程示意图；

图6是本发明实施例提供的一种数据同步方法的流程示意图；

图7是本发明实施例提供的又一种数据同步方法的流程示意图；

图8是本发明实施例提供的一种服务器的结构示意图；

图9是本发明实施例提供的另一种服务器的结构示意图；

图10是本发明实施例提供的增量数据迁移模块的结构示意图；

图11是本发明实施例提供的又一种服务器的结构示意图；

图12是本发明实施例提供的第一同步单元的结构示意图；

图13是本发明实施例提供的增量数据记录模块的结构示意图；

图14是本发明实施例提供的第二记录单元的结构示意图；

图15是本发明实施例提供的一种服务器的结构示意图。

实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在使用热数据和冷数据的管理方式中，随着时间的推移，当部分热数据需要转换为冷数据时，往往需要对业务服务进行暂停，并对需要转移的热数据进行存储节点的切换以及路由的切换，由于业务服务暂停的时间由需要转移的热数据的数据量所决定，当数据量较大时，容易影响业务服务的质量，降低对业务数据的查询及修改等数据处理的效率。

为了更好理解本发明实施例公开的一种数据管理方法及服务器，下面先对本发明实施例适用的数据管理的架构进行描述。

请参见图1，为本发明实施例提供了一种数据管理系统的架构图。如图1所示，该数据管理系统100可以包括多个协调者节点以及多个数据节点，其中，协调者节点用于对外部用户终端1～N提供接口，接收用户终端发送的对业务数据的查询、修改等数据处理请求，并向数据节点进行分发，以及存储业务数据的存储索引等。多个协调者节点间的位置对等，用户设备可以接入任一协调者节点以对业务数据进行数据处理。所述数据节点用于存储业务数据，并执行协调者节点分发的数据处理请求等。

其中，多个协调者节点以及多个数据节点可以分别置于不同的后台服务设备中，以形成服务设备群组。在本发明实施例中，将多个协调者节点以及多个数据节点组成的设备群组称为服务器。

本发明实施例中，采用热数据和冷数据的方式对具有时效性的业务数据分别进行存储，其中，业务数据具有数据量大，并且随着时间的推移，其被访问的频率逐渐降低的特性，例如：交易流水数据、通话记录数据等。热数据中包括多个数据节点，如图1所示，包括数据节点1和数据节点2等，用于存储近期产生的业务数据(例如：近4个月的业务数据等)。冷数据中同样也包括多个数据节点，如图1所示，包括数据节点3和数据节点4等，用于存储除了近期以外的业务数据(例如：4个月以前的业务数据等)。

可以理解的是，通过对热数据和冷数据分别进行存储，可以以时间范围为分界线，分别定义用户频繁访问的数据以及非频繁访问的数据，随着时间的推移，需要定期将超过时间范围的热数据转移至冷数据中进行存储。

根据本发明实施例提供的方法，预设一个时间段，将预设时间段内存储的当前业务数据集合(即热数据)定义为第一业务数据集合，将除所述预设时间段外所存储的历史业务数据集合(即冷数据)定义为第二业务数据集合。在将热数据转移至冷数据时，首先，将基础数据迁移至第二业务数据集合中(见110)；然后，记录基础数据的迁移过程中针对基础数据所获取的增量数据；在基础数据的迁移过程完成时，将增量数据迁移至第二业务数据集合中(见120)。

所述用户终端可以包括：平板电脑、智能手机、笔记本电脑、掌上电脑、个人计算机以及移动互联网设备(MID)等终端设备。

基于图1所示的系统架构，下面将结合附图2-附图7，对本发明实施例提供的数据管理方法进行详细介绍。

请参见图2，为本发明实施例提供了一种数据管理方法的流程示意图。如图2所示，本发明实施例的所述方法，应用于服务器，可以包括以下步骤S101-步骤S104。

S101，获取第一业务数据集合中待迁移的基础数据，生成与所述基础数据相同的镜像数据，并将所述基础数据迁移至第二业务数据集合中。

具体的，服务器可以获取第一业务数据集合中待迁移的基础数据，可以理解的是，所述第一业务数据集合为预设时间段内存储的当前业务数据集合，即上述热数据，所述基础数据为随着时间推移在所述预设时间段外的需要从所述第一业务数据集合转移至第二业务数据集合的业务数据，或者所述基础数据为基于管理人员对预设时间段进行修改(例如：从近4个月修改为近3个月等)所形成的前后时间差中存在的业务数据，所述第二业务数据集合为除所述预设时间段外所存储的历史业务数据集合，即上述冷数据。所述服务器具体为包括多个协调者节点以及多个数据节点的后台服务设备群组。

所述服务器可以生成与所述基础数据相同的镜像数据，例如：采用数据快照的方式生成与所述基础数据相同的镜像数据等，所述服务器将所述基础数据迁移至所述第二业务数据中。

S102，记录所述基础数据的迁移过程中针对所述基础数据所获取的增量数据。

具体的，所述服务器可以在所述基础数据从所述第一业务数据集合迁移至所述第二业务数据集合的迁移过程中，记录针对所述基础数据所获取的增量数据，需要说明的是，所述增量数据为在所述基础数据的迁移过程中，需要对所述基础数据进行数据插入、更新等操作的数据。

S103，在所述基础数据的迁移过程完成时，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中。

具体的，在所述基础数据的迁移过程完成时，即所述基础数据已经迁移至所述第二业务数据集合中时，所述服务器可以采用所述增量数据对所述镜像数据进行添加处理，将对所述基础数据的数据插入、更新等操作的数据添加至所述镜像数据中，同时，所述服务器还需要将所述增量数据迁移至所述第二业务数据集合中，对所述基础数据进行数据插入、更新等操作。

S104，当所述增量数据的迁移过程完成时，清除所述第一业务数据集合中的所述镜像数据和所述增量数据。

具体的，当所述增量数据的迁移过程完成时，所述服务器可以更新所述基础数据和所述增量数据的路由信息，即将所述基础数据和所述增量数据的路由信息由所述第一业务数据集合转换为所述第二业务数据集合，后续用户终端发起的对所述基础数据和所述增量数据的查询、插入、删除、更新等均分配至所述第二业务数据集合中执行，所述服务器同时清除所述第一业务数据集合中的所述镜像数据以及所述第一业务数据集合中的所述增量数据。

在本发明实施例中，在对第一业务数据集合中的基础数据进行迁移时，通过生成并保留基础数据的镜像数据，先将基础数据迁移至第二业务数据集合中，并记录基础数据迁移过程中针对基础数据的增量数据，在基础数据迁移完成时，再进行增量数据的迁移，直至增量数据迁移完成后，清除第一业务数据集合中的镜像数据和所述增量数据，实现了在线对业务数据进行迁移的过程，提高了对业务数据的查询及修改等数据处理的效率，进而保证了业务服务的质量。

请参见图3，为本发明实施例提供了另一种数据管理方法的流程示意图。如图3所示，本发明实施例的所述方法可以包括一下步骤S201-步骤S207。

S201，将属于预设时间段内的业务数据存储至第一业务数据集合中，将属于所述预设时间段外的业务数据存储至第二业务数据集合中。

具体的，服务器可以将属于预设时间段内的业务数据存储至第一业务数据集合中，并将属于所述预设时间段外的业务数据存储至第二业务数据集合中，可以理解的是，所述第一业务数据集合为预设时间段内存储的当前业务数据集合，即上述热数据；所述第二业务数据集合为除所述预设时间段外所存储的历史业务数据集合，即上述冷数据。所述服务器具体为包括多个协调者节点以及多个数据节点的后台服务设备群组。

S202，获取第一业务数据集合中待迁移的基础数据，生成与所述基础数据相同的镜像数据，并将所述基础数据迁移至第二业务数据集合中。

具体的，所述服务器可以获取第一业务数据集合中待迁移的基础数据，可以理解的是，所述基础数据为随着时间推移在所述预设时间段外的需要从所述第一业务数据集合转移至第二业务数据集合的业务数据，或者所述基础数据为基于管理人员对预设时间段进行修改(例如：从近4个月修改为近3个月等)所形成的前后时间差中存在的业务数据，所述服务器可以生成与所述基础数据相同的镜像数据，例如：采用数据快照的方式生成与所述基础数据相同的镜像数据等，所述服务器将所述基础数据迁移至所述第二业务数据中。

S203，记录所述基础数据的迁移过程中针对所述基础数据所获取的第一增量数据。

具体的，考虑到迁移的所述基础数据的数据量较大，所述基础数据的迁移过程同样需要较长的时间，此时在所述基础数据的迁移过程中所产生的所述增量数据的数据量同样较大，因此需要循环对不断产生的增量数据进行后续的迁移处理，优选的，所述服务器记录所述基础数据的迁移过程中针对所述基础数据所获取的第一增量数据，所述第一增量数据用于表示在对所述基础数据进行迁移的过程中所产生的针对所述基础数据的增量数据。

S204，将所述第一增量数据作为增量数据，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中，记录所述增量数据的迁移过程中针对所述基础数据和所述增量数据所获取的第二增量数据，将所述第二增量数据作为增量数据，重复执行本步骤，直至所述第二增量数据的数据量小于预设数据量阈值。

具体的，所述服务器可以将所述第一增量数据作为增量数据，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中，记录所述增量数据的迁移过程中针对所述基础数据和所述增量数据所获取的第二增量数据，将所述第二增量数据作为增量数据，重复执行本步骤，直至所述第二增量数据的数据量小于预设数据量阈值，可以理解的是，所述第二增量数据为用于表示在对所述第一增量数据进行迁移的过程中所产生的针对所述基础数据和所述第一增量数据的增量数据。所述预设数据量阈值可以由维护人员根据经验值进行设定，以保证所述第二增量数据在迁移过程中对用户终端请求执行的插入、更新等操作的影响可以忽略不计。

例如：假设所述第一增量数据的数据量为1TB，将所述第一增量数据迁移至所述第二业务数据集合需要8小时，在这8小时过程中产生的第二增量数据的数据量为0.5TB，将该第二增量数据迁移至所述第二业务数据集合需要4小时，以此循环，直至产生的第二增量数据的数据量为36MB时，此时所需的迁移时间大概为1秒，因此当所述第二增量数据的数据量所需的迁移时间非常短时，可以进一步采用双写操作的方式进行处理，无需再次记录所述第二增量数据迁移至所述第二业务数据集合时所产生的增量数据。

S205，当所述第二增量数据的数据量小于预设数据量阈值时，采用所述第二增量数据同时对所述第一业务数据集合中的所述镜像数据、所述增量数据，以及所述第二业务数据集合中的所述基础数据、所述增量数据进行修改处理，并获取修改处理结果。

具体的，针对上述双写操作，当所述第二增量数据的数据量小于预设数据量阈值时，所述服务器可以采用所述第二增量数据同时对所述第一业务数据集合中的所述镜像数据、所述增量数据，以及所述第二业务数据集合中的所述基础数据、所述增量数据进行修改处理，即采用所述第二增量数据对所述第一业务数据集合中的所述镜像数据和所述增量数据进行数据插入、更新等操作，同时，采用所述第二增量数据对所述第二业务数据集合中的所述基础数据和所述增量数据进行数据插入、更新等操作，通过采用双写操作的方式，实现了在增量数据不影响对用户终端请求执行的插入、更新等操作的基础上，实时同步完成剩余业务数据的迁移以及对业务数据的修改过程，并可以对第一业务数据集合及第二业务数据集合中的业务数据进行进一步的校验，以保证业务数据在迁移过程中的一致性，当发现业务数据不一致时，所述服务器可以关闭双写操作并进行数据回滚，此时由于业务数据的路由信息并未发生改变，实现无成本的数据回滚。

S206，当所述修改处理结果为修改处理成功时，确定所述增量数据的迁移过程完成。

具体的，当所述修改处理结果为修改处理成功时，所述服务器确定所述增量数据的迁移过程完成。

特殊的，在基础数据迁移的过程中，以及在增量数据迁移的过程中，当存在用户终端对基础数据或增量数据的查询请求时，所述服务器均将所述查询请求分配至所述第一业务数据集合中，并将查询结果返回至所述用户终端。

S207，当所述增量数据的迁移过程完成时，清除所述第一业务数据集合中的所述镜像数据和所述增量数据。

在本发明实施例中，所述服务器中的多个数据节点可以随着业务数据的数据量进行节点个数的调节，所述服务器可以基于业务要求对第二业务数据集合中满足删除条件的业务数据进行清除，优选的，所述业务要求可以为预设的删除时间阈值，例如：针对历史10年或10年以上的业务数据等，所述服务器可以将所述第二业务数据集合中满足删除时间阈值的业务数据进行清除，同时，清除后的数据节点可以等待再次使用，实现了对数据节点的动态调配。

在本发明实施例中，在对第一业务数据集合中的基础数据进行迁移时，通过生成并保留基础数据的镜像数据，先将基础数据迁移至第二业务数据集合中，并记录基础数据迁移过程中针对基础数据的增量数据，在基础数据迁移完成时，再进行增量数据的迁移，直至增量数据迁移完成后，清除第一业务数据集合中的镜像数据和所述增量数据，实现了在线对业务数据进行迁移的过程，提高了对业务数据的查询及修改等数据处理的效率，进而保证了业务服务的质量；通过循环记录增量数据并进行迁移的方式，进一步实现了在线对业务数据进行迁移的过程，降低对业务数据进行插入、更新等操作的影响；通过采用双写操作的方式，实现了在增量数据不影响对用户终端请求执行的插入、更新等操作的基础上，实时同步完成剩余业务数据的迁移以及对业务数据的修改过程，并可以对第一业务数据集合及第二业务数据集合中的业务数据进行进一步的校验，以保证业务数据在迁移过程中的一致性；通过采用删除时间阈值的方式对数据节点进行动态调配，在存储空间不足时，无需替换数据节点的存储容量的硬件设备，降低硬件成本。

请参见图4，为本发明实施例提供了又一种数据管理方法的流程示意图。如图4所示，本发明实施例的所述方法可以包括以下步骤S301-步骤S308。

S301，获取第一业务数据集合中待迁移的基础数据，生成与所述基础数据相同的镜像数据，并将所述基础数据迁移至第二业务数据集合中。

S302，记录所述基础数据的迁移过程中针对所述基础数据所获取的增量数据。

S303，在所述基础数据的迁移过程完成时，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中。

S304，当所述增量数据的迁移过程完成时，清除所述第一业务数据集合中的所述镜像数据和所述增量数据。

S305，当检测到用户终端发送的携带有时间范围的业务数据查询请求时，检测所述时间范围是否属于所述预设时间段。

具体的，当检测到用户终端发送的携带有时间范围的业务数据查询请求时，所述服务器可以进一步检测所述时间范围是否属于所述预设时间段，若是，则转入执行步骤S306；若否，则转入执行步骤S307。

S306，将所述第一业务数据集合中属于所述预设时间段且属于所述时间范围的业务数据返回至所述用户终端。

具体的，当所述服务器检测到所述时间范围属于所述预设时间段时，所述服务器可以将所述第一业务数据集合中属于所述预设时间段且属于所述时间范围的业务数据返回至所述用户终端。

S307，将所述第二业务数据集合中不属于所述预设时间段但属于所述时间范围的业务数据返回至所述用户终端。

具体的，当所述服务器检测到所述时间范围不属于所述预设时间段时，所述服务器可以将所述第二业务数据集合中不属于所述预设时间段但属于所述时间范围的业务数据返回至所述用户终端。

S308，当检测到用户终端发送的未携带有时间范围的业务数据查询请求时，将所述第一业务数据集合中属于所述预设时间段的第一业务数据，以及所述第二业务数据集合中不属于所述预设时间段的第二业务数据返回至所述用户终端。

具体的，当检测到用户终端发送的未携带有时间范围的业务数据查询请求时，所述服务器可以将所述第一业务数据集合中属于所述预设时间段的第一业务数据，以及所述第二业务数据集合中不属于所述预设时间段的第二业务数据返回至所述用户终端。

需要说明的是，上述查询过程中，考虑到业务数据在存储的过程中存在错误插入的情况，即原本属于第一业务数据集合的业务数据被存储至第二业务数据集合中，而原本数据第二业务数据集合的业务数据被存储至第一业务数据集合中，因此当存在此类业务数据时，所述服务器可以不将此类业务数据返回至所述用户终端，以保护数据访问的一致性。

可以理解的是，本发明实施例的步骤S305-步骤S308执行的业务数据查询过程可以不遵循本发明实施例的执行流程，即用户终端可以在任意时间发起业务数据的查询流程。

其中，本发明实施例的步骤S301-步骤S304可以参见图2和图3所示实施例的具体描述，在此不进行赘述。

在本发明实施例中，在对第一业务数据集合中的基础数据进行迁移时，通过生成并保留基础数据的镜像数据，先将基础数据迁移至第二业务数据集合中，并记录基础数据迁移过程中针对基础数据的增量数据，在基础数据迁移完成时，再进行增量数据的迁移，直至增量数据迁移完成后，清除第一业务数据集合中的镜像数据和所述增量数据，实现了在线对业务数据进行迁移的过程，提高了对业务数据的查询及修改等数据处理的效率，进而保证了业务服务的质量；考虑到业务数据在存储的过程中存在错误插入的情况，可以不将错误插入的业务数据返回至用户终端，以保护数据访问的一致性。

针对附图2中对增量数据的记录和迁移操作，目前使用的PostgreSQL(对象-关系数据库管理系统)数据库，通常是通过日志的方式记录由各种数据处理业务对数据库的修改所生成的增量数据，进而再将增量数据迁移(或者同步)到其他的数据库，即目前的数据库的增量数据的同步方法需要通过日志来实现。而日志与数据库的版本之间是强相关的，因此，对于两个版本不同的数据库是无法通过日志实现增量数据的同步。而且目前的数据库的增量数据的同步方法都是基于单个进程实现的，即需要通过单个进程将所有增量数据同步到其他的数据库，例如，在大并发写入的情况下，增量数据会产生的比较快，因此，基于单个进程的同步方法将会大大降低增量数据的同步效率。

为了解决上述技术问题，图5是本发明实施例提供的另一种数据管理方法的流程示意图。如图5所示，本发明实施例的所述方法可以包括以下步骤S501-步骤S506。

S501，获取第一业务数据集合中待迁移的基础数据，生成与所述基础数据相同的镜像数据，并将所述基础数据迁移至第二业务数据集合中。

此步骤可参照上述步骤101的描述，在此不再赘述。

S502，在所述基础数据的迁移过程中，获取数据操作指令，根据所述数据操作指令针对所述基础数据执行数据处理业务，并记录基于所述数据处理业务所生成的总增量数据；所述总增量数据为基于逻辑语句的增量数据。

通过该步骤，实现了记录所述基础数据的迁移过程中针对所述基础数据所获取的增量数据。为了和后续的表增量数据进行区分，此处将增量数据称为总增量数据。

具体的，服务器可以获取用户设备发送的数据操作指令，所述数据操作指令可以包括数据新增指令、数据删除指令、数据修改指令等等，所述服务器可以进一步根据所述数据操作指令执行数据处理业务，所述数据处理业务可以包括对上述第一业务数据集合中的基础数据(为了描述方便，将这些基础数据的集合称为源数据库)进行数据新增业务、数据删除业务、数据修改业务等等。例如，若所述数据操作指令为数据删除指令，则所述服务器根据所述数据删除指令对相应的源数据库中的部分数据进行删除。

其中，所述服务器所记录的所述总增量数据为基于逻辑语句的增量数据，具体可以为基于SQL(Structured Query Language，结构化查询语言)语句的增量数据。所述服务器可以将数据库中的各数据表中的各行数据所涉及到的修改操作、删除操作以及新增操作都分别记录为一条SQL语句，同时还记录SQL语句涉及到的数据表信息或数据库信息，进而将所记录的SQL语句和所涉及到的数据表信息或数据库信息确定为总增量数据。由于SQL语句在不同版本的数据库中都是通用的，所以基于SQL语句的增量数据可以在不同版本的数据库之间进行同步。

S503，在所述基础数据的迁移过程完成时，采用所述总增量数据对所述镜像数据进行添加处理。

此步骤可参照上述步骤103的描述，在此不再赘述。

S504，查找所述总增量数据所关联的至少一个第一数据表；各第一数据表均包括对应的表增量数据；所述各第一数据表分别对应的表增量数据的总和为所述总增量数据。

具体的，所述服务器记录所述总增量数据后，可以进一步检测所述数据处理业务的执行状态，若所述数据处理业务的执行状态为数据回滚状态，则删除所记录的所述总增量数据。若所述数据处理业务的执行状态为成功执行状态，说明所述数据处理业务顺利提交，进而可以查找所述总增量数据所关联的至少一个第一数据表。其中，各第一数据表均包括对应的表增量数据；所述各第一数据表分别对应的表增量数据的总和为所述总增量数据。其中，若所述数据记录范围为所述至少一个第二数据表，则所述至少一个第二数据表包含所述至少一个第一数据表。

例如，有5个第二数据表，其中有4个第二数据表中包含增量数据(即表增量数据)，则可以将这4个包含增量数据的数据表确定为与所述总增量数据相关联的第一数据表。

例如，所述服务器记录源数据库中基于所述数据处理业务所生成的总增量数据，所述数据处理业务对应的执行操作涉及到所述源数据库中的5个数据表，则可以将这5个数据表确定为所述总增量数据所关联的第一数据表，每个第一数据表中所生成的增量数据为表增量数据，这5个第一数据表分别对应的表增量数据的总和即为所述总增量数据。

又例如，若所述数据记录范围包括数据表A、数据表B以及数据表 C，且所述数据处理业务只涉及到数据表A和数据表B，即只有数据表A和数据表B包含表增量数据，则所述服务器可以将数据表A和数据表B确定为所述总增量数据所关联的第一数据表，数据表A和数据表B分别对应的表增量数据的总和即为所述总增量数据。

S505，将所述各第一数据表中的表增量数据并行同步至所述第二业务数据集合。

通过该步骤，实现了将所述总增量数据迁移至所述第二业务数据集合中，即迁移是一种并行同步的过程。

具体的，所述服务器可以根据第一数据表进行SQL分发，使得同一张第一数据表中的所有基于SQL语句的增量数据(即表增量数据)都由同一个进程进行同步，进而对不同的第一数据表中的表增量数据分别使用不同的进程进行同步，因此，不仅可以保证第一数据表中的数据的一致性，也可以实现将所述各第一数据表中的表增量数据并行同步至所述第二业务数据集合。

例如，所述服务器中存在第一数据表A、第一数据表B以及第一数据表C，第一数据表A包括表增量数据a，第一数据表B包括表增量数据b，第一数据表C包括表增量数据c，则所述服务器可以通过第一个进程将表增量数据a同步至所述第二业务数据集合，并通过第二个进程将表增量数据b同步至所述第二业务数据集合，并通过第三个进程将表增量数据c同步至所述第二业务数据集合，即实现了对表增量数据a、表增量数据b、表增量数据c进行并行同步。

基于数据表进行并行同步的方法相比于使用一个进程对所有增量数据进行单进程同步的方法，可以大大减少同步时间，即可以提高增量数据的同步效率。

S506，当所述表增量数据的同步过程完成时，清除所述第一业务数据集合中的所述镜像数据和所述总增量数据。

此步骤可参照上述步骤104的描述，在此不再赘述。

在上述实施例中，由于总增量数据为基于逻辑语句的增量数据，且基于逻辑语句的增量数据可以在各种版本的数据库中使用，所以本发明实施例可以在不同版本的数据库之间进行增量数据的同步；而且通过多进程分别对各表增量数据进行并行同步，可以有效提高同步效率。

针对上述实施例中步骤502记录总增量数据、步骤504和步骤505的同步操作，图6是本发明实施例提供的一种数据同步方法的流程示意图，所述方法可以包括：

S601，获取数据操作指令，根据所述数据操作指令针对所述基础数据执行数据处理业务，并设置与所述数据处理业务对应的数据记录范围。

具体的，所述服务器在执行所述数据处理业务的同时，还可以进一步设置与所述数据处理业务对应的数据记录范围，具体可以根据当前的业务需求设置所述数据记录范围，例如，当前业务需求为需要对数据表A和数据表B中被修改的数据进行同步，则可以设置所述数据记录范围为数据表A和数据表B，即后续只在数据表A和数据表B中记录基于所述数据处理业务所生成的总增量数据；若当前需要对整个源数据库(即包括第一业务数据集合中的基础数据)中被修改的基础数据进行同步，则可以设置所述数据记录范围为该源数据库，即后续可以在该源数据库中记录基于所述数据处理业务所生成的总增量数据。

若所述数据记录范围为源数据库，可以先判断所述数据处理业务对应的修改数据(或删除数据或新增数据)是否属于所述源数据库，若属于，则可以记录该修改数据(或删除数据或新增数据)对应的增量数据，否则不记录所对应的增量数据，即所述服务器只在源数据库中记录基于所述数据处理业务所生成的总增量数据。通过设置与所述数据处理业务对应的数据记录范围，可以选择性的记录指定的数据表或数据库中的增量数据，从而可以解决日志中将无需关注的数据表或数据库对应的修改也一并记录下来的问题，因此，本发明实施例可以更灵活地选择所需记录的增量数据，不仅可以提高同步效率也可以节省服务器的存储资源。

可选的，所述服务器在步骤S601之前，可以先检测当前是否存在正在执行的数据处理业务，若存在，则可以等待正在执行的数据处理业务执行完后，再执行S601步骤，以保证所记录的总增量数据是完整的数据处理业务的增量数据，以便于在同步所述总增量数据时可以保证所同步的数据处理业务的完整性。

S602，若所述数据记录范围为至少一个第二数据表，则在所述至少一个第二数据表中记录基于所述数据处理业务所生成的总增量数据。

具体的，若所述数据记录范围为至少一个第二数据表，可以先判断所述数据处理业务对应的修改数据(或删除数据或新增数据)是否属于所述至少一个第二数据表，若属于，则可以记录该修改数据(或删除数据或新增数据)对应的增量数据，否则不记录所对应的增量数据，即只在所述至少一个第二数据表中记录基于所述数据处理业务所生成的总增量数据。例如，若4个第二数据表，所述数据处理业务为数据删除业务，则所述服务器只需记录这4个第二数据表中的每一条数据删除操作、各数据删除操作分别对应的操作序号和第二数据表信息，并将所记录的每一条数据删除操作、各数据删除操作分别对应的操作序号和第二数据表信息确定为总增量数据。

其中，所述服务器所记录的所述总增量数据为基于逻辑语句的增量数据，具体可以为基于SQL语句的增量数据。所述服务器可以将数据库中的各数据表中的各行数据所涉及到的修改操作、删除操作以及新增操作都分别记录为一条SQL语句，同时还记录SQL语句涉及到的数据表信息或数据库信息，进而将所记录的SQL语句和所涉及到的数据表信息或数据库信息确定为总增量数据。由于SQL语句在不同版本的数据库中都是通用的，所以基于SQL语句的增量数据可以在不同版本的数据库之间进行同步。

S603，若所述数据记录范围为所述基础数据，则在所述基础数据中记录基于所述数据处理业务所生成的总增量数据。

具体的，若所述数据记录范围为所述基础数据(称其为源数据库)，可以先判断所述数据处理业务对应的修改数据(或删除数据或新增数据)是否属于所述源数据库，若属于，则可以记录该修改数据(或删除数据或新增数据)对应的增量数据，否则不记录所对应的增量数据，即所述服务器只在源数据库中记录基于所述数据处理业务所生成的总增量数据。例如，若所述服务器中包括5个数据库，其中一个为源数据库，且所述数据处理业务为数据修改业务，则所述服务器只需记录该源数据库中的每一条数据修改操作、各数据修改操作所修改的数据、各数据修改操作分别对应的操作序号和数据表信息，并将所记录的每一条数据修改操作、各数据修改操作所修改的数据、各数据修改操作分别对应的操作序号和数据表信息确定为总增量数据。

可选的，若所述数据处理业务同时包括数据删除业务和数据修改业务，则所记录到的总增量数据即包括数据删除部分也包括数据修改部分。通过确定所述数据处理业务对应的数据记录范围，可以选择性的记录指定的数据表或数据库中的增量数据，从而可以解决日志中将无需关注的数据表或数据库对应的修改也一并记录下来的问题，因此，本发明实施例可以更灵活地选择所需记录的增量数据，不仅可以提高同步效率也可以节省服务器的存储资源。

其中，S603中的所述总增量数据也是基于SQL语句的增量数据。

S604，检测所述数据处理业务的执行状态。

S605，若所述数据处理业务的执行状态为数据回滚状态，则删除所记录的所述总增量数据。

具体的，所述服务器记录所述总增量数据后，可以进一步检测所述数据处理业务的执行状态，若所述数据处理业务的执行状态为数据回滚状态，说明所述数据处理业务所修改(或删除或新增)的数据并没有落地，因此，可以删除所记录的所述总增量数据。

S606，若所述数据处理业务的执行状态为成功执行状态，则查找所述总增量数据所关联的至少一个第一数据表。

具体的，若所述数据处理业务的执行状态为成功执行状态，说明所述数据处理业务顺利提交，进而可以查找所述总增量数据所关联的至少一个第一数据表。其中，若所述数据记录范围为所述源数据库，则具体可以在所述源数据库中查找所述数据处理业务在哪些数据表中进行了数据的修改(或删除或新增)，所查找出的这些数据表即为与所述总增量数据关联的第一数据表。其中，若所述数据记录范围为所述至少一个第二数据表，则所述至少一个第二数据表包含所述至少一个第一数据表，例如，有5个第二数据表，其中有4个第二数据表中包含增量数据(即表增量数据)，则可以将这4个包含增量数据的数据表确定为与所述总增量数据相关联的第一数据表。

其中，各第一数据表均包括对应的表增量数据；所述各第一数据表分别对应的表增量数据的总和为所述总增量数据。例如，所述服务器记录源数据库中基于所述数据处理业务所生成的总增量数据，所述数据处理业务对应的执行操作涉及到所述源数据库中的5个数据表，则可以将这5个数据表确定为所述总增量数据所关联的第一数据表，每个第一数据表中所生成的增量数据为表增量数据，这5个第一数据表分别对应的表增量数据的总和即为所述总增量数据。又例如，若所述数据记录范围包括数据表A、数据表B以及数据表C，且所述数据处理业务只涉及到数据表A和数据表B，即只有数据表A和数据表B包含表增量数据，则所述服务器可以将数据表A和数据表B确定为所述总增量数据所关联的第一数据表，数据表A和数据表B分别对应的表增量数据的总和即为所述总增量数据。

S607，判断所述至少一个第一数据表中是否存在包含主关键字的第一数据表。

具体的，所述主关键字为Primary Key，且Primary Key的值在第一数据表中是唯一的，且第一数据表中每行数据分别对应的Primary Key均是填写在该第一数据表中的其中一列。

S608，将所述各第一数据表中的表增量数据并行同步至所述第二业务数据集合。

具体的，若S607判断为否，即所述至少一个第一数据表中不存在包含主关键字的第一数据表，则所述服务器可以根据第一数据表进行SQL分发，使得同一张第一数据表中的所有基于SQL语句的增量数据(即表增量数据)都由同一个进程进行同步，进而对不同的第一数据表中的表增量数据则由不同的进程进行同步，因此，不仅可以保证第一数据表中的数据的一致性，也可以实现将所述各第一数据表中的表增量数据并行同步至第二业务数据集合(称其为目标数据库)。例如，所述服务器中存在第一数据表A、第一数据表B以及第一数据表C，第一数据表A包括表增量数据a，第一数据表B包括表增量数据b，第一数据表C包括表增量数据c，则所述服务器可以通过第一个进程将表增量数据a同步至目标数据库，并通过第二个进程将表增量数据b同步至目标数据库，并通过第三个进程将表增量数据c同步至目标数据库，即实现了对表增量数据a、表增量数据b、表增量数据c进行并行同步。基于数据表进行并行同步的方法相比于使用一个进程对所有增量数据进行单进程同步的方法，可以大大减少同步时间，即可以提高增量数据的同步效率。

S609，将不包含所述主关键字的第一数据表中的表增量数据并行同步至所述第二业务数据集合，并查找与包含所述主关键字的第一数据表对应的表增量数据所关联的至少一个目标行数据，将所述各目标行数据分别对应的行增量数据并行同步至所述第二业务数据集合。

具体的，若S607判断为是，即所述至少一个第一数据表中存在包含主关键字的第一数据表，则所述服务器可以对不包含主关键字的第一数据表进行基于表增量数据的并行同步，具体过程可以一并参见S505步骤，这里不再进行赘述。

所述服务器对于包含主关键字的第一数据表，可以先查找与包含所述主关键字的第一数据表对应的表增量数据所关联的至少一个目标行数据，所述第一数据表中各目标行数据分别对应的行增量数据的总和为该第一数据表对应的表增量数据。例如，所述数据处理业务所执行的操作涉及到第一数据表中的其中10行数据，那么这10行数据即为与该第一数据表对应的表增量数据所关联的目标行数据，这10行数据分别对应的增量数据(即行增量数据)的总和即为该第一数据表对应的表增量数据。所述服务器再进一步根据目标行数据进行SQL分发，由于目标行数据对应的行增量数据可以包含Primary Key，所以可以将含有相同Primary Key的行增量数据(可以为两张或更多的第一数据表中的含有相同Primary Key的行增量数据)都通过同一个进程进行同步，进而对含有不同Primary Key的行增量数据分别使用不同的进程进行同步。由于一张第一数据表中的Primary Key各不相同，并且不会重复，所以基于 Primary Key对行增量数据进行并行同步的方法不仅可以保证第一数据表中的数据的一致性，也可以具备比基于第一数据表的表增量数据进行并行同步更高的同步效率。例如，所述服务器中的第一数据表含有Primary Key，且该第一数据表中的目标行数据包括行数据A、行数据B以及行数据C，行数据A包括行增量数据a，行数据B包括行增量数据b，行数据C包括行增量数据c，则所述服务器可以通过第一个进程将行增量数据a同步至目标数据库，并通过第二个进程将行增量数据b同步至目标数据库，并通过第三个进程将行增量数据c同步至目标数据库，即实现了对行增量数据a、行增量数据b、行增量数据c进行并行同步。

本发明实施例通过获取数据操作指令，根据数据操作指令执行数据处理业务，并记录基于数据处理业务所生成的总增量数据，可以查找总增量数据所关联的至少一个第一数据表，并将各第一数据表中的表增量数据并行同步至目标数据库。由于总增量数据为基于逻辑语句的增量数据，且基于逻辑语句的增量数据可以在各种版本的数据库中使用，所以本发明实施例可以在不同版本的数据库之间进行增量数据的同步；而且通过确定所述数据处理业务对应的数据记录范围，可以选择性的记录指定的数据表或数据库中的增量数据，因此，不仅可以提高同步效率也可以节省服务器的存储资源；而且通过多进程分别对各表增量数据进行并行同步，可以有效提高同步效率；而且当数据表中包含主关键字时，还可以进一步对包含主关键字的数据表对应的表增量数据进行基于行增量数据的并行同步，以进一步提高同步效率。

图7是本发明实施例提供的又一种数据同步方法的流程示意图，所述方法可以包括：

S701，记录接收到后台业务指令对应的起始时间戳，将所述基础数据中处于所述起始时间戳的全量数据确定为待同步全量数据，并根据所述后台业务指令将所述待同步全量数据同步至所述第二业务数据集合。

具体的，所述后台业务指令为在线升级指令或数据搬迁指令。当所述服务器接收到所述后台业务指令时，可以记录接收到所述后台业务指令对应的起始时间戳，若所述后台业务指令为在线升级指令，则所述服务器可以新建一个最新版本的数据库作为目标数据库用于表示第二业务数据集合，并将所述源数据库(即包括所述基础数据的数据库)中处于所述起始时间戳的全量数据(全量数据即为所述源数据库中的所有数据，且假设所述服务器处于所述起始时间戳的时刻没有正在执行的数据处理业务)确定为待同步全量数据，并根据所述后台业务指令将所述待同步全量数据同步至目标数据库。若所述后台业务指令为数据搬迁指令，则所述服务器可以将当前已有的数据库或新建的数据库或其他服务器中的数据库作为目标数据库，且目标数据库的版本与源数据库的版本可以相同或不同。

可选的，若处于所述起始时间戳的所述服务器中存在正在执行的数据处理业务，且该数据处理业务对第一部分数据进行操作，对第二部分数据没有进行操作，则所述服务器可以先将第二部分数据同步至所述目标数据库，且当该数据处理业务执行完后，可以将执行完该数据处理业务后所得到的更新后的第一部分数据再同步到所述目标数据库。

S702，获取数据操作指令，根据所述数据操作指令针对所述基础数据执行数据处理业务，并设置与所述数据处理业务对应的数据记录范围。

S703，在所述基础数据中记录基于所述数据处理业务所生成的增量数据。

具体的，若所述服务器是将所述待同步全量数据同步至所述目标数据库，则所述服务器可以从所述起始时间戳开始，实时获取数据操作指令，并根据所述数据操作指令执行数据处理业务，此时可以设置所述数据记录范围为所述源数据库，进而可以在所述源数据库中记录基于所述数据处理业务所生成的增量数据。

可选的，若所述服务器是将所述第二部分数据同步至所述目标数据库，则所述服务器可以从所述起始时间戳开始，实时获取数据操作指令，并根据所述数据操作指令执行数据处理业务，此时可以设置所述数据记录范围为所述第二部分数据所涉及到数据表，以作为至少一个第二数据表，进而可以在所述至少一个第二数据表中记录基于所述数据处理业务所生成的增量数据。当开始同步所述更新后的第一部分数据时，所述服务器可以重新设置所述数据记录范围为所述源数据库，进而开始在所述源数据库中记录基于所述数据处理业务所生成的增量数据。

S704，判断所述待同步全量数据是否已全部同步至所述第二业务数据集合。

S705，将完成所述数据处理业务的时刻确定为结束时间戳，并将所述起始时间戳到所述结束时间戳之间所记录到的所有增量数据确定为总增量数据。

具体的，若S704判断为是，说明在线升级已完成或数据搬迁已完成，此时，若所述服务器中的所述数据处理业务已完成，则停止记录增量数据，若所述数据处理业务仍未完成，则可以等到完成所述数据处理业务时再停止记录增量数据。所述服务器可以进一步将完成所述数据处理业务的时刻确定为结束时间戳，并将所述起始时间戳到所述结束时间戳之间所记录到的所有增量数据确定为总增量数据。若S704判断为否，说明在线升级还未完成或数据搬迁还未完成，因此，所述服务器将继续执行S703步骤，以进一步记录新的增量数据。

S706，检测所述数据处理业务的执行状态。

S707，若所述数据处理业务的执行状态为数据回滚状态，则删除所记录的所述总增量数据。

S708，若所述数据处理业务的执行状态为成功执行状态，则查找所述总增量数据所关联的至少一个第一数据表；各第一数据表均包括对应的表增量数据；所述各第一数据表分别对应的表增量数据的总和为所述总增量数据。

S709，判断所述至少一个第一数据表中是否存在包含主关键字的第一数据表。

S710，将所述各第一数据表中的表增量数据并行同步至所述第二业务数据集合。

具体的，若S709判断为否，则将所述各第一数据表中的表增量数据并行同步至所述目标数据库(即第二业务数据集合)。

S711，将不包含所述主关键字的第一数据表中的表增量数据并行同步至所述第二业务数据集合，并查找与包含所述主关键字的第一数据表对应的表增量数据所关联的至少一个目标行数据，将所述各目标行数据分别对应的行增量数据并行同步至所述第二业务数据集合。

具体的，若S709判断为是，则执行S711步骤。

S706-S711步骤的具体实现方式可以参见上述图6对应实施例中的S604-S609，这里不再进行赘述。

在整个升级过程中或数据搬迁过程中，源数据库持续提供服务，直到升级完毕或搬迁完毕，可以将所述源数据库中所记录的所述总增量数据中的表增量数据和/或行增量数据并行同步到所述目标数据库，以保证目标数据库中的数据的一致性，且整个服务过程不中断，即可以实现在保证服务不中断的前提下从对源数据库的使用过渡到对目标数据库的使用。

下面将结合附图8-附图15，对本发明实施例提供的服务器进行详细介绍。需要说明的是，附图8-附图15所示的服务器，用于执行本发明图2-图7所示实施例的方法，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明图2-图7所示的实施例。

请参见图8，为本发明实施例提供了一种服务器的结构示意图。如图8所示，本发明实施例的所述服务器1可以包括：基础数据迁移模块11、增量数据记录模块12、增量数据迁移模块13和镜像数据清除模块14。

基础数据迁移模块11，用于获取第一业务数据集合中待迁移的基础数据，生成与所述基础数据相同的镜像数据，并将所述基础数据迁移至第二业务数据集合中。

所述基础数据迁移模块11可以生成与所述基础数据相同的镜像数据，例如：采用数据快照的方式生成与所述基础数据相同的镜像数据等，所述基础数据迁移模块11将所述基础数据迁移至所述第二业务数据中。

增量数据记录模块12，用于记录所述基础数据的迁移过程中针对所述基础数据所获取的增量数据；

具体实现中，所述增量数据记录模块12可以在所述基础数据从所述第一业务数据集合迁移至所述第二业务数据集合的迁移过程中，记录针对所述基础数据所获取的增量数据，需要说明的是，所述增量数据为在所述基础数据的迁移过程中，需要对所述基础数据进行数据插入、更新等操作的数据。

增量数据迁移模块13，用于在所述基础数据的迁移过程完成时，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中；

具体实现中，在所述基础数据的迁移过程完成时，即所述基础数据已经迁移至所述第二业务数据集合中时，所述增量数据迁移模块13可以采用所述增量数据对所述镜像数据进行添加处理，将对所述基础数据的数据插入、更新等操作的数据添加至所述镜像数据中，同时，所述增量数据迁移模块13还需要将所述增量数据迁移至所述第二业务数据集合中，对所述基础数据进行数据插入、更新等操作。

镜像数据清除模块14，用于当所述增量数据的迁移过程完成时，清除所述第一业务数据集合中的所述镜像数据和所述增量数据；

具体实现中，当所述增量数据的迁移过程完成时，所述镜像数据清除模块14可以更新所述基础数据和所述增量数据的路由信息，即将所述基础数据和所述增量数据的路由信息由所述第一业务数据集合转换为所述第二业务数据集合，后续用户终端发起的对所述基础数据和所述增量数据的查询、插入、删除、更新等均分配至所述第二业务数据集合中执行，所述镜像数据清除模块14同时清除所述第一业务数据集合中的所述镜像数据以及所述第一业务数据集合中的所述增量数据。

请参见图9，为本发明实施例提供了另一种服务器的结构示意图。如图9所示，本发明实施例的所述服务器1可以包括：基础数据迁移模块11、增量数据记录模块12、增量数据迁移模块13、镜像数据清除模块14、业务数据存储模块15、时间检测模块16、第一数据返回模块17和第二数据返回模块18。

业务数据存储模块15，用于将属于预设时间段内的业务数据存储至第一业务数据集合中，将属于所述预设时间段外的业务数据存储至第二业务数据集合中；

具体实现中，所述业务数据存储模块15可以将属于预设时间段内的业务数据存储至第一业务数据集合中，并将属于所述预设时间段外的业务数据存储至第二业务数据集合中，可以理解的是，所述第一业务数据集合为预设时间段内存储的当前业务数据集合，即上述热数据；所述第二业务数据集合为除所述预设时间段外所存储的历史业务数据集合，即上述冷数据。所述服务器1具体为包括多个协调者节点以及多个数据节点的后台服务设备群组。

基础数据迁移模块11，用于获取第一业务数据集合中待迁移的基础数据，生成与所述基础数据相同的镜像数据，并将所述基础数据迁移至第二业务数据集合中；

具体实现中，所述基础数据迁移模块11可以获取第一业务数据集合中待迁移的基础数据，可以理解的是，所述基础数据为随着时间推移在所述预设时间段外的需要从所述第一业务数据集合转移至第二业务数据集合的业务数据，或者所述基础数据为基于管理人员对预设时间段进行修改(例如：从近4个月修改为近3个月等)所形成的前后时间差中存在的业务数据，所述基础数据迁移模块11可以生成与所述基础数据相同的镜像数据，例如：采用数据快照的方式生成与所述基础数据相同的镜像数据等，所述基础数据迁移模块11将所述基础数据迁移至所述第二业务数据中。

考虑到迁移的所述基础数据的数据量较大，所述基础数据的迁移过程同样需要较长的时间，此时在所述基础数据的迁移过程中所产生的所述增量数据的数据量同样较大，因此需要循环对不断产生的增量数据进行后续的迁移处理，优选的，所述增量数据记录模块12记录所述基础数据的迁移过程中针对所述基础数据所获取的第一增量数据，所述第一增量数据用于表示在对所述基础数据进行迁移的过程中所产生的针对所述基础数据的增量数据。

具体的，请一并参见图10，为本发明实施例提供了增量数据迁移模块的结构示意图。如图10所示，所述增量数据迁移模块13可以包括：

增量数据处理单元131，用于在所述基础数据的迁移过程完成时，将所述第一增量数据作为增量数据，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中，记录所述增量数据的迁移过程中针对所述基础数据和所述增量数据所获取的第二增量数据，将所述第二增量数据作为增量数据，重复执行本步骤，直至所述第二增量数据的数据量小于预设数据量阈值。

结果获取单元132，用于当所述第二增量数据的数据量小于预设数据量阈值时，采用所述第二增量数据同时对所述第一业务数据集合中的所述镜像数据、所述增量数据，以及所述第二业务数据集合中的所述基础数据、所述增量数据进行修改处理，并获取修改处理结果。

过程确定单元133，用于当所述修改处理结果为修改处理成功时，确定所述增量数据的迁移过程完成。

镜像数据清除模块14，用于当所述增量数据的迁移过程完成时，清除所述第一业务数据集合中的所述镜像数据和所述增量数据。

时间检测模块16，用于当检测到用户终端发送的携带有时间范围的业务数据查询请求时，检测所述时间范围是否属于所述预设时间段。

第一数据返回模块17，用于若所述时间检测模块16检测所述时间范围是否属于所述预设时间段的检测结果为是，则将所述第一业务数据集合中属于所述预设时间段且属于所述时间范围的业务数据返回至所述用户终端。

所述第一数据返回模块17，还用于若所述时间检测模块16检测所述时间范围是否属于所述预设时间段的检测结果为否，则将所述第二业务数据集合中不属于所述预设时间段但属于所述时间范围的业务数据返回至所述用户终端。

第二数据返回模块18，用于当检测到用户终端发送的未携带有时间范围的业务数据查询请求时，将所述第一业务数据集合中属于所述预设时间段的第一业务数据，以及所述第二业务数据集合中不属于所述预设时间段的第二业务数据返回至所述用户终端。

在本发明实施例中，在对第一业务数据集合中的基础数据进行迁移时，通过生成并保留基础数据的镜像数据，先将基础数据迁移至第二业务数据集合中，并记录基础数据迁移过程中针对基础数据的增量数据，在基础数据迁移完成时，再进行增量数据的迁移，直至增量数据迁移完成后，清除第一业务数据集合中的镜像数据和所述增量数据，实现了在线对业务数据进行迁移的过程，提高了对业务数据的查询及修改等数据处理的效率，进而保证了业务服务的质量；通过循环记录增量数据并进行迁移的方式，进一步实现了在线对业务数据进行迁移的过程，降低对业务数据进行插入、更新等操作的影响；通过采用双写操作的方式，实现了在增量数据不影响对用户终端请求执行的插入、更新等操作的基础上，实时同步完成剩余业务数据的迁移以及对业务数据的修改过程，并可以对第一业务数据集合及第二业务数据集合中的业务数据进行进一步的校验，以保证业务数据在迁移过程中的一致性；考虑到业务数据在存储的过程中存在错误插入的情况，可以不将错误插入的业务数据返回至用户终端，以保护数据访问的一致性；通过采用删除时间阈值的方式对数据节点进行动态调配，在存储空间不足时，无需替换数据节点的存储容量的硬件设备，降低硬件成本。

请参见图11，为本发明实施例提供了又一种服务器的结构示意图。如图11所示，所述增量数据记录模块12用于，在所述基础数据的迁移过程中，获取数据操作指令，根据所述数据操作指令针对所述基础数据执行数据处理业务，并记录基于所述数据处理业务所生成的总增量数据；所述总增量数据为基于逻辑语句的增量数据；

所述增量数据迁移模块13包括：

查找单元131，用于查找所述总增量数据所关联的至少一个第一数据表；各第一数据表均包括对应的表增量数据；所述各第一数据表分别对应的表增量数据的总和为所述总增量数据；

第一同步单元132，用于将所述各第一数据表中的表增量数据并行同步至所述第二业务数据集合。

在一实施例中，服务器1还包括：

状态检测模块15，用于检测所述数据处理业务的执行状态；

通知模块16，用于若所述数据处理业务的执行状态为成功执行状态，则通知所述查找单元131查找所述总增量数据所关联的至少一个第一数据表；

删除模块17，用于若所述数据处理业务的执行状态为数据回滚状态，则删除所记录的所述总增量数据。

具体的，请一并参见图12，为本发明实施例提供了第一同步单元的结构示意图。如图12所示，所述第一同步单元132可以包括：

判断子单元1321，用于判断所述至少一个第一数据表中是否存在包含主关键字的第一数据表；

同步子单元1322，用于若所述判断子单元1321判断为否，则将所述各第一数据表中的表增量数据并行同步至所述第二业务数据集合；

所述同步子单元1322，还用于若所述判断子单元1321判断为是，则将不包含所述主关键字的第一数据表中的表增量数据并行同步至所述第二业务数据集合，并查找与包含所述主关键字的第一数据表对应的表增量数据所关联的至少一个目标行数据，将所述各目标行数据分别对应的行增量数据并行同步至所述第二业务数据集合；

其中，所述第一数据表中各目标行数据分别对应的行增量数据的总和为该第一数据表对应的表增量数据。

具体的，请一并参见图13，为本发明实施例提供了增量数据记录模块的结构示意图。如图13所示，所述增量数据记录模块12包括：

获取检测单元122，用于获取数据操作指令，根据所述数据操作指令针对所述基础数据执行数据处理业务，并设置与所述数据处理业务对应的数据记录范围；

第一记录单元121，用于若所述数据记录范围为至少一个第二数据表，则在所述至少一个第二数据表中记录基于所述数据处理业务所生成的总增量数据；

第二记录单元123，用于若所述数据记录范围为所述基础数据，则在所述基础数据中记录基于所述数据处理业务所生成的总增量数据。

具体的，请一并参见图14，为本发明实施例提供了第二记录单元的结构示意图。

在一个实施例中，如图11所示，所述增量数据迁移模块13还包括：

第二同步单元133，用于记录接收到后台业务指令对应的起始时间戳，并将所述基础数据中处于所述起始时间戳的全量数据确定为待同步全量数据，并根据所述后台业务指令将所述待同步全量数据同步至所述第二业务数据集合；所述后台业务指令为在线升级指令或数据搬迁指令。

相应地，如图14所示，第二记录单元123包括：

增量记录子单元1231，用于在所述基础数据中记录基于所述数据处理业务所生成的增量数据；

同步判断子单元1232，用于判断所述待同步全量数据是否已全部同步至所述第二业务数据集合；

通知子单元1233，用于若所述同步判断子单元1232判断为否，则通知所述增量记录子单元1231继续在所述基础数据中记录基于所述数据处理业务所生成的增量数据；

确定子单元1234，用于若所述同步判断子单元1232判断为是，则将完成所述数据处理业务的时刻确定为结束时间戳，并将所述起始时间戳到所述结束时间戳之间所记录到的所有增量数据确定为总增量数据。

请参见图15，为本发明实施例提供了又一种服务器的结构示意图。如图15所示，所述服务器1500可以包括：至少一个处理器1501，例如CPU，至少一个网络接口1504，用户接口1503，存储器1505，至少一个通信总线1502。其中，通信总线1502用于实现这些组件之间的连接通信。其中，用户接口1503可以包括显示屏(Display)、键盘(Keyboard)，可选用户接口1503还可以包括标准的有线接口、无线接口。网络接口1504可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1505可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器1505可选的还可以是至少一个位于远离前述处理器1501的存储装置。如图15所示，作为一种计算机存储介质的存储器1505中可以包括操作系统、网络通信模块、用户接口模块以及数据管理应用程序。

在图15所示的服务器1500中，用户接口1503主要用于为用户提供输入的接口，获取用户输入的数据；而处理器1501可以用于调用存储器1505中存储的数据管理应用程序，并具体执行以下操作：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

一种数据管理方法，其特征在于，应用于服务器，包括：

获取第一业务数据集合中待迁移的基础数据，生成与所述基础数据相同的镜像数据，并将所述基础数据迁移至第二业务数据集合中；

记录所述基础数据的迁移过程中针对所述基础数据所获取的增量数据；

在所述基础数据的迁移过程完成时，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中；

当所述增量数据的迁移过程完成时，清除所述第一业务数据集合中的所述镜像数据和所述增量数据；

其中，所述第一业务数据集合为预设时间段内存储的当前业务数据集合，所述第二业务数据集合为除所述预设时间段外所存储的历史业务数据集合。
根据权利要求1所述的方法，其特征在于，所述获取第一业务数据集合中待迁移的基础数据之前，还包括：

将属于预设时间段内的业务数据存储至第一业务数据集合中，将属于所述预设时间段外的业务数据存储至第二业务数据集合中。
根据权利要求1所述的方法，其特征在于，所述记录所述基础数据的迁移过程中针对所述基础数据所获取的增量数据，包括：

记录所述基础数据的迁移过程中针对所述基础数据所获取的第一增量数据；

所述采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中，包括：

将所述第一增量数据作为增量数据，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中，记录所述增量数据的迁移过程中针对所述基础数据和所述增量数据所获取的第二增量数据，将所述第二增量数据作为增量数据，重复执行本步骤，直至所述第二增量数据的数据量小于预设数据量阈值；

当所述第二增量数据的数据量小于预设数据量阈值时，采用所述第二增量数据同时对所述第一业务数据集合中的所述镜像数据、所述增量数据，以及所述第二业务数据集合中的所述基础数据、所述增量数据进行修改处理，并获取修改处理结果；

当所述修改处理结果为修改处理成功时，确定所述增量数据的迁移过程完成。
根据权利要求1所述的方法，其特征在于，还包括：

当检测到用户终端发送的携带有时间范围的业务数据查询请求时，检测所述时间范围是否属于所述预设时间段；

若是，则将所述第一业务数据集合中属于所述预设时间段且属于所述时间范围的业务数据返回至所述用户终端；

若否，则将所述第二业务数据集合中不属于所述预设时间段但属于所述时间范围的业务数据返回至所述用户终端。
根据权利要求1所述的方法，其特征在于，还包括：

当检测到用户终端发送的未携带有时间范围的业务数据查询请求时，将所述第一业务数据集合中属于所述预设时间段的第一业务数据，以及所述第二业务数据集合中不属于所述预设时间段的第二业务数据返回至所述用户终端。
根据权利要求1所述的方法，其特征在于，还包括：

将所述第二业务数据集合中满足删除时间阈值的业务数据进行清除。
根据权利要求1所述的方法，其特征在于，所述记录所述基础数据的迁移过程中针对所述基础数据所获取的增量数据包括：

在所述基础数据的迁移过程中，获取数据操作指令，根据所述数据操作指令针对所述基础数据执行数据处理业务，并记录基于所述数据处理业务所生成的总增量数据；所述总增量数据为基于逻辑语句的增量数据；

所述将所述增量数据迁移至所述第二业务数据集合中包括：

查找所述总增量数据所关联的至少一个第一数据表；各第一数据表均包括对应的表增量数据；所述各第一数据表分别对应的表增量数据的总和为所述总增量数据；

将所述各第一数据表中的表增量数据并行同步至所述第二业务数据集合。
如权利要求7所述的方法，其特征在于，所述将所述各第一数据表中的表增量数据并行同步至所述第二业务数据集合，包括：

判断所述至少一个第一数据表中是否存在包含主关键字的第一数据表；

若判断为否，则将所述各第一数据表中的表增量数据并行同步至所述第二业务数据集合；

若判断为是，则将不包含所述主关键字的第一数据表中的表增量数据并行同步至所述第二业务数据集合，并查找与包含所述主关键字的第一数据表对应的表增量数据所关联的至少一个目标行数据，将所述各目标行数据分别对应的行增量数据并行同步至所述第二业务数据集合；

其中，所述第一数据表中各目标行数据分别对应的行增量数据的总和为该第一数据表对应的表增量数据。
如权利要求7所述的方法，其特征在于，所述获取数据操作指令，根据所述数据操作指令针对所述基础数据执行数据处理业务，并记录基于所述数据处理业务所生成的总增量数据，包括：

获取数据操作指令，根据所述数据操作指令针对所述基础数据执行数据处理业务，并设置与所述数据处理业务对应的数据记录范围；

若所述数据记录范围为至少一个第二数据表，则在所述至少一个第二数据表中记录基于所述数据处理业务所生成的总增量数据；

若所述数据记录范围为所述基础数据，则在所述基础数据中记录基于所述数据处理业务所生成的总增量数据。
如权利要求7所述的方法，其特征在于，在所述查找所述总增量数据所关联的至少一个第一数据表的步骤之前，还包括：

检测所述数据处理业务的执行状态；

若所述数据处理业务的执行状态为成功执行状态，则执行所述查找所述总增量数据所关联的至少一个第一数据表的步骤；

若所述数据处理业务的执行状态为数据回滚状态，则删除所记录的所述总增量数据。
如权利要求9所述的方法，其特征在于，在所述获取数据操作指令的步骤之前，还包括：

记录接收到后台业务指令对应的起始时间戳，将所述基础数据中处于所述起始时间戳的全量数据确定为待同步全量数据，并根据所述后台业务指令将所述待同步全量数据同步至所述第二业务数据集合；

则所述在所述基础数据中记录基于所述数据处理业务所生成的总增量数据，包括：

在所述基础数据中记录基于所述数据处理业务所生成的增量数据；

判断所述待同步全量数据是否已全部同步至所述第二业务数据集合；

若判断为否，则继续执行所述在所述基础数据中记录基于所述数据处理业务所生成的增量数据的步骤；

若判断为是，则将完成所述数据处理业务的时刻确定为结束时间戳，并将所述起始时间戳到所述结束时间戳之间所记录到的所有增量数据确定为总增量数据。
一种服务器，其特征在于，包括处理器和存储器，所述存储器中存储可被所述处理器执行的指令，当执行所述指令时，所述处理器用于：

获取第一业务数据集合中待迁移的基础数据，生成与所述基础数据相同的镜像数据，并将所述基础数据迁移至第二业务数据集合中；

记录所述基础数据的迁移过程中针对所述基础数据所获取的增量数据；

在所述基础数据的迁移过程完成时，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中；

当所述增量数据的迁移过程完成时，清除所述第一业务数据集合中的所述镜像数据和所述增量数据；

其中，所述第一业务数据集合为预设时间段内存储的当前业务数据集合，所述第二业务数据集合为除所述预设时间段外所存储的历史业务数据集合。
根据权利要求12所述的服务器，其特征在于，当执行所述指令时，所述处理器进一步用于：

将属于预设时间段内的业务数据存储至第一业务数据集合中，将属于所述预设时间段外的业务数据存储至第二业务数据集合中。
根据权利要求12所述的服务器，其特征在于，当执行所述指令时，所述处理器进一步用于：记录所述基础数据的迁移过程中针对所述基础数据所获取的第一增量数据；

在所述基础数据的迁移过程完成时，将所述第一增量数据作为增量数据，采用所述增量数据对所述镜像数据进行添加处理，并将所述增量数据迁移至所述第二业务数据集合中，记录所述增量数据的迁移过程中针对所述基础数据和所述增量数据所获取的第二增量数据，将所述第二增量数据作为增量数据，重复执行本步骤，直至所述第二增量数据的数据量小于预设数据量阈值；

当所述第二增量数据的数据量小于预设数据量阈值时，采用所述第二增量数据同时对所述第一业务数据集合中的所述镜像数据、所述增量数据，以及所述第二业务数据集合中的所述基础数据、所述增量数据进行修改处理，并获取修改处理结果；

当所述修改处理结果为修改处理成功时，确定所述增量数据的迁移过程完成。
根据权利要求12所述的服务器，其特征在于，当执行所述指令时，所述处理器进一步用于：

当检测到用户终端发送的携带有时间范围的业务数据查询请求时，检测所述时间范围是否属于所述预设时间段；

若检测所述时间范围是否属于所述预设时间段的检测结果为是，则将所述第一业务数据集合中属于所述预设时间段且属于所述时间范围的业务数据返回至所述用户终端；

若检测所述时间范围是否属于所述预设时间段的检测结果为否，则将所述第二业务数据集合中不属于所述预设时间段但属于所述时间范围的业务数据返回至所述用户终端。
根据权利要求12所述的服务器，其特征在于，当执行所述指令时，所述处理器进一步用于：

当检测到用户终端发送的未携带有时间范围的业务数据查询请求时，将所述第一业务数据集合中属于所述预设时间段的第一业务数据，以及所述第二业务数据集合中不属于所述预设时间段的第二业务数据返回至所述用户终端。
根据权利要求12所述的服务器，其特征在于，当执行所述指令时，所述处理器进一步用于：

将所述第二业务数据集合中满足删除时间阈值的业务数据进行清除。
根据权利要求12所述的服务器，其特征在于，当执行所述指令时，所述处理器进一步用于：在所述基础数据的迁移过程中，获取数据操作指令，根据所述数据操作指令针对所述基础数据执行数据处理业务，并记录基于所述数据处理业务所生成的总增量数据；所述总增量数据为基于逻辑语句的增量数据；

查找所述总增量数据所关联的至少一个第一数据表；各第一数据表均包括对应的表增量数据；所述各第一数据表分别对应的表增量数据的总和为所述总增量数据；

将所述各第一数据表中的表增量数据并行同步至所述第二业务数据集合。
根据权利要求18所述的服务器，其特征在于，当执行所述指令时，所述处理器进一步用于：

判断所述至少一个第一数据表中是否存在包含主关键字的第一数据表；

若判断为否，则将所述各第一数据表中的表增量数据并行同步至所述第二业务数据集合；

若判断为是，则将不包含所述主关键字的第一数据表中的表增量数据并行同步至所述第二业务数据集合，并查找与包含所述主关键字的第一数据表对应的表增量数据所关联的至少一个目标行数据，将所述各目标行数据分别对应的行增量数据并行同步至所述第二业务数据集合；

其中，所述第一数据表中各目标行数据分别对应的行增量数据的总和为该第一数据表对应的表增量数据。
根据权利要求18所述的服务器，其特征在于当执行所述指令时，所述处理器进一步用于：获取数据操作指令，根据所述数据操作指令针对所述基础数据执行数据处理业务，并设置与所述数据处理业务对应的数据记录范围；

若所述数据记录范围为至少一个第二数据表，则在所述至少一个第二数据表中记录基于所述数据处理业务所生成的总增量数据；

若所述数据记录范围为所述基础数据，则在所述基础数据中记录基于所述数据处理业务所生成的总增量数据。
根据权利要求18所述的服务器，其特征在于，当执行所述指令时，所述处理器进一步用于：

检测所述数据处理业务的执行状态；

若所述数据处理业务的执行状态为成功执行状态，则查找所述总增量数据所关联的至少一个第一数据表；

若所述数据处理业务的执行状态为数据回滚状态，则删除所记录的所述总增量数据。
根据权利要求20所述的服务器，其特征在于，当执行所述指令时，所述处理器进一步用于：记录接收到后台业务指令对应的起始时间戳，并将所述基础数据中处于所述起始时间戳的全量数据确定为待同步全量数据，并根据所述后台业务指令将所述待同步全量数据同步至所述第二业务数据集合；

在所述基础数据中记录基于所述数据处理业务所生成的增量数据；

判断所述待同步全量数据是否已全部同步至所述第二业务数据集合；

若判断为否，则继续在所述基础数据中记录基于所述数据处理业务所生成的增量数据；

若判断为是，则将完成所述数据处理业务的时刻确定为结束时间戳，并将所述起始时间戳到所述结束时间戳之间所记录到的所有增量数据确定为总增量数据。
一种计算机可读存储介质，其特征在于，存储有计算机可读指令，可以使至少一个处理器执行如权利要求1至11中任一项所述的方法。