WO2021169955A1

WO2021169955A1 - 一种数据库复制系统、方法、源端设备以及目的端设备

Info

Publication number: WO2021169955A1
Application number: PCT/CN2021/077476
Authority: WO
Inventors: 孟小珍; 马剑涛; 黄凯耀; 李志学
Original assignee: 华为技术有限公司
Priority date: 2020-02-28
Filing date: 2021-02-23
Publication date: 2021-09-02
Also published as: US20220405306A1; CN113326315A; EP4095714B1; EP4095714A1; EP4095714A4

Abstract

一种数据库复制系统、方法、源端设备以及目的端设备，在该数据库复制系统中，在源端数据库中的事务日志到目的端设备之前，通过将事务日志按照产生时间的先后顺序进行分组，实现并行化获取并发送多组事务日志的过程，可以提高数据库复制系统的处理效率。进一步，由于在事务日志重演之前不需要考虑事务日志之间的依赖关系，从而不需要对事务日志进行集中分析处理，可以降低源端数据库的处理复杂度，可以提高系统的处理效率。且，由于不同组的事务日志在目的端设备会根据事务日志之间的依赖关系以及产生时间的先后顺序进行重演，从而可以保证在目的端数据库中获取的数据的准确性，以确保目的端数据库中的数据与源端数据库中的数据的一致性。

Description

一种数据库复制系统、方法、源端设备以及目的端设备

相关申请的交叉引用

本申请要求在2020年02月28日提交中国专利局、申请号为202010129105.2、申请名称为“数据复制方法和系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中；本申请要求在2020年05月08日提交中国专利局、申请号为202010383462.1、申请名称为“一种数据库复制系统、方法、源端设备以及目的端设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及存储技术领域，尤其涉及一种数据库复制系统、方法、源端设备以及目的端设备。

背景技术

随着技术的发展，越来越多的数据需要使用数据库进行存储。为了保证数据库中数据的可靠性，通常可以通过数据库复制方案，将源端数据库中的数据复制到目的端数据库中，以保证当源端数据库中的数据发生故障时，能够从目的端数据库中恢复发生故障前的数据。

作为一种示例，基于事务日志的数据库复制方案通常包括变化数据捕获、变化数据传输以及变化数据重演这3个阶段。其中，变化数据捕获是指，通过源数据库的日志文件中记录的事务日志，识别源端数据库中发生变化的数据，并获取该发生变化的数据所对应的事务日志。变化数据的传输是指，将发生变化的数据所对应的事务日志从源端数据库传输到目的端数据库。变化数据的重演是指，目的端数据库对接收到的发生变化的数据所对应的事务日志进行解析及处理，将变化的数据更新到目的端数据库。

由于数据库中的多个事务日志之间可能存在依赖关系，例如，事务日志1必须在事务日志2重演完成之后再重演，其原因在于，事务日志1和事务日志2均记录了源数据库中针对相同的操作对象进行的操作，例如写操作，针对源数据库的一个数据表行主键的写操作，事务日志1记录的针对该行主键的写操作先于事务日志2记录的针对该行主键的写操作。因此，在数据库复制方案中，考虑到上述依赖关系，只能对事务日志进行串行处理，例如先从源端数据库的日志文件中获取事务日志1，并发送事务日志1至目的端数据库，再从源端数据库的日志文件中获取事务日志2，并发送事务日志2至目的端数据库，目的端数据库先对事务日志1进行重演，再对事务日志2进行重演，由于以上方案获取事务日志的过程中必须严格执行次序，从而导致通过数据库复制方案复制数据时的效率较低。可见，如何提高根据数据库复制方案复制数据的效率，是目前亟待解决的技术问题。

发明内容

本申请提供一种数据库复制系统、方法、源端设备以及目的端设备，用以提高数据库复制方案复制数据的效率。

第一方面，提供一种数据库复制系统，该系统用于根据源端数据库的日志文件中包括的至少两组事务日志，在目的端数据库进行重演，该系统包括源端设备和目的端设备，其中：

源端设备，用于从源端数据库的日志文件中并行获取至少两组事务日志，至少两组事务日志包括第一组事务日志和第二组事务日志，并发送至少两组事务日志，例如，第一组事务日志至少包括相邻的第一事务日志和第二事务日志，第二组事务日志至少包括相邻的第三事务日志和第四事务日志，第二事务日志的产生时间早于第三事务日志的产生时间；其中，相邻的可以理解为事务日志的产生时间连续。

目的端设备，用于接收至少两组事务日志，并根据至少两组事务日志在目的端设备的目的端数据库进行事务重演，例如，先在根据第一组事务日志中的第一事务日志、第二事务日志以及第一事务日志与第二事务日志的依赖关系在目的端数据库进行事务重演之后，再根据第二组事务日志中的第三事务日志、第四事务日志以及第三事务日志与第四事务日志的依赖关系在目的端数据库进行事务重演，使得目的端数据库与源端数据库存储的数据一致。

在上述技术方案中，在源端数据库中的事务日志到目的端设备之前，通过将事务日志按照产生时间的先后顺序进行分组，实现并行化获取并发送多组事务日志的过程，可以提高数据库复制系统的处理效率。进一步，由于在事务日志重演之前不需要考虑事务日志之间的依赖关系，从而不需要对事务日志进行集中分析处理，可以降低源端数据库的处理复杂度，可以提高系统的处理效率。且，由于不同组的事务日志在目的端设备会根据事务日志之间的依赖关系以及产生时间的先后顺序进行重演，从而可以保证在目的端数据库中获取的数据的准确性，以确保目的端数据库中的数据与源端数据库中的数据的一致性。

在一种可能的设计中，源端设备还用于在确认第一事务日志记录的第一事务操作在源端数据库中的操作对象与第二事务日志记录的第二事务操作在源端数据库中的操作对象相同，且第一事务日志记录的第一事务操作在源端数据库中的操作时刻早于第二事务日志记录的第二事务操作在源端数据库中的操作时刻的情况下，将第一事务日志的编号记录到第二事务日志中，该第一事务日志的编号用于指示第一事务日志与第二事务日志的依赖关系；以及，

在确认第三事务日志记录的第三事务操作在源端数据库中的操作对象与第四事务日志记录的第四事务操作在源端数据库中的操作对象相同，且第三事务日志记录的第三事务操作在源端数据库中的操作时刻早于第四事务日志记录的第四事务操作在源端数据库中的操作时刻的情况下，将第三事务日志的编号记录到第四事务日志中，该第三事务日志的编号用于指示第三事务日志与第四事务日志的依赖关系。

在上述技术方案中，可以通过源端设备将事务日志之间的依赖关系记录在对应的事务日志中，从而目的端设备可以直接根据每个事务日志记录的依赖关系来进行事务日志重演，可以提高进行事务日志重演过程的效率。

在一种可能的设计中，目的端设备还用于在确认第一事务日志记录的第一事务操作在源端数据库中的操作对象与第二事务日志记录的第二事务操作在源端数据库中的操作对象相同，且第一事务日志记录的第一事务操作在源端数据库中的操作时刻早于第二事务日志记录的第二事务操作在源端数据库中的操作时刻的情况下，并将第一事务日志的编号记录到第二事务日志中，该第一事务日志的编号用于指示第一事务日志与第二事务日志的依赖关系；以及，

在上述技术方案中，也可以在目的端设备接收到事务日志之后，确定各个事务日志之间的依赖关系，从而可以减少源端设备的处理量，提高抽取事务日志的过程的效率。

在一种可能的设计中，以第一组事务日志和第二组事务日志为例，对目的端设备在目的端数据库进行事务日志重演的过程进行说明。

针对第一组事务日志，目的端设备在获取到第一组事务日志中的第二事务日志的情况下，确认第二事务日志记录有用于指示第一事务日志与第二事务日志的依赖关系的第一事务日志的编号，在确认根据第一事务日志进行的事务重演完成之后，再根据第二事务日志进行事务重演。

在上述技术方案中，目的端设备可以通过确定事务日志中是否携带其他事务日志的编号来确定该事务日志是否与其他事务日志之间存在依赖关系，若存在依赖关系，则需要等待其所依赖的事务日志完成重演之后，再根据该事务日志进行重演，以确保在目的端数据库获取的数据的准确性。

在一种可能的设计中，目的端设备在获取到第一组事务日志中的第一事务日志的情况下，确认第一事务日志没有记录有用于指示与第一事务日志存在依赖关系的事务日志的编号，则根据第一事务日志进行事务重演。

在上述技术方案中，若某一个事务日志中不包括其他事务日志的编号，则确定该事务日志与其他事务日志之间不存在依赖关系，则可以直接根据该事务日志进行事务重演，而不用等待其他事务日志。

针对第二组事务日志，目的端设备在获取到第二组事务日志中的第四事务日志的情况下，确认第四事务日志记录有用于指示第四事务日志与第三事务日志的依赖关系的第三事务日志的编号，在确认根据第三事务日志进行的事务重演完成之后，根据第四事务日志进行事务重演。

在一种可能的设计中，目的端设备在获取到第二组事务日志中的第三事务日志的情况下，确认第三事务日志没有记录有用于指示与第三事务日志存在依赖关系的事务日志的编号，根据第三事务日志进行事务重演。

针对该第二组事务日志进行重演所能实现的技术效果可以参照前述针对第一组事务日志进行重演的技术效果的描述，在此不再赘述。

在一种可能的设计中，源端设备和源端数据库设置在第一区域，目的端设备和目的端数据库设置在第二区域，第一区域和第二区域远程连接。

在上述技术方案中，源端设备和目的端设备可以设置在不同的区域或者不同的数据中心，然后通过不同的区域或者不同的数据中心之间的远程连接发送事务日志。当然，源端设备和目的端设备也可以设置在同一区域或同一数据中心，在此不作限制。

在一种可能的设计中，源端设备用于根据事务日志的编号范围从源端数据库中并行获取至少两组事务日志。

在上述技术方案中，可以预先为各个事务日志组分配好对应的事务日志的编号范围，源端设备则可以根据各个编号范围进行事务日志抽取，提高处理效率。

在一种可能的设计中，源端设备还用于：从源端数据库中读取日志概要记录信息，日志概要记录信息记录有源端数据库产生的事务日志的编号、在日志文件中的记录位置、长度以及数量，然后，根据日志概要记录信息在日志文件中并行获取至少两组事务日志。

在源端数据库中，事务日志在日志文件中存储的位置可能是不连续的，在这种情况下，源端数据库中可以存储日志概要记录信息，然后，源端设备在需要抽取事务日志时，首先读取源端数据库的日志概要记录信息，从该日志概要记录信息中找到需要收取的事务日志的记录，根据该条记录中的位置、长度以及数量，确定事务日志在日志文件中的存储位置，从而不用遍历日志文件中所有的事务日志，便可以获取该事务日志，可以提高抽取模块的处理效率。

第二方面，提供一种数据库复制方法，在该方法中，源端设备首先从源端数据库的日志文件中并行获取至少两组事务日志，所述至少两组事务日志包括第一组事务日志和第二组事务日志，并发送所述至少两组事务日志，其中，第一组事务日志至少包括相邻的第一事务日志和第二事务日志，所述第二组事务日志至少包括相邻的第三事务日志和第四事务日志，所述第二事务日志的产生时间早于所述第三事务日志的产生时间；然后，向目的端设备发送所述至少两组事务日志。

在一种可能的设计中，源端设备在确认所述第一事务日志记录的第一事务操作在所述源端数据库中的操作对象与所述第二事务日志记录的第二事务操作在所述源端数据库中的操作对象相同，且所述第一事务日志记录的第一事务操作在所述源端数据库中的操作时刻早于所述第二事务日志记录的第二事务操作在所述源端数据库中的操作时刻的情况下，将所述第一事务日志的编号记录到所述第二事务日志中，其中，所述第一事务日志的编号用于指示所述第一事务日志与所述第二事务日志的依赖关系；以及，

在确认所述第三事务日志记录的第三事务操作在所述源端数据库中的操作对象与所述第四事务日志记录的第四事务操作在所述源端数据库中的操作对象相同，且所述第三事务日志记录的第三事务操作在所述源端数据库中的操作时刻早于所述第四事务日志记录的第四事务操作在所述源端数据库中的操作时刻的情况下，将所述第三事务日志的编号记录到所述第四事务日志中，其中，所述第三事务日志的编号用于指示所述第三事务日志与所述第四事务日志的依赖关系。

在一种可能的设计中，源端设备可以根据事务日志的编号范围从源端数据库中并行获取所述至少两组事务日志。

在一种可能的设计中，源端设备可以先从所述源端数据库中读取日志概要记录信息，所述日志概要记录信息记录有所述源端数据库产生的事务日志的编号、在所述日志文件中的记录位置、长度以及数量，然后，再根据所述日志概要记录信息在所述日志文件中并行获取所述至少两组事务日志。

第三方面，提供一种数据库复制方法，在该方法中，目的端设备首先从源端设备接收至少两组事务日志，所述至少两组事务日志包括第一组事务日志以及第二组事务日志，所述第一组事务日志至少包括相邻的第一事务日志和第二事务日志，所述第二组事务日志至少相邻的包括第三事务日志和第四事务日志，所述第二事务日志的产生时间早于所述第三事务日志的产生时间；然后，根据所述至少两组事务日志在所述目的端设备的目的端数据库进行事务重演，使得所述目的端数据库与所述源端数据库存储的数据一致，其中，在根据所述第一组事务日志中的所述第一事务日志、所述第二事务日志以及所述第一事务日志与所述第二事务日志的依赖关系在目的端数据库进行事务重演之后，根据所述第二组事务日志中的所述第三事务日志、所述第四事务日志以及所述第三事务日志与所述第四事务日志的依赖关系在所述目的端数据库进行事务重演。

在一种可能的设计中，目的端设备在确认所述第一事务日志记录的第一事务操作在所述源端数据库中的操作对象与所述第二事务日志记录的第二事务操作在所述源端数据库中的操作对象相同，且所述第一事务日志记录的第一事务操作在所述源端数据库中的操作时刻早于所述第二事务日志记录的第二事务操作在所述源端数据库中的操作时刻的情况下，并将所述第一事务日志的编号记录到所述第二事务日志中，其中，所述第一事务日志的编号用于指示所述第一事务日志与所述第二事务日志的依赖关系；以及，

在一种可能的设计中，目的端设备在获取到所述第一事务日志的情况下，确认所述第一事务日志没有记录有用于指示与所述第一事务日志存在依赖关系的事务日志的编号，根据所述第一事务日志进行事务重演。

在一种可能的设计中，目的端设备在获取到所述第二事务日志的情况下，确认所述第二事务日志记录有用于指示所述第一事务日志与所述第二事务日志的依赖关系的所述第一事务日志的编号，在确认根据所述第一事务日志进行的事务重演完成之后，根据所述第二事务日志进行事务重演。

在一种可能的设计中，目的端设备在获取到所述第三事务日志的情况下，确认所述第三事务日志没有记录有用于指示与所述第三事务日志存在依赖关系的事务日志的编号，根据所述第三事务日志进行事务重演。

在一种可能的设计中，目的端设备在获取到所述第四事务日志的情况下，确认所述第四事务日志记录有用于指示所述第四事务日志与所述第三事务日志的依赖关系的所述第三事务日志的编号，在确认根据所述第三事务日志进行的事务重演完成之后，根据所述第四事务日志进行事务重演。

第四方面，提供一种源端设备，该源端设备包括处理模块和发送模块，这些模块可以执行上述第二方面任一种设计示例中的所执行的相应功能，具体的：

处理模块，用于从源端数据库的日志文件中并行获取至少两组事务日志，所述至少两组事务日志包括第一组事务日志和第二组事务日志，并发送所述至少两组事务日志，其中，第一组事务日志至少包括相邻的第一事务日志和第二事务日志，所述第二组事务日志至少包括相邻的第三事务日志和第四事务日志，所述第二事务日志的产生时间早于所述第三事务日志的产生时间；

发送模块，用于向目的端设备发送所述至少两组事务日志。

在一种可能的设计中，所述处理模块还用于：

在确认所述第一事务日志记录的第一事务操作在所述源端数据库中的操作对象与所述第二事务日志记录的第二事务操作在所述源端数据库中的操作对象相同，且所述第一事务日志记录的第一事务操作在所述源端数据库中的操作时刻早于所述第二事务日志记录的第二事务操作在所述源端数据库中的操作时刻的情况下，将所述第一事务日志的编号记录到所述第二事务日志中，其中，所述第一事务日志的编号用于指示所述第一事务日志与所述第二事务日志的依赖关系；以及，

在一种可能的设计中，所述处理模块具体用于：

根据事务日志的编号范围从源端数据库中并行获取所述至少两组事务日志。

在一种可能的设计中，所述处理模块具体用于：

从所述源端数据库中读取日志概要记录信息，所述日志概要记录信息记录有所述源端数据库产生的事务日志的编号、在所述日志文件中的记录位置、长度以及数量；

根据所述日志概要记录信息在所述日志文件中并行获取所述至少两组事务日志。

第五方面，提供一种目的端设备，该目的端设备包括接收模块和处理模块，这些模块可以执行上述第三方面任一种设计示例中的所执行的相应功能，具体的：

接收模块，用于从源端设备接收至少两组事务日志，所述至少两组事务日志包括第一组事务日志以及第二组事务日志，所述第一组事务日志至少包括相邻的第一事务日志和第二事务日志，所述第二组事务日志至少包括相邻的第三事务日志和第四事务日志，所述第二事务日志的产生时间早于所述第三事务日志的产生时间；

处理模块，用于在根据所述第一组事务日志中的所述第一事务日志、所述第二事务日志以及所述第一事务日志与所述第二事务日志的依赖关系在目的端数据库进行事务重演之后，根据所述第二组事务日志中的所述第三事务日志、所述第四事务日志以及所述第三事务日志与所述第四事务日志的依赖关系在所述目的端数据库进行事务重演，使得所述目的端数据库与所述源端数据库存储的数据一致。

在一种可能的设计中，所述处理模块还用于：

在一种可能的设计中，所述处理模块具体用于：

在获取到所述第一事务日志的情况下，确认所述第一事务日志没有记录有用于指示与所述第一事务日志存在依赖关系的事务日志的编号，根据所述第一事务日志进行事务重演。

在一种可能的设计中，所述处理模块具体用于：

在获取到所述第二事务日志的情况下，确认所述第二事务日志记录有用于指示所述第一事务日志与所述第二事务日志的依赖关系的所述第一事务日志的编号，在确认根据所述第一事务日志进行的事务重演完成之后，根据所述第二事务日志进行事务重演。

在一种可能的设计中，所述处理模块具体用于：

在获取到所述第三事务日志的情况下，确认所述第三事务日志没有记录有用于指示与所述第三事务日志存在依赖关系的事务日志的编号，根据所述第三事务日志进行事务重演。

在一种可能的设计中，所述处理模块具体用于：

在获取到所述第四事务日志的情况下，确认所述第四事务日志记录有用于指示所述第四事务日志与所述第三事务日志的依赖关系的所述第三事务日志的编号，在确认根据所述第三事务日志进行的事务重演完成之后，根据所述第四事务日志进行事务重演。

第六方面，提供一种源端设备，该源端设备包括处理器，用于实现上述第二方面描述的方法。该源端设备还可以包括存储器，用于存储程序指令和数据。该存储器与该处理器耦合，该处理器可以调用并执行该存储器中存储的程序指令，用于实现上述第二方面描述的方法中的任意一种方法。该源端设备还可以包括通信接口，该通信接口用于该源端设备与其它设备进行通信。示例性地，该其它设备为目的端设备。

在一种可能的设计中，该源端设备包括处理器和通信接口，其中：

处理器，用于从源端数据库的日志文件中并行获取至少两组事务日志，所述至少两组事务日志包括第一组事务日志和第二组事务日志，并发送所述至少两组事务日志，其中，第一组事务日志至少包括相邻的第一事务日志和第二事务日志，所述第二组事务日志至少包括相邻的第三事务日志和第四事务日志，所述第二事务日志的产生时间早于所述第三事务日志的产生时间；

通信接口，用于向目的端设备发送所述至少两组事务日志。

在一种可能的设计中，所述处理器还用于：

在一种可能的设计中，所述处理器具体用于：

第七方面，提供一种目的端设备，该目的端设备包括处理器，用于实现上述第三方面描述的方法。该目的端设备还可以包括存储器，用于存储程序指令和数据。该存储器与该处理器耦合，该处理器可以调用并执行该存储器中存储的程序指令，用于实现上述第三方面描述的方法中的任意一种方法。该目的端设备还可以包括通信接口，该通信接口用于该目的端设备与其它设备进行通信。示例性地，该其它设备为源端设备。

在一种可能的设计中，该目的端设备包括处理器和通信接口，其中：

通信接口，用于从源端设备接收至少两组事务日志，所述至少两组事务日志包括第一组事务日志以及第二组事务日志，所述第一组事务日志至少包括相邻的第一事务日志和第二事务日志，所述第二组事务日志至少包括相邻的第三事务日志和第四事务日志，所述第二事务日志的产生时间早于所述第三事务日志的产生时间；

处理器，用于在根据所述第一组事务日志中的所述第一事务日志、所述第二事务日志以及所述第一事务日志与所述第二事务日志的依赖关系在目的端数据库进行事务重演之后，根据所述第二组事务日志中的所述第三事务日志、所述第四事务日志以及所述第三事务日志与所述第四事务日志的依赖关系在所述目的端数据库进行事务重演，使得所述目的端数据库与所述源端数据库存储的数据一致。

在一种可能的设计中，所述处理器还用于：

在一种可能的设计中，所述处理器具体用于：

第八方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被计算机执行时，使所述计算机执行第二方面或第三方面中任意一项所述的方法。

第九方面，本申请实施例提供一种计算机程序产品，所述计算机程序产品存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被计算机执行时，使所述计算机执行第二方面或第三方面中任意一项所述的方法。

第十方面，本申请提供了一种芯片系统，该芯片系统包括处理器，还可以包括存储器，用于实现第二方面或第三方面中所述的方法。该芯片系统可以由芯片构成，也可以包含芯片和其他分立器件。

上述第二方面至第十方面及其实现方式的有益效果可以参考对第一方面的系统及其实现方式的有益效果的描述。

附图说明

图1为本申请实施例的应用场景的一种示例的示意图；

图2为一种基于事务日志的数据库复制方案的示意图；

图3为本申请实施例提供的数据库复制系统300的结构框图；

图4为数据库复制系统300的一种示例的结构框图；

图5为数据库复制系统300的另一种示例的结构框图；

图6为数据库复制系统300的另一种示例的结构框图；

图7为数据库复制系统300的另一种示例的结构框图；

图8为图7所示的数据库复制系统300进行数据复制的一种示例的示意图；

图9为数据库复制系统300的另一种示例的结构框图；

图10为数据库复制系统300的另一种示例的结构框图；

图11为数据库复制系统300的另一种示例的结构框图；

图12为本申请实施例提供的数据库复制方法的一种示例的流程图；

图13为本申请实施例提供的数据库复制方法的另一种示例的流程图；

图14为本申请实施例提供的各个模块进行初始化设置的流程图；

图15为本申请实施例提供的各个模块进行数据库复制的流程图；

图16为本申请实施例提供的各个模块进行故障恢复的流程图；

图17为本申请实施例提供的源端设备的一种示例的结构示意图；

图18为本申请实施例提供的目的端设备的一种示例的结构示意图。

具体实施方式

为了使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施例作进一步地详细描述。

为便于本领域技术人员理解本申请提供的技术方案，下面对本申请所涉及的技术术语进行说明。

1)源端设备，是指用于独立存储数据的设备，例如服务器，或者，也可以用于存储数据的设备集群，例如，包括管理设备和多个存储设备的存储系统，其中，管理设备可以是服务器，存储设备可以是硬盘驱动器(hard disk drive，HDD)磁盘设备、固态驱动器(solid state drive，SSD)磁盘设备，串行高级技术附件(serial advanced technology attachment，SATA)磁盘设备等。

目的端设备与源端设备相似，在此不再赘述。

2)源端数据库，是指源端设备中按照一定的存储方式存储数据且统一管理的多个数据的集合，源端设备可以对数据库中的数据进行新增、查询、更新、删除等操作。根据不同的存储方式，源端数据库可以包括关系型数据或者非关系数据，当然，也可以包括其他类型的数据库，在此不作限制。一个源端设备中可以包括一个源端数据库，也可以包括多个源端数据库，若包括多个源端数据库，则可以对每个数据库进行编号，源端设备可以根据每个源端数据库的编号访问各个源端数据库。

目的端数据库与源端数据相似，在此不再赘述。

3)操作对象，是指源端数据库中存储的每个数据。例如，源端数据库采用数据表的方式存储数据，则操作对象可以是指该源端数据库中的任意一个数据表中，由行主键或者行唯一键确定的一行的数据。

4)依赖关系，是指针对源端数据库的同一操作对象生成的多个事务日志之间必须按照事务日志的产生时间的先后顺序进行重演的关系。例如，在第一时刻对源端数据库中的某一个操作对象进行修改操作生成了事务日志1，在第一时刻之后的第二时刻，对该操作对象再次进行修改操作，生成了事务日志2，且由于事务日志2的产生时间在事务日志1之后，因此，事务日志2必须在事务日志1之后进行重演，则事务日志1和事务日志2之间存在依赖关系，也可以称为事务日志2依赖事务日志1。

5)区域，是指电力和网络相互独立的物理区域，每个区域可以用于提供相应的计算资源，例如虚拟机等，或每个区域也可以用于提供相应的存储资源，例如存储系统，在此不作限制。在每个区域用来提供存储资源时，也可以将区域称为数据中心。不同的区域或者数据中心之间远程连接，例如，可以通过无线网络进行连接等。

6)事务日志的产生时间，是指事务日志在日志文件中的逻辑时间，而不是一个具体的时间戳。逻辑时间可以理解为，多个事务日志之间的先后顺序，例如，事务日志1是在事务日志2之前产生的，但是并不能指示事务日志是在某一个时刻(例如10时39分00秒)产生的。

7)本申请实施例中“多个”是指两个或两个以上，鉴于此，本申请实施例中也可以将“多个”理解为“至少两个”。“至少一个”，可理解为一个或多个，例如理解为一个、两个或更多个。例如，包括至少一个，是指包括一个、两个或更多个，而且不限制包括的是哪几个，例如，包括A、B和C中的至少一个，那么包括的可以是A、B、C、A和B、A和C、B和C、或A和B和C。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，字符“/”，如无特殊说明，一般表示前后关联对象是一种“或”的关系。

除非有相反的说明，本申请实施例提及“第一”、“第二”等序数词用于对多个对象进行区分，不用于限定多个对象的顺序、时序、优先级或者重要程度。

首先，对本申请实施例的应用场景进行说明。

随着大数据分析技术、物联网技术等技术的发展，数据成为了推动相关技术进步的核心要素，因此，各行各业的数据需要进行存储，以便用来分析和指导业务。例如，可以通过数据库存储系统将数据进行存储。为了保证数据的可靠性，通常会将存储系统中的数据进行复制。请参考图1，以存储系统为数据库存储系统为例，可以通过网络，将源端数据库中的数据复制到目的端数据库中，从而当源端数据库发生故障时，可以从目的端数据库中恢复数据。通过网络将源端数据库中的数据复制到目的端数据库的方案有多种，例如，可以基于应用层复制数据，可以基于数据库复制数据等，在本申请实施例中，主要针对基于数据库复制数据的方案，可以简称为数据库复制方案。

下面，以基于事务日志的数据库复制方案为例，对数据库复制方案进行说明。

当源端数据库中存储的数据发生变化时，源端数据库会生成与变化的数据对应的事务日志。事务日志可以记录对操作对象进行的操作、操作对象的内容，操作对象的起止位置等信息，在此不对事务日志所包括的具体内容进行限制。例如，在时刻1，通过写入操作，向源端数据库中写入一个新数据，例如为数据A，则数据A为源端数据库中发生变化的数据，因此，源端数据库中会生成与数据A对应的事务日志存储在日志文件中，该事务日志可以记录对数据A进行的操作(在该示例中该操作为写入操作)、数据A的内容、数据A的起止位置等信息。为方便说明，将与数据A对应的事务日志标记为事务日志1。然后，在时刻1之后的时刻2，通过修改操作，对数据A进行修改，则源端数据库再次生成与数据A对应的事务日志2并存储在日志文件中。

当需要将源端数据库中的数据复制到目的端数据库时，则可以采用基于事务日志的数据库复制方案。基于事务日志的数据库复制方案的一个主要原则就是：要求事务日志到达目的端数据库时，必须按照事务日志之间的依赖关系进行重演。例如，前述所述的事务日志2必须在事务日志1之后进行重演，从而才能获取与源端数据库相同的数据。

基于上述原则，请参考图2，为一种基于事务日志的数据库复制方案的示意图。如图2所示，该数据库复制方案中包括4个模块，分别为事务抽取模块、跨域传输模块、重演前并行化模块以及事务重演模块。其中，事务抽取模块以及跨域传输模块设置在源端设备中，重演前并行化模块以及事务重演模块设置在目的端设备中。事务抽取模块、跨域传输模块以及重演前并行化模块之间是一对一的关系，重演前并行化模块和事务重演模块之间是一对多的关系，即在该复制方案中，事务抽取模、跨域传输模块以及重演前并行化模块的数量为1个，而事务重演模块的数量为多个，具体的数值可以根据实际使用需求进行设置。在图2中，以事务重演模块包括K个为例。

源端设备中的事务抽取模块，首先获取源端数据库中发生变化的数据对应的事务日志，具体来讲，就是按照事务日志的产生时间的先后顺序，从源端数据库中用于存储事务日志的日志文件中依次串行读取事务日志，然后将获取的事务日志传输给跨域传输模块进行处理。跨域传输模块在接收到事务日志后，则将获取的事务日志依次串行传输给重演前并行化模块，从而将变化的数据对应的事务日志发送到目的端设备。需要说明的是，在上述技术方案中，事务抽取模块串行读取事务日志，是指从某一个源端数据库对应的一个日志文件中依次串行读取事务日志，每个源端数据库仅包括一个日志文件。

目的端设备中的重演前并行化模块，在接收该多个事务日志后，首先识别该多个事务日志之间的依赖关系，并根据确定出的依赖关系将多个事务日志传输给事务重演模块。例如，重演前并行化模块可以默认接收到的第一个事务日志没有依赖其他事务日志，则将第一事务日志传输给K个事务重演模块中的其中一个事务重演模块，例如传输给事务重演模块1。然后继续判断接收到的第二个事务日志与第一个事务日志之间的依赖关系，确定该第二个事务日志与第一个事务日志处理的是源端数据库中相同的操作对象，则确定第二个事务日志与第一个事务日志之间存在依赖关系，在这种情况下，重演前并行化模块需要等待事务重演模块1重演完成第一个事务日志之后，再将第二个事务日志传输给事务重演模块1。若重演前并行化模块确定第二个事务日志与第一个事务日志之间不存在依赖关系，则直接将该第二个事务日志传输给K个事务重演模块中除事务重演模块1之外的事务重演模块，例如，传输给事务重演模块2，这样，事务重演模块1和事务重演模块2可以并行处理不同的事务日志，从而可以实现将不存在依赖关系的事务日志并行化处理的过程。每个事务重演模块，在接收到事务日志后，则在目标数据库中执行该事务日志，执行完成后，则可以得到源端数据库中发生会变化的数据。然后，事务重演模块会将事务日志的执行结果反馈给重演前并行化模块，以使重演前并行化模块根据是否接收到某一个事务日志的执行结果来确定该事务日志是否重演完成。

可见，在上述数据库复制方案中，除了可以在事务重演阶段，通过设置多个事务重演模块实现并行重演事务日志，在其他处理阶段中，例如，事务抽取阶段、跨域传输阶段以及重演前并行化阶段，都只能采用串行处理方式，从而导致通过数据库复制方案复制数据时的效率较低。

由上述过程可知，正是因为考虑到事务日志之间的依赖关系，从而导致事务日志在进行重演之前，只能采用串行方式进行处理。但是，若想要通过传输事务日志的方式，在目的端数据库获取源端数据库中发生变化的数据，其实只要保证事务日志在重演时按照其依赖关系进行重演即可，而在事务日志重演之前可以不用考虑该依赖关系，这样就可以实现并行传输多个事务日志，从而可以提高复制数据的效率。

鉴于此，本申请实施例提供一种能够提高复制数据的效率数据库复制系统。下面，结合附图对本申请实施例提供的数据库复制系统进行说明。

请参考图3，为本申请实施例提供的数据库复制系统300的结构框图。数据库复制系统300用于根据源端数据库的日志文件中包括的至少两组事务日志，在目的端数据库进行重演，如图3所示，数据库复制系统300包括源端设备301，以及与源端设备301通信连接的目的端设备302，其中：

源端设备301，用于从源端数据库的日志文件中并行获取至少两组事务日志，该至少两组事务日志包括第一组事务日志和第二组事务日志。其中，每组事务日志中包括至少两个事务日志，例如，第一组事务日志至少包括第一事务日志和第二事务日志，第二组事务日志至少包括第三事务日志和第四事务日志。

需要说明的是，每一组事务日志中包括的事务日志是相邻的，即第一事务日志与第二事务日志相邻，第三事务日志与第四事务日志相邻。事务日志是相邻的，可以理解为，每一组事务日志中的事务日志在日志文件中的产生时间是连续的。例如，日志文件中的每一行用于记录一个事务日志，源端设备301根据事务日志的产生时间将各个事务日志存储在日志文件中，则第一事务日志和第二事务日志存储在日志文件中连续的两行中，第三事务日志和第四事务日志存储在日志文件中连续的另外两行中。且，在本申请实施例中，第一组事务日志中的每一个事务日志的产生时间均早于第二组事务日志中任意一个事务日志的产生时间，也就是说，第一组事务日志中的最后一个事务日志的产生时间早于第二组事务日志的第一个事务日志的产生时间。如前所述，第一组事务日志包括第一事务日志和第二事务日志，第二事务日志为第一组事务日志中按照产生时间排序的最后一个事务日志，第二组事务日志包括第三事务日志和第三事务日志，第三事务日志为第二组事务日志中按照时间排序的第一个事务日志，则第二事务日志的产生时间早于第三事务日志的产生时间。

在本申请实施例中，不限制源端设备301并行获取的事务日志组的数量，例如，可以并行获取3组事务日志，或者并行获取5组事务日志等，在此不作限制。在本申请实施例中，为方便说明，下文中，以源端设备301并行获取两组事务日志，分别标记为第一组事务日志和第二组事务日志为例，对本申请实施例中的系统进行说明。

另外，需要说明的是，源端设备301中可以包括至少一个源端数据库，上述获取的至少两组事务日志，是从某一个源端数据库对应的日志文件中获取的，也可以是从不同的源端数据库对应的日志文件中获取的，在此不作限制。

当源端设备301获取该第一组事务日志和第二组事务日志后，则将该第一组事务日志和该第二组事务日志发送给目的端设备。需要说明的是，源端设备301可以任何方式发送该第一组事务日志和第二组事务日志，具体可以通过并行发送或者异步发送的方式，在此不作限制。

目的端设备302，用于接收该第一组事务日志和该第二组事务日志，然后根据每组事务日志中所包括的至少两个事务日志以及每组事务日志中的事务日志之间的依赖关系，在目的端设备302的目的端数据库中重演每组事务日志，使得目的端数据库与源端数据库存储的数据一致。

具体来讲，由于第一组事务日志中的最后一个事务日志的产生时间早于第二组事务日志的第一个事务日志的产生时间，因此，目的端设备302需要先根据所述第一组事务日志中的第一事务日志、第二事务日志以及第一事务日志与第二事务日志的依赖关系，在目的端数据库进行事务重演之后，再根据第二组事务日志中的第三事务日志、第四事务日志以及第三事务日志与第四事务日志的依赖关系在目的端数据库进行事务重演。

需要说明的是，在实际使用过程中，上述系统中的源端设备和目的端设备还可以并行处理更多组事务日志，例如并行处理三组事务日志、四组事务日志等，当获取更多组事务日志时，源端设备和目的端设备对该多组事务日志的处理过程与前述两组事务日志的处理过程相同。

另外，在本申请实施例中，源端设备和源端数据库可以集成在一个设备中，也可以是两个独立的设备，目的端设备和目的端数据库也可以集成在一个设备或者也可以是两个独立的设备。且，源端设备和源端数据库可以设置在第一区域或第一数据中心，目的端设备和目的端数据库可以设置在与第一区域或第一数据中心远程连接的第二区域或第二数据中心，或者，源端设备、源端数据库、目的端设备以及目的端数据库也可以是设置在同一区域或者同一数据中心，在此不作限制。

下面，将以不同的示例对数据库复制系统300的源端设备301和目的端设备302的具体实现方式进行说明。

示例一

请参考图4，为数据库复制系统300的一种示例的结构框图。如图4所示，源端设备301中可以设置两个抽取模块(分别为第一抽取模块3011和第二抽取模块3012)和两个发送模块(分别为第一发送模块3013和第二发送模块3014)，两个抽取模块和两个发送模块为一对一连接的关系，例如，第一抽取模块3011与第一发送模块3013连接，第二抽取模块3012与第二发送模块3014连接。目的端设备302中可以设置两个接收模块(分别为第一接收模块3021和第二接收模块3022)和一个重演模块3023，两个接收模块分别与两个发送模块为一对一连接的关系，例如，第一发送模块3013与第一接收模块3021连接，第二发送模块3014与第二接收模块3022连接，两个接收模块分别与重演模块3023连接。

需要说明的是，抽取模块、发送模块以及接收模块的数量可以与源端设备301所需要抽取的事务日志组的数量相关联，例如，若源端设备301需要获取两组事务日志，则可以设置两个抽取模块、两个发送模块以及两个接收模块；若源端设备301需要获取三组事务日志，则可以设置三个抽取模块、三个发送模块以及三个接收模块，以此类推，在此不一一列举。

具体来讲，若源端设备301和目的端设备302为独立的装置，例如可以是独立的服务器，则每个抽取模块、每个发送模块、每个接收模块以及重演模块可以是服务器中由程序代码实现的功能模块或者应用程序或者线程等。若源端设备301和目的端设备302为集群系统，例如，由至少一个虚拟机组成的集群系统，则每个抽取模块、每个发送模块、每个接收模块以及重演模块可以是部署在虚拟机上的虚拟化功能实例或者容器等。当然，上述各个模块也可以通过其他方式实现，在此不作限制。

在本示例中，每个抽取模块用于从源端数据库的日志文件中获取一组事务日志，例如，第一个抽取模块3011用于从日志文件中获取第一组事务日志，第二个抽取模块3012用于从日志文件中获取第二组事务日志。在本申请实施例中，抽取模块获取事务日志的方式可以包括但不限于如下三种：

第一种获取方式：

每个抽取模块首先需要确定其应该抽取的一组事务日志所在的抽取范围，然后根据各自的抽取范围，获取第一组事务日志和第二组事务日志。

该抽取范围可以是预先设置好的。例如，日志文件中的每一行可以用来存储一个事务日志，具体来讲，可以通过一个事务日志的起始标识和终止标识来指示日志文件中的某一行。则第一个抽取模块3011固定抽取日志文件中1-100行中存储的事务日志，第二个抽取模块3012固定抽取日志文件中的101-200行中存储的事务日志，当确定需要抽取事务日志时，各个抽取模块则按照预先设置好的抽取范围，并行从日志文件中对应的位置获取该组事务日志。需要说明的是，可以为每个抽取模块设置用于抽取事务日志的时间，例如，可以设置在源端设备301开机后的一小时后开始抽取事务日志，则在源端设备301的运行时长达到一小时后，则各个抽取模块则按照上述方式获取各组事务日志。

第二种获取方式：

每个抽取模块根据事务日志的编号范围从源端数据库中并行获取第一组事务日志和第二组事务日志。

具体来讲，事务日志的编号可以是抽取模块根据事务日志的产生时间先后顺序进行编号得到的。例如，第一个产生的事务日志的编号为1，第二个产生的事务日志的编号为2，以此类推。在这种情况下，可以预先设置每个抽取模块用于抽取的事务日志的起始编号和抽取个数，例如，每个抽取模块均抽取5000个事务日志，则第一个抽取模块3011需要抽取的事务日志的起始编号为1，抽取个数为5000，即抽取编号为1-5000的事务日志，第二个抽取模块3012需要抽取的事务日志的起始编号为5001，抽取个数为5000，即抽取编号为5001-10000的事务日志。则每个抽取模块则按照预设的编号范围，获取一组事务日志。需要说明的是，在上述示例中，是以事务日志的起始编号为1进行说明的，在实际使用过程中，事务日志的起始编号也可以为0，在此不作限制。

然后，在每个抽取模块确定各自的编号范围后，则按照该编号范围，从源端数据库中获取一组事务日志。例如，日志文件中的每个事务日志可以包括头部和主体两部分，头部用于记录该事务日志的存储位置等信息，主体用于记录该事务日志的类型、该事务日志对应的操作以及所处理的数据的内容等信息，在此不一一说明。抽取模块可以依次从源端数据库中读取每个事务日志，在读取事务日志时，首先根据事务日志的产生时间确定该事务日志的编号，若该事务日志的编号属于该抽取模块对应的编号范围，则进一步读取事务日志的头部和该事务日志的主体，以获取该事务日志；若该事务日志的编号不属于该抽取模块对应的编号范围，则跳过该事务日志读取下一个事务日志，直至获取该编号范围对应的所有的事务日志，最终获取与该抽取模块对应的一组事务日志。另外，抽取模块在根据事务日志的产生时间确定事务日志的编号后，也可以在获取该事务日志之后，将该事务日志的编号添加在事务日志的头部中。

另外，需要说明的是，抽取模块在获取每个事务日志之后，可以对事务日志进行过滤，然后再对过滤之后的事务日志进行编号。过滤方式例如，抽取模块只需要获取数据表A的事务日志，则抽取模块可以过滤掉不属于数据表A的事务日志。或者，抽取模块也可以根据事务日志的类型进行过滤，例如，过滤掉对创建数据表的事务日志以及修改数据表结构的事务日志等。具体的过滤方式有多种，在此不一一说明。

然而在源端数据库中，事务日志在日志文件中存储的位置可能是不连续的，例如，事务日志1存储在日志文件的第一行，事务日志2存储在日志文件的第四行，在这种情况下，每个抽取模块可能需要遍历日志文件中所有的事务日志，才能获取其编号范围内对应的事务日志。

因此，为了进一步提高抽取模块的处理效率，提供第三种获取方式：

源端设备301的源端数据库在存储事务日志时，可以生成与每个事务日志对应的日志概要记录信息，该日志概要记录信息记录有源端数据库产生的事务日志的编号、在所述日志文件中的记录位置、长度以及数量，当然，也可以包括其他信息，在此不一一举例。需要说明的是，该日志概要记录信息中的事务日志的编号是由源端数据库产生的，例如，源端数据库可以根据事务日志的产生时间对事务日志进行编号。该日志概要记录信息存储在源端数据库中指定的位置，这样，当抽取模块需要获取事务日志时，可以首先到指定位置获取该日志概要记录信息，然后根据所述日志概要记录信息在日志文件中并行获取第一组事务日志和第二组事务日志。例如，抽取模块需要获取编号为2的事务日志，则抽取模块首先获取源端数据库的日志概要记录信息，从该日志概要记录信息中找到编号为2的一条记录，根据该条记录中的位置、长度以及数量，确定编号为2的事务日志在日志文件中的存储位置，然后到日志文件中对应的位置获取事务日志，即编号为2的事务日志，从而不用遍历日志文件中所有的事务日志，可以提高抽取模块的处理效率。

需要说明的是，在上述示例中，每个抽取模块对应的抽取范围中所包括的事务日志的数量是相同，在实际使用过程中，不同的抽取模块所对应的抽取范围中包括的事务日志的数量也可以是不同。例如，第一个抽取模块可以抽取5000个事务日志，第二个抽取模块可以抽取4000个事务日志，本领域技术人员可以根据实际使用需求进行设置，在此不作限制。

由前述内容可知，每个事务日志中可以记录多种内容，例如，可以包括该所处理的操作对象、操作对象的内容、操作对象(可以理解为数据)的大小等信息，结合本申请实施例中传输事务日志的目的(即为了能够获取源端数据库中发生变化的数据)来看，并非事务日志中包括的每一个内容都是获取源端数据库中发生变化的数据必不可少的，例如，即使事务日志中不包括所处理的数据的大小，当在目的端数据库中重演该事务日志后，仍然可以获取对应的数据。因此，为了减少传输的事务日志所占用的传输资源，提高传输事务日志的效率，在本申请实施例中，每个抽取模块获取事务日志后，还可以对事务日志进行解析，并按照预设的过滤条件，对每个事务日志进行过滤处理，获取过滤后的事务日志。

作为一种示例，在获取事务日志后，首先对事务日志进行解析，获取该事务日志所包括的内容，然后根据该事务日志对应的操作类型，以及与每个操作类型对应的过滤条件，将事务日志中的部分内容过滤掉，然后将剩余内容进行复制并组合，得到过滤后的事务日志。其中，将部分内容过滤掉，可以理解为将部分内容删除。事务日志对应的操作类型可以包括但不限于增加数据的操作类型、修改数据的操作类型、删除数据的操作类型、增加数据库表的操作类型以及删除数据库表的操作类型等，本领域技术人员可以根据实际使用需求设置与不同的操作类型对应的过滤条件，例如，针对增加数据的操作类型，其对应的过滤条件可以为过滤掉除所处理的数据的存储位置以及数据的内容之外的信息，又例如，针对删除数据的操作类型，其对应的过滤条件可以为过滤掉所处理的操作对象之外的信息，这样，可以灵活地对不同的事务日志进行过滤。此处进行过滤的条件与前述抽取模块在对事务日志进行编号之前进行过滤的条件可以相同，也可以不同，在此不作限制。

当然，当源端数据库的类型不同时，事务日志的结构可能会不同。例如，当源端数据库采用数据库A时，事务日志包括5个字段，当源端数据库采用数据库B时，事务日志包括7个字段，因此，为了保证能够准确地解析事务日志所包括的内容，每个抽取模块可以适配支持不同类型的数据库对应的事务日志，也就是说，每个抽取模块可以对应有多种对事务日志进行解析的方式，抽取模块在解析事务日志之前，可以先确定源端数据库的类型，然后采用与源端数据库的类型相匹配的解析方式，对事务日志进行解析。

另外，在本申请实施例中，当每个抽取模块抽取完一组事务日志后，每个抽取模块还可以自动计算出下一组要抽取的事务日志的抽取范围。例如，多个抽取模块之间可以进行交互，每个抽取模块可以获取其他模块的抽取范围，例如，第一个抽取模块1的编号范围为1-5000，且第一个抽取模块获取其他抽取模块的编号范围中包括的事务日志的数量均为5000，则第一个抽取模块可以推算出下一组要抽取的事务日志的编号范围为20001-25000。或者，每个抽取模块中还可以预先设置计算策略，该计算策略可以为在抽取完一组事务日志后，自动在当前的编号范围内增加20000得到下一组事务日志的编号范围。这样，抽取模块可以不用等待重演模块重演完其抽取的事务日志，便抽取下一组事务日志，可以加快处理效率。

当第一抽取模块3011和第二抽取模块3012分别获取对应的一组事务日志后，则将各自获取的一组事务日志发送到与其连接的发送模块，例如，第一抽取模块3011将获取的第一组事务日志发送给第一发送模块3013，第二抽取模块3012将获取的第二组事务日志发送给第二发送模块3014，然后通过第一发送模块3013将第一组事务日志发送给第一接收模块3021，通过第二发送模块3014将第二组事务日志并行发送给第二接收模块3022。

第一接收模块3021和第二接收模块3022分别接收到该第一组事务日志和第二组事务日志之后，则将该第一组事务日志和第二组事务日志发送给重演模块3023，重演模块3023根据事务日志之间的依赖关系在目的端数据库重演这两组事务日志。

作为一种示例，重演模块3023首先判断第一组事务日志中包括的事务日志之间的依赖关系，例如，重演模块3023确定第一组事务日志中的第一事务日志的操作对象与第二事务日志的操作对象是否相同，若相同，则判断第一事务日志的产生时间是否在第二事务日志的产生时间之前，若是，则确定第二事务日志依赖第一事务日志，则重演模块3023先重演第一事务日志之后，再重演第二事务日志，以保证在目的端数据库获取的数据的准确性。具体来讲，重演模块3023中可以包括多个重演队列，重演模块3023可以根据事务日志之间的依赖关系，将第一组事务日志中包括的多个事务日志划分到多个重演队列中。例如，第一事务日志与第二事务日志具有依赖关系，则将第一事务日志和第二事务日志划分到同一个重演队列中，其他的事务日志均与第一事务日志和第二事务日志之间不存在依赖关系，则将其他事务日志划分到其他重演队列中，直至将第一组事务日志中所有的事务日志都划分到对应的重演队列中，然后依次重演各个重演队列中的每个事务日志，完成对第一组事务日志的重演。重演模块3023采用与上述相同的方式，确定第二组事务日志中包括的事务日志之间的依赖关系，并在重演完第一组事务日志之后，按照第二组事务日志中各个事务日志之间的依赖关系，重演第二组事务日志中的所有事务日志，具体过程与重演第一组事务日志相似，在此不再赘述。

需要说明的是，一个事务日志中可以包括多个事务操作，例如，该多个事务操作可以包括增加、修改、删除不同的数据表的不同行或者不同列中的数据，也就是说，一个事务日志可以包括多个操作对象，则在这种情况下，确定该事务日志与其他事务日志之间的依赖关系时，只要其他事务日志的操作对象，与该事务日志的多个操作对象中的其中一个操作对象相同，则确定这两个事务日志之间存在依赖关系。

当然，在其他实施例中，重演模块也可以包括多个。请参考图5，为数据库复制系统300的另一种示例的结构框图。与图4不同的是，在图5所示的示例中，重演模块的数量可以与接收模块的数量相同，例如，包括两个重演模块，分别为第一重演模块3024和第二重演模块3025，其中，第一重演模块3024与第一接收模块3021连接，用于接收第一组事务日志，第二重演模块3025与第二接收模块3022连接，用于接收第二组事务日志，然后第一重演模块3024和第二重演模块3025按照预设的顺序重演其接收到的事务日志，该预设的顺序为第一重演模块3024先进行重演，当第一重演模块3024中的事务日志重演完之后，第二重演模块3025再进行重演。其中，每个重演模块重演其接收到的一组事务日志的方式与图4中的重演模块3023的方式相似，在此不作限制。

需要说明的是，在图5所示的示例中，接收模块也可以集成到重演模块中，例如，将第一接收模块3021集成到第一重演模块3024中，将第二接收模块3022集成到第二重演模块3025中，从而可以简化系统。

示例二

如图3所示的数据库复制系统300中的源端设备301除用于并行获取第一组事务日志和第二组事务日志之外，还用于提供第一组事务日志和第二组事务日志中每一组事务日志包括的多个事务日志之间的依赖关系。

具体来讲，针对第一组事务日志，源端设备301在确认第一事务日志记录的第一事务操作在源端数据库中的操作对象与第二事务日志记录的第二事务操作在源端数据库中的操作对象相同，且第一事务日志记录的第一事务操作在源端数据库中的操作时刻早于第二事务日志记录的第二事务操作在源端数据库中的操作时刻的情况下，将第一事务日志的编号记录到第二事务日志中，通过在第二事务日志中携带的第一事务日志的编号，来指示第一事务日志与第二事务日志的依赖关系，即第二事务日志依赖第一事务日志。

针对第二组事务日志，源端设备301在确认第三事务日志记录的第三事务操作在源端数据库中的操作对象与第四事务日志记录的第四事务操作在源端数据库中的操作对象相同，且第三事务日志记录的第三事务操作在源端数据库中的操作时刻早于第四事务日志记录的第四事务操作在源端数据库中的操作时刻的情况下，将第三事务日志的编号记录到第四事务日志中，通过在第四事务日志中携带的第三事务日志的编号，来指示为第三事务日志与第四事务日志的依赖关系，即第四事务日志依赖第三事务日志。

在这种情况下，目的端设备302则可以根据每一组事务日志中是否携带其他事务日志的编号来重演每一组事务日志中的多个事务日志。

具体来讲，若第一事务日志中不包括用于指示与该第一事务日志存在依赖关系的事务日志的编号，则目的端设备302在获取到该第一事务日志的情况下，确认根据该第一事务日志进行事务重演。然后，目的端设备302在获取到第一组事务日志中的第二事务日志的情况下，确认该第二事务日志记录有用于指示该第一事务日志与该第二事务日志的依赖关系的第一事务日志的编号，在确认根据第一事务日志进行的事务重演完成之后，再根据第二事务日志进行事务重演，依次类推，直至重演完第一组事务日志中包括的所有事务日志。然后，目的端设备302在获取到第二组事务日志中的第三事务日志的情况下，确认该第三事务日志没有记录有用于指示与该第三事务日志存在依赖关系的事务日志的编号，在根据该第三事务日志进行事务重演。在获取到第二组事务日志中的第四事务日志的情况下，确认该第四事务日志记录有用于指示第四事务日志与第三事务日志的依赖关系的第三事务日志的编号，在确认根据第三事务日志进行的事务重演完成之后，再根据第四事务日志进行事务重演，依次类推，直至重演完第二组事务日志中包括的所有事务日志。

在这种情况下，请参考图6，为数据库复制系统300的另一种示例的结构框图。

与图4所示的结构不同的是，源端设备301中还设置有两个并行化模块，分别为第一并行化模块3015和第二并行化模块3016，每个并行化模块分别与一个抽取模块和一个发送模块连接，例如，第一并行化模块3015分别与第一抽取模块3011以及第一发送模块3013连接，第二并行化模块3016分别与第二抽取模块3012以及第二发送模块3014连接。每个并行化模块用于确定每一组事务日志中包括的多个事务日志之间的依赖关系，并将该依赖关系添加到对应的事务日志中。

需要说明的是，并行化模块的数量以及实现方式，与前述抽取模块、每个发送模块、每个接收模块以及重演模块相似，在此不再赘述。另外，第一抽取模块3011、第一发送模块3013、第二抽取模块3012、第二发送模块3014、第一接收模块3021、第二接收模块3022以及重演模块3023分别与图4中相应的模块相似，在此不再赘述。在本示例中，主要对并行化模块进行说明。

具体来讲，第一并行化模块3015接收到与其连接的第一抽取模块3011发送的第一组事务日志后，则依次为该组事务日志中的每个事务日志添加依赖关系。首先，第一并行化模块3015获取第一组事务日志中的第一个事务日志，很显然第一个事务日志不存在依赖关系，然后，第一并行化模块3015可以在第一个事务日志的头部添加一个字段，该字段用于指示该事务日志所依赖的事务日志的编号，由于第一个事务日志不存在依赖关系，则第一个事务日志对应的字段中可以为空，或者，第一并行化模块3015也可以在该字段中写入0，在这种情况下，事务日志的起始编号为1，若为0，则说明该事务日志不依赖其他事务日志。然后，第一并行化模块3015判断第一组事务日志中的第二个事务日志的依赖关系，确定该第二个事务日志记录的事务操作在源端数据库中的操作对象是否与在前的事务日志记录的事务操作在源端数据库的操作对象相同。例如，第一并行化模块3015确定第一个事务日志记录的事务操作用于处理数据表A的第一行数据，第二个事务日志记录的事务操作也用于处理数据表A的第一行数据，则第一并行化模块3015确定第一个事务日志和第二个事务日志分别记录的事务操作在源端数据库中的操作对象相同；或者，当源端数据库为KV键值数据库，则第一并行化模块3015可以通过确定两个事务日志中记录的操作对象是否存在至少一个相同的键值来确定两个事务日志分别记录的事务操作在源端数据库中的操作对象是否相同，若存在相同的键值，则说明两个事务日志分别记录的事务操作在源端数据库中的操作对象相同，若不存在任意一个相同的键值，则说明两个事务日志分别记录的事务操作在源端数据库中的操作对象不同。当然，也可以通过其他方式判断，在此不作限制。

然后，第一并行化模块3015再判断第一个事务日志记录的事务操作在源端数据库中的操作时刻(可以理解为第一个事务日志在日志文件的产生时间)，是否在第二个事务日志记录的事务操作在源端数据库中的操作时刻(可以理解为第二个事务日志在日志文件的产生时间)之前，若为是，则说明第二个事务日志依赖第一个事务日志，则将第一个事务日志的编号添加到第二个事务日志的头部中新增的字段中。紧接着，继续确定第一组事务日志中的第三个事务日志分别与第一个事务日志和第二个事务日志的依赖关系，具体确定方式与前述确定第二个事务日志与第一个事务日志的依赖关系相似，在此不再赘述。若确定第三个事务日志分别与第一个事务日志及第二个事务日志存在依赖关系，则在第三个事务日志的头部中新增的字段中，增加第一个事务日志的编号和第二个事务日志的编号。采用前述相同的方式，确定该组事务中每个事务日志与在先的事务日志之间的依赖关系，并将确定的依赖关系添加在对应的事务日志中，从而获得包括依赖关系的一组事务日志，然后将包括依赖关系的事务日志发送给第一发送模块3013，通过第一发送模块3013将包括依赖关系的事务日志发送给目的端设备302中的重演模块3023。

需要说明的是，每个并行化处理模块处理完一组事务日志后，可以将已经处理完的事务日志先缓存在本地，然后再创建新的处理队列，接收并处理与其连接的抽取模块发送的另一组事务日志，而不用等待前述已经处理完成的事务日志成功传输到目的端数据库，可以提高并行化处理模块的处理效率。

另外，由前述内容可知，在重演模块根据事务日志进行重演时，需要先重演完成第一组事务日志后，才能根据第二组事务日志进行重演，因此，为了便于重演模块区分出不同组的事务日志，并行化处理模块也可以在每个事务日志的头部中新增字段，用于指示该事务日志所属的组别的信息。例如，第一事务日志和第二事务日志属于第一组事务日志，则在第一事务日志和第二事务日志的头部中增加编号1，第三事务日志和第四事务日志属于第二组事务日志，则在第三事务日志和第四事务日志的头部中增加编号2。

另外，针对前述对抽取模块的说明可知，每个抽取模块抽取完一组事务日志后，还可以自动计算出下一组要抽取的事务日志的抽取范围。例如，第一个抽取模块1在抽取完编号范围为1-5000的事务日志之后，不用等待该事务日志重演完成，则在确定出下一组要抽取的事务日志的编号范围为20001-25000之后，可以抽取编号范围为20001-25000的事务日志。很显然，取编号范围为20001-25000的事务日志也是属于组1的事务日志，为了便于将编号范围为1-5000的事务日志和编号范围为20001-25000的事务日志区分开，并行化处理模块还可以在事务日志中增加用于显示抽取次数的标识。例如，编号范围为1-5000的事务日志为抽取模块1第一次抽取的事务日志组中的事务日志，则可以在每个事务日志中增加编号11，其中第一个编号1用于指示该事务日志为第一次抽取的，第二个编号用于指示该事务日志所属的组别为第一组，当然，也可以用第一个编号1指示该事务日志所述的组别，用第二个编号1指示该事务日志为第一次抽取的，在此不作限制；编号范围为20001-25000的事务日志为抽取模块1第二次抽取的事务日志组中的事务日志，则可以在每个事务日志中增加编号21，其中第一个编号2用于指示该事务日志为第二次抽取的，第二个事务日志用于指示该事务日志所属的组别为第一组，或者，也可以增加编号12，第一个编号1用于指示该事务日志所属的组别，第二个编号2用于指示该事务日志为第二次抽取的，这样，当重演模块接收到事务日志后，先执行每个抽取模块第一次抽取的事务日志，然后在执行第二次抽取的事务日志，以此类推。

示例三

请参考图7，为数据库复制系统300的另一种示例的结构框图。

与图6所示的结构不同的是，目的端设备302中的重演模块的数量可以有多个，且重演模块的数量可以与接收模块的数量不同。例如，在图7中，包括三个重演模块，分别为第三重演模块3026、第四重演模块3027以及第五重演模块3028，其中，每个重演模块分别与第一接收模块3021和第二接收模块3022连接，也就是说，每个接收模块可以向任意一个重演模块发送事务日志，且每个重演模块可以用来接收来自不同组的事务日志。

第一种示例，每个接收模块可以将接收的一组事务日志中的每个事务日志随机分发给任意一个重演模块。

第二种示例，每个接收模块可以按照预设的顺序将接收的一组事务日志中的每个事务日志分发给重演模块，例如，第一接收模块3021将接收到的第一组事务日志中的第一个事务日志分发给第三重演模块3026，将第一组事务日志中的第二个事务日志分发给第四重演模块3027，将第三个事务日志分发给第五重演模块3028，将第四个事务日志分发给第三重演模块3026，将第五个事务日志分发给第四重演模块3027，将第六个事务日志分发给第五重演模块3028，以此类推。

第三种示例，可以给每个重演模块进行编号，例如，第三重演模块3026的编号为1，第四重演模块3027的编号为2，第五重演模块3028的编号为3，可以按照负载均衡的原则，根据每个事务日志的编号进行哈希计算，哈希计算的结果即每个事务日志应该分发到的重演模块的编号，从而将该事务日志分发给对应的重演模块。例如，第一组事务日志中的第一个事务日志为事务日志1，则第一接收模块3021对编号1进行哈希计算，得到计算值，例如为1，则说明事务日志1应该分发给编号为1的重演模块，则第一接收模块3021将事务日志1分发给第三重演模块3026，以此类推，直至完成将接收到的每个事务日志分发给重演模块。

需要说明的是，在上述示例中，当接收模块将接收到的一组事务日志分发给多个重演模块时，还可以在每个事务日志中携带该事务日志所述的事务日志组的标识。例如，第一组事务日志中的每个事务日志携带第一组的标识，第二组事务日志中的每个事务日志携带第二组的标识，以此类推，在此不一一说明。

每个重演模块在接收到各个接收模块发送的事务日志之后，则将事务日志缓存到不同的重演队列中等待重演。具体来讲，一个重演模块可以设置多个重演队列，这些重演队列分别缓存不同的接收模块发送的事务日志，例如，在本实例中，接收模块的数量为2个，则每个重演模块中可以包括有2个重演队列，按照从每个接收模块接收的事务日志的产生时间的先后顺序，将不同接收模块发送的事务日志缓存在不同的重演队列中。例如，第三重演模块3026将从第一接收模块3021接收的事务日志，依次缓存在第一个重演队列中，将从第二接收模块3022中接收的事务日志，依次缓存在第二个重演队列中。其他重演模块的处理过程与第三重演模块3026的处理方式相同，在此不再赘述。或者，可以设置多个重演队列与不同的事务日志组相关联，例如，将第一组事务日志中的所有事务日志缓存在第一个重演队列中，将第二组事务日志中的所有事务日志缓存在第二个重演队列中，这样，可以根据不同的重演队列来进行事务日志重演。

然后，每个重演模块则按照重演队列的顺序，依次重演完不同队列中的事务日志，例如，第三重演模块3026先处理第一个重演队列中的事务日志，在重演该队列中所有的事务日志之后，再重演第二个重演队列中所有的事务日志。其他重演模块的处理方式也是一样，在此不再赘述。

每个重演模块在确定该重演模块中正在等待处理的第一个事务日志满足重演条件时，重演该第一个事务日志。其中，正在等待处理的第一个事务日志，可以理解为，该重演模块正在处理的重演队列中的第一个等待处理的事务日志。例如，第三重演模块3026首先处理第一个重演队列中的事务日志，第一个重演队列中的第一个事务日志为第一组事务日志中的第一个事务日志，然后，第三重演模块3026确定该第一个事务日志是否依赖其他事务日志，例如，第三重演模块3026确定第一个事务日志中没有携带第一组事务日志中其他事务日志的编号，从而确定第一个事务日志不依赖其他事务日志，则确定第一个事务日志满足重演条件，则按照第一个事务日志，在目的端数据库中进行重演，具体重演的过程与图2所示的示例中相似，在此不作限制。当第三重演模块3026重演完该第一个事务日志之后，则将重演结果发送给其他重演模块，即将重演结果发送给第四重演模块3027 以及第五重演模块3028，其中，重演结果为第一个事务日志完成重演。

其中，当第三重演模块3026在处理其第一个重演队列中的事务日志时，第四重演模块3027以及第五重演模块3028也在并行处理各自的第一个重演队列中的事务日志。只不过，由于第四重演模块3027中第一个重演队列的第一个等待处理的事务日志为第一组事务日志中的第二个事务日志，第四重演模块3027确定该第二个事务日志依赖第一组事务日志中的第一个事务日志，从而，在第四重演模块3027未从其他重演模块中接收到第一组事务日志的第一个事务日志完成重演的重演结果之前，第四重演模块3027不能重演该事务日志。第五重演模块3028也是如此。也就是说，在同一时刻，多个重演模块中只有一个重演模块在重演事务日志，而其他的重演模块处于等待状态中。

当第四重演模块3027接收到第三重演模块3026发送的第一组事务日志中的第一个事务日志的重演结果之后，第四重演模块3027判断该重演结果正好是其在等待处理的事务日志(即第一组事务日志中的第二个事务日志)所依赖的事务日志的重演结果，则第四重演模块3027确定其正在等待处理的事务日志满足重演条件，则按照该事务日志在目的端数据中进行重演，并将第二个事务日志的重演结果发送给第三重演模块3026以及第五重演模块3027。

当第五重演模块3028接收到第三重演模块3026发送的第一组事务日志中的第一个事务日志的重演结果之后，第五重演模块3028判断其在等待处理的事务日志为第一组事务日志中的第四个事务日志，而第四个事务日志依赖第二个事务日志和第三个事务日志，该重演结果不是其正在等待处理的事务日志所依赖的事务日志的重演结果，因此，保持继续等待的状态，直至其接收到第一组的第二个事务日志和第三个事务日志的重演结果之后，才能开始重演。

需要说明的是，当第四重演模块3027以及第五重演模块3028在预设时长内未接收到其正在等待处理的事务日志所依赖的事务日志的重演结果时，第四重演模块3027以及第五重演模块3028也可以向其他重演模块发送用于获取该重演结果的询问请求，并由执行该事务日志的重演模块对该询问请求进行应答，应答结果为该事务日志是否重演完成。这样，第四重演模块3027以及第五重演模块3028也可以根据应答结果确定是否需要继续保持等待状态。

按照上述过程，当三个重演模块重演完所有重演队列中的事务日志之后，则在目的端数据库得到了与源端数据库相同的数据。

在本申请实施例中，为了保证传输事务日志的可靠性，每个发送模块中还可以包括缓存单元，用于缓存未发送给接收模块的事务日志。源端设备301可以对日志文件中存储时长超过阈值的事务日志进行清除，然而，当发送模块与接收模块的传输发生异常，例如，传输中断，在这种情况下，发送模块可以通过缓存单元，将还未发送给接收模块的事务日志进行存储，以便于当传输恢复后，重新向该接收模块发送该事务日志。或者，发送模块也可以采用其他方式保证事务日志传输的可靠性，例如，发送模块也可以直接将还未发送给接收模块的事务日志存储到永久性存储设备中，在此不作限制。

另外，每个发送模块可以同时创建多个处理队列，每个处理队列用于处理从并行化模块接收的一组事务日志，并按照预设的处理顺序，依次将各个处理队列中的事务日志发送给接收模块。各个处理队列之间可以独立执行，即，当其中一个处理队列中的事务日志未全部发送给接收模块时，另一个处理队列中从与其连接的并行化模块中接收下一组事务日志，以减少传输等待的时延。

为了能够更加直观地了解该示例中各个模块的处理流程，下面以一个具体的例子，对图7所示的数据库复制系统300进行数据复制的处理流程进行说明。请参考图8，为图7所示的数据库复制系统300进行数据复制的一种示例的示意图。

如图8所示，源端设备301的源端数据库在预设时长内产生了包括n个事务日志的日志文件，n个事务日志分别为事务日志1～事务日志n，且源端设备301包括3个抽取模块，分别为抽取模块1～抽取模块3，3个并行化模块，分别为并行化模块1～并行化模块3，以及3个发送模块，分别为发送模块1～发送模块3，且各个模块之间一一连接，即并行化模块1分别与抽取模块1和发送模块1连接，并行化模块2分别与抽取模块2和发送模块2连接，并行化模块3分别与抽取模块3和发送模块3连接，相应地，在目的端设备302中包括3个接收模块和3个重演模块，分别为接收模块1～接收模块3，重演模块1～重演模块3，3个接收模块和3个重演模块一一连接。源端设备301中的每个发送模块分别与目的端设备302中的3个接收模块连接。

首先，各个抽取模块按照各自的编号范围从源端数据库的日志文件中并行抽取一组事务日志，例如，抽取模块1抽取的组1的事务日志包括事务日志1～事务日志3，抽取模块2抽取的组2的事务日志包括事务日志4～事务日志6，抽取模块3抽取的组3的事务日志包括事务日志7～事务日志9，然后各个抽取模块将各自抽取的一组事务日志发送给与其连接的并行化模块。在图8中，以T1～T9为例标记事务日志1～事务日志9。

并行化模块1接收到抽取模块1发送的组1的事务日志后，确定事务日志2依赖事务日志1，则将编号1添加到事务日志2的头部，以指示事务日志1和事务日志2之间的依赖关系，以及，确定事务日志3和事务日志1不依赖其他事务日志，则在事务日志1和事务日志2的头部中添加编号0，然后将添加编号的事务日志1～添加编号的事务日志3发送给发送模块1。并行化模块2接收到抽取模块2发送的组2的事务日志后，确定事务日志6依赖事务日志4，则将编号4添加到事务日志6的头部，以及，确定事务日志4和事务日志5不依赖其他事务日志，则在事务日志4和事务日志5的头部中添加编号0，然后将添加编号的事务日志4～添加编号的事务日志6发送给发送模块2。并行化模块3接收到抽取模块3发送的组3的事务日志后，确定事务日志7～事务日志9均不依赖其他事务日志，则在事务日志7～事务日志9的头部中添加编号0，然后将添加编号的事务日志7～添加编号的事务日志9发送给发送模块3。

发送模块1～发送模块3在接收到对应的一组事务日志后，则根据事务日志的编号，将各个事务日志发送给接收模块。例如，发送模块1对编号1进行哈希计算，得到的计算结果为1，从而将添加编号的事务日志1发送给接收模块1，且，发送模块1在事务日志1中添加事务日志组的编号，以向接收模块1指示事务日志1所属的事务日志组为组1，采用相同的方式发送组1中所有的事务日志，在此不一一说明。在图8中，发送模块1将事务日志1～事务日志3分别发送给接收模块1～接收模块3，发送模块2将事务日志4～事务日志6分别发送给接收模块1～接收模块3，发送模块3将事务日志7～事务日志9分别发送给接收模块1～接收模块3，从而接收模块1接收到组1的事务日志1、组2的事务日志4以及组3的事务日志7，接收模块2接收到组1的事务日志2、组2的事务日志5以及组3的事务日志8，接收模块3接收到组1的事务日志3、组2的事务日志6以及组3的事务日志9。接收模块将接收到的事务日志发送给与其连接的重演模块。

重演模块在接收到事务日志之后，则按照事务日志的之间的依赖关系以及事务日志所在的组，依次在目的端数据库中重演事务日志。例如，重演模块1首先执行组1中的事务日志，即事务日志1，确定事务日志1不依赖其他事务日志，则直接在目的端数据库中按照事务日志1进行重演，然后将事务日志1完成重演的结果发送给重演模块2和重演模块3。并行地，重演模块2首先执行组1中的事务日志2，由于事务日志2依赖事务日志1，则重演模块2先等待其他重演模块发送事务日志1完成重演的结果，当重演模块2从重演模块1接收到该结果后，则在目的端数据中按照事务日志2进行重演，然后将事务日志2完成重演的结果发送给重演模块1和重演模块3。并行地，重演模块3首先执行组1中的事务日志3，由于事务日志3不依赖其他事务日志，则重演模块3直接在目的端数据库中按照事务日志3进行重演，然后将事务日志3完成重演的结果发送给重演模块1和重演模块2。

然后，重演模块1可以判断组1的事务日志是否全部完成重演，在组1的事务日志全部完成重演后，则根据组2的事务日志进行重演。例如，组1的所有事务日志均缓存在第一个重演队列中，若重演队列1中的所有事务日志均已完成重演，则重演模块1可以判断组1的事务日志全部完成重演，则根据第二个重演队列中的事务日志进行重演。组2的事务日志的重演过程与组1的事务日志的重演过程相似，在此不再赘述。当每个重演模块重演完其接收到的所有的事务日志时，在目的端数据库中则得到了与源端数据库相同的数据，实现了将源端数据库中的数据复制到目的端数据库中。

示例四

与示例二中的数据库复制系统300不同的是，可以将设置在源端设备301中的并行化模块的功能，迁移到目的端设备302中，即源端设备301中不用提供每一组事务日志包括的多个事务日志之间的依赖关系，而通过目的端设备302确定出每一组事务日志包括的多个事务日志之间的依赖关系。

具体来讲，针对第一组事务日志，目的端设备302在确认第一事务日志记录的第一事务操作在源端数据库中的操作对象与第二事务日志记录的第二事务操作在源端数据库中的操作对象相同，且第一事务日志记录的第一事务操作在源端数据库中的操作时刻早于第二事务日志记录的第二事务操作在源端数据库中的操作时刻的情况下，将第一事务日志的编号记录到第二事务日志中，通过在第二事务日志中携带的第一事务日志的编号，来指示第一事务日志与第二事务日志的依赖关系，即第二事务日志依赖第一事务日志。

针对第二组事务日志，目的端设备302在确认第三事务日志记录的第三事务操作在源端数据库中的操作对象与第四事务日志记录的第四事务操作在源端数据库中的操作对象相同，且第三事务日志记录的第三事务操作在源端数据库中的操作时刻早于第四事务日志记录的第四事务操作在源端数据库中的操作时刻的情况下，将第三事务日志的编号记录到第四事务日志中，通过在第四事务日志中携带的第三事务日志的编号，来指示为第三事务日志与第四事务日志的依赖关系，即第四事务日志依赖第三事务日志。

目的端设备302确定每一组事务日志包括的多个事务日志之间的依赖关系的方式，与示例二中源端设备301相似，在此不再赘述。

在这种情况下，请参考图9，为数据库复制系统300的另一种示例的结构框图。

与图6所示的结构不同的是，更改了两个并行化模块的设置位置，由图6中设置在源端设备301中更改为设置在目的端设备302中。在图9中包括第三并行化模块30209和第四并行化模块30210，其中，每个并行化模块分别连接一个接收模块连接，用于从一个接收模块中接收一组事务日志，且每个并行化模块均与重演模块连接，也就是说，每个并行化模块可以向重演模块发送事务日志。

其中，第三并行化模块30209与图6所示的第一并行化模块3015相似，第四并行化模块30210与图6所示的第二并行化模块3016相似，其他模块分别与图6所示的相应的模块相似，在此不再赘述。

在图9中，重演模块的数量为一个，当然，重演模块的数量也可以是多个，如图10所示，包括三个重演模块，分别为第三重演模块3026、第四重演模块3027以及第五重演模块3028，从而每一个并行化模块分别与每一个重演模块连接，用于向任意一个重演模块发送事务日志。在这种情况下，各个并行化模块还用于执行将接收到的一组事务日志中的每个事务日志发送给多个重演模块的过程，例如，可以将接收的一组事务日志中的每个事务日志随机分发给任意一个重演模块，或者，可以按照预设的顺序将接收的一组事务日志中的每个事务日志分发给重演模块，或者，可以给每个重演模块进行编号，按照负载均衡的原则，根据每个事务日志的编号进行哈希计算，哈希计算的结果即每个事务日志应该分发到的重演模块的编号，从而将该事务日志分发给对应的重演模块。具体过程可以参照图7所示的示例中接收模块的分发事务日志的第一种～第三种示例，在此不再赘述。

示例五

请参考图11，为数据库复制系统300的另一种示例的结构框图。

与图10所示的结构不同的是，图11中还包括管理设备，分别为源端管理设备303以及目的端管理设备304。其他模块与图10中相似，在此不再赘述。

其中，源端管理设备303可以为每个抽取模块分配用于获取一组事务日志的编号范围，各个抽取模块根据源端管理设备303分配的编号范围抽取对应的事务日志。和/或，源端管理设备303还可以用于监测源端设备301中各个模块的运行状态，以及动态调整各个抽取模块抽取事务日志的数量以及范围。例如，监测到某一个抽取模块发生故障，则可以将该抽取模块需要获取的事务日志分配给其他抽取模块。

目的端管理设备304用于监测目的端设备302中各个模块的运行状态，以及动态调整各个接收模块和各个重演模块处理的事务日志的数量。例如，当监测到某个重演模块发生故障，则可以通知各个接收模块不向该故障的重演模块发送事务日志，且将该故障的重演模块需要重演的事务日志分发到其他重演模块中。

作为一种示例，目的端管理设备304在监测到某个重演模块出现故障时，收集相关信息，例如，发生故障的重演模块所处理的当前事务编号，故障的重演模块的编号等，然后将收集的相关信息发送给其他重演模块，然后，每个重演模块将事务的产生时间位于发生故障的重演模块所处理的当前事务编号之后的事务日志重新分发给其他未发生故障的重演模块，从而通过其他未发生故障的重演模块在目的端数据库重演事务日志。

若各个重演模块接收到的事务日志是由源端设备301中的发送模块分发的，则目的端管理设备304需要将收集的相关信息发送个源端管理设备303，由源端管理设备303将相关信息转发给各个发送模块，以将事务的产生时间位于发生故障的重演模块所处理的当前事务编号之后的事务日志重新分发给其他未发生故障的重演模块。

当目的端设备302中的接收模块或者源端设备301中的发送模块重新分发事务日志时，可以在重新分发的事务日志中添加重发标识，例如，可以添加“二次hash重发”标志，则收到携带有“二次hash重发”标志的第一条事务日志的重演模块可以立即进行事务重演，完成恢复。例如，发生故障的重演模块正在处理的事务日志的编号为3，则携带有“二次hash重发”标志的第一条事务日志为事务日志4，则当某一个重演模块接收到携带有“二次hash重发”标志且编号为4的事务日志后，则直接根据该事务日志在目的端数据库进行重演，然后将重演结果发送给其他重演模块，其余的事务日志则按照前述方式，根据每个事务日志所在的事务日志组以及依赖关系，在目的端数据库进行重演，从而恢复整个重演过程。

当然，若其他模块发生故障，源端管理设备303和目的端管理设备304也可以采用相似的方式重新分配未发生故障的模块的任务，以保证系统的稳定性。

另外，上述各个示例中的各个模块也可以进行自由组合，不限于上述示例中的几种组合方式。

在上述技术方案中，只在事务日志进行重演时，才考虑事务日志之间的依赖关系，这样，在事务日志进行重演之前，在不考虑事务日志之间的依赖关系的前提下，可以将事务日志分为多组并行抽取以及并行发送，从而可以提高数据库复制系统的处理效率。且，由于事务日志在目的端数据库会根据事务日志之间的依赖关系进行重演，因此，可以保证目的端数据库能够获取与源端数据库相同的数据，保证数据的一致性。

基于同一发明构思，本申请实施例提供一种数据库复制方法，该方法可以应用在如图3～图11所示的数据库复制系统中。请参考图12，为该方法的一种示例的流程图，该流程图描述如下：

S121、源端设备从源端数据库的日志文件中并行获取至少两组事务日志，该至少两组事务日志包括第一组事务日志和第二组事务日志。

在本申请实施例中，不限制事务日志组的数量，为方便说明，下文中以该至少两组事务日志包括第一组事务日志和第二组事务日志为例。其中，第一组事务日志至少包括相邻的第一事务日志和第二事务日志，第二组事务日志至少包括相邻的第三事务日志和第四事务日志，第二事务日志的产生时间早于第三事务日志的产生时间。对第一组事务日志和第二组事务日志的说明，可以参照前述示例一中的相应内容，在此不再赘述。

在本申请实施例中，源端设备从源端数据库中并行获取第一组事务日志和第二组事务日志，可以包括但不限于如下三种方式：

第一种获取方式：

首先需要确定其应该抽取的一组事务日志所在的抽取范围，然后根据各自的抽取范围，获取第一组事务日志和第二组事务日志。

第二种获取方式：

根据事务日志的编号范围从源端数据库中并行获取第一组事务日志和第二组事务日志。

第三种获取方式：

源端设备在存储事务日志时，可以生成与每个事务日志对应的日志概要记录信息，该日志概要记录信息记录有源端数据库产生的事务日志的编号、在所述日志文件中的记录位置、长度以及数量，然后，当源端设备需要获取事务日志时，则首先读取该日志概要记录信息，根据该日志概要记录信息在所述日志文件中并行获取所述第一组事务日志和所述第二组事务日志。

对上述三种获取方式的描述，可以参照前述任意一个示例中对抽取模块的说明，在此不再赘述。

需要说明的是，在本申请实施例中，以源端设备获取两组事务日志为例进行说明，在实际使用过程中，不限制源端设备并行获取的事务日志的组数，例如，可以并行获取三组事务日志、四组事务日志甚至更多组事务日志，在此不作限制。

S122、源端设备并行发送该第一组事务日志和该第二组事务日志，目的端设备接收该第一组事务日志以及该第二组事务日志。

若源端设备与目的端设备设置在不同的区域或者不同的数据中心，则源端设备可以通过与目的端设备之间的远程连接，将该第一组事务日志和第二组事务日志发送给目的端设备。

具体实现方式可以参照前述任意一个示例中对发送模块的说明，在此不再赘述。

S123、目的端设备在根据该第一组事务日志中的第一事务日志、第二事务日志以及第一事务日志与第二事务日志的依赖关系在目的端数据库进行事务重演之后，根据第二组事务日志中的第三事务日志、第四事务日志以及第三事务日志与第四事务日志的依赖关系在目的端数据库进行事务重演，使得目的端数据库与源端设备的源端数据库存储的数据一致。

具体来讲，目的端设备首先需要确定每一组事务日志所包括的多个事务日志之间的依赖关系，例如，确定第一组事务日志包括的第一事务日志和第二事务日志之间的依赖关系，以及，确定第二组事务日志包括的第三事务日志和第四事务日志之间的依赖关系。然后根据每一组事务日志的依赖关系，在目的端数据库中根据该组事务日志进行重演。

在本申请实施例中，确定第一组事务日志包括的第一事务日志和第二事务日志之间的依赖关系，包括：

在确认第一事务日志记录的第一事务操作在源端数据库中的操作对象与第二事务日志记录的第二事务操作在源端数据库中的操作对象相同，且第一事务日志记录的第一事务操作在源端数据库中的操作时刻早于第二事务日志记录的第二事务操作在源端数据库中的操作时刻的情况下，并将第一事务日志的编号记录到第二事务日志中，其中，第一事务日志的编号用于指示第一事务日志与第二事务日志的依赖关系。

确定第二组事务日志包括的第三事务日志和第四事务日志之间的依赖关系，包括：

在确认第三事务日志记录的第三事务操作在源端数据库中的操作对象与第四事务日志记录的第四事务操作在源端数据库中的操作对象相同，且第三事务日志记录的第三事务操作在源端数据库中的操作时刻早于第四事务日志记录的第四事务操作在源端数据库中的操作时刻的情况下，将第三事务日志的编号记录到第四事务日志中，其中，第三事务日志的编号用于指示第三事务日志与第四事务日志的依赖关系。

具体实现方式可以参照前述示例四中，对目的端设备302中的并行化处理模块的说明，在此不再赘述。

在确认每一组事务日志之间的依赖关系之后，则根据各个事务日志之间的依赖关系，在目的端数据库重演各个事务日志。

作为一种示例，目的端设备在获取到第一事务日志的情况下，确认第一事务日志没有记录有用于指示与该第一事务日志存在依赖关系的事务日志的编号，根据第一事务日志在目的端数据库进行事务重演。然后，在获取到第二事务日志的情况下，确认第二事务日志记录有用于指示第一事务日志与第二事务日志的依赖关系的第一事务日志的编号，在确认根据第一事务日志进行的事务重演完成之后，根据第二事务日志在目的端数据库进行事务重演。

目的端设备在获取到第三事务日志的情况下，确认第三事务日志没有记录有用于指示与该第三事务日志存在依赖关系的事务日志的编号，根据第三事务日志在目的端数据库进行事务重演。然后，在获取到第四事务日志的情况下，确认第四事务日志记录有用于指示第四事务日志与第三事务日志的依赖关系的第三事务日志的编号，在确认根据第三事务日志进行的事务重演完成之后，根据第四事务日志在目的端数据库进行事务重演。

具体实现方式可以参照前述任意一个示例中对重演模块的说明，在此不再赘述。

当目的端设备按照上述方式，在目的端数据库重演完所有的事务日志，则可以获取源端数据库中的数据，从而与源端数据库保持一致。

在上述技术方案中，目的端设备在进行事务重演之前，需要先确定每一组事务日志之间的依赖关系，在另一些实施例中，也可以由源端设备确定每一组事务日志之间的依赖关系，从而可以减少目的端设备的运算量。

请参考图13，为该方法的另一种示例的流程图，该流程图描述如下：

S131、源端设备从源端数据库的日志文件中并行获取第一组事务日志和第二组事务日志。

S132、源端设备确定每一组事务日志所包括的多个事务日志之间的依赖关系。

作为一种示例，针对第一组事务日志，源端设备在确认第一事务日志记录的第一事务操作在源端数据库中的操作对象与第二事务日志记录的第二事务操作在源端数据库中的操作对象相同，且第一事务日志记录的第一事务操作在源端数据库中的操作时刻早于第二事务日志记录的第二事务操作在源端数据库中的操作时刻的情况下，将第一事务日志的编号记录到第二事务日志中，其中，第一事务日志的编号用于指示第一事务日志与第二事务日志的依赖关系。

针对第二组事务日志，源端设备在确认第三事务日志记录的第三事务操作在源端数据库中的操作对象与第四事务日志记录的第四事务操作在源端数据库中的操作对象相同，且第三事务日志记录的第三事务操作在源端数据库中的操作时刻早于第四事务日志记录的第四事务操作在源端数据库中的操作时刻的情况下，将第三事务日志的编号记录到第四事务日志中，其中，第三事务日志的编号用于指示第三事务日志与第四事务日志的依赖关系。

其中，源端设备确定事务日志之间的依赖关系的方式，可以参照示例二中对并行化模块的说明，在此不再赘述。

S133、源端设备并行发送该第一组事务日志和该第二组事务日志，目的端设备接收该第一组事务日志以及该第二组事务日志。

需要说明的是，在这种情况下，源端设备发送的事务日志中，都携带有该事务日志所依赖的事务日志的编号。若某一个事务日志没有依赖的事务日志，则事务日志可以不携带其他事务日志的编号，或者携带的事务日志的编号为0。

S134、目的端设备在根据该第一组事务日志中的第一事务日志、第二事务日志以及第一事务日志与第二事务日志的依赖关系在目的端数据库进行事务重演之后，根据第二组事务日志中的第三事务日志、第四事务日志以及第三事务日志与第四事务日志的依赖关系在目的端数据库进行事务重演，使得目的端数据库与源端设备的源端数据库存储的数据一致。

步骤S133和步骤S134，分别与步骤S122和步骤S123相似，在此不再赘述。

在上述技术方案中，通过源端设备并行获取并发送多组事务日志，从而可以提高数据复制的效率，且并行发送的多组事务日志在目的端设备会根据事务日志之间的依赖关系进行事务日志重演，从而可以保证获取的数据的准确性，可以确保目的端数据库的数据与源数据库中的数据保持一致。

上述实施例中的介绍的源端设备以及目的端设备的功能，均可以由程序代码实现的功能模块、应用程序、线程、虚拟化功能实例或者容器来实现。例如，在源端设备中可以设置源端管理模块、多个抽取模块、多个并行化模块、多个发送模块，其中，源端管理模块用于监测源端设备中其他模块的运行状态，每个抽取模块用于从源端数据库的日志文件中获取一组事务日志，多个抽取模块并行获取多组事务日志，每个并行化模块用于从一个抽取模块中获取一组事务日志，然后确定该组事务日志中多个事务日志之间的依赖关系，然后将包括依赖关系的一组事务日志发送给一个发送模块，由该发送模块将包括由依赖关系的一组事务日志发送给目的端设备。在目的端设备中可以设置目的端管理模块和多个重演模块，目的端管理模块用于监测目的端设备中其他模块的运行状态，每个重演模块用于从源端设备接收事务日志，并由多个重演模块相互配合完成所有事务日志的重演。

下面，以上述多个模块为例，对本申请实施例提供的数据库复制方法进行说明。

在通过上述各个模块实现本申请实施例中的数据库复制方法之前，需要对各个模块进行初始化设置，请参考图14，为各个模块进行初始化设置的流程图，该流程图描述如下：

S1401、源端管理模块读取本端配置数据。

其中，该配置数据可以是由技术人员预先设置的，例如，可以包括抽取模块、并行化模块以及发送模块之间的拓扑关系及网络连接信息，并监听抽取模块、并行化模块、发送模块以及目的端管理模块发送的连接建立请求。

为方便说明，在图14中，以一个抽取模块、一个并行化模块以及一个发送模块为例进行示意说明，在抽取模块、并行化模块、发送模块的数量为多个时，每一个模块的处理过程均与图14对应的模块的处理过程相同。

S1402、目的端管理模块读取本端配置数据。

其中，该配置数据可以是由技术人员预先设置的，例如，可以包括重演模块之间的网络连接信息，并监听重演模块向目的端管理模块发送的连接建立请求。

为方便说明，在图14中，以一个重演模块为例进行示意说明，在重演模块的数量为多个时，每一个重演模块的处理过程均与图14所示的重演模块的处理过程相同。

S1403、抽取模块、并行化模块、发送模块分别向源端管理模块发送连接建立请求，并与源端管理模块建立连接。

S1404、重演模块分别向目的端管理模块发送连接建立请求，并与目的端管理模块建立连接。

S1405、目的端管理模块向源端管理模块发送连接建立请求，并与源端管理模块建立连接。

目的端管理模块还可以向源端管理模块发送目的端设备最后重演事务日志的编号和/或与目的端管理模块连接的重演模块的信息等。当重演模块由多个时，则发送所有重演模块的信息。

S1406、源端管理模块分别向并行化模块和发送模块发送连接确认消息，以及各个模块对应的连接信息。

例如，源端管理模块向每个并行化模块反馈与其连接的抽取模块和发送模块的信息，向每个发送模块发送与其连接的并行化模块以及重演模块的信息。

S1407、抽取模块、并行化模块、发送模块以及重演模块建立连接。

S1408、源端管理模块根据抽取模、并行化模块以及发送模块的配对数，计算每个抽取模块需要抽取的一组事务日志的编号范围，并向抽取模块反馈其对应的编号范围。

例如，抽取模块的数量为4个，每个抽取模块用于抽取2500个事务日志，即第一个抽取模块用于获取的一组事务日志的编号范围为1～2500，第二个抽取模块用于获取的一组事务日志的编号范围为2501～5000，以此类推。

S1409、源端管理模块向目的端管理模块反馈所有发送模块的信息以及每个抽取模块需要抽取的一组事务日志的编号范围。

S1410、每个抽取模块保存其编号范围，向源端管理模块返回确认消息。

通过上述步骤，完成数据库复制系统的初始化配置。在完成数据库复制系统的初始化配置之后，数据库复制系统则可以进行数据库复制。

请参考图15，为各个模块进行数据库复制的流程图，该流程图描述如下：

S1501、每个抽取模块向源端数据库发起事务日志获取请求。

该事务日志获取请求用于获取事务日志。由于每个抽取模块的处理流程相同，因此，在图15所示的示例中，仅以一个抽取模块为例进行说明。

S1502、抽取模块根据事务日志的头部信息，判断读取的某一个事务日志是否为该抽取模块对应的编号范围内的事务日志，若是，则继续获取该事务日志的主体信息，对该事务日志进行解析及过滤处理，最终获取该事务日志；若为否，则抛弃该事务日志，继续读取下一个事务日志。

S1503、抽取模块将获取的事务日志发送给与其连接的并行化模块。

S1504、并行化模块识别接收到的事务日志所在的事务日志的组别以及确定该事务日志与其他事务日志之间的依赖关系，并将该依赖关系携带在该事务日志中。

S1505、并行化模块将携带有依赖关系的事务日志发送给与其连接的发送模块。

S1506、发送模块对该事务日志的编号进行哈希计算，哈希计算的结果为用于接收该事务日志的重演模块的编号，并将该事务日志发送给对应的重演模块。

在本示例中，以重演模块的数量为K个为例。发送模块确定将该事务日志发送给重演模块1。

S1507、重演模块1识别接收到的事务日志所在的事务日志的组别，根据该组别确定该事务日志是否属于当前正在处理的重演队列，若是，则将该事务日志存放在该重演队列中，若为否，则创建新的重演队列用于存放该事务日志。

在本示例中，同一个组别的事务日志存放在同一个重演队列中。

S1508、重演模块1确定该事务日志是否满足重演条件，若满足重演条件，则根据该事务日志在目的端数据库进行重演。

其中，若该事务日志中不携带其他事务日志的编号，则确定该事务日志满足重演条件。或者，若该事务日志中携带另一个事务日志的编号，且该另一个事务日志已经重演完成，则确定该事务日志满足重演条件。

需要说明的是，若重演模块1确定该事务日志依赖其他事务日志，重演模块1可以等待其他重演模块发送该事务日志所依赖的事务日志的重演结果。若在预设时长内仍未收到该重演结果，则可以根据所依赖的事务日志的编号，进行哈希计算，确定所依赖的事务日志对应的重演模块，并向该重演模块发送询问请求，该询问请求用于获取该重演结果。若接收到与该询问请求对应的应答消息中指示该事务日志重演完成，则重演模块1则根据该事务日志在目的端数据库进行重演；若接收到与该询问请求对应的应答消息中指示该事务日志还未重演完成，则继续等待。

存在一种情况，用于重演所依赖的事务日志的重演模块发生故障，从而，重演模块1不会接收到与该询问请求对应的应答消息，在这种情况下，重演模块1可以确定用于重演所依赖的事务日志的重演模块发生故障判，从而将该情况发送给目的端管理模块，需要说明的是，这种情况在图15中未示出。

S1509、重演模块1将该事务日志的重演结果通知其他重演模块。

当其他重演节点接收到重演结果后，则触发对后续事务日志的重演，具体过程与步骤S1508相似，在此不再赘述。各个重演模块重复执行重演模块1所执行的步骤，直至完成所有事务日志的重演，当目的端设备中接收到的最后一个事务日志重演完成，则由完成最后一个事务日志重演的重演模块，将重演结果反馈给发送模块以及其他重演模块。发送模块在确定最后一个事务日志完成重演之后，则可以清除对事务日志的缓存。

由图15所示的示例可知，重演模块在根据事务日志重演时，可能会发生故障，为了保证所有的事务日志都能够重演完成，在本申请实施例中还可以通过源端管理模块和目的端管理模块进行故障恢复的处理。请参考图16，为各个模块进行故障恢复的流程图，该流程图描述如下：

S161、目的端管理模块确定重演模块m发生故障。

目的端管理模块确定重演模块m发生故障的方式可以包括但不限于如下方式：

第一种确定方式：

每个重演模块可以按照预设周期，向目的端管理模块发送心跳，若目的端管理模块在某个周期内未接收到重演模块m发送的心跳，则可以确定重演模块m发生故障。

第二种确定方式：

其他重演模块向重演模块m发送询问请求，但是未得到重演模块m的应答消息，从而将该情况上报给目的端管理模块，在这种情况下，目的端管理模块可以确定重演模块m发生故障。

第三种确定方式：

目的端管理模块可以主动查询目的端数据库的重演状态，确定目的端数据库中最后一个重演的事务日志的编号，如果最后一个重演的事务日志的编号不是目的端设备接收到的最后一个事务日志的编号，则根据查询到的最后一个重演的事务日志的编号进行哈希计算，哈希计算的结果为m，则目的端管理模块可以确定重演模块m发生故障。

当然，也可以通过其他方式确定重演模块m发生故障，在此不作限制。

S162、目的端管理模块向源端管理模块以及各个重演模块发送故障通知消息。

其中，该故障通知消息中可以包括发生故障的重演模块的编号，例如，m，以及发生故障的重演模块中最后重演的事务日志的编号，例如，事务日志n。

S163、各个重演模块标识重演模块m为故障模块。

S164、源端管理模块向各个发送模块发送该故障通知消息。

S165、发送模块重新分发事务日志。

当发送模块接收该故障通知消息后，则将已经分发给重演模块m的事务日志进行二次哈希计算，分发到其他重演模块。该重新分发的事务日志可以携带“二次hash重发”标志。

由于各个发送模块的处理过程相同，因此，在图16中以一个发送模块为例进行说明。

S166、各个重演模块根据事务日志所在的组的编号以及故障重演模块的编号重新创建新的重演队列，缓存重发的事务日志，并向发送模块反馈确认消息。

S167、各个重演模块根据重发后的事务日志以及重发之前的事务日志，在目的端数据库进行重演。

各个重演模块可以采用与前述相同的方式，在目的端数据库重演各个事务日志，在此不再赘述。若某一个重演模块接收到携带“二次hash重发”标识的第一条事务日志，例如，接收到携带“二次hash重发”标识且编号为n的事务日志，则该重演模块可以立即根据该事务日志进行重演，而不用等待。

发送模块在将已经发送给重演模块m的事务日志重新分发之后，则按照正常的方式发送其他事务日志，当然，若确定某一个事务日志需要分发到重演模块m，则仍需要对该事务日志进行二次哈希计算，以将该事务日志分发到其他重演模块，虽然发送模块进行了二次哈希计算，但是对于重演模块来讲，是第一次接收到该事务日志，因此，在这种情况下，不需要在进行了二次哈希计算的事务日志中携带“二次hash重发”标识。

上述本申请提供的实施例中，为了实现上述本申请实施例提供的方法中的各功能，存储系统可以包括硬件结构和/或软件模块，以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能以硬件结构、软件模块、还是硬件结构加软件模块的方式来执行，取决于技术方案的特定应用和设计约束条件。

图3-图11所示的实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，另外，在本申请各个实施例中的各功能模块可以集成在一个处理器中，也可以是单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

如图17所示为本申请实施例提供的源端设备1700，其中，源端设备1700可以为芯片系统。本申请实施例中，芯片系统可以由芯片构成，也可以包含芯片和其他分立器件。

源端设备1700包括至少一个处理器1720，用于实现或用于支持源端设备1700实现本申请实施例提供的方法中源端设备的功能。示例性地，处理器1720可以从源端数据库的日志文件中并行获取至少两组事务日志，具体参见方法示例中的详细描述，此处不做赘述。

源端设备1700还可以包括至少一个存储器1730，用于存储程序指令和/或数据。存储器1730和处理器1720耦合。本申请实施例中的耦合是装置、单元或模块之间的间接耦合或通信连接，可以是电性，机械或其它的形式，用于装置、单元或模块之间的信息交互。处理器1720可能和存储器1730协同操作。处理器1720可能执行存储器1730中存储的程序指令。所述至少一个存储器中的至少一个可以包括于处理器中。

源端设备1700还可以包括通信接口1710，用于通过传输介质和其它设备进行通信，从而用于源端设备1700可以和其它设备进行通信。示例性地，该其它设备可以是存储客户端或者存储设备。处理器1720可以利用通信接口1710收发数据。

本申请实施例中不限定上述通信接口1710、处理器1720以及存储器1730之间的具体连接介质。本申请实施例在图17中以存储器1730、处理器1720以及通信接口1710之间通过总线1740连接，总线在图17中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图17中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在本申请实施例中，处理器1720可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

在本申请实施例中，存储器1730可以是非易失性存储器，比如硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)等，还可以是易失性存储器(volatile memory)，例如随机存取存储器(random-access memory，RAM)。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。本申请实施例中的存储器还可以是电路或者其它任意能够实现存储功能的装置，用于存储程序指令和/或数据。

如图18所示为本申请实施例提供的目的端设备1800，其中，目的端设备1800可以为芯片系统。本申请实施例中，芯片系统可以由芯片构成，也可以包含芯片和其他分立器件。

目的端设备1800包括至少一个处理器1820，用于实现或用于支持目的端设备1800实现本申请实施例提供的方法中目的端设备的功能。示例性地，处理器1820可以从源端设备中获取至少两组事务日志，并根据事务日志在目的端数据库进行事务日志重演，具体参见方法示例中的详细描述，此处不做赘述。

目的端设备1800还可以包括至少一个存储器1830，用于存储程序指令和/或数据。存储器1830和处理器1820耦合。本申请实施例中的耦合是装置、单元或模块之间的间接耦合或通信连接，可以是电性，机械或其它的形式，用于装置、单元或模块之间的信息交互。处理器1820可能和存储器1830协同操作。处理器1820可能执行存储器1830中存储的程序指令。所述至少一个存储器中的至少一个可以包括于处理器中。

目的端设备1800还可以包括通信接口1810，用于通过传输介质和其它设备进行通信，从而用于目的端设备1800可以和其它设备进行通信。示例性地，该其它设备可以是存储客户端或者存储设备。处理器1820可以利用通信接口1810收发数据。

本申请实施例中不限定上述通信接口1810、处理器1820以及存储器1830之间的具体连接介质。本申请实施例在图18中以存储器1830、处理器1820以及通信接口1810之间通过总线1840连接，总线在图18中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图18中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在本申请实施例中，处理器1820可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

在本申请实施例中，存储器1830可以是非易失性存储器，比如硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)等，还可以是易失性存储器(volatile memory)，例如随机存取存储器(random-access memory，RAM)。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。本申请实施例中的存储器还可以是电路或者其它任意能够实现存储功能的装置，用于存储程序指令和/或数据。

本申请实施例中还提供一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行图12-图16所示的实施例中服务端执行的方法。

本申请实施例中还提供一种计算机程序产品，包括指令，当其在计算机上运行时，使得计算机执行图12-图16所示的实施例中服务端执行的方法。

本申请实施例提供了一种芯片系统，该芯片系统包括处理器，还可以包括存储器，用于实现前述方法中源端设备或目的端设备的功能。该芯片系统可以由芯片构成，也可以包含芯片和其他分立器件。

本申请实施例提供的方法中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、网络设备、用户设备或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，简称DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机可以存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，数字视频光盘(digital video disc，简称DVD))、或者半导体介质(例如，SSD)等。

Claims

一种数据库复制系统，其特征在于，包括源端设备和目的端设备，所述数据库复制系统用于根据源端数据库的日志文件中包括的至少两组事务日志，在目的端数据库进行重演，其中：

所述源端设备，用于从所述源端数据库的日志文件中并行获取所述至少两组事务日志，所述至少两组事务日志包括第一组事务日志和第二组事务日志，并发送所述至少两组事务日志，其中，第一组事务日志至少包括相邻的第一事务日志和第二事务日志，所述第二组事务日志至少包括相邻的第三事务日志和第四事务日志，所述第二事务日志的产生时间早于所述第三事务日志的产生时间；

所述目的端设备，用于接收所述至少两组事务日志，在根据所述第一组事务日志中的所述第一事务日志、所述第二事务日志以及所述第一事务日志与所述第二事务日志的依赖关系在所述目的端数据库进行事务重演之后，根据所述第二组事务日志中的所述第三事务日志、所述第四事务日志以及所述第三事务日志与所述第四事务日志的依赖关系在所述目的端数据库进行事务重演，使得所述目的端数据库与所述源端数据库存储的数据一致。
根据权利要求1所述的数据库复制系统，其特征在于，

所述源端设备还用于在确认所述第一事务日志记录的第一事务操作在所述源端数据库中的操作对象与所述第二事务日志记录的第二事务操作在所述源端数据库中的操作对象相同，且所述第一事务日志记录的第一事务操作在所述源端数据库中的操作时刻早于所述第二事务日志记录的第二事务操作在所述源端数据库中的操作时刻的情况下，将所述第一事务日志的编号记录到所述第二事务日志中，其中，所述第一事务日志的编号用于指示所述第一事务日志与所述第二事务日志的依赖关系；

所述源端设备还用于在确认所述第三事务日志记录的第三事务操作在所述源端数据库中的操作对象与所述第四事务日志记录的第四事务操作在所述源端数据库中的操作对象相同，且所述第三事务日志记录的第三事务操作在所述源端数据库中的操作时刻早于所述第四事务日志记录的第四事务操作在所述源端数据库中的操作时刻的情况下，将所述第三事务日志的编号记录到所述第四事务日志中，其中，所述第三事务日志的编号用于指示所述第三事务日志与所述第四事务日志的依赖关系。
根据权利要求1所述的数据库复制系统，其特征在于，

所述目的端设备还用于在确认所述第一事务日志记录的第一事务操作在所述源端数据库中的操作对象与所述第二事务日志记录的第二事务操作在所述源端数据库中的操作对象相同，且所述第一事务日志记录的第一事务操作在所述源端数据库中的操作时刻早于所述第二事务日志记录的第二事务操作在所述源端数据库中的操作时刻的情况下，将所述第一事务日志的编号记录到所述第二事务日志中，其中，所述第一事务日志的编号用于指示所述第一事务日志与所述第二事务日志的依赖关系；

所述目的端设备还用于在确认所述第三事务日志记录的第三事务操作在所述源端数据库中的操作对象与所述第四事务日志记录的第四事务操作在所述源端数据库中的操作对象相同，且所述第三事务日志记录的第三事务操作在所述源端数据库中的操作时刻早于所述第四事务日志记录的第四事务操作在所述源端数据库中的操作时刻的情况下，将所述第三事务日志的编号记录到所述第四事务日志中，其中，所述第三事务日志的编号用于指示所述第三事务日志与所述第四事务日志的依赖关系。
根据权利要求2或3所述的数据库复制系统，其特征在于，

所述目的端设备在获取到所述第一组事务日志中的所述第二事务日志的情况下，确认所述第二事务日志记录有用于指示所述第一事务日志与所述第二事务日志的依赖关系的所述第一事务日志的编号，在确认根据所述第一事务日志进行的事务重演完成之后，根据所述第二事务日志进行事务重演。
根据权利要求2或3所述的数据库复制系统，其特征在于，

所述目的端设备在获取到第一组事务日志中的所述第一事务日志的情况下，确认所述第一事务日志没有记录有用于指示与所述第一事务日志存在依赖关系的事务日志的编号，根据所述第一事务日志进行事务重演。
根据权利要求2或3所述的数据库复制系统，其特征在于，

所述目的端设备在获取到第二组事务日志中的所述第四事务日志的情况下，确认所述第四事务日志记录有用于指示所述第四事务日志与所述第三事务日志的依赖关系的所述第三事务日志的编号，在确认根据所述第三事务日志进行的事务重演完成之后，根据所述第四事务日志进行事务重演。
根据权利要求2或3所述的数据库复制系统，其特征在于，

所述目的端设备在获取到第二组事务日志中的所述第三事务日志的情况下，确认所述第三事务日志没有记录有用于指示与所述第三事务日志存在依赖关系的事务日志的编号，根据所述第三事务日志进行事务重演。
根据权利要求1至7任一项所述的数据库复制系统，其特征在于，所述源端设备和所述源端数据库设置在第一区域，所述目的端设备和所述目的端数据库设置在第二区域，所述第一区域和所述第二区域远程连接。
根据权利要求1至8任一项所述的数据库复制系统，其特征在于，

所述源端设备用于根据事务日志的编号范围从源端数据库中并行获取所述至少两组事务日志。
根据权利要求9所述的数据库复制系统，其特征在于，所述源端设备还用于：

从所述源端数据库中读取日志概要记录信息，所述日志概要记录信息记录有所述源端数据库产生的事务日志的编号、在所述日志文件中的记录位置、长度以及数量；

根据所述日志概要记录信息在所述日志文件中并行获取所述至少两组事务日志。
一种数据库复制方法，其特征在于，包括：

从源端数据库的日志文件中并行获取至少两组事务日志，所述至少两组事务日志包括第一组事务日志和第二组事务日志，并发送所述至少两组事务日志，其中，第一组事务日志至少包括相邻的第一事务日志和第二事务日志，所述第二组事务日志至少包括相邻的第三事务日志和第四事务日志，所述第二事务日志的产生时间早于所述第三事务日志的产生时间；

向目的端设备发送所述至少两组事务日志。
根据权利要求11所述的方法，其特征在于，所述方法还包括：

在确认所述第一事务日志记录的第一事务操作在所述源端数据库中的操作对象与所述第二事务日志记录的第二事务操作在所述源端数据库中的操作对象相同，且所述第一事务日志记录的第一事务操作在所述源端数据库中的操作时刻早于所述第二事务日志记录的第二事务操作在所述源端数据库中的操作时刻的情况下，将所述第一事务日志的编号记录到所述第二事务日志中，其中，所述第一事务日志的编号用于指示所述第一事务日志与所述第二事务日志的依赖关系；以及，

在确认所述第三事务日志记录的第三事务操作在所述源端数据库中的操作对象与所述第四事务日志记录的第四事务操作在所述源端数据库中的操作对象相同，且所述第三事务日志记录的第三事务操作在所述源端数据库中的操作时刻早于所述第四事务日志记录的第四事务操作在所述源端数据库中的操作时刻的情况下，将所述第三事务日志的编号记录到所述第四事务日志中，其中，所述第三事务日志的编号用于指示所述第三事务日志与所述第四事务日志的依赖关系。
根据权利要求11或12所述的方法，其特征在于，从源端数据库中并行获取所述至少两组事务日志，包括：

根据事务日志的编号范围从源端数据库中并行获取所述至少两组事务日志。
根据权利要求13所述的方法，其特征在于，根据事务日志的编号范围从源端数据库中并行获取所述至少两组事务日志，包括：

从所述源端数据库中读取日志概要记录信息，所述日志概要记录信息记录有所述源端数据库产生的事务日志的编号、在所述日志文件中的记录位置、长度以及数量，

根据所述日志概要记录信息在所述日志文件中并行获取所述至少两组事务日志。
一种数据库复制方法，其特征在于，包括：

从源端设备接收至少两组事务日志，所述至少两组事务日志包括第一组事务日志以及第二组事务日志，所述第一组事务日志至少包括相邻的第一事务日志和第二事务日志，所述第二组事务日志至少相邻的包括第三事务日志和第四事务日志，所述第二事务日志的产生时间早于所述第三事务日志的产生时间；

在根据所述第一组事务日志中的所述第一事务日志、所述第二事务日志以及所述第一事务日志与所述第二事务日志的依赖关系在目的端数据库进行事务重演之后，根据所述第二组事务日志中的所述第三事务日志、所述第四事务日志以及所述第三事务日志与所述第四事务日志的依赖关系在所述目的端数据库进行事务重演，使得所述目的端数据库与所述源端数据库存储的数据一致。
根据权利要求15所述的方法，其特征在于，所述方法还包括：

在确认所述第一事务日志记录的第一事务操作在所述源端数据库中的操作对象与所述第二事务日志记录的第二事务操作在所述源端数据库中的操作对象相同，且所述第一事务日志记录的第一事务操作在所述源端数据库中的操作时刻早于所述第二事务日志记录的第二事务操作在所述源端数据库中的操作时刻的情况下，将所述第一事务日志的编号记录到所述第二事务日志中，其中，所述第一事务日志的编号用于指示所述第一事务日志与所述第二事务日志的依赖关系；以及，

在确认所述第三事务日志记录的第三事务操作在所述源端数据库中的操作对象与所述第四事务日志记录的第四事务操作在所述源端数据库中的操作对象相同，且所述第三事务日志记录的第三事务操作在所述源端数据库中的操作时刻早于所述第四事务日志记录的第四事务操作在所述源端数据库中的操作时刻的情况下，将所述第三事务日志的编号记录到所述第四事务日志中，其中，所述第三事务日志的编号用于指示所述第三事务日志与所述第四事务日志的依赖关系。
根据权利要求15或16所述的方法，其特征在于，根据所述第一组事务日志中的所述第一事务日志、所述第二事务日志以及所述第一事务日志与所述第二事务日志的依赖关系在目的端数据库进行事务重演，包括：

在获取到所述第一事务日志的情况下，确认所述第一事务日志没有记录有用于指示与所述第一事务日志存在依赖关系的事务日志的编号，根据所述第一事务日志进行事务重演。
根据权利要求15或16所述的方法，其特征在于，根据所述第一组事务日志中的所述第一事务日志、所述第二事务日志以及所述第一事务日志与所述第二事务日志的依赖关系在目的端数据库进行事务重演，包括：

在获取到所述第二事务日志的情况下，确认所述第二事务日志记录有用于指示所述第一事务日志与所述第二事务日志的依赖关系的所述第一事务日志的编号，在确认根据所述第一事务日志进行的事务重演完成之后，根据所述第二事务日志进行事务重演。
根据权利要求15或16所述的方法，其特征在于，根据所述第二组事务日志中的所述第三事务日志、所述第四事务日志以及所述第三事务日志与所述第四事务日志的依赖关系在所述目的端数据库进行事务重演，包括：

在获取到所述第三事务日志的情况下，确认所述第三事务日志没有记录有用于指示与所述第三事务日志存在依赖关系的事务日志的编号，根据所述第三事务日志进行事务重演。
根据权利要求15或16所述的方法，其特征在于，根据所述第二组事务日志中的所述第三事务日志、所述第四事务日志以及所述第三事务日志与所述第四事务日志的依赖关系在所述目的端数据库进行事务重演，包括：

在获取到所述第四事务日志的情况下，确认所述第四事务日志记录有用于指示所述第四事务日志与所述第三事务日志的依赖关系的所述第三事务日志的编号，在确认根据所述第三事务日志进行的事务重演完成之后，根据所述第四事务日志进行事务重演。
一种源端设备，其特征在于，包括：

处理模块，用于从源端数据库的日志文件中并行获取至少两组事务日志，所述至少两组事务日志包括第一组事务日志和第二组事务日志，并发送所述至少两组事务日志，其中，第一组事务日志至少包括相邻的第一事务日志和第二事务日志，所述第二组事务日志至少包括相邻的第三事务日志和第四事务日志，所述第二事务日志的产生时间早于所述第三事务日志的产生时间；

发送模块，用于向目的端设备发送所述至少两组事务日志。
根据权利要求21所述的设备，其特征在于，所述处理模块还用于：

在确认所述第一事务日志记录的第一事务操作在所述源端数据库中的操作对象与所述第二事务日志记录的第二事务操作在所述源端数据库中的操作对象相同，且所述第一事务日志记录的第一事务操作在所述源端数据库中的操作时刻早于所述第二事务日志记录的第二事务操作在所述源端数据库中的操作时刻的情况下，将所述第一事务日志的编号记录到所述第二事务日志中，其中，所述第一事务日志的编号用于指示所述第一事务日志与所述第二事务日志的依赖关系；以及，

在确认所述第三事务日志记录的第三事务操作在所述源端数据库中的操作对象与所述第四事务日志记录的第四事务操作在所述源端数据库中的操作对象相同，且所述第三事务日志记录的第三事务操作在所述源端数据库中的操作时刻早于所述第四事务日志记录的第四事务操作在所述源端数据库中的操作时刻的情况下，将所述第三事务日志的编号记录到所述第四事务日志中，其中，所述第三事务日志的编号用于指示所述第三事务日志与所述第四事务日志的依赖关系。
根据权利要求21或22所述的设备，其特征在于，所述处理模块具体用于：

根据事务日志的编号范围从源端数据库中并行获取所述至少两组事务日志。
根据权利要求23所述的设备，其特征在于，所述处理模块具体用于：

从所述源端数据库中读取日志概要记录信息，所述日志概要记录信息记录有所述源端数据库产生的事务日志的编号、在所述日志文件中的记录位置、长度以及数量，

根据所述日志概要记录信息在所述日志文件中并行获取所述至少两组事务日志。
一种目的端设备，其特征在于，包括：

接收模块，用于从源端设备接收至少两组事务日志，所述至少两组事务日志包括第一组事务日志以及第二组事务日志，所述第一组事务日志至少包括相邻的第一事务日志和第二事务日志，所述第二组事务日志至少包括相邻的第三事务日志和第四事务日志，所述第二事务日志的产生时间早于所述第三事务日志的产生时间；

处理模块，用于在根据所述第一组事务日志中的所述第一事务日志、所述第二事务日志以及所述第一事务日志与所述第二事务日志的依赖关系在目的端数据库进行事务重演之后，根据所述第二组事务日志中的所述第三事务日志、所述第四事务日志以及所述第三事务日志与所述第四事务日志的依赖关系在所述目的端数据库进行事务重演，使得所述目的端数据库与所述源端数据库存储的数据一致。
根据权利要求25所述的设备，其特征在于，所述处理模块还用于：

在确认所述第一事务日志记录的第一事务操作在所述源端数据库中的操作对象与所述第二事务日志记录的第二事务操作在所述源端数据库中的操作对象相同，且所述第一事务日志记录的第一事务操作在所述源端数据库中的操作时刻早于所述第二事务日志记录的第二事务操作在所述源端数据库中的操作时刻的情况下，将所述第一事务日志的编号记录到所述第二事务日志中，其中，所述第一事务日志的编号用于指示所述第一事务日志与所述第二事务日志的依赖关系；以及，

在确认所述第三事务日志记录的第三事务操作在所述源端数据库中的操作对象与所述第四事务日志记录的第四事务操作在所述源端数据库中的操作对象相同，且所述第三事务日志记录的第三事务操作在所述源端数据库中的操作时刻早于所述第四事务日志记录的第四事务操作在所述源端数据库中的操作时刻的情况下，将所述第三事务日志的编号记录到所述第四事务日志中，其中，所述第三事务日志的编号用于指示所述第三事务日志与所述第四事务日志的依赖关系。
根据权利要求25或26所述的设备，其特征在于，所述处理模块具体用于：

在获取到所述第一事务日志的情况下，确认所述第一事务日志没有记录有用于指示与所述第一事务日志存在依赖关系的事务日志的编号，根据所述第一事务日志进行事务重演。
根据权利要求25或26所述的设备，其特征在于，所述处理模块具体用于：

在获取到所述第二事务日志的情况下，确认所述第二事务日志记录有用于指示所述第一事务日志与所述第二事务日志的依赖关系的所述第一事务日志的编号，在确认根据所述第一事务日志进行的事务重演完成之后，根据所述第二事务日志进行事务重演。
根据权利要求25或26所述的设备，其特征在于，所述处理模块具体用于：

在获取到所述第三事务日志的情况下，确认所述第三事务日志没有记录有用于指示与所述第三事务日志存在依赖关系的事务日志的编号，根据所述第三事务日志进行事务重演。
根据权利要求25或26所述的设备，其特征在于，所述处理模块具体用于：

在获取到所述第四事务日志的情况下，确认所述第四事务日志记录有用于指示所述第四事务日志与所述第三事务日志的依赖关系的所述第三事务日志的编号，在确认根据所述第三事务日志进行的事务重演完成之后，根据所述第四事务日志进行事务重演。
一种源端设备，其特征在于，包括：

存储器，用于存储指令；

处理器，用于执行所述存储器中的指令，使得所述源端设备执行如权利要求11-14任一项所述的方法。
一种目的端设备，其特征在于，包括：

存储器，用于存储指令；

处理器，用于执行所述存储器中的指令，使得所述目的端设备执行如权利要求15-20任一项所述的方法。
一种计算机存储介质，其特征在于，所述计算机存储介质存储有指令，当所述指令在计算机上运行时，使得所述计算机执行如权利要求11-14或15-20任一项所述的方法。
一种计算机程序产品，其特征在于，所述计算机程序产品存储有指令，当所述指令在计算机上运行时，使得所述计算机执行如权利要求11-14或15-20任一项所述的方法。