WO2020215532A1

WO2020215532A1 - 一种异构数据库之间数据同步的系统、方法、存储介质

Info

Publication number: WO2020215532A1
Application number: PCT/CN2019/100029
Authority: WO
Inventors: 阮崇鹤; 高爽; 朱海勇; 吴鸿伟; 周成祖; 鄢小征
Original assignee: 厦门市美亚柏科信息股份有限公司
Priority date: 2019-04-26
Filing date: 2019-08-09
Publication date: 2020-10-29
Also published as: CN110162571A

Abstract

一种异构数据库之间数据同步的系统、方法、存储介质，应用于在异构数据库之间数据同步过程，所述系统包括采集插件单元（101）、写入插件单元（103）和数据处理中心（102），多个数据库通过采集插件单元和写入插件单元与所述数据处理中心以星型方式相连接，数据处理中心包括多个同步执行节点，多个同步执行节点以分布式执行的方式进行数据同步，采用适配器适配各种异构数据库的采集和写入，采用统一的中间数据格式传输，简化了不同源端和目标端的连接，提高了数据的采集效率，具有很强的扩展性，采用统一的同步任务控制器实现同步任务的接收、分配、接收以及负载均衡，通过多通道的方式并行执行数据同步的操作，以进一步提高执行效率。

Description

一种异构数据库之间数据同步的系统、方法、存储介质

相关申请

本申请要求保护在2019年4月26日提交的申请号为201910346104.0的中国专利申请的优先权，该申请的全部内容以引用的方式结合到本文中。

技术领域

本发明涉及数据处理技术领域，特别是一种异构数据库之间数据同步的系统、方法、存储介质。

背景技术

目前大数据技术迅速发展，各行各业产生的数据是愈来愈多，随着数据规模的扩大，数据种类和结构的多样性的增加，为了加强对数据的使用效率，各种不同数据结构类型的数据库也深入到了不同的应用和行业中，对这些异构数据库的配合使用已是常态。

对于那些地域分散而管理又相对集中的跨地域的公司企业或单位，为了提高数据的价值，需要对数据进行集中整合分析，这推动数据中心或数据平台的建设。目前数据存储的种类比较多，主流一般包括关系型数据库、分布式并行数据库、列式数据库、全文检索数据库、图数据库、内存数据库、文档数据库、分布式文件存储和流式系统等。常规的数据库支撑导入导出能力，但语法各异，导出导入和ETL技术虽然完成数据同步，但未能达到数据同步集中管理、扩展能力、速度和性能要求。传统的主流数据库开发商也有数据同步方案，但一般针对同构数据库，对异构数据库的支撑能力有限。

现有技术中针对不同数据库采用导出导入或ETL的方式，将数据从源端数据库抽出，再将数据加载到目标数据库，达到数据同步的目的。但随着场景逐渐复杂，使用的数据库种类越来越多了，同步需要适配各种异构数据库，造成系统高度复杂。

现有技术中另一种常见的数据同步复制是由数据库自身同构复制技术实现的，比如Oracle常见的RAC技术，RAC是采用了高缓存合并，集群节点共享存储，这种技术对于跨域的和非Oracle异构的数据库是不支持的。对于这种复杂方式，各数据库厂商一般都辅助工具完成数据同步复制，但是复制方案仍依赖于相应的数据库管理系统核心技术，不能保证完全与DBMS无关。

此外，现有技术中GoldenGate，主要是围绕Oracle的同步工具，是通过运行在源端的Extract进程抓取数据库的DML、DDL操作，然后通过运行在目标端的Replicat去重新构造DML或DDL操作并应用到目标端数据库上。其对源和目标系统侵入性比较强，需要相应的权限和部署进程处理，缺乏很好的扩展和定制能力。对于DBlink技术，其配置与对应数据库耦合度高。对于这些常用关系数据库采用的同步工具不能有效支撑除关系型数据库其他的数据库类型，且对数据形式有一定要求，缺乏集中的同步管理。

且现有技术中，数据任务进程缺乏统一的系统管理，横向扩展能力有限，效率低且性能差，无法适应大规模数据的同步。

发明内容

本发明针对上述现有技术中的缺陷，提出了如下技术方案。

一种异构数据库之间数据同步的系统，该系统包括采集插件单元、写入插件单元和数据处理中心，多个数据库通过采集插件单元和写入插件单元与所述数据处理中心相连接；

所述采集插件单元用于从所述多个数据库中的一个数据库中读取数据，并将所读取的数据发送至数据处理中心；

所述数据处理中心用于将接收的数据先转换为预定的格式的数据再转换为拟写入的数据库数据格式的数据，并将转换为拟写入数据库的数据格式的数据发送至写入插件单元；

所述写入插件单元用于将接收的转换为拟写入数据库的数据格式的数据写入对应的数据库。

更进一步地，所述预定的格式为CSV或XML格式。

更进一步地，所述多个数据库与所述数据处理中心呈星型连接方式，所述数据处理中心包括采集插件适配器、第一格式转换单元、数据处理单元、第二格式单元和写入插件适配器，所述采集插件适配器与所述采集插件单元相连接，用于接收采集插件单元从数据库中所采集的数据并发送至第一格式转换单元，第一格式转换单元用于将接收的数据格式化为预定的格式的数据后发送至数据处理单元，数据处理单元进行处理后将处理后的预定格式的数据发送至第二格式转换单元，所述第二格式转换单元将预定的格式的数据再转换为拟写入的数据库数据格式的数据后发送至写入插件适配器，写入插件适配器将拟写入的数据库数据格式的数据发送至写入插件单元。

更进一步地，所述数据处理中心由至少一个同步执行节点组成。

更进一步地，所述同步执行节点在同步任务控制器的控制下执行数据同步的操作，所述同步任务控制器包括同步任务管理单元、执行节点管理单元、控制单元、日志管理单元、报表警告单元、服务单元和数据持久化单元，所述同步任务管理单元根据接收的任务的任务信息指定控制单元来激活任务，再将激活的任务分配到至少一个同步执行节点中运行；执行节点管理单元用于向至少一个同步执行节点发送执行命令和元数据；日志管理单元用于记录每一个同步执行节点的运行状态；所述报表警告单元根据预定的规则进行警报；服务单元用于向客户提供数据服务功能；数据持久化单元用于将数据持久化在本地数据库中。

更进一步地，所述同步执行节点通过多通道的方式并行执行数据同步的操作，所述通道包数据接收器、数据切分模块、多个第一数据转换模块、多个数据处理模块、多个第二数据转换模块、数据合并模块和数据发送器，所述数据接收器从采集插件适配器接收数据并发送至所述数据切分模块，所述数据切分模块将数据切分后发送至多个第一数据转换模块，多个第一数据转换模块将接收的数据转换为预定的格式后发送至相应的数据处理模块，数据处理模块处理后发送至相应的第二数据转换模块，第二数据转换模块将预定的格式的数据再转换为拟写入的数据库数据格式的数据后发送至数据合并模块，数据合并模块将接收的数据合并后发送至数据发送器，数据发送器将合并后的拟写入的数据库数据格式的数据后发送至写入插件适配器。

本发明还提出了基于上述的异构数据库之间数据同步的系统的数据同步方法，该方法包括：

设置步骤，设置多个数据库中的每个数据库通过采集插件单元和写入插件单元与数据处理中心相连接；

采集步骤，通过所述采集插件单元从所述多个数据库中的一个数据库中读取数据，并将所读取的数据发送至数据处理中心；

格式化步骤，通过所述数据处理中心将接收的数据先转换为预定的格式的数据再转换为拟写入的数据库数据格式的数据，并将转换为拟写入数据库的数据格式的数据发送至写入插件单元；

写入步骤，通过所述写入插件单元将接收的转换为拟写入数据库的数据格式的数据写入对应的数据库。

更进一步地，所述预定的格式为CSV或XML格式。

本发明还提出了一种计算机可读存储介质，所述存储介质上存储有计算机程序代码，当所述计算机程序代码被计算机执行时执行上述之任一的方法。

本发明的技术效果为：本发明提出了一种异构数据库之间数据同步的系统、方法、存储介质，应用于在异构数据库之间数据同步过程，所述系统包括采集插件单元、写入插件单元和数据处理中心，多个数据库通过采集插件单元和写入插件单元与所述数据处理中心以星型方式相连接，数据处理中心包括多个同步执行节点，多个同步执行节点以分布式执行的方式进行数据同步，数据采集与数据写入插件采用插件式结构，以统一的中间数据格式进行处理和传输，简化了不同源数据库和目标数据库的连接，采用适配器适配各种异构数据库的采集和写入，本发明采用统一的中间数据格式传输，简化了不同源端和目标端的连接，提高了数据的采集效率，且通过插件连接方式具有很强的扩展性，采用统一的同步任务控制器实现同步任务的接收、分配、接收以及采集日志的管理、报警，数据持久化等处理，还控制负载实现同步执行节点之间的负载均衡，同步执行节点通过多通道的方式并行执行数据同步的操作，以进一步提高执行效率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显。

图1是根据本发明的实施例的一种异构数据库之间数据同步的系统的示意图。

图2是根据本发明的实施例的数据处理中心的结构图。

图3是根据本发明的实施例的多通道的结构图。

图4是根据本发明的实施例的同步任务控制器的结构图。

图5是根据本发明的实施例的异构数据库之间数据同步的系统的数据同步方法的流程图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了本发明的一种异构数据库之间数据同步的系统，该系统包括采集插件单元101、写入插件单元103和数据处理中心102，多个数据库通过采集插件单元101和写入插件单元103与所述数据处理中心102相连接。

其中，所述采集插件单元101用于从所述多个数据库中的一个数据库中读取数据，并将所读取的数据发送至数据处理中心102；所述数据处理中心102用于将接收的数据先转换为预定的格式的数据再转换为拟写入的数据库数据格式的数据，并将转换为拟写入数据库的数据格式的数据发送至写入插件单元103；所述写入插件单元103用于将接收的转换为拟写入数据库的数据格式的数据写入对应的数据库。

采用插件式(即集插件单元、写入插件单元103)即每个同步任务执行器(也称为同步任务执行节点)都是以数据库插件结合传输处理中心这种架构进行处理，中间使用统一的数据格式传输和标准化的处理，该系统支持以通用的CSV和XML两种格式作为中间数据格式。CSV通过分隔符分隔字段值，其文件以纯文本形式存储，第一行表头表明每列的数据字段；XML是一种用于标记电子文件使其具有结构性的标记语言，通过标签来表明每个数据字段。即本系统的数据采集与数据写入插件采用插件式结构，以统一的中间数据格式进行处理和传输，简化了不同源数据库和目标数据库的连接，本系统采用统一的中间数据格式传输，简化了不同源端和目标端的连接，提高了数据的采集效率，且通过插件连接方式具有很强的扩展性，这是本发明的重要发明点之一。

在一个实施例中，所述多个数据库与所述数据处理中心102呈星型连接方式。如图2所示，所述数据处理中心102包括采集插件适配器、第一格式转换单元、数据处理单元、第二格式单元和写入插件适配器，所述采集插件适配器与所述采集插件单元101相连接，用于接收采集插件单元101从数据库中所采集的数据并发送至第一格式转换单元，第一格式转换单元用于将接收的数据格式化为预定的格式的数据后发送至数据处理单元，数据处理单元进行处理后将处理后的预定格式的数据发送至第二格式转换单元，所述第二格式转换单元将预定的格式的数据再转换为拟写入的数据库数据格式的数据后发送至写入插件适配器，写入插件适配器将拟写入的数据库数据格式的数据发送至写入插件单元103。采用星型连接方式将现有技术中复杂的网状的数据同步链路变成了星型数据链路，位于星型中间的数据处理中心102负责连接各种异构数据库并对同步的不同数据格式进行格式化。当需要扩展接入一个新的数据库种类的时候，只需要将此数据库按格式要求和传输规范，对接到中央的数据处理中心102，便能跟已有的数据库做到无缝数据对接。即通过插件连接方式使得数据同步系统具有很强的扩展性，这是本发明的重要发明点之一。

在一个实施例中，所述数据处理中心102由至少一个同步执行节点组成。所述同步执行节点在同步任务控制器的控制下执行数据同步的操作。如图3所示，所述同步任务控制器包括同步任务管理单元、执行节点管理单元、控制单元、日志管理单元、报表警告单元、服务单元和数据持久化单元，所述同步任务管理单元根据接收的任务的任务信息指定控制单元来激活任务，再将激活的任务分配到至少一个同步执行节点中运行；执行节点管理单元用于向至少一个同步执行节点发送执行命令和元数据；日志管理单元用于记录每一个同步执行节点的运行状态；所述报表警告单元根据预定的规则进行警报；服务单元用于向客户提供数据服务功能；数据持久化单元用于将数据持久化在本地数据库中。

为了满足同步系统的高效和高可用，满足支持大量任务和大规模数据的同步，本系统采用分布式执行方式。前端与同步任务控制器进行交互，完成对数据同步的操作和管理；同步任务控制器包括了同步任务管理、执行节点管理、日志管理和报表告警等其他功能，数据持久化在本地的mysql数据库中，通过控制单元和服务与节点进行通信。控制命令和元数据由控制器下达给执行节点，执行节点会将心跳、状态和收集的日志回传给控制器，同步执行节点除了完成与控制器的注册、通信，也是同步任务的具体执行的地方。

多个执行节点根据任务的调度要求并行地处理数据同步任务，维护控制和调度。同步任务控制器会根据任务信息指定控制器模块来拉起(即激活)任务，再把任务分配到具体的同步执行节点中运行。同步任务控制器和同步执行节点之间采用了自定义的RPC调用方式来实现，该RPC使用hessian做序列化，在HTTP层传输。

分布式的方式可以大量任务根据负载的要求平均分配到多个执行的服务器节点上并行运行，提高效率和高可用。当某台节点失效时，同步任务控制器能根据心跳和状态进行判断，将任务分配给其他正常节点执行。即本系统采用统一的同步任务控制器实现同步任务的接收、分配、接收以及采集日志的管理、报警，数据持久化等处理，还控制负载实现同步执行节点之间的负载均衡，这是本发明的又一个重要发明点。

在一个实施例中，所述同步执行节点通过多通道的方式并行执行数据同步的操作。如图4所示，所述通道包数据接收器、数据切分模块、多个第一数据转换模块、多个数据处理模块、多个第二数据转换模块、数据合并模块和数据发送器，所述数据接收器从采集插件适配器接收数据并发送至所述数据切分模块，所述数据切分模块将数据切分后发送至多个第一数据转换模块，多个第一数据转换模块将接收的数据转换为预定的格式后发送至相应的数据处理模块，数据处理模块处理后发送至相应的第二数据转换模块，第二数据转换模块将预定的格式的数据再转换为拟写入的数据库数据格式的数据后发送至数据合并模块，数据合并模块将接收的数据合并后发送至数据发送器，数据发送器将合并后的拟写入的数据库数据格式的数据后发送至写入插件适配器。

每个同步执行节点在执行数据同步任务时，支持内部以多通道的形式进行同步数据，这样可以做到通道间的数据不会相互耦合。每个通道运行在自身的一个线程，这可以防止繁忙的通道阻塞，或者一个通道失败停止，不会影响其他通道的正常同步。

每一个通道执行一个数据同步任务，在数据采集插件采集到数据后，通过适配器，任务会进行拆分，在通道内以多线程并行的方式将数据划分为多个数据块进行处理，处理过程主要是对数据进行传输格式的统一，转换为标准csv或xml文件格式，然后进行数据内容的标准处理，包括数据的清洗、过滤、内容转换等。也支持根据业务场景的定制处理，只需要在处理单元模块中加入额外的处理逻辑。数据完成处理后，对多线程并行执行生成的数据进行合并，然后需要进行第二次文件格式转换，转换的目标格式主要是根据目标写入插件的不同而不同，目的是为了适配写入端的高效写入要求。最后推送至统一的传输通道，根据数据任务的目的系统分拣至对应的写入插件，完成数据写入目标数据库。即本系统同步执行节点通过多通道的方式并行执行数据同步的操作，以进一步提高执行效率，这是本发明的再一个重要发明点。

进一步参考图5，是基于上述图1所示系统的异构数据库之间的数据同步方法，该方法可以运行于各种电子设备或通过网络连接的多个电子设备中。

图5示出了本发明的本发明的基于上述的异构数据库之间数据同步的系统的数据同步方法，该方法包括：

设置步骤S501，设置多个数据库中的每个数据库通过采集插件单元和写入插件单元与数据处理中心相连接。

采集步骤S502，通过所述采集插件单元从所述多个数据库中的一个数据库中读取数据，并将所读取的数据发送至数据处理中心。

格式化步骤S503，通过所述数据处理中心将接收的数据先转换为预定的格式的数据再转换为拟写入的数据库数据格式的数据，并将转换为拟写入数据库的数据格式的数据发送至写入插件单元。

写入步骤S504，通过所述写入插件单元将接收的转换为拟写入数据库的数据格式的数据写入对应的数据库。

采用插件式(即集插件单元101、写入插件单元103)即每个同步任务执行器(也称为同步任务执行节点)都是以数据库插件结合传输处理中心这种架构进行处理，中间使用统一的数据格式传输和标准化的处理，该系统支持以通用的CSV和XML两种格式作为中间数据格式。CSV通过分隔符分隔字段值，其文件以纯文本形式存储，第一行表头表明每列的数据字段；XML是一种用于标记电子文件使其具有结构性的标记语言，通过标签来表明每个数据字段。即本系统的数据采集与数据写入插件采用插件式结构，以统一的中间数据格式进行处理和传输，简化了不同源数据库和目标数据库的连接，本系统采用统一的中间数据格式传输，简化了不同源端和目标端的连接，提高了数据的采集效率，且通过插件连接方式具有很强的扩展性，这是本发明的重要发明点之一。

在一个实施例中，所述多个数据库与所述数据处理中心呈星型连接方式。如图2所示，所述数据处理中心包括采集插件适配器、第一格式转换单元、数据处理单元、第二格式单元和写入插件适配器，所述采集插件适配器与所述采集插件单元相连接，用于接收采集插件单元从数据库中所采集的数据并发送至第一格式转换单元，第一格式转换单元用于将接收的数据格式化为预定的格式的数据后发送至数据处理单元，数据处理单元进行处理后将处理后的预定格式的数据发送至第二格式转换单元，所述第二格式转换单元将预定的格式的数据再转换为拟写入的数据库数据格式的数据后发送至写入插件适配器，写入插件适配器将拟写入的数据库数据格式的数据发送至写入插件单元。采用星型连接方式将现有技术中复杂的网状的数据同步链路变成了星型数据链路，位于星型中间的数据处理中心负责连接各种异构数据库并对同步的不同数据格式进行格式化。当需要扩展接入一个新的数据库种类的时候，只需要将此数据库按格式要求和传输规范，对接到中央的数据处理中心，便能跟已有的数据库做到无缝数据对接。即通过插件连接方式使得数据同步系统具有很强的扩展性，这是本发明的重要发明点之一。

在一个实施例中，所述数据处理中心由至少一个同步执行节点组成。所述同步执行节点在同步任务控制器的控制下执行数据同步的操作。如图3所示，所述同步任务控制器包括同步任务管理单元、执行节点管理单元、控制单元、日志管理单元、报表警告单元、服务单元和数据持久化单元，所述同步任务管理单元根据接收的任务的任务信息指定控制单元来激活任务，再将激活的任务分配到至少一个同步执行节点中运行；执行节点管理单元用于向至少一个同步执行节点发送执行命令和元数据；日志管理单元用于记录每一个同步执行节点的运行状态；所述报表警告单元根据预定的规则进行警报；服务单元用于向客户提供数据服务功能；数据持久化单元用于将数据持久化在本地数据库中。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本发明的技术效果为，提出了一种异构数据库之间数据同步的系统、方法、存储介质，应用于在异构数据库之间数据同步过程，所述系统包括采集插件单元、写入插件单元和数据处理中心，多个数据库通过采集插件单元和写入插件单元与所述数据处理中心以星型方式相连接，数据处理中心包括多个同步执行节点，多个同步执行节点以分布式执行的方式进行数据同步，数据采集与数据写入插件采用插件式结构，以统一的中间数据格式进行处理和传输，简化了不同源数据库和目标数据库的连接，采用适配器适配各种异构数据库的采集和写入，本发明采用统一的中间数据格式传输，简化了不同源端和目标端的连接，提高了数据的采集效率，且通过插件连接方式具有很强的扩展性，采用统一的同步任务控制器实现同步任务的接收、分配、接收以及采集日志的管理、报警，数据持久化等处理，还控制负载实现同步执行节点之间的负载均衡，同步执行节点通过多通道的方式并行执行数据同步的操作，以进一步提高执行效率。

最后所应说明的是：以上实施例仅以说明而非限制本发明的技术方案，尽管参照上述实施例对本发明进行了详细说明，本领域的普通技术人员应当理解：依然可以对本发明进行修改或者等同替换，而不脱离本发明的精神和范围的任何修改或局部替换，其均应涵盖在本发明的权利要求范围当中。

Claims

一种异构数据库之间数据同步的系统，其特征在于，该系统包括采集插件单元、写入插件单元和数据处理中心，多个数据库通过采集插件单元和写入插件单元与所述数据处理中心相连接；

所述采集插件单元用于从所述多个数据库中的一个数据库中读取数据，并将所读取的数据发送至数据处理中心；

所述数据处理中心用于将接收的数据先转换为预定的格式的数据再转换为拟写入的数据库数据格式的数据，并将转换为拟写入数据库的数据格式的数据发送至写入插件单元；

所述写入插件单元用于将接收的转换为拟写入数据库的数据格式的数据写入对应的数据库。
根据权利要求1所述的系统，其特征在于，所述预定的格式为CSV或XML格式。
根据权利要求2所述的系统，其特征在于，所述多个数据库与所述数据处理中心呈星型连接方式，所述数据处理中心包括采集插件适配器、第一格式转换单元、数据处理单元、第二格式单元和写入插件适配器，所述采集插件适配器与所述采集插件单元相连接，用于接收采集插件单元从数据库中所采集的数据并发送至第一格式转换单元，第一格式转换单元用于将接收的数据格式化为预定的格式的数据后发送至数据处理单元，数据处理单元进行处理后将处理后的预定格式的数据发送至第二格式转换单元，所述第二格式转换单元将预定的格式的数据再转换为拟写入的数据库数据格式的数据后发送至写入插件适配器，写入插件适配器将拟写入的数据库数据格式的数据发送至写入插件单元。
根据权利要求3所述的系统，其特征在于，所述数据处理中心由至少一个同步执行节点组成。
根据权利要求1-4任一项所述的系统，其特征在于，所述同步执行节点在同步任务控制器的控制下执行数据同步的操作，所述同步任务控制器包括同步任务管理单元、执行节点管理单元、控制单元、日志管理单元、报表警告单元、服务单元和数据持久化单元，所述同步任务管理单元根据接收的任务的任务信息指定控制单元来激活任务，再将激活的任务分配到至少一个同步执行节点中运行；执行节点管理单元用于向至少一个同步执行节点发送执行命令和元数据；日志管理单元用于记录每一个同步执行节点的运行状态；所述报表警告单元根据预定的规则进行警报；服务单元用于向客户提供数据服务功能；数据持久化单元用于将数据持久化在本地数据库中。
根据权利要求5所述的系统，其特征在于，所述同步执行节点通过多通道的方式并行执行数据同步的操作，所述通道包数据接收器、数据切分模块、多个第一数据转换模块、多个数据处理模块、多个第二数据转换模块、数据合并模块和数据发送器，所述数据接收器从采集插件适配器接收数据并发送至所述数据切分模块，所述数据切分模块将数据切分后发送至多个第一数据转换模块，多个第一数据转换模块将接收的数据转换为预定的格式后发送至相应的数据处理模块，数据处理模块处理后发送至相应的第二数据转换模块，第二数据转换模块将预定的格式的数据再转换为拟写入的数据库数据格式的数据后发送至数据合并模块，数据合并模块将接收的数据合并后发送至数据发送器，数据发送器将合并后的拟写入的数据库数据格式的数据后发送至写入插件适配器。
一种基于权利1-6任一项所述的异构数据库之间数据同步的系统的数据同步方法，其特征在于，该方法包括：

设置步骤，设置多个数据库中的每个数据库通过采集插件单元和写入插件单元与数据处理中心相连接；

采集步骤，通过所述采集插件单元从所述多个数据库中的一个数据库中读取数据，并将所读取的数据发送至数据处理中心；

格式化步骤，通过所述数据处理中心将接收的数据先转换为预定的格式的数据再转换为拟写入的数据库数据格式的数据，并将转换为拟写入数据库的数据格式的数据发送至写入插件单元；

写入步骤，通过所述写入插件单元将接收的转换为拟写入数据库的数据格式的数据写入对应的数据库。
根据权利要求7所述的方法，其特征在于，所述预定的格式为CSV或XML格式。
根据权利要求8所述的方法，其特征在于，所述多个数据库与所述数据处理中心呈星型连接方式，所述数据处理中心包括采集插件适配器、第一格式转换单元、数据处理单元、第二格式单元和写入插件适配器，所述采集插件适配器与所述采集插件单元相连接，用于接收采集插件单元从数据库中所采集的数据并发送至第一格式转换单元，第一格式转换单元用于将接收的数据格式化为预定的格式的数据后发送至数据处理单元，数据处理单元进行处理后将处理后的预定格式的数据发送至第二格式转换单元，所述第二格式转换单元将预定的格式的数据再转换为拟写入的数据库数据格式的数据后发送至写入插件适配器，写入插件适配器将拟写入的数据库数据格式的数据发送至写入插件单元。
根据权利要求9所述的方法，其特征在于，所述数据处理中心由至少一个同步执行节点组成。
根据权利要求7-10任一项所述的方法，其特征在于，所述同步执行节点在同步任务控制器的控制下执行数据同步的操作，所述同步任务控制器包括同步任务管理单元、执行节点管理单元、控制单元、日志管理单元、报表警告单元、服务单元和数据持久化单元，所述同步任务管理单元根据接收的任务的任务信息指定控制单元来激活任务，再将激活的任务分配到至少一个同步执行节点中运行；执行节点管理单元用于向至少一个同步执行节点发送执行命令和元数据；日志管理单元用于记录每一个同步执行节点的运行状态；所述报表警告单元根据预定的规则进行警报；服务单元用于向客户提供数据服务功能；数据持久化单元用于将数据持久化在本地数据库中。
根据权利要求11所述的方法，其特征在于，所述同步执行节点通过多通道的方式并行执行数据同步的操作，所述通道包数据接收器、数据切分模块、多个第一数据转换模块、多个数据处理模块、多个第二数据转换模块、数据合并模块和数据发送器，所述数据接收器从采集插件适配器接收数据并发送至所述数据切分模块，所述数据切分模块将数据切分后发送至多个第一数据转换模块，多个第一数据转换模块将接收的数据转换为预定的格式后发送至相应的数据处理模块，数据处理模块处理后发送至相应的第二数据转换模块，第二数据转换模块将预定的格式的数据再转换为拟写入的数据库数据格式的数据后发送至数据合并模块，数据合并模块将接收的数据合并后发送至数据发送器，数据发送器将合并后的拟写入的数据库数据格式的数据后发送至写入插件适配器。
一种计算机可读存储介质，其特征在于，所述存储介质上存储有计算机程序代码，当所述计算机程序代码被计算机执行时执行权利要求7-12之任一的方法。