CN109101627B - 异构数据库同步方法及装置 - Google Patents

异构数据库同步方法及装置 Download PDF

Info

Publication number
CN109101627B
CN109101627B CN201810921222.5A CN201810921222A CN109101627B CN 109101627 B CN109101627 B CN 109101627B CN 201810921222 A CN201810921222 A CN 201810921222A CN 109101627 B CN109101627 B CN 109101627B
Authority
CN
China
Prior art keywords
transaction
database
check code
data
heterogeneous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810921222.5A
Other languages
English (en)
Other versions
CN109101627A (zh
Inventor
何毓锟
赵琼
郭志军
庞天泽
马海欣
李渊飞
葛翰翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of Communications Co Ltd
Original Assignee
Bank of Communications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of Communications Co Ltd filed Critical Bank of Communications Co Ltd
Priority to CN201810921222.5A priority Critical patent/CN109101627B/zh
Publication of CN109101627A publication Critical patent/CN109101627A/zh
Application granted granted Critical
Publication of CN109101627B publication Critical patent/CN109101627B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种异构数据库同步方法及装置,异构数据库同步方法包括:获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,以及,该事务报文分别对应在源数据库的主服务器中的第一校验码和源数据库的备用服务器中的第二校验码;判断第一校验码与第二校验码是否相同;若是,则根据事务报文在事务文件添加各个事务;以及,自事务文件中读取至少一个新增的事务,并将事务及对应的回放指令发送至目标数据库,使得目标数据库根据该回放指令对事务进行同步回放处理。本发明能够在避免与源端应用争抢数据库资源的基础上,有效实现异构数据库数据的同步传输,并能够对数据进行一致性监测,进而有效提高异构数据库之间的数据同步的可靠性。

Description

异构数据库同步方法及装置
技术领域
本发明涉及计算机数据处理技术领域,具体涉及一种异构数据库同步方法及装置。
背景技术
随着当今数字化技术的飞速发展,以及其在金融及科研等领域中促使的客户、产品、渠道、技术、竞争等方面的快速变化,数据的核心资产地位也越发的被凸显出来。以金融领域举例,商业银行的业务发展带来了服务产品的多样化,数字化经营所带来的金融数据类型也从传统结构化数据,延伸到实时流数据,以及各类非结构化数据。传统数据库单一模式包打天下的模式无法再适应复杂多变的海量数据处理需求,从而出现了新型可扩展/高性能数据库NewSQL和非关系型的数据库NoSQL技术,形成了以不同的技术解决不同场景应用的局面。基于此,数据合并或迁移、动态数据映射和数据融合管理等问题都迫切地需要一个跨平台的实现异构数据库实时同步的解决方案。
现有技术中,异构数据库同步的传统方式为基于数据库自身的同构复制技术实现的,各数据库开发商在各自的数据库同构复制的基础上提出了异构数据库的复制方案,例如关系型数据库管理系统SQL server提出的出版者及预订者同步方案,关系数据库管理系统Oracle中采用多主复制和物化视图的方案实现数据同步功能,但尽管各厂商研发出的异构数据库辅助工具完善了异构数据库同步复制的功能,但复制依然方案依赖于数据库管理系统的核心技术。基于此,异构数据库同步的另一种方式举例为基于关系型数据库管理系统MySQL中二进制日志Binlog的增量订阅/消费,通过数据库的日志解析,获取增量变更进行同步。实现原理是模拟MySQL中从盘slave的交互协议,向MySQL中主盘master发送去除无用信息dump协议,在收到master推送的二进制日志Binlog后解析字节byte流,通过过滤和路由处理EventSink模块的过滤、归并、加工等将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端的ETL(Extract-Transform-Load)过程路由分发给目标数据库进行存储,通过开源项目canal自身实现高可用HA(High Availability)来解决传统方式存在的问题。
然后,上述现有技术存在由于异构数据库之间的数据同步的可靠性低的问题,即由于未考虑源MySQL数据库的可用性因素,使得一旦源数据库出现宕机或在主从式操作系统master-slave部署时出现主备切换时,异构数据库之间的同步服务即会中断。
发明内容
针对现有技术中的问题,本发明提供一种异构数据库同步方法及装置,能够在避免与源端应用争抢数据库资源的基础上,有效实现异构数据库数据的同步传输,同时能够对数据进行一致性监测,进而有效提高异构数据库之间的数据同步的可靠性。
为解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供一种异构数据库同步方法,包括:
获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,以及,该事务报文分别对应在所述源数据库的主服务器中的第一校验码和所述源数据库的备用服务器中的第二校验码;
判断所述第一校验码与第二校验码是否相同;
若是,则根据所述事务报文在事务文件添加各个事务;
以及,自所述事务文件中读取至少一个新增的事务,并将所述事务及对应的回放指令发送至目标数据库,使得所述目标数据库根据该回放指令对所述事务进行同步回放处理。
一实施例中,所述异构数据库同步方法还包括:
若所述第一校验码与第二校验码不同,则生成报警日志并进入休眠状态,以及在休眠时长满足预设休眠时长后,返回重新获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文。
一实施例中,所述事务为由多条结构化查询语言SOL语句构成一组针对数据库的操作序列。
一实施例中,在所述获取源数据库的Redo日志所对应的属于数据更新类型的事务报文之前,所述异构数据库同步方法还包括:
读取并解析所述源数据库的主服务器本地的Redo日志;
判断所述Redo日志对应的增量数据的类型;
若所述Redo日志对应的增量数据的类型为数据更新类型,则对所述增量数据进行格式转换,生成所述增量数据对应的事务报文,并确定所述事务报文对应在所述源数据库的主服务器中的第一校验码;
以及,确定所述事务报文对应在所述源数据库的备用服务器中的第二校验码。
一实施例中,所述异构数据库同步方法还包括:
若所述Redo日志对应的增量数据的类型为数据库对象相关操作类型,则根据所述Redo日志对应的增量数据,对所述源数据库的主服务器本地的数据库对象进行维护。
一实施例中,所述将所述事务及对应的回放指令发送至目标数据库,包括:
若自所述事务文件中读取的新增的事务有多个,则根据预设规则将各个事务进行合并处理;
以及,将合并后的事务及对应的回放指令发送至目标数据库。
一实施例中,所述异构数据库同步方法还包括:
若所述合并后的事务有多个,则采用并行或串行的方式将各个所述合并后的事务及对应的回放指令发送至目标数据库。
第二方面,本发明提供一种异构数据库同步系统,包括:捕获服务器模块和事务回放模块;
其中,所述捕获服务器模块还包括事务及校验码获取单元、校验码判断单元和事务文件新增单元;
所述事务及校验码获取单元,用于获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,以及,该事务报文分别对应在所述源数据库的主服务器中的第一校验码和所述源数据库的备用服务器中的第二校验码;
所述校验码判断单元,用于判断所述第一校验码与第二校验码是否相同;
所述事务文件新增单元,用于在经判断获知所述第一校验码与第二校验码相同后,根据所述事务报文在事务文件添加各个事务;
所述事务回放模块,用于自所述事务文件中读取至少一个新增的事务,并将所述事务及对应的回放指令发送至目标数据库,使得所述目标数据库根据该回放指令对所述事务进行同步回放处理。
一实施例中,所述捕获服务器模块还包括:
休眠及重启单元,用于若所述第一校验码与第二校验码不同,则生成报警日志并进入休眠状态,以及在休眠时长满足预设休眠时长后,返回重新获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文。
一实施例中,所述事务为由多条结构化查询语言SOL语句构成一组针对数据库的操作序列。
一实施例中,所述异构数据库同步系统还包括:设置在所述源数据库的主服务器中的第一数据解析传输模块,以及,设置在所述源数据库的备用服务器中的第二数据解析传输模块;
其中,所述第一数据解析传输模块还包括:Redo日志解析单元、增量数据类型判断单元以及事务报文生成单元;
所述Redo日志解析单元,用于读取并解析所述源数据库的主服务器本地的Redo日志;
所述增量数据类型判断单元,用于判断所述Redo日志对应的增量数据的类型;
所述事务报文生成单元,用于在所述Redo日志对应的增量数据的类型为数据更新类型时,对所述增量数据进行格式转换,生成所述增量数据对应的事务报文,并确定所述事务报文对应在所述源数据库的主服务器中的第一校验码;
所述第二数据解析传输模块,用于确定所述事务报文对应在所述源数据库的备用服务器中的第二校验码。
一实施例中,所述第一数据解析传输模块还包括:
数据库对象维护单元,用于在所述Redo日志对应的增量数据的类型为数据库对象相关操作类型时,根据所述Redo日志对应的增量数据,对所述源数据库的主服务器本地的数据库对象进行维护。
一实施例中,所述事务回放模块包括:
事务合并单元,用于在自所述事务文件中读取的新增的事务有多个时,根据预设规则将各个事务进行合并处理;
合并事务发送单元,用于将合并后的事务及对应的回放指令发送至目标数据库。
一实施例中,所述合并事务发送单元还包括:
并行或串行发送子单元,用于在所述合并后的事务有多个时,采用并行或串行的方式将各个所述合并后的事务及对应的回放指令发送至目标数据库。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的异构数据库同步方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的异构数据库同步方法的步骤。
由上述技术方案可知,本发明提供一种异构数据库同步方法及装置,其中的异构数据库同步方法包括:获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,以及,该事务报文分别对应在源数据库的主服务器中的第一校验码和源数据库的备用服务器中的第二校验码;判断第一校验码与第二校验码是否相同;若是,则根据事务报文在事务文件添加各个事务;以及,自事务文件中读取至少一个新增的事务,并将事务及对应的回放指令发送至目标数据库,使得目标数据库根据该回放指令对事务进行同步回放处理。所述异构数据库同步方法通过获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,能够实现源数据库与其他支持标准SQL语法的异构数据库之间的数据同步,将数据增量准实时推送至目标数据库,进而能够在避免与源端应用争抢数据库资源的基础上,有效实现异构数据库数据的同步传输,通过对第一校验码与第二校验码之间的一致性判断,能够对数据进行一致性监测,避免在源数据库master-slave部署时出现主备切换时的异构数据库之间的同步服务中断问题的出现,进而有效提高异构数据库之间的数据同步的可靠性,以及,通过以事务为单元在目标数据库回放,使得目标端数据能够始终处于事务一致性状态。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法实施例中的异构数据库同步方法的流程示意图。
图2为本发明方法实施例中的包含有步骤202的异构数据库同步方法的流程示意图。
图3为本发明方法实施例中的异构数据库同步方法中步骤001至005的流程示意图。
图4为本发明方法实施例中的异构数据库同步方法中步骤400的流程示意图。
图5为本发明系统实施例中的异构数据库同步系统的结构示意图。
图6为本发明系统实施例中的包含有捕获服务器模块的异构数据库同步系统的结构示意图。
图7为本发明系统实施例中的包含有第一数据解析传输模块和第二数据解析传输模块的异构数据库同步系统的结构示意图。
图8为本发明系统实施例中的异构数据库同步系统中的事务回放模块30的结构示意图。
图9为本发明设备实施例中的电子设备的结构示意图。
图10为本发明具体应用实例中的应用异构数据库同步系统实现异构数据库同步方法的逻辑示意图。
图11为本发明具体应用实例中的第一数据解析传输模块和第二数据解析传输模块的运行逻辑示意图。
图12为本发明具体应用实例中的第一数据解析传输模块与捕获服务器模块之间的交互举例示意图。
图13为本发明具体应用实例中的捕获服务器模块的运行逻辑示意图。
图14为本发明具体应用实例中的第一数据解析传输模块、第二数据解析传输模块及捕获服务器模块之间的交互举例示意图。
图15为本发明具体应用实例中的事务回放模块的运行逻辑示意图。
图16为本发明具体应用实例中的事务回放模块的相邻事务合并优化策略举例示意图。
图17为本发明具体应用实例中的事务回放模块的热点数据更新优化策略举例示意图。
图18为本发明具体应用实例中的第一数据解析传输模块、第二数据解析传输模块、捕获服务器模块及事务回放模块之间的交互举例示意图。
图19为本发明的效果测试举例中的数据解析传输模块的CPU变化率示意图。
图20为本发明的效果测试举例中的数据解析传输模块的内存变化示意图。
图21为本发明的效果测试举例中的事务回放模块的CPU变化率示意图。
图22为本发明的效果测试举例中的事务回放模块的内存变化示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种异构数据库同步方法的具体实施方式,参见图1,所述异构数据库同步方法具体包括如下内容:
步骤100:获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,以及,该事务报文分别对应在所述源数据库的主服务器中的第一校验码和所述源数据库的备用服务器中的第二校验码。
其中,所述事务为由多条结构化查询语言SOL语句构成一组针对数据库的操作序列,且所述第一校验码和第二校验码均可以为循环冗余校验码CRC(Cyclic RedundancyCheck)校验码。
在步骤100中,异构数据库同步系统获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,以及,该事务报文分别对应在所述源数据库的主服务器中的第一校验码和所述源数据库的备用服务器中的第二校验码。可以理解的是,所述重做Redo日志用于记录事务对数据的更新操作,可表示为:事务T为数据库元素X写入新值v。Redo日志通常用于在数据库实例故障恢复数据,例如在Oracle数据库所在服务器突然掉电、突然重启或者执行非正常关闭shutdown abort等命令使得在服务器重新启动之后,Oracle数据库没有办法正常的启动实例。此时,Oracle会使用Redo日志,把数据库恢复到服务器掉电前的那一个时刻,从而使得数据库能正常的启动起来,即当用户生成一个数据库事务时,Redo日志会记录被修改的数据的更新后的值。
可以理解的是,所述源数据库可以为支持海量数据的高性能分布式数据库系统OCEANBASE,且所述目标数据库相对于源数据库来说,为一个支持标准SQL语法的异构数据库。在一种举例中,所述源数据库及异构数据库均属于同一个能够实现数据的共享和透明访问的异构数据库系统,其中,所述异构数据库系统的一种举例为关系型数据库管理系统DB2,该DB2除了可以提供主流的OS/390和VM操作系统,以及中等规模的AS/400系统之外,还提供了跨平台(包括基于UNIX的LINUX,HP-UX,SunSolaris,以及SCOUnixWare;还有用于个人电脑的OS/2操作系统,以及微软的Windows 2000和其早期的系统)的DB2产品。DB2数据库可以通过使用微软的开放数据库连接(ODBC)接口,Java数据库连接(JDBC)接口,或者CORBA接口代理被任何的应用程序访问。
另外,所述异构数据库同步系统可以体现为1个或几个相同通信的服务器,所述异构数据库同步系统的硬件组成中也可以包括终端设备,所述终端设备可以具有显示功能。具体地,所述终端设备可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDK)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
所述服务器可以与所述终端设备进行通信。所述服务器与所述终端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
步骤200:判断所述第一校验码与第二校验码是否相同。
若是,则执行步骤201。
步骤201:根据所述事务报文在事务文件添加各个事务。
在上述描述中,异构数据库同步系统判断所述第一校验码与第二校验码是否相同,并根据所述事务报文在事务文件添加各个事务。可以理解的是,所述异构数据库同步系统可以在预设的事务文件中添加由以事务为单位的SQL语句,若该事务文件的内存达到阈值,则所述异构数据库同步系统可以重新生成新的事务文件,并在该事务文件中添加由以单个事务为单位的SQL语句。
步骤300:自所述事务文件中读取至少一个新增的事务,并将所述事务及对应的回放指令发送至目标数据库,使得所述目标数据库根据该回放指令对所述事务进行同步回放处理。
在上述描述中,异构数据库同步系统自所述事务文件中读取预设定量的以单个事务为单位的SQL语句,并将所述事务及对应的回放指令发送至目标数据库,使得所述目标数据库根据该回放指令对所述事务进行同步回放处理。
从上述描述可知,本发明的实施例提供的异构数据库同步方法,通过获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,能够实现源数据库与其他支持标准SQL语法的异构数据库之间的数据同步,将数据增量准实时推送至目标数据库,进而能够在避免与源端应用争抢数据库资源的基础上,有效实现异构数据库数据的同步传输,通过对第一校验码与第二校验码之间的一致性判断,能够对数据进行一致性监测,避免在源数据库master-slave部署时出现主备切换时的异构数据库之间的同步服务中断问题的出现,进而有效提高异构数据库之间的数据同步的可靠性,以及,通过以事务为单元在目标数据库回放,使得目标端数据能够始终处于事务一致性状态。
在一种具体实施方式中,参见图2,所述异构数据库同步方法中的步骤200之后还包含有步骤202,所述步骤202具体包括如下内容:
若所述第一校验码与第二校验码不相同,则执行所述步骤202:生成报警日志并进入休眠状态,以及在休眠时长满足预设休眠时长后,返回步骤100,重新获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文。
从上述描述可知,本发明的实施例提供的异构数据库同步方法,通过对第一校验码与第二校验码之间的一致性判断,能够对数据进行一致性监测,并在迅速监测到数据不一致情况后暂停同步,一旦源数据库恢复一致性状态后,数据同步过程仍然能够继续、避免数据丢失,进而有效提高异构数据库之间的数据同步的可靠性。
在一种具体实施方式中,参见图3,所述异构数据库同步方法中的步骤100之前还包含有步骤001至步骤005,所述步骤001至步骤005具体包括如下内容:
步骤001:读取并解析所述源数据库的主服务器本地的Redo日志。
可以理解的是,所述异构数据库同步系统可以对所述源数据库的主服务器节点存储的指定Redo日志进行协议解析,并可以补充特定信息如CRC校验值、字段名称、字段类型、主键信息,无符号unsigned类型处理。最后以一种轻量级的数据交换格式的JSON(JavaScript Object Notation,JS对象简谱)报文的形式对解析及内容补充后的SQL语句构成的事务报文。
步骤002:判断所述Redo日志对应的增量数据的类型是数据更新类型还是数据库对象相关操作类型。
若所述Redo日志对应的增量数据的类型为数据更新类型,则执行步骤003,若所述Redo日志对应的增量数据的类型为数据库对象相关操作类型,则执行步骤005。
可以理解的是,所述异构数据库同步系统判断所述Redo日志对应的增量数据的类型是数据更新类型还是数据库对象Schema的相关操作类型。其中,数据库中的Schema为数据库对象的集合。
步骤003:若所述Redo日志对应的增量数据的类型为数据更新类型,则对所述增量数据进行格式转换,生成所述增量数据对应的事务报文,并确定所述事务报文对应在所述源数据库的主服务器中的第一校验码;
步骤004:确定所述事务报文对应在所述源数据库的备用服务器中的第二校验码。
步骤005:根据所述Redo日志对应的增量数据,对所述源数据库的主服务器本地的数据库对象进行维护。
从上述描述可知,本发明的实施例提供的异构数据库同步方法,通过解析Redo日志捕捉数据库增量更新,避免了与源端应用争抢数据库资源,减少了对应用的影响。
在一种具体实施方式中,参见图4,所述异构数据库同步方法中的步骤300中的将所述事务及对应的回放指令发送至目标数据库具体包括如下内容:
步骤401:若自所述事务文件中读取的新增的事务有多个,则根据预设规则将各个事务进行合并处理。
步骤402:将合并后的事务及对应的回放指令发送至目标数据库,且在步骤402中,若所述合并后的事务有多个,则步骤402具体可以为:采用并行或串行的方式将各个所述合并后的事务及对应的回放指令发送至目标数据库。
从上数描述可知,本发明的实施例提供的异构数据库同步方法,以事务为单元在目标数据库回放,目标端数据总是处于事务一致性状态,以及,在事务回放过程中使用了优化控制策略保证高性能回放。
本发明实施例提供一种能够实现所述异构数据库同步方法中全部内容的异构数据库同步系统的具体实施方式,参见图5,所述异构数据库同步系统具体包括如下内容:
捕获服务器模块20和事务回放模块30。
其中,所述捕获服务器模块还包括事务及校验码获取单元21、校验码判断单元22和事务文件新增单元23。
所述事务及校验码获取单元21,用于获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,以及,该事务报文分别对应在所述源数据库的主服务器中的第一校验码和所述源数据库的备用服务器中的第二校验码。
其中,所述事务为由多条结构化查询语言SOL语句构成一组针对数据库的操作序列。
所述校验码判断单元22,用于判断所述第一校验码与第二校验码是否相同;
所述事务文件新增单元23,用于在经判断获知所述第一校验码与第二校验码相同后,根据所述事务报文在事务文件添加各个事务。
所述事务回放模块30,用于自所述事务文件中读取至少一个新增的事务,并将所述事务及对应的回放指令发送至目标数据库,使得所述目标数据库根据该回放指令对所述事务进行同步回放处理。
本申请提供的异构数据库同步系统的实施例具体可以用于执行上述实施例中的异构数据库同步方法的实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
从上述描述可知,本发明的实施例提供的异构数据库同步系统,通过捕获服务器模块获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,能够实现源数据库与其他支持标准SQL语法的异构数据库之间的数据同步,将数据增量准实时推送至目标数据库,进而能够在避免与源端应用争抢数据库资源的基础上,有效实现异构数据库数据的同步传输,通过对第一校验码与第二校验码之间的一致性判断,能够对数据进行一致性监测,避免在源数据库master-slave部署时出现主备切换时的异构数据库之间的同步服务中断问题的出现,进而有效提高异构数据库之间的数据同步的可靠性,以及,通过事务回放模块以事务为单元在目标数据库回放,使得目标端数据能够始终处于事务一致性状态。
在一种具体实施方式中,参见图6,所述异构数据库同步系统中的捕获服务器模块20中还具体包括如下内容:
休眠及重启单元24,用于若所述第一校验码与第二校验码不同,则生成报警日志并进入休眠状态,以及在休眠时长满足预设休眠时长后,返回重新获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文。
从上述描述可知,本发明的实施例提供的异构数据库同步系统,通过休眠及重启单元对第一校验码与第二校验码之间的一致性判断,能够对数据进行一致性监测,并在迅速监测到数据不一致情况后暂停同步,一旦源数据库恢复一致性状态后,数据同步过程仍然能够继续、避免数据丢失,进而有效提高异构数据库之间的数据同步的可靠性。
在一种具体实施方式中,参见图7,所述异构数据库同步系统中还包括有设置在所述源数据库的主服务器中的第一数据解析传输模块11,以及,设置在所述源数据库的备用服务器中的第二数据解析传输模块12,具体内容如下:
所述第一数据解析传输模块还包括:Redo日志解析单元111、增量数据类型判断单元112、事务报文生成单元113以及数据库对象维护单元114。
所述Redo日志解析单元111,用于读取并解析所述源数据库的主服务器本地的Redo日志。
所述增量数据类型判断单元112,用于判断所述Redo日志对应的增量数据的类型。
所述事务报文生成单元113,用于在所述Redo日志对应的增量数据的类型为数据更新类型时,对所述增量数据进行格式转换,生成所述增量数据对应的事务报文,并确定所述事务报文对应在所述源数据库的主服务器中的第一校验码。
数据库对象维护单元114,用于在所述Redo日志对应的增量数据的类型为数据库对象相关操作类型时,根据所述Redo日志对应的增量数据,对所述源数据库的主服务器本地的数据库对象进行维护。
所述第二数据解析传输模块12,用于确定所述事务报文对应在所述源数据库的备用服务器中的第二校验码。
从上述描述可知,本发明的实施例提供的异构数据库同步系统,通过解析Redo日志捕捉数据库增量更新,避免了与源端应用争抢数据库资源,减少了对应用的影响。
在一种具体实施方式中,参见图8,所述异构数据库同步系统中的事务回放模块30还具体包括内容如下:
事务合并单元31,用于在自所述事务文件中读取的新增的事务有多个时,根据预设规则将各个事务进行合并处理。
合并事务发送单元32,用于将合并后的事务及对应的回放指令发送至目标数据库。
其中,所述合并事务发送单元32还包括并行或串行发送子单元321,所述并行或串行发送子单元321用于在所述合并后的事务有多个时,采用并行或串行的方式将各个所述合并后的事务及对应的回放指令发送至目标数据库。
从上数描述可知,本发明的实施例提供的异构数据库同步系统,以事务为单元在目标数据库回放,目标端数据总是处于事务一致性状态,以及,在事务回放过程中使用了优化控制策略保证高性能回放。
本发明的实施例还提供能够实现上述实施例中的异构数据库同步方法中全部步骤的一种电子设备的具体实施方式,参见图9,所述电子设备具体包括如下内容:
处理器(processor)601、存储器(memory)602、通信接口(CommunicationsInterface)603和总线604;
其中,所述处理器601、存储器602、通信接口603通过所述总线604完成相互间的通信;所述通信接口603用于实现源数据库的Redo日志、异构数据库同步系统及目标数据库等相关设备之间的信息传输;
所述处理器601用于调用所述存储器602中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的异构数据库同步方法中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤100:获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,以及,该事务报文分别对应在所述源数据库的主服务器中的第一校验码和所述源数据库的备用服务器中的第二校验码。
步骤200:判断所述第一校验码与第二校验码是否相同。
若是,则执行步骤201。
步骤201:根据所述事务报文在事务文件添加各个事务。
步骤300:自所述事务文件中读取至少一个新增的事务,并将所述事务及对应的回放指令发送至目标数据库,使得所述目标数据库根据该回放指令对所述事务进行同步回放处理。
从上述描述可知,本发明的实施例提供的电子设备,通过获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,能够实现源数据库与其他支持标准SQL语法的异构数据库之间的数据同步,将数据增量准实时推送至目标数据库,进而能够在避免与源端应用争抢数据库资源的基础上,有效实现异构数据库数据的同步传输,通过对第一校验码与第二校验码之间的一致性判断,能够对数据进行一致性监测,避免在源数据库master-slave部署时出现主备切换时的异构数据库之间的同步服务中断问题的出现,进而有效提高异构数据库之间的数据同步的可靠性,以及,通过以事务为单元在目标数据库回放,使得目标端数据能够始终处于事务一致性状态。
本申请的实施例还提供能够实现上述实施例中的异构数据库同步方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的异构数据库同步方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤100:获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,以及,该事务报文分别对应在所述源数据库的主服务器中的第一校验码和所述源数据库的备用服务器中的第二校验码。
步骤200:判断所述第一校验码与第二校验码是否相同。
若是,则执行步骤201。
步骤201:根据所述事务报文在事务文件添加各个事务。
步骤300:自所述事务文件中读取至少一个新增的事务,并将所述事务及对应的回放指令发送至目标数据库,使得所述目标数据库根据该回放指令对所述事务进行同步回放处理。
从上述描述可知,本发明的实施例提供的计算机可读存储介质,通过获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,能够实现源数据库与其他支持标准SQL语法的异构数据库之间的数据同步,将数据增量准实时推送至目标数据库,进而能够在避免与源端应用争抢数据库资源的基础上,有效实现异构数据库数据的同步传输,通过对第一校验码与第二校验码之间的一致性判断,能够对数据进行一致性监测,避免在源数据库master-slave部署时出现主备切换时的异构数据库之间的同步服务中断问题的出现,进而有效提高异构数据库之间的数据同步的可靠性,以及,通过以事务为单元在目标数据库回放,使得目标端数据能够始终处于事务一致性状态。
为进一步地说明本方案,参见图10,本发明还提供应用所述异构数据库同步系统实现异构数据库同步方法的具体应用实例,具体包括如下内容:
在所述异构数据库同步系统的具体应用实例中,具体包括三个模块:第一数据解析传输模块(Log Agent)11、第二数据解析传输模块(Log Agent)12、捕获服务器模块(Capture Server)20和事务回放模块(SQL Replayer)30。其中,所述第一数据解析传输模块(Log Agent)11和第二数据解析传输模块(Log Agent)12分别设置在所述源数据库的事务处理服务器(主)和事务处理服务器(备)中。
所述第一数据解析传输模块(Log Agent)11负责对数据库事务处理节点存储的指定Redo日志进行协议解析,并补充特定信息如CRC校验值、字段名称、字段类型、主键信息,unsigned类型处理。以json报文的形式将转化的SQL发送给捕获服务器模块(CaptureServer)20,支持多数据解析传输模块(Log Agent)部署。
所述捕获服务器模块(Capture Server)20定时从数据解析传输模块(Log Agent)11拉取SQL json报文,多数据解析传输模块(Log Agent)部署时支持CRC数据一致性校验,以源数据库的事务粒度持久化存储事务文件在本地磁盘;支持捕获服务器模块(CaptureServer)HA部署,同一时间只能有一个处运行running状态,其他的处于备用standby状态。
所述事务回放模块(SQL Replayer)30负责按顺序读取事务文件,根据参数配置可支持事务合并、并发执行、串行提交的控制策略,确保事务一致性的情况下完成在目标异构数据库上的高性能回放。
应用上述异构数据库同步系统的具体应用实例实现异构数据库同步方法的具体应用实例如下:
参见图11,第一数据解析传输模块(Log Agent)11和第二数据解析传输模块(LogAgent)12部署在分布式数据库的主备事务处理服务器上,当接收到捕获服务器模块(Capture Server)20的请求后,读取本地的Redo日志并解析,如果是数据变更则生成等价的SQL json报文返回到捕获服务器模块(Capture Server)20;如果是Schema相关的日志,则进行第一数据解析传输模块(Log Agent)1130自身的Schema维护操作;对于其他日志忽略不做任何处理。第一数据解析传输模块(Log Agent)11和第二数据解析传输模块(LogAgent)12启动初始化时,会向捕获服务器模块(Capture Server)20注册,并拉取当前最新schema文件。在正常运行过程中,会和捕获服务器模块(Capture Server)20保持心跳,当遇到本地schema信息变更时向捕获服务器模块(Capture Server)20发送最新版本schema。
参见图12,第一数据解析传输模块(Log Agent)11与捕获服务器模块(CaptureServer)20之间的一种交互举例如下:
S1:事务处理服务器(主)中的第一数据解析传输模块进行数据初始化,并向捕获服务器模块发送注册请求。
S2:捕获服务器模块接收所述注册请求,并对应注册所述数据解析传输模块。
S3:捕获服务器模块向第一数据解析传输模块发送最新的数据库对象集合文件。
S4:第一数据解析传输模块接收并存储所述数据库对象相关操作文件,第二数据解析传输模块同步存储所述数据库对象相关操作文件。
S5:捕获服务器模块向第一数据解析传输模块定时发送数据获取请求。
S6:第一数据解析传输模块接收所述数据获取请求,读取并解析本地Redo日志。
S71:若第一数据解析传输模块根据解析结果获知所述Redo日志类型为数据库对象Schema相关操作类型,则第一数据解析传输模块对本地存储的数据库对象相关操作文件进行更新维护,并向捕获服务器模块发送更新后的数据库对象集合文件,同时,第二数据解析传输模块同步更新所述数据库对象集合文件;
S81:捕获服务器模块接收并更新所述数据库对象集合文件。
参见图13,所述捕获服务器模块(Capture Server)20定时(预计每隔1s,可配置)向事务处理服务器上部署的第一数据解析传输模块(Log Agent)11发送数据获取fetch请求,并自第一数据解析传输模块(Log Agent)11和第二数据解析传输模块(Log Agent)12分别拉取增量数据对应CRC校验码;然后校验第一数据解析传输模块(Log Agent)11和第二数据解析传输模块(Log Agent)12返回的校验码是否一致,如果CRC不一致,说明源数据库内部发生数据不一致,此时放弃此次拉取的等价SQL,写报警日志,休眠一段时间后重试,待源数据库自身恢复数据一致状态后继续同步操作。
参见图14,第一数据解析传输模块(Log Agent)11、第二数据解析传输模块(LogAgent)12与捕获服务器模块(Capture Server)20之间的一种交互举例如下:
S1:事务处理服务器(主)中的第一数据解析传输模块进行数据初始化,并向捕获服务器模块发送注册请求。
S2:捕获服务器模块接收所述注册请求,并对应注册所述数据解析传输模块。
S3:捕获服务器模块向第一数据解析传输模块发送最新的数据库对象集合文件。
S4:第一数据解析传输模块接收并存储所述数据库对象相关操作文件,第二数据解析传输模块同步存储所述数据库对象相关操作文件。
S5:捕获服务器模块向第一数据解析传输模块定时发送数据获取请求。
S6:第一数据解析传输模块接收所述数据获取请求,读取并解析本地Redo日志。
S72:若第一数据解析传输模块根据解析结果获知Redo日志类型为数据更新类型,则第一数据解析传输模块生成所述数据更新日志对应的事务报文,并发送该事务报文及对应的第一CRC校验码至捕获服务器模块。
S82:捕获服务器模块接收所述事务报文及对应的第一CRC校验码。
S9:捕获服务器模块向第二数据解析传输模块发送CRC校验码获取请求。
S10:第二数据解析传输模块接收所述CRC校验码获取请求。
S11:第二数据解析传输模块向捕获服务器模块发送本地Redo日志对应的第二CRC校验码。
S12:捕获服务器模块接收所述第二CRC校验码,并检验所述第一CRC验证码与第二CRC验证码是否一致。
S131:若所述第一CRC验证码与第二CRC验证码不一致,则捕获服务器模块生成报警日志并进入休眠状态,并在休眠时长满足预设休眠时长后,重新启动执行S5。
参见图15,事务回放模块(SQL Replayer)30实现事务合并、并发执行、串行提交的控制策略,可有效提升事务回放效率避免目标数据库同步堵塞。首次启动SQLReplay时,需配置目标数据库的同步表,以保存数据同步时间、事务文件名、事务号、文件行号等信息。
启动事务回放模块(SQL Replayer)30时需检查同步表状态,如果存在则读取同步点信息,如果不存在则初始化同步表;运行时,定时(预定1s)从事务文件读取一定量(可参数配置)SQL,并进行校验,以事务为单位在目标数据库进行回放,同时更新同步表中同步点信息,如果同步成功继续下一个事务,如果失败写异常日志,每日定时删除已过期事务日志。
所述事务回放模块(SQL Replayer)30的控制策略如下:
1)相邻事务合并优化策略:
参见图16的相邻事务合并原理,其中,I1至I9分别表示insert数据库对象1至9,U2表示update数据库对象2,图16为源数据库中解析出来的增量数据记录,需要对目标数据库进行的回放操作;相邻事务合并优化后产生3个事务,事务号用合并后的最大事务号标记;合并目的是减少事务提交的次数和事务同步点的更新次数,可参数配置合并事务大小。
2)并发执行,串行提交优化策略:
事务合并后,并发执行,串行提交策略将保证回放时事务号大的事务需等待前一个事务提交才能继续。例如提交阶段106事务将等待103事务先提交,如果103事务提交出现异常,106将自动回滚,此时同步点将停留在103事务号之前。其他事务回放都将挂住,需等103提交成功后重新被拉起;并发执行、串行提交可以严格保证回放到某一时间点的事务出现异常后,恢复后可从失败的事务开始继续回放,不会出现事务的穿透。
3)热点数据更新优化策略
当存在源数据库存在热点数据更新时,即使采用相邻事务合并以及并发执行的优化策略,由于目标端数据同步冲突率很高导致回放性能无法提升。
参见图17,其中,I1至I6分别表示insert数据库对象1至6,U2至U5表示update数据库对象2至5,因此通过热点事务合并的策略实现,打破事务发生的时间序,将热点数据更新事务聚类合并,严格保证合并后的事务是非耦合的,提升并发性能;例如在105号事务会先于104号事务回放于目标端,但目标端数据与源端保持最终一致性。
参见图18,第一数据解析传输模块(Log Agent)11、第二数据解析传输模块(LogAgent)12、捕获服务器模块(Capture Server)20及事务回放模块(SQL Replayer)30之间的一种交互举例如下:
S1:事务处理服务器(主)中的第一数据解析传输模块进行数据初始化,并向捕获服务器模块发送注册请求。
S2:捕获服务器模块接收所述注册请求,并对应注册所述数据解析传输模块。
S3:捕获服务器模块向第一数据解析传输模块发送最新的数据库对象集合文件。
S4:第一数据解析传输模块接收并存储所述数据库对象相关操作文件,第二数据解析传输模块同步存储所述数据库对象相关操作文件。
S5:捕获服务器模块向第一数据解析传输模块定时发送数据获取请求。
S6:第一数据解析传输模块接收所述数据获取请求,读取并解析本地Redo日志。
S72:若第一数据解析传输模块根据解析结果获知Redo日志类型为数据更新类型,则第一数据解析传输模块生成所述数据更新日志对应的事务报文,并发送该事务报文及对应的第一CRC校验码至捕获服务器模块。
S82:捕获服务器模块接收所述事务报文及对应的第一CRC校验码。
S9:捕获服务器模块向第二数据解析传输模块发送CRC校验码获取请求。
S10:第二数据解析传输模块接收所述CRC校验码获取请求。
S11:第二数据解析传输模块向捕获服务器模块发送本地Redo日志对应的第二CRC校验码。
S12:捕获服务器模块接收所述第二CRC校验码,并检验所述第一CRC验证码与第二CRC验证码是否一致。
S132:若所述第一CRC验证码与第二CRC验证码一致,则捕获服务器模块根据所述事务报文在事务文件新增各个事务。
S14:事务回放模块开始运行,定时自所述事务文件中读取定量的事务。
S15:事务回放模块将各个合并后的事务及对应的回放指令并行或串行发送至目标数据库。
S16:目标数据库在目标数据库中回放各个事务,并更新所述同步表中的同步点信息,若回放成功,则继续回放下一事务;若回放失败,则发送回放失败信息。
S17:若所述事务回放模块接收到所述回放失败信息,则事务回放模块根据所述回放失败信息,添加异常日志。
S18:事务回放模块定时向目标数据库发送过期日志删除指令。
S19:目标数据库根据接收的所述过期日志删除指令删除过期日志文件。
另外,在一种具体举例中,本发明的异构数据库间通用数据格式如表1所示。
表1
Figure BDA0001764279810000201
从上述描述可知,本发明具体应用实例中的应用所述异构数据库同步系统实现异构数据库同步方法的有益效果如下:
1.高性能:通过解析Redo日志捕捉数据库增量更新,避免了与源端应用争抢数据库资源,减少了对应用的影响。在事务回放模块中使用了优化控制策略保证高性能回放。
2.目标端数据的事务一致性:以事务为单元在目标数据库回放,目标端数据总是处于事务一致性状态。
3.灵活的配置方式:支持表级增量捕捉,支持灵活的数据映射配置。
4.异步复制:这是一种异步复制技术,对源数据库影响小。
5.支持异构数据库:使用公开的标准接口向目标数据库复制变动。
本发明具体应用实例中的应用所述异构数据库同步系统实现异构数据库同步方法能够提高目标库的数据新鲜度:传统迁移工具只提供全量迁移功能,这个过程中需要话费大量时间,本技术方案可实现秒级异构数据库数据实时同步,大大提高目标库的数据新鲜度;降低运维成本:传统方案针对异构数据库在数据迁移时,需要编写定制化的导入导出脚本,当业务逻辑变更后,需要修改大量脚本,本技术方案只需配置好同步规则;以及自主可控,定制开发:本技术方案可根据目标库需求,只同步部分表、表中部分字段以及异构表数据的同步。
为了进一步验证本发明的异构数据库同步方法的效果,本发明还提供如图19至图22所述的压测过程中,CDC个模块系统资源消耗中的示意图,其中,图19和图20分别为数据解析传输模块(Log Agent)的CPU变化率和内存显示程序MEM中的内存变化,图21和图22分别为事务回放模块(SQL Replayer)的CPU变化率和内存显示程序MEM中的内存变化。另外,还根据中文数据库CBase环境测试了不同参数下,CDC同步数据到DB2的延迟情况。如表2所示,其中开关语句中的关键字case1-10是采用事务自动提交,case1-3使用一个线程写CBase,case4-6使用10个线程写,case7-9使用30个线程;case11-15使用不同事务大小,CBase写线程数都为50。
表2
Figure BDA0001764279810000211
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本说明书实施例的实施例而已,并不用于限制本说明书实施例。对于本领域技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的权利要求范围之内。

Claims (14)

1.一种异构数据库同步方法,其特征在于,包括:
读取并解析源数据库的主服务器本地的Redo日志;
判断所述Redo日志对应的增量数据的类型;
若所述Redo日志对应的增量数据的类型为数据更新类型,则对所述增量数据进行格式转换,生成所述增量数据对应的事务报文,并确定所述事务报文对应在所述源数据库的主服务器中的第一校验码;
以及,确定所述事务报文对应在所述源数据库的备用服务器中的第二校验码;
获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,以及,该事务报文分别对应在所述源数据库的主服务器中的第一校验码和所述源数据库的备用服务器中的第二校验码;
判断所述第一校验码与第二校验码是否相同;
若是,则根据所述事务报文在事务文件添加各个事务;
以及,自所述事务文件中读取至少一个新增的事务,并将所述事务及对应的回放指令发送至目标数据库,使得所述目标数据库根据该回放指令对所述事务进行同步回放处理。
2.根据权利要求1所述的异构数据库同步方法,其特征在于,还包括:
若所述第一校验码与第二校验码不同,则生成报警日志并进入休眠状态,以及在休眠时长满足预设休眠时长后,返回重新获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文。
3.根据权利要求1所述的异构数据库同步方法,其特征在于,所述事务为由多条结构化查询语言SQL 语句构成一组针对数据库的操作序列。
4.根据权利要求1所述的异构数据库同步方法,其特征在于,还包括:
若所述Redo日志对应的增量数据的类型为数据库对象相关操作类型,则根据所述Redo日志对应的增量数据,对所述源数据库的主服务器本地的数据库对象进行维护。
5.根据权利要求1所述的异构数据库同步方法,其特征在于,所述将所述事务及对应的回放指令发送至目标数据库,包括:
若自所述事务文件中读取的新增的事务有多个,则根据预设规则将各个事务进行合并处理;
以及,将合并后的事务及对应的回放指令发送至目标数据库。
6.根据权利要求5所述的异构数据库同步方法,其特征在于,还包括:
若所述合并后的事务有多个,则采用并行或串行的方式将各个所述合并后的事务及对应的回放指令发送至目标数据库。
7.一种异构数据库同步系统,其特征在于,包括:设置在源数据库的主服务器中的第一数据解析传输模块、设置在所述源数据库的备用服务器中的第二数据解析传输模块、捕获服务器模块和事务回放模块;
其中,所述第一数据解析传输模块还包括:Redo日志解析单元、增量数据类型判断单元以及事务报文生成单元;
所述Redo日志解析单元,用于读取并解析所述源数据库的主服务器本地的Redo日志;
所述增量数据类型判断单元,用于判断所述Redo日志对应的增量数据的类型;
所述事务报文生成单元,用于在所述Redo日志对应的增量数据的类型为数据更新类型时,对所述增量数据进行格式转换,生成所述增量数据对应的事务报文,并确定所述事务报文对应在所述源数据库的主服务器中的第一校验码;
所述第二数据解析传输模块,用于确定所述事务报文对应在所述源数据库的备用服务器中的第二校验码;
其中,所述捕获服务器模块还包括事务及校验码获取单元、校验码判断单元和事务文件新增单元;
所述事务及校验码获取单元,用于获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文,以及,该事务报文分别对应在所述源数据库的主服务器中的第一校验码和所述源数据库的备用服务器中的第二校验码;
所述校验码判断单元,用于判断所述第一校验码与第二校验码是否相同;
所述事务文件新增单元,用于在经判断获知所述第一校验码与第二校验码相同后,根据所述事务报文在事务文件添加各个事务;
所述事务回放模块,用于自所述事务文件中读取至少一个新增的事务,并将所述事务及对应的回放指令发送至目标数据库,使得所述目标数据库根据该回放指令对所述事务进行同步回放处理。
8.根据权利要求7所述的异构数据库同步系统,其特征在于,所述捕获服务器模块还包括:
休眠及重启单元,用于若所述第一校验码与第二校验码不同,则生成报警日志并进入休眠状态,以及在休眠时长满足预设休眠时长后,返回重新获取源数据库的重做Redo日志所对应的属于数据更新类型的事务报文。
9.根据权利要求7所述的异构数据库同步系统,其特征在于,所述事务为由多条结构化查询语言SQL 语句构成一组针对数据库的操作序列。
10.根据权利要求7所述的异构数据库同步系统,其特征在于,所述第一数据解析传输模块还包括:
数据库对象维护单元,用于在所述Redo日志对应的增量数据的类型为数据库对象相关操作类型时,根据所述Redo日志对应的增量数据,对所述源数据库的主服务器本地的数据库对象进行维护。
11.根据权利要求7所述的异构数据库同步系统,其特征在于,所述事务回放模块包括:
事务合并单元,用于在自所述事务文件中读取的新增的事务有多个时,根据预设规则将各个事务进行合并处理;
合并事务发送单元,用于将合并后的事务及对应的回放指令发送至目标数据库。
12.根据权利要求11所述的异构数据库同步系统,其特征在于,所述合并事务发送单元还包括:
并行或串行发送子单元,用于在所述合并后的事务有多个时,采用并行或串行的方式将各个所述合并后的事务及对应的回放指令发送至目标数据库。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6任一项所述的异构数据库同步方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任一项所述的异构数据库同步方法的步骤。
CN201810921222.5A 2018-08-14 2018-08-14 异构数据库同步方法及装置 Active CN109101627B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810921222.5A CN109101627B (zh) 2018-08-14 2018-08-14 异构数据库同步方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810921222.5A CN109101627B (zh) 2018-08-14 2018-08-14 异构数据库同步方法及装置

Publications (2)

Publication Number Publication Date
CN109101627A CN109101627A (zh) 2018-12-28
CN109101627B true CN109101627B (zh) 2022-03-22

Family

ID=64849517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810921222.5A Active CN109101627B (zh) 2018-08-14 2018-08-14 异构数据库同步方法及装置

Country Status (1)

Country Link
CN (1) CN109101627B (zh)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885617A (zh) * 2019-01-29 2019-06-14 中国工商银行股份有限公司 分布式异构数据库系统的数据同步方法及装置
CN109947801A (zh) * 2019-02-25 2019-06-28 交通银行股份有限公司 数据库数据同步系统、方法及装置
CN110012008B (zh) * 2019-04-02 2022-03-22 山东国子软件股份有限公司 基于http协议的异构数据源分布式协调一致性方法及系统
CN112287035A (zh) * 2019-07-25 2021-01-29 中移动信息技术有限公司 数据加载方法、装置、设备及存储介质
CN110222122A (zh) * 2019-07-26 2019-09-10 深圳市元征科技股份有限公司 一种MongoDB的数据同步方法及相关设备
CN110569142A (zh) * 2019-08-29 2019-12-13 天津大学 一种oracle数据增量同步系统及方法
CN110674214B (zh) * 2019-09-06 2023-11-21 中国平安财产保险股份有限公司 大数据同步方法、装置、计算机设备及存储介质
CN110765212A (zh) * 2019-11-07 2020-02-07 内蒙古工业大学 基于数据库为平台的数据同步系统及方法
CN111061749B (zh) * 2019-12-12 2024-02-23 山东大学 基于事务顺序分析的数据库事务并发重做方法和装置
CN113032477B (zh) * 2019-12-24 2023-07-21 中移在线服务有限公司 基于gtid的长距离数据同步方法、装置及计算设备
CN111324668B (zh) * 2020-02-18 2023-11-21 中国联合网络通信集团有限公司 数据库数据同步处理方法、装置及存储介质
CN111427787B (zh) * 2020-03-26 2023-05-30 杭州小影创新科技股份有限公司 一种异构数据库业务数据同步测试方法
CN113297263A (zh) * 2020-04-01 2021-08-24 阿里巴巴集团控股有限公司 数据处理方法、装置、系统、电子设备及存储介质
CN111444278B (zh) * 2020-04-01 2023-08-29 Oppo(重庆)智能科技有限公司 数据同步方法、装置及中转服务器
CN111930693B (zh) * 2020-05-28 2024-02-06 武汉达梦数据库股份有限公司 一种基于日志解析同步的事务合并执行方法及装置
CN111737348B (zh) * 2020-06-15 2023-10-10 中国工商银行股份有限公司 基于数据库表的时效同步方法及装置
CN112116467B (zh) * 2020-06-16 2024-06-04 上海金融期货信息技术有限公司 一种异构柜台并行运行方法和系统
CN113806611A (zh) * 2020-06-17 2021-12-17 海信集团有限公司 一种存储搜索引擎结果的方法及设备
CN111680106B (zh) * 2020-06-17 2024-04-09 深圳前海微众银行股份有限公司 一种多应用系统数据同步的方法及装置
CN112035463B (zh) * 2020-07-22 2023-07-21 武汉达梦数据库股份有限公司 基于日志解析的异构数据库的双向同步方法和同步装置
CN111881211B (zh) * 2020-07-24 2022-06-10 北京浪潮数据技术有限公司 一种存储数据同步方法、系统、设备及计算机存储介质
CN112187916B (zh) * 2020-09-27 2023-12-05 中国银联股份有限公司 一种跨系统的数据同步方法与装置
CN112527903A (zh) * 2020-12-11 2021-03-19 北京首汽智行科技有限公司 一种基于canal平台的数据同步方法
CN114647659A (zh) * 2020-12-17 2022-06-21 金篆信科有限责任公司 数据处理方法、装置、电子设备、存储介质
CN113010495B (zh) * 2021-03-19 2023-01-06 北京三快在线科技有限公司 一种数据库优化方法及装置
CN112860804B (zh) * 2021-03-31 2024-03-08 中国工商银行股份有限公司 一种熔断限额数据同步方法和装置
CN113282605A (zh) * 2021-04-14 2021-08-20 上海瀚之友信息技术服务有限公司 一种异构数据库的实时同步系统及方法
CN113127427B (zh) * 2021-04-21 2022-08-02 山东英信计算机技术有限公司 一种解析数据库日志中事务分布的方法、系统及装置
CN113220711A (zh) * 2021-05-19 2021-08-06 李坚白 一种同步异构机器人控制器数据库的方法及系统
CN113792094A (zh) * 2021-08-26 2021-12-14 广东电网有限责任公司 一种数据同步系统、方法、设备及介质
CN115114370B (zh) * 2022-01-20 2023-06-13 腾讯科技(深圳)有限公司 主从数据库的同步方法、装置、电子设备和存储介质
CN115114377B (zh) * 2022-08-26 2022-12-13 湖南融链科技有限公司 一种大规模分布式可信数据同步方法与系统
CN115374218B (zh) * 2022-08-26 2024-01-26 苏州浪潮智能科技有限公司 一种异构数据库的数据同步方法、装置、设备及介质
CN115329006B (zh) * 2022-08-31 2023-08-04 保利和悦生活科技服务有限公司 一种网络商城后台与第三方接口的数据同步方法及系统
CN116112130A (zh) * 2023-02-06 2023-05-12 北京滴普科技有限公司 数据纠偏补数方法、装置、设备及系统
CN116028579A (zh) * 2023-02-27 2023-04-28 南昌国讯信息技术股份有限公司 数据库同步方法及电子设备和存储介质
CN116385001B (zh) * 2023-06-07 2023-08-22 建信金融科技有限责任公司 交易日志回放方法、装置、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6980988B1 (en) * 2001-10-01 2005-12-27 Oracle International Corporation Method of applying changes to a standby database system
CN105955970A (zh) * 2015-11-12 2016-09-21 中国银联股份有限公司 一种基于日志解析的数据库复制方法及装置
CN106227822A (zh) * 2016-07-22 2016-12-14 深圳市中润四方信息技术有限公司 一种数据分发方法及数据同步系统
US9563522B2 (en) * 2015-03-31 2017-02-07 Oracle International Corporation Data recovery for a relational database management system instance in a heterogeneous database system
CN103984715B (zh) * 2014-05-08 2017-04-12 武汉库百网络技术有限公司 一种异构数据库的数据同步、校验方法、装置及系统
CN103761318B (zh) * 2014-01-27 2017-08-18 中国工商银行股份有限公司 一种关系型异构数据库数据同步的方法及系统
CN103795754B (zh) * 2012-10-31 2017-08-25 中国电信股份有限公司 多系统间的数据同步方法和系统
CN107122355A (zh) * 2016-02-24 2017-09-01 阿里巴巴集团控股有限公司 数据迁移系统和方法
KR101825910B1 (ko) * 2016-08-31 2018-03-22 국방과학연구소 리두 로그 분석 기반의 중립 데이터를 이용한 이기종 데이터베이스의 데이터 동기화 시스템 및 방법
CN108241676A (zh) * 2016-12-26 2018-07-03 阿里巴巴集团控股有限公司 实现数据同步的方法及设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6980988B1 (en) * 2001-10-01 2005-12-27 Oracle International Corporation Method of applying changes to a standby database system
CN103795754B (zh) * 2012-10-31 2017-08-25 中国电信股份有限公司 多系统间的数据同步方法和系统
CN103761318B (zh) * 2014-01-27 2017-08-18 中国工商银行股份有限公司 一种关系型异构数据库数据同步的方法及系统
CN103984715B (zh) * 2014-05-08 2017-04-12 武汉库百网络技术有限公司 一种异构数据库的数据同步、校验方法、装置及系统
US9563522B2 (en) * 2015-03-31 2017-02-07 Oracle International Corporation Data recovery for a relational database management system instance in a heterogeneous database system
CN105955970A (zh) * 2015-11-12 2016-09-21 中国银联股份有限公司 一种基于日志解析的数据库复制方法及装置
CN107122355A (zh) * 2016-02-24 2017-09-01 阿里巴巴集团控股有限公司 数据迁移系统和方法
CN106227822A (zh) * 2016-07-22 2016-12-14 深圳市中润四方信息技术有限公司 一种数据分发方法及数据同步系统
KR101825910B1 (ko) * 2016-08-31 2018-03-22 국방과학연구소 리두 로그 분석 기반의 중립 데이터를 이용한 이기종 데이터베이스의 데이터 동기화 시스템 및 방법
CN108241676A (zh) * 2016-12-26 2018-07-03 阿里巴巴集团控股有限公司 实现数据同步的方法及设备

Also Published As

Publication number Publication date
CN109101627A (zh) 2018-12-28

Similar Documents

Publication Publication Date Title
CN109101627B (zh) 异构数据库同步方法及装置
EP3754514B1 (en) Distributed database cluster system, data synchronization method and storage medium
US11068501B2 (en) Single phase transaction commits for distributed database transactions
US10621049B1 (en) Consistent backups based on local node clock
US7783601B2 (en) Replicating and sharing data between heterogeneous data systems
US9779128B2 (en) System and method for massively parallel processing database
Moss Nested transactions: An approach to reliable distributed computing
US11042503B1 (en) Continuous data protection and restoration
US11860741B2 (en) Continuous data protection
US20190012343A1 (en) Transaction execution commitment without updating of data row transaction status
CN113438275B (zh) 数据迁移方法、装置、存储介质及数据迁移设备
US12111817B2 (en) Log execution method and apparatus, computer device and storage medium
CN115994053A (zh) 数据库备机的并行回放方法、装置、电子设备及介质
US9612921B2 (en) Method and system for load balancing a distributed database providing object-level management and recovery
Matri et al. Týr: blob storage meets built-in transactions
WO2024081139A1 (en) Consensus protocol for asynchronous database transaction replication with fast, automatic failover, zero data loss, strong consistency, full sql support and horizontal scalability
CN112800060A (zh) 数据处理方法、装置、计算机可读存储介质及电子设备
WO2023111765A1 (en) System and method for handling data consolidation from an edge device to a target database
Kampen Zero Downtime Schema Migrations in Highly Available Databases
Trofimov et al. Delivery, consistency, and determinism: rethinking guarantees in distributed stream processing
US20240126781A1 (en) Consensus protocol for asynchronous database transaction replication with fast, automatic failover, zero data loss, strong consistency, full sql support and horizontal scalability
US20230055003A1 (en) Method for Organizing Data by Events, Software and System for Same
CN112965945B (zh) 数据存储方法、装置、电子设备及计算机可读介质
US11599293B2 (en) Consistent data stream replication and reconstruction in a streaming data storage platform
KR101929948B1 (ko) 데이터 타입 기반의 멀티 디바이스 데이터 동기화를 위한 방법 및 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant