CN111930693A - 一种基于日志解析同步的事务合并执行方法及装置 - Google Patents

一种基于日志解析同步的事务合并执行方法及装置 Download PDF

Info

Publication number
CN111930693A
CN111930693A CN202010470229.7A CN202010470229A CN111930693A CN 111930693 A CN111930693 A CN 111930693A CN 202010470229 A CN202010470229 A CN 202010470229A CN 111930693 A CN111930693 A CN 111930693A
Authority
CN
China
Prior art keywords
transaction
linked list
merged
lsn
merging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010470229.7A
Other languages
English (en)
Other versions
CN111930693B (zh
Inventor
孙峰
付铨
黄海明
余院兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Dameng Database Co Ltd
Original Assignee
Wuhan Dameng Database Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Dameng Database Co Ltd filed Critical Wuhan Dameng Database Co Ltd
Priority to CN202010470229.7A priority Critical patent/CN111930693B/zh
Publication of CN111930693A publication Critical patent/CN111930693A/zh
Application granted granted Critical
Publication of CN111930693B publication Critical patent/CN111930693B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1734Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/466Transaction processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及计算机技术领域,尤其涉及一种基于日志解析同步的事务合并执行方法及装置,其中方法包括:按顺序依次从待合并事务链表取出事务合并,当取出第i个事务时,利用已合并事务链表中的i‑1个提交LSN作为分割界限,在操作容器中划出i‑1个操作区间;从第i个事务中取出操作,通过当前操作的LSN在操作容器中定位到相应区间,并在相应区间内找到相同操作类型的位置,将当前操作插入;完成事务合并后,从操作容器中按顺序提取操作执行,相同的操作合并后批量执行。本发明在合并时以先提交事务的提交LSN作为分割界限,将后提交事务的部分操作上移来找到相同的操作,在执行的时候可以批量执行,提高了事务之间操作的合并率,可有效提升同步性能。

Description

一种基于日志解析同步的事务合并执行方法及装置
【技术领域】
本发明涉及计算机技术领域,尤其涉及一种基于日志解析同步的事务合并执行方法及装置。
【背景技术】
传统的基于数据库自身的主备机制实现数据库数据的实时复制,是进行数据容灾备份、保障数据安全的重要解决方案。目前如ORACLE公司的DataGuard、达梦数据库的DM7主备产品等都是实现这种解决方案的成熟商业化产品。数据库主备机制下,一般备机作为备份节点,只提供只读访问,可以在备机上做一些报表分析、数据挖掘等只读访问的应用,而不能像主机一样提供读写访问。另外,数据库主备机制要求备机数据库系统和主机一致,对于异构数据库系统环境,则不能利用数据库自身的主备机制实现有效的数据实时复制。
针对数据库主备机制实现数据复制的不足,目前基于软件的异构数据库复制技术应用广泛。这种技术在源端捕获出数据库的增量数据,然后发送到目标端,在目标端通过通用的数据库访问接口将增量数据应用到目标数据库,实现数据复制。这种技术因为使用到通用数据库接口,因此支持异构数据库系统复制,支持异构操作系统环境,并且目标端备机数据库系统可读写,是一种“双活”系统。
目前,有多种技术方式实现获取源端数据库的增量数据,其中,基于数据库日志捕获分析的数据实时同步技术,因其对源数据库侵入性小、捕获分析性能高,得到较大发展及研究。这种技术通过分析源数据库归档或联机日志,捕获出数据库的INSERT、UPDATE、DELETE操作日志,然后发送到目标端;目标端对日志信息进行逆向生成,恢复成SQL语句方式,然后使用数据库通用接口应用到目标数据库,实现数据复制。因此,在数据库实时复制过程中,目标端的执行效率是影响数据同步性能的重要因素。
通常,源端数据库上并发执行的各个事务中可能存在大量小事务,数据库系统都会根据并发控制机制去执行,把相冲突的事务操作互斥执行,并且在日志文件中顺序的记录下各个事务的操作日志;数据同步时应该针对小事务采用事务合并执行的策略,把源端多次执行的操作合并以后批量执行,以便提升同步性能。然而,现有的数据同步系统往往是以事务为单位进行同步的,在确定事务提交以后才会被分配到执行线程执行;在这种机制下,事务合并的方法往往采取事务追加的方式进行合并,这种合并策略虽然可以解决部分的应用场景下同步效率的问题,但是在某些特殊的应用场景下事务合并以后事务之间操作合并率并不高,目标端的执行效率仍较低,无法有效提升同步性能。因此,在如何保证数据复制一致性的前提下来合并事务和事务之间的操作,提高目标端数据复制的执行效率,就成为业界亟待解决的重要技术问题。
鉴于此,克服上述现有技术所存在的缺陷是本技术领域亟待解决的问题。
【发明内容】
本发明需要解决的技术问题是:
现有的数据同步系统往往是以事务为单位进行同步,采取简单的叠加进行事务合并,但事务合并以后事务之间的操作合并率并不高,目标端的执行效率仍较低,无法有效提升同步性能;因此,如何在保证数据复制一致性的前提下提高事务合并以后事务之间操作的合并率,提高目标端数据复制的执行效率,成为业界亟待解决的重要技术问题。
本发明通过如下技术方案解决上述技术问题:
第一方面,本发明提供了一种基于日志解析同步的事务合并执行方法,包括:
按照表ID将存在多个表操作的事务打散,并选择相同表ID的多个事务添加到待合并事务链表;
按顺序依次从待合并事务链表取出各事务进行合并,且每合并一个事务,将该事务的提交LSN添加到已合并事务链表,将合并后生成的操作存放至操作容器;其中,当从待合并事务链表中取出第i个事务时,利用已合并事务链表中的i-1个提交LSN作为分割界限,在操作容器中划出i-1个操作区间;按顺序依次从所述第i个事务中取出操作,通过当前操作的LSN在操作容器中定位到相应的操作区间,并在相应的操作区间内找到与当前操作相同操作类型的操作位置,将当前操作插入至该位置;
完成各事务的合并后,从操作容器中按顺序提取操作执行;其中,夹在两个操作中间的提交操作忽略执行,相同的操作合并后批量执行;
其中,各操作按LSN的大小顺序发送至目的端,所述待合并事务链表与所述已合并事务链表中的对象按事务的提交LSN的大小顺序存放。
优选的,在所述按照表ID将存在多个表操作的事务打散之前,所述方法还包括:
源端数据库同步系统从源端数据库读取日志后,按捕获日志的顺序进行日志解析,并将解析以后的操作按顺序发送到目的端数据库同步系统;
目的端数据库同步系统接收到源端的操作后,按操作的事务ID和表ID进行分类管理,在接收到事务提交操作后将相同事务ID的事务添加到待执行事务链表;
其中,所述待执行事务链表中的事务按事务提交LSN的大小顺序存放。
优选的,所述选择相同表ID的多个事务添加到待合并事务链表,具体为:
执行线程从所述待执行链表中取出一个事务添加到所述待合并链表,根据该事务的表ID从所述待执行链表中选择相同表ID的事务,并将选出的有相同表ID的事务也添加到所述待合并链表中。
优选的,对于待合并事务链表中的任一事务A,合并过程具体包括:
从所述待合并事务链表中取出事务A,从所述已合并事务链表中取一个提交LSN,并将该提交LSN作为当前的分割LSN;
从事务A中取出一个操作,判断当前操作的操作类型是否是提交操作;如果是提交操作,则将该提交操作追加到操作容器,将对应的提交LSN添加到所述已合并事务链表,并按顺序继续从所述待合并事务链表中取出下一个事务;如果不是提交操作,则判断当前操作的LSN是否小于分割LSN。
优选的,合并过程中采用操作链表来存放需要批量合并的操作,如果当前操作的LSN小于分割LSN,则判断当前操作的操作类型是否与操作链表中操作的操作类型一致;如果一致,则将当前操作添加到所述操作链表中,并按顺序继续从事务A中提取下一个操作。
优选的,如果当前操作的操作类型与操作链表中操作的操作类型不一致,则使用分割LSN在所述操作容器中定位,并从定位处向前搜索是否存在和操作链表中的操作相同操作类型的操作,一直搜索到上一次合并操作的位置或上个事务的提交操作为止;
如果搜索到与操作链表中的操作相同操作类型的操作,则将操作链表中的操作合并至搜索到的位置;如果搜索不到,则将操作链表中的操作合并至搜索停止的位置;
合并完成后清空操作链表,将当前操作添加到操作链表中,并按顺序继续从事务A中提取下一个操作。
优选的,合并过程中采用操作链表来存放需要批量合并的操作,如果当前操作的LSN大于分割LSN,则判断当前所述操作链表中是否存在操作;
如果存在,则使用分割LSN在所述操作容器中定位,并从定位处向前搜索是否存在和操作链表中的操作相同操作类型的操作,一直搜索到上一次合并操作的位置或上个事务的提交操作为止。
优选的,如果搜索到与操作链表中的操作相同操作类型的操作,则将操作链表中的操作合并至搜索到的位置;如果搜索不到,则将操作链表中的操作合并至搜索停止的位置;
合并完成后清空操作链表,按顺序继续从所述已合并事务链表中取下一个提交LSN,并将该提交LSN作为新的分割LSN,继续判断当前操作的LSN是否小于新的分割LSN;
其中,在取提交LSN时如果已经到达所述已合并事务链表的末尾,则将事务A中剩余的操作追加到操作容器中,并按顺序继续从所述待合并事务链表中取出下一个事务。
优选的,在从所述已合并事务链表中取提交LSN时,如果所述已合并事务链表为空,或者事务A已经遍历完所述已合并事务链表中的提交LSN,则将事务A中剩余的操作按顺序追加到所述操作容器中;追加完成后,按顺序继续从所述待合并事务链表中取出下一个事务。
第二方面,本发明提供了一种基于日志解析同步的事务合并执行装置,包括至少一个处理器和存储器,所述至少一个处理器和存储器之间通过数据总线连接,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令在被所述处理器执行后,用于完成第一方面所述的基于日志解析同步的事务合并执行方法。
与现有技术相比,本发明的有益效果是:
本发明提供的一种基于日志解析同步的事务合并执行方法中,按照表ID来打散存在多个表操作的事务,然后按表ID来选择相同表ID的事务进行合并,合并时以先提交事务的提交LSN作为分割界限,将后提交事务在源端数据库中并行执行的部分操作上移来找到相同的操作,使得后提交事务与先提交事务中相同的操作合并到一起,以便在执行的时候可以批量执行,提高了事务合并以后事务之间操作的合并率,可有效提高目标端数据复制的执行效率,提升同步性能。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于日志解析同步的事务合并执行方法的流程图;
图2为本发明实施例提供的一种事务合并方法的具体流程图;
图3为本发明实施例提供的一种基于日志解析同步的事务合并执行装置的架构图。
【具体实施方式】
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。下面就参考附图和实施例结合来详细说明本发明。
实施例1:
数据同步在目标端数据库同步事务时,应该本着尽量减少和数据库交互的次数来执行操作,因为每次和数据库交互都会带来额外的开销,批量一千行执行一次插入的操作所花费时间远比执行一千次每次只插入一行花费的时间少,因此操作合并是数据同步中一项非常重要的技术。而基于日志解析同步又是以事务为单位,所以把多个小事务合并成一个大事务,然后针对该大事务中的操作合并后执行可以有效地提升同步性能。
数据库日志在把数据库中的操作写入日志时采用的是串行方式,也就是说,数据库内部并行执行的事务操作产生的日志会交替地写入到日志文件中。鉴于上述原因,假如只有一个活动事务对某个表做DML操作,那么数据库日志中将会连续地记录这个表的DML操作日志;假如有两个活动事务分别针对同一个表做DML操作,那么数据库日志中将会交替地记录这个表上两个事务的DML日志。数据同步在目标端数据库同步这两个事务时,采取事务合并的方式同步这两个事务,如果采用简单的叠加方式,在两个事务操作都是同一个操作的情况下,针对这种最理想的状态两个事务的操作可以合并成一次批量执行;但是如果这两个事务的操作是各种DML操作交替执行,那么就算事务合并了,这种采用简单叠加方式合并后事务操作之间的合并率也会比较低。
在有些应用场景中,目的端数据库仅仅作为源端数据库的一个冗余备份,应用不会直接访问目的端数据库上的数据,这种情况下,应用并不关心目的库上数据之间的逻辑性;也就是说,同步服务在同步事务时,不必再考虑事务内或是事务之间的数据关联性,只要保证在同步完成后源数据库和目的数据库上的数据在总体上是一致的。这种场景下单个事务内或是多个事务之间的操作执行的先后顺序无关紧要,那么目的端在提升入库性能的策略上就可以有更加灵活的方法。数据同步服务在同步数据时,在按事务分类的基础上可以进一步的细化操作的分类,把单个事务中对多个表的操作按表ID打散成多个更小的事务,然后再把这些小事务再按表ID合并成更大的事务来合并操作,这样就可以更加有效的提升操作的合并率,而且每个表合并成的事务在并行执行的环境中可以抛开事务提交的先后顺序来执行。
根据上述思路,本发明实施例提供了一种基于日志解析同步的事务合并执行方法,如图1所示,主要包括以下步骤:
步骤201,按照表ID将存在多个表操作的事务打散,并选择相同表ID的多个事务添加到待合并事务链表。
其中,源端的每个事务均包含一个或多个表操作,每个操作对应拥有一个日志序列号(LogSequenceNumber,简写为LSN),以表示该操作的执行顺序,源端解析出的各操作会按顺序(即按LSN从小到大的顺序)发送至目的端。对于源端的每个事务,如果仅包含一个表操作,则无需处理;如果包含多个表操作,则需要将对应的事务按照表ID打散成多个小事务。打散之后,以某一事务涉及的表ID为基准选择拥有相同表ID的多个事务,所述多个事务后续将合并成一个大事务来提交。
为了方便操作,可预先初始化一个待合并事务链表,选择完成后将选择出的需要合并的事务添加到所述待合并事务链表。其中,所述待合并事务链表中的事务按事务的提交LSN(即事务中包含的提交操作的LSN)的大小顺序存放,也就是按事务的提交先后顺序存放。
步骤202,按顺序依次从待合并事务链表取出各事务进行合并,且每合并一个事务,将该事务的提交LSN添加到已合并事务链表,将合并后生成的操作存放至操作容器。
在进行事务合并中,可按照各事务的提交LSN由小到大的顺序,依次从所述待合并事务链表取出每个待合并的事务进行合并。为了方便操作,可预先初始化一个已合并事务链表和一个操作容器,每完成一个事务的合并后,将该事务的提交LSN添加到已合并事务链表备用,将合并后生成的操作存放至操作容器。如此一来,当按顺序从所述待合并事务链表中取至第i个事务时,也就已经完成待合并事务链表中前i-1个事务的合并,此时操作容器中已经存放有前i-1个事务合并后生成的事务操作,已合并事务链表中已经存放有前i-1个事务的提交LSN。
进一步地,当从待合并事务链表中取出第i个事务时,利用已合并事务链表中的i-1个提交LSN作为分割界限,在操作容器中划出i-1个操作区间;然后按顺序依次从所述第i个事务中取出每个操作,对于每个操作,通过当前操作的LSN在操作容器中定位到相应的操作区间,并在相应的操作区间内找到与当前操作相同操作类型的操作位置,将当前操作插入至该位置,从而将相同的操作归到一起,方便后续合并与批量执行。具体的合并过程将在实施例2中展开详细介绍,在此不做赘述。
步骤203,完成各事务的合并后,从操作容器中按顺序提取操作执行;其中,夹在两个操作中间的提交操作忽略执行,相同的操作合并后批量执行。
当执行线程遍历完所述待合并事务链表,即所述待合并事务链表中的所有事务都取出并完成事务合并之后,所述待合并事务链表中的多个事务被合并成一个大事务,此时所有待合并事务涉及的操作都已经按设定规则插入至所述操作容器中,且相同操作已归在一起,便可从操作容器中按顺序提取操作执行。需要说明的是,相同的操作需合并后批量执行,夹在两个操作中间的提交操作需忽略执行,即只执行操作容器尾部的提交操作(即提交LSN最大的提交操作);直到操作容器中的所有操作都执行后,提交合并后的该大事务,完成入库。
本发明实施例提供的上述事务合并执行方法中,按照表ID来打散存在多个表操作的事务,然后按表ID来选择相同表ID的事务进行合并,合并时以先提交事务的提交LSN作为分割界限,将后提交事务在源端数据库中并行执行的部分操作上移来找到相同操作类型的操作,尽量将相同的操作归到一起,以便在执行的时候可以批量执行,提高了事务合并以后事务之间操作的合并率,可有效提高目标端数据复制的执行效率,提升同步性能。这主要是基于源端数据库生成的操作在两个提交日志之间是无数据冲突的原则来调整操作的顺序,以提交日志为界,把范围内的操作按表和操作的类型归类,这样就可以有效的提升事务合并以后操作的合并率,实现批量执行以提升入库性能。
实施例2:
上述实施例1中介绍了一种基于日志解析同步的事务合并执行方法的主要步骤,在此基础上,本发明实施例进一步对实施例1中事务合并执行方法的完整步骤展开详细介绍。
结合图2,本发明实施例提供的一种基于日志解析同步的事务合并执行方法,具体包括以下步骤:
步骤101,在源端数据库及目的端数据库部署同步系统。其中,源端数据库同步系统用于从源端数据库读取日志,而目的端数据库同步系统则负责把源端发过来的同步操作应用到目的端数据库。
为了方便后续操作,在所述目的端数据库同步系统启动后,可在目的端初始化一条待执行事务链表、一条待合并事务链表和一条已合并事务链表。其中,待执行事务链表用来存放待执行入库的事务,待合并事务链表用来存放需要合并操作的事务(即待合并的事务),已合并事务链表用来存放已经合并事务的提交LSN,并且三个链表中的事务顺序都按事务的提交LSN的大小顺序存放,也就是按照事务的提交先后顺序存放。
步骤102,源端数据库同步系统从源端数据库读取日志后,按捕获日志的顺序进行日志解析,并将解析以后的操作按顺序发送到目的端数据库同步系统。
步骤103,目的端数据库同步系统接收到源端的操作后,按操作的事务ID和表ID进行分类管理,在接收到事务提交操作后将相同事务ID的事务添加到待执行事务链表。
具体来讲,目的端数据库同步系统在接收到源端的操作后,会先判断该操作是否是提交操作;如果是提交操作,则提取该操作的事务ID,在分类管理的事务中找出所有事务ID一致的事务,并把这些事务添加到待执行链表中等待执行;如果不是提交操作,则提取该操作的事务ID和涉及的表ID,然后按事务ID和表ID的组合键来进行分类管理。
其中,由于采取了事务ID和表ID的组合键来管理事务,源端数据库中涉及多个表操作的事务在这里就会被打散成多个小事务;当接收到该事务的提交操作时,就需要找出该事务中所有被打散的小事务,把这些小事务都添加到待执行链表中去等待执行。
步骤104,负责事务入库的执行线程先从待执行链表中取出一个事务添加到待合并链表,然后根据该事务的表ID从待执行链表中选择相同表ID的事务,并将选出的有相同表ID的事务也添加到待合并链表中。
该步骤对应于实施例1中的步骤201,目的是选出合并的事务。其中,选中的事务要从待执行链表中移出,这样下次再选择合并的事务时,上次未能合并的事务就可以继续这个动作。在选择合并的事务个数时,可根据预先设定的合并事务的规模值来决定。假如设定合并以后的操作个数为N,那么在选择事务时就可以统计合并事务的操作数;当操作数达到或超过N时,停止选择。在这里,N如果设置得过小会影响操作合并的效果,而如果设置得过大则会影响执行线程之间的并行度,因此需要根据同步环境来决定N值,在此不做具体限定。
步骤105,初始化一个操作容器。执行线程在选择出合并的事务以后,需要继续进行事务之间操作上的合并,为方便操作,此处初始化一个操作容器,准备用来存放合并生成的事务操作。
步骤106,从所述待合并事务链表中取出一个事务A,准备将该事务中的操作合并入所述操作容器中。
其中,这里的事务A可以是指待合并事务链表中的任一事务,且在提取时优先按照各事务的提交LSN从小到大的顺序依次提取。由于每个事务都可能涉及多个操作,为了后续批量合并操作方便,此处可初始化一个操作链表用来存放需要批量合并的操作。如果所有事务都已经合并完成,即所述待合并事务链表中的事务已经全部取完,则直接跳到最后一个步骤113,从操作容器中按顺序提取操作执行。
步骤107,从所述已合并事务链表中取一个提交LSN,并将该提交LSN作为当前的分割LSN。
对于任一事务A,在进行合并时都需要遍历取出所述已合并事务链表中的每个提交LSN,即依次将每个提交LSN作为分割LSN,且取提交LSN时优先按照提交LSN从小到大的顺序依次提取。其中,提取时如果所述已合并事务链表为空,或者事务A已经遍历完所述已合并事务链表中的提交LSN,则将事务A中剩余的操作按顺序追加到所述操作容器中,追加完成后,按顺序继续从所述待合并事务链表中取出下一个事务,即跳到步骤106继续执行;否则将继续向下执行步骤108,进行操作合并。
其中,在合并第一个事务的操作到操作容器中时(即事务A为待合并事务链表中的第一个事务),已合并事务链表为空链表,所以直接采用操作追加的形式按顺序把操作塞入操作容器中,然后把第一个事务的提交LSN添加到已合并事务链表中;在事务A遍历完已合并事务链表时,代表事务A后续的操作LSN比已合并事务链表中最后一个提交LSN都要大,那么这些操作将不能再跟前面的事务的操作合并,所以直接采用操作追加的形式按顺序把这些操作塞入操作容器中。
步骤108,从事务A中取出一个操作,判断当前操作的操作类型是否是提交操作;如果是提交操作,则将该提交操作追加到操作容器,将对应的提交LSN添加到所述已合并事务链表,并按顺序继续从所述待合并事务链表中取出下一个事务,即跳到步骤106;如果不是提交操作,则继续向下执行步骤109。
步骤109,如果不是提交操作,则判断当前操作的LSN是否小于分割LSN。如果当前操作的LSN小于分割LSN,则继续向下执行步骤110;如果当前操作的LSN大于分割LSN,则跳到步骤112继续执行。
步骤110,如果当前操作的LSN小于分割LSN,则判断当前操作的操作类型是否与操作链表中操作的操作类型一致;如果一致,则将当前操作添加到所述操作链表中,并按顺序继续从事务A中提取下一个操作,即跳到步骤108继续执行;如果不一致,则继续向下执行步骤111。
其中,源端数据库在事务并行执行时,某些事务中批量执行的操作在日志流中可能会被其它事务的操作分隔开,而使用操作链表来缓存同一个事务中连续相同的操作,可以把那些在日志流中不连续但是在本事务中却连续的批量操作进行合并。
步骤111,如果当前操作的操作类型与操作链表中操作的操作类型不一致,则使用分割LSN在所述操作容器中定位,并从定位处向前搜索是否存在和操作链表中的操作(即当前待合并操作)相同操作类型的操作,一直搜索到上一次合并操作的位置或上个事务的提交操作为止。
如果搜索到与操作链表中的操作相同操作类型的操作,则将操作链表中的操作合并至搜索到的位置;如果搜索不到,则将操作链表中的操作合并至搜索停止的位置;此处还需记录下合并的位置,下次再合并向前搜索时应该止于此位置。合并完成后清空操作链表,将当前操作添加到操作链表中,并按顺序继续从事务A中提取下一个操作,即跳到步骤108继续执行。
需要说明的是,事务A的第一个操作在操作容器中搜索指定的位置时,从定位开始向前,一直到上一个事务的提交操作为止,这段区间内的操作和事务A的第一个操作在逻辑上是没有冲突的,可以合并到这段区间的任意位置;一旦操作合并以后,后续的操作再次合并时向前搜索的位置就不能越过上次合并的位置,不然就破坏了当前操作在事务A中的操作顺序。
步骤112,如果当前操作的LSN大于分割LSN,则判断当前所述操作链表中是否存在操作;如果存在,则使用分割LSN在所述操作容器中定位,并从定位处向前搜索是否存在和操作链表中的操作相同操作类型的操作,一直搜索到上一次合并操作的位置或上个事务的提交操作为止。
如果搜索到与操作链表中的操作相同操作类型的操作,则将操作链表中的操作合并至搜索到的位置;如果搜索不到,则将操作链表中的操作合并至搜索停止的位置;此处还需记录下合并的位置,下次再合并向前搜索时应该止于此位置;合并完成后清空操作链表,按顺序继续从所述已合并事务链表中取下一个提交LSN,并将该提交LSN作为新的分割LSN,继续判断当前操作的LSN是否小于新的分割LSN。其中,在取提交LSN时如果已经到达所述已合并事务链表的末尾,则将事务A中剩余的操作追加到操作容器中,并按顺序继续从所述待合并事务链表中取出下一个事务,即跳到步骤106继续执行。
步骤113,执行线程完成事务合并后,从操作容器中按顺序提取操作执行;该步骤对应于实施例1中的步骤203。
执行到步骤112时,所述待合并事务链表中的所有事务已经完成合并(即所述待合并事务链表中的所有事务合并成一个大事务),各事务涉及的操作也都已经存放至操作容器,且相同的操作被归到一起。那么,在从操作容器中按顺序提取操作执行时,可采用操作链表把操作相同的操作缓存到链表以后批量执行,并忽略夹在两个操作中间的提交操作;直到操作容器中的所有操作都被取出并执行以后,提交合并后的大事务,完成入库。
本发明实施例提供的上述事务合并执行方法,其原理主要是通过利用每个待合并事务的提交LSN做为分割界限,在操作容器中划出一连串的操作区间;在合并操作时,通过操作的LSN定位到相应的操作区间,然后把该操作在它所属的区间内找到相同表相同操作类型的操作位置,把相同的操作合并到一起。这样在事务合并完成以后执行时,比采用事务叠加合并的方式合并率更高,执行次数就更少,从而提升同步性能。
由于合并操作时,当前操作在合并时,通过分割LSN定位后操作向上移动的区间受到上一次合并位置的限制,如果源端的事务未按表ID打散就合并,当前操作上移的区间就会受到本事务中其它表操作合并位置的影响;而使用表ID来打散源端的事务以后,合并的事务都是针对同一张表的操作,操作在合并时相同类型的操作会排得更加紧密。
下面对上述事务合并执行方法的基本步骤作如下解释:
首先,数据库的日志流中记录的操作先后顺序可以直接反映出各个事务的操作在数据库内部执行的先后顺序,而以日志流中的提交操作作为分界线则反映出各个事务操作在数据库内部执行的并行度,两个事务的操作在日志流中以第一个提交操作为界,前面重合的那部分操作可以表示在源数据库中是并行执行的,而后面单个事务的操作在源数据库运行时可能会访问到前面一个事务的数据。那么这两个事务在合并时,如果采用简单叠加的方式,那只有当先提交事务的最后一个操作和后提交事务的第一个操作都相同的情况下才能合并执行。而本发明采用以先提交事务在日志流中的提交操作为界限,后提交的事务在该界限之前的操作在先提交的事务操作中间寻找合适的位置,把后提交事务界限之前的操作按一定规则插入进去,使得这些操作和先提交的事务操作合并执行,来提升事务合并以后操作的合并率。
其次,在不用考虑保证事务原子性的前提下,采用表ID来打散存在多个表操作的事务,然后再以表ID来先择相同表ID的事务进行合并,多个事务之间操作合并时就可以有效防止其它表的操作带来的合并位置影响,可以进一步的提升操作合并率。
实施例3:
在上述实施例1和实施例2的基础上,本发明实施例提供了一种基于日志解析同步的事务合并执行方法的具体实例,以便更好地理解整个事务合并执行过程。
在该具体的实施例中,假设源端数据库和目的端数据库现都有表T1(ID VARCHAR)和T2(ID VARCHAR)。
源端应用有三个事务,对表T1和T2进行如下操作:
TRX1:INSERT INTO T1(ID)VALUES('TRX1_T1_1');
TRX2:INSERT INTO T1(ID)VALUES('TRX2_T1_10');
TRX1:INSERT INTO T1(ID)VALUES('TRX1_T1_2');
TRX1:UPDATE T1 SET ID='TRX1_T1_2'WHERE ID='TRX1_T1_2';
TRX3:INSERT INTO T2(ID)VALUES('TRX3_T2_300');
TRX3:INSERT INTO T1(ID)VALUES('TRX3_T1_30');
TRX1:COMMIT;
TRX2:INSERT INTO T1(ID)VALUES('TRX2_T1_20');
TRX3:UPDATE T1 SET ID='TRX3_T1_30'WHERE ID='TRX3_T1_30';
TRX2:UPDATE T1 SET ID='TRX2_T1_20'WHERE ID='TRX2_T1_20';
TRX2:COMMIT;
TRX3:UPDATE T1 SET ID='TRX3_T1_10'WHERE ID='TRX3_T1_10';
TRX3:COMMIT;
上述各操作的顺序在日志接收线程接收到之后,会形成如表1所示的情况。
表1:
Figure BDA0002514059800000161
Figure BDA0002514059800000171
结合图2给出的执行步骤,本发明实施例中的事务合并过程具体如下:
步骤301,按照表ID将存在多个表操作的事务打散,并选择相同表ID的多个事务添加到待合并事务链表。按照上述选择规则,生成的待合并链表中的事务详细情况为{TRX1(T1),TRX2(T1),TRX3(T1)},即待合并链表中有TRX1、TRX2、TRX3三个事务针对表T1的操作(或者说小事务)。
步骤302,构造一个操作容器。为了陈述方便,此处以表格做为容器来解释操作合并的过程,所述操作容器如表2所示。
表2:
LSN 操作 备注
步骤303,从待合并链表中取出第一个事务TRX1,其操作信息如表3。
表3:
事务ID 操作 LSN
TRX1 INSERT INTO T1(ID)VALUES('TRX1_T1_1') 1
TRX1 INSERT INTO T1(ID)VALUES('TRX1_T1_2') 3
TRX1 UPDATE T1 SET ID='TRX1_T1_2'WHERE ID='TRX1_T1_2' 4
TRX1 COMMIT; 8
此时,由于已合并事务链表为空,那么第一个事务TRX1的操作顺序追加到操作容器中,形成如表4所示的操作面局。
表4:
LSN 操作 备注
1 INSERT INTO T1(ID)VALUES('TRX1_T1_1') TRX1
3 INSERT INTO T1(ID)VALUES('TRX1_T1_2') TRX1
4 UPDATE T1 SET ID='TRX1_T1_2'WHERE ID='TRX1_T1_2' TRX1
8 COMMIT; TRX1
然后把提交LSN添加到已合并事务链表中,形成{TRX1(LSN=8)}。
步骤304,从待合并链表中取出第二个事务TRX2,其操作信息如表5。
表5:
Figure BDA0002514059800000181
Figure BDA0002514059800000191
步骤305,从已合并事务链表中取出第一个事务TRX1的提交LSN(LSN=8),把它作为第一分割LSN去分割事务TRX2中的操作。
步骤306,从事务TRX2中提取到第一个INSERT操作,它的LSN(LSN=2)比第一分割LSN要小,所以将该操作添加到操作链表。
步骤307,从事务TRX2中提取到第二个INSERT操作,它的LSN(LSN=7)比第一分割LSN要小,所以将该操作添加到操作链表。
步骤308,从事务TRX2中提取到第三个UPDATE操作,它的LSN(LSN=10)比第一分割LSN要大,所以需要对操作链表进行清空;使用第一分割LSN(LSN=8)在操作容器中定位,并从定位处向前搜索到相同操作类型的位置,把操作链表中的操作(即事务TRX2的前两个INSERT操作,LSN=2,LSN=7)插入操作容器,形成如表6所示的操作面布局。
表6:
Figure BDA0002514059800000192
Figure BDA0002514059800000201
通过表6可以发现,前两个INSERT操作被归类到了操作容器中第一分割LSN之前的INSERT操作一起。插入操作容器完成以后,取已合并链表中下一个提交LSN;由于已到达已合并链表末尾,则事务TRX2后续的操作(即后两个操作,LSN=10,LSN=11)直接追加到操作容器中,形成如表7所示的操作面布局。
表7:
LSN 操作 备注
1 INSERT INTO T1(ID)VALUES('TRX1_T1_1') TRX1
3 INSERT INTO T1(ID)VALUES('TRX1_T1_2') TRX1
2 INSERT INTO T1(ID)VALUES('TRX2_T1_10') TRX2
7 INSERT INTO T1(ID)VALUES('TRX2_T1_20') TRX2
4 UPDATE T1 SET ID='TRX1_T1_2'WHERE ID='TRX1_T1_2' TRX1
8 COMMIT; TRX1
10 UPDATE T1 SET ID='TRX2_T1_20'WHERE ID='TRX2_T1_20' TRX2
11 COMMIT; TRX2
然后将事务TRX2的提交LSN添加到已合并事务链表中,形成:{TRX1(LSN=8),TRX2(LSN=11)}。其中,后续使用时,LSN=8仍作为第一分割LSN,而LSN=11将作为第二分割LSN。
步骤309,从待合并链表中取出第三个事务TRX3,其操作信息如表8。
表8:
事务ID 操作 LSN
TRX3 INSERT INTO T1(ID)VALUES('TRX3_T1_30') 6
TRX3 UPDATE T1 SET ID='TRX3_T1_30'WHERE ID='TRX3_T1_30' 9
TRX3 UPDATE T1 SET ID='TRX3_T1_10'WHERE ID='TRX3_T1_10'; 12
TRX3 COMMIT; 13
步骤310,从已合并事务链表中取出第一个事务TRX1的提交LSN(LSN=8),把它作为第一分割LSN去分割事务TRX3中的操作。
步骤311,从事务TRX3中提取到第一个INSERT操作,它的LSN(LSN=6)比第一分割LSN要小,所以将该操作添加到操作链表。
步骤312,从事务TRX3中提取到第二个UPDATE操作,它的LSN(LSN=9)比第一分割LSN要大,所以需要清空操作链表;使用第一分割LSN(LSN=8)在操作容器中定位,并从定位处向前搜索到相同操作类型的位置,把操作链表中的操作(即事务TRX3的第一个INSERT操作,LSN=6)插入操作容器,形成如表9所示的操作面布局。
表9:
Figure BDA0002514059800000211
Figure BDA0002514059800000221
然后把当前操作(即事务TRX3的第二个UPDATE操作,LSN=9)添加到操作链表。
步骤313,从事务TRX3中提取后续操作,此时需将当前操作的LSN与第二分割LSN(LSN=11)比较,具体可参照事务TRX2的合并规则,在此不做赘述。合并以后,形成如表10所示的操作布局。
表10:
Figure BDA0002514059800000222
Figure BDA0002514059800000231
步骤314,在待合并事务链表中的三个事务都合并完成后,执行整个大的事务时,就可以合并相同的操作,形成如表11所示的执行方式。
表11:
Figure BDA0002514059800000232
Figure BDA0002514059800000241
从表11所示的合并以后的操作布局可以看出,事务TRX2和事务TRX3中本来独立的INSERT操作都将被批量执行,可以和采用叠加方式来合并后的操作布局进行对比,就可能看出合并率的明显提升。其中,采用叠加方式合并后的操作布局如表12所示。
表12:
Figure BDA0002514059800000242
通过比较表11和表12中的两个操作布局可以看出,采用本发明实施例的方案合并以后执行次数为2次,而采用叠加合并的方案则需要执行6次,本发明提供的方法明显优于传统方案。
步骤315,第一组事务(即针对表格T1的事务)合并完成以后,还剩下{TRX3(T2)}的事务,继续按照上述原理合并执行,具体过程不再赘述。
需要说明的是,本发明实施例是以涉及三个事务TRX1、TRX2、TRX3和两个表T1、T2为例进行说明,但并不用以限制本发明。当涉及的事务数量和表数量出现变化时,具体的事务合并执行过程仍可参考上述实施例中的步骤,在此不做赘述。
实施例4:
在上述实施例1-实施例3提供的基于日志解析同步的事务合并执行方法的基础上,本发明还提供了一种可用于实现上述方法的基于日志解析同步的事务合并执行装置,如图3所示,是本发明实施例的装置架构示意图。本实施例的基于日志解析同步的事务合并执行装置包括一个或多个处理器21以及存储器22。其中,图3中以一个处理器21为例。
所述处理器21和所述存储器22可以通过总线或者其他方式连接,图3中以通过总线连接为例。
所述存储器22作为一种基于日志解析同步的事务合并执行方法非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如实施例1-实施例3中的基于日志解析同步的事务合并执行方法。所述处理器21通过运行存储在所述存储器22中的非易失性软件程序、指令以及模块,从而执行基于日志解析同步的事务合并执行装置的各种功能应用以及数据处理,即实现实施例1-实施例3的基于日志解析同步的事务合并执行方法。
所述存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,所述存储器22可选包括相对于所述处理器21远程设置的存储器,这些远程存储器可以通过网络连接至所述处理器21。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述程序指令/模块存储在所述存储器22中,当被所述一个或者多个处理器21执行时,执行上述实施例1-实施例3中的基于日志解析同步的事务合并执行方法,例如,执行以上描述的图1和图2所示的各个步骤。
本领域普通技术人员可以理解实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,ReadOnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁盘或光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于日志解析同步的事务合并执行方法,其特征在于,包括:
按照表ID将存在多个表操作的事务打散,并选择相同表ID的多个事务添加到待合并事务链表;
按顺序依次从待合并事务链表取出各事务进行合并,且每合并一个事务,将该事务的提交LSN添加到已合并事务链表,将合并后生成的操作存放至操作容器;其中,当从待合并事务链表中取出第i个事务时,利用已合并事务链表中的i-1个提交LSN作为分割界限,在操作容器中划出i-1个操作区间;按顺序依次从所述第i个事务中取出操作,通过当前操作的LSN在操作容器中定位到相应的操作区间,并在相应的操作区间内找到与当前操作相同操作类型的操作位置,将当前操作插入至该位置;
完成各事务的合并后,从操作容器中按顺序提取操作执行;其中,夹在两个操作中间的提交操作忽略执行,相同的操作合并后批量执行;
其中,各操作按LSN的大小顺序发送至目的端,所述待合并事务链表与所述已合并事务链表中的对象按事务的提交LSN的大小顺序存放。
2.根据权利要求1所述的基于日志解析同步的事务合并执行方法,其特征在于,在所述选择相同表ID的多个事务添加到待合并事务链表之前,所述方法还包括:
源端数据库同步系统从源端数据库读取日志后,按捕获日志的顺序进行日志解析,并将解析以后的操作按顺序发送到目的端数据库同步系统;
目的端数据库同步系统接收到源端的操作后,按操作的事务ID和表ID进行分类管理,在接收到事务提交操作后将相同事务ID的事务添加到待执行事务链表;
其中,所述待执行事务链表中的事务按事务提交LSN的大小顺序存放。
3.根据权利要求2所述的基于日志解析同步的事务合并执行方法,其特征在于,所述选择相同表ID的多个事务添加到待合并事务链表,具体为:
执行线程从所述待执行链表中取出一个事务添加到所述待合并链表,根据该事务的表ID从所述待执行链表中选择相同表ID的事务,并将选出的有相同表ID的事务也添加到所述待合并链表中。
4.根据权利要求1所述的基于日志解析同步的事务合并执行方法,其特征在于,对于待合并事务链表中的任一事务A,合并过程具体包括:
从所述待合并事务链表中取出事务A,从所述已合并事务链表中取一个提交LSN,并将该提交LSN作为当前的分割LSN;
从事务A中取出一个操作,判断当前操作的操作类型是否是提交操作;如果是提交操作,则将该提交操作追加到操作容器,将对应的提交LSN添加到所述已合并事务链表,并按顺序继续从所述待合并事务链表中取出下一个事务;如果不是提交操作,则判断当前操作的LSN是否小于分割LSN。
5.根据权利要求4所述的基于日志解析同步的事务合并执行方法,其特征在于,合并过程中采用操作链表来存放需要批量合并的操作,如果当前操作的LSN小于分割LSN,则判断当前操作的操作类型是否与操作链表中操作的操作类型一致;如果一致,则将当前操作添加到所述操作链表中,并按顺序继续从事务A中提取下一个操作。
6.根据权利要求5所述的基于日志解析同步的事务合并执行方法,其特征在于,如果当前操作的操作类型与操作链表中操作的操作类型不一致,则使用分割LSN在所述操作容器中定位,并从定位处向前搜索是否存在和操作链表中的操作相同操作类型的操作,一直搜索到上一次合并操作的位置或上个事务的提交操作为止;
如果搜索到与操作链表中的操作相同操作类型的操作,则将操作链表中的操作合并至搜索到的位置;如果搜索不到,则将操作链表中的操作合并至搜索停止的位置;
合并完成后清空操作链表,将当前操作添加到操作链表中,并按顺序继续从事务A中提取下一个操作。
7.根据权利要求4所述的基于日志解析同步的事务合并执行方法,其特征在于,合并过程中采用操作链表来存放需要批量合并的操作,如果当前操作的LSN大于分割LSN,则判断当前所述操作链表中是否存在操作;
如果存在,则使用分割LSN在所述操作容器中定位,并从定位处向前搜索是否存在和操作链表中的操作相同操作类型的操作,一直搜索到上一次合并操作的位置或上个事务的提交操作为止。
8.根据权利要求7所述的基于日志解析同步的事务合并执行方法,其特征在于,如果搜索到与操作链表中的操作相同操作类型的操作,则将操作链表中的操作合并至搜索到的位置;如果搜索不到,则将操作链表中的操作合并至搜索停止的位置;
合并完成后清空操作链表,按顺序继续从所述已合并事务链表中取下一个提交LSN,并将该提交LSN作为新的分割LSN,继续判断当前操作的LSN是否小于新的分割LSN;
其中,在取提交LSN时如果已经到达所述已合并事务链表的末尾,则将事务A中剩余的操作追加到操作容器中,并按顺序继续从所述待合并事务链表中取出下一个事务。
9.根据权利要求4-8任一所述的基于日志解析同步的事务合并执行方法,其特征在于,在从所述已合并事务链表中取提交LSN时,如果所述已合并事务链表为空,或者事务A已经遍历完所述已合并事务链表中的提交LSN,则将事务A中剩余的操作按顺序追加到所述操作容器中;追加完成后,按顺序继续从所述待合并事务链表中取出下一个事务。
10.一种基于日志解析同步的事务合并执行装置,其特征在于,包括至少一个处理器和存储器,所述至少一个处理器和存储器之间通过数据总线连接,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令在被所述处理器执行后,用于完成权利要求1-9任一所述的基于日志解析同步的事务合并执行方法。
CN202010470229.7A 2020-05-28 2020-05-28 一种基于日志解析同步的事务合并执行方法及装置 Active CN111930693B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010470229.7A CN111930693B (zh) 2020-05-28 2020-05-28 一种基于日志解析同步的事务合并执行方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010470229.7A CN111930693B (zh) 2020-05-28 2020-05-28 一种基于日志解析同步的事务合并执行方法及装置

Publications (2)

Publication Number Publication Date
CN111930693A true CN111930693A (zh) 2020-11-13
CN111930693B CN111930693B (zh) 2024-02-06

Family

ID=73316482

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010470229.7A Active CN111930693B (zh) 2020-05-28 2020-05-28 一种基于日志解析同步的事务合并执行方法及装置

Country Status (1)

Country Link
CN (1) CN111930693B (zh)

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1387269A1 (en) * 2002-08-02 2004-02-04 Hewlett Packard Company, a Delaware Corporation Backup system and method of generating a checkpoint for a database
US20040030703A1 (en) * 2002-08-12 2004-02-12 International Business Machines Corporation Method, system, and program for merging log entries from multiple recovery log files
CN101551822A (zh) * 2009-05-27 2009-10-07 北京星网锐捷网络技术有限公司 一种数据库复制方法和装置
CN102156720A (zh) * 2011-03-28 2011-08-17 中国人民解放军国防科学技术大学 一种数据恢复的方法、装置和系统
US20150379062A1 (en) * 2014-06-26 2015-12-31 Amazon Technologies, Inc. Multi-database log with multi-item transaction support
US20160171002A1 (en) * 2014-12-12 2016-06-16 International Business Machines Corporation Merging database operations for serializable transaction execution
US9552242B1 (en) * 2013-09-25 2017-01-24 Amazon Technologies, Inc. Log-structured distributed storage using a single log sequence number space
CN106777270A (zh) * 2016-12-28 2017-05-31 中国民航信息网络股份有限公司 一种基于提交点时间线同步的异构数据库复制并行执行系统及方法
CN106844507A (zh) * 2016-12-27 2017-06-13 星环信息科技(上海)有限公司 一种数据批处理的方法及设备
CN107026880A (zh) * 2016-02-01 2017-08-08 北京京东尚科信息技术有限公司 数据同步方法和装置
CN107077492A (zh) * 2014-09-10 2017-08-18 亚马逊科技公司 可扩展的基于日志的事务管理
US20180144015A1 (en) * 2016-11-18 2018-05-24 Microsoft Technology Licensing, Llc Redoing transaction log records in parallel
CN109101627A (zh) * 2018-08-14 2018-12-28 交通银行股份有限公司 异构数据库同步方法及装置
CN109657007A (zh) * 2018-12-17 2019-04-19 武汉达梦数据库有限公司 基于异步提交的数据库数据同步并行执行方法及设备
CN110262929A (zh) * 2018-08-13 2019-09-20 武汉达梦数据库有限公司 一种保证复制事务一致性的方法以及相应的复制装置
CN110597663A (zh) * 2019-09-16 2019-12-20 阿里巴巴集团控股有限公司 一种事务处理方法及装置
CN111143389A (zh) * 2019-12-27 2020-05-12 腾讯科技(深圳)有限公司 事务执行方法、装置、计算机设备及存储介质

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1387269A1 (en) * 2002-08-02 2004-02-04 Hewlett Packard Company, a Delaware Corporation Backup system and method of generating a checkpoint for a database
US20040030703A1 (en) * 2002-08-12 2004-02-12 International Business Machines Corporation Method, system, and program for merging log entries from multiple recovery log files
CN101551822A (zh) * 2009-05-27 2009-10-07 北京星网锐捷网络技术有限公司 一种数据库复制方法和装置
CN102156720A (zh) * 2011-03-28 2011-08-17 中国人民解放军国防科学技术大学 一种数据恢复的方法、装置和系统
US9552242B1 (en) * 2013-09-25 2017-01-24 Amazon Technologies, Inc. Log-structured distributed storage using a single log sequence number space
US20150379062A1 (en) * 2014-06-26 2015-12-31 Amazon Technologies, Inc. Multi-database log with multi-item transaction support
CN107077492A (zh) * 2014-09-10 2017-08-18 亚马逊科技公司 可扩展的基于日志的事务管理
US20160171002A1 (en) * 2014-12-12 2016-06-16 International Business Machines Corporation Merging database operations for serializable transaction execution
CN107026880A (zh) * 2016-02-01 2017-08-08 北京京东尚科信息技术有限公司 数据同步方法和装置
US20180144015A1 (en) * 2016-11-18 2018-05-24 Microsoft Technology Licensing, Llc Redoing transaction log records in parallel
CN106844507A (zh) * 2016-12-27 2017-06-13 星环信息科技(上海)有限公司 一种数据批处理的方法及设备
CN106777270A (zh) * 2016-12-28 2017-05-31 中国民航信息网络股份有限公司 一种基于提交点时间线同步的异构数据库复制并行执行系统及方法
CN110262929A (zh) * 2018-08-13 2019-09-20 武汉达梦数据库有限公司 一种保证复制事务一致性的方法以及相应的复制装置
CN109101627A (zh) * 2018-08-14 2018-12-28 交通银行股份有限公司 异构数据库同步方法及装置
CN109657007A (zh) * 2018-12-17 2019-04-19 武汉达梦数据库有限公司 基于异步提交的数据库数据同步并行执行方法及设备
CN110597663A (zh) * 2019-09-16 2019-12-20 阿里巴巴集团控股有限公司 一种事务处理方法及装置
CN111143389A (zh) * 2019-12-27 2020-05-12 腾讯科技(深圳)有限公司 事务执行方法、装置、计算机设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
张小强 等: "一种基于目录的软件事务性内存实现算法", 《计算机研究与发展》, no. 09, pages 1517 - 1523 *
张金玲: "基于事务合并优化的数据同步算法研究与应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 01, pages 138 - 743 *
胡爽 等: "内存数据库事务提交的关键技术与挑战", 《华东师范大学学报(自然科学版)》, no. 05, pages 18 - 26 *
钟容: "基于事务日志的数据同步模型研究", 《科技创新与应用》, no. 10, pages 17 - 18 *

Also Published As

Publication number Publication date
CN111930693B (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
US11003689B2 (en) Distributed database transaction protocol
EP3401804B1 (en) Adaptive query routing in a replicated database environment
CN112035222B (zh) 一种基于日志解析同步的事务操作合并执行方法及装置
EP3185143B1 (en) Decentralized transaction commit protocol
EP3185142B1 (en) Distributed database transaction protocol
JP5577350B2 (ja) 効率的なデータ同期化のための方法及びシステム
US9881041B2 (en) Multiple RID spaces in a delta-store-based database to support long running transactions
US20180067962A1 (en) Consistent execution of partial queries in hybrid dbms
EP3413215A1 (en) Dynamic snapshot isolation protocol selection
US11416350B2 (en) Recovery of in-memory databases from log records
CN110309233B (zh) 数据存储的方法、装置、服务器和存储介质
WO2022002103A1 (zh) 一种在数据节点上回放日志的方法、数据节点及系统
CN107665219B (zh) 一种日志管理方法及装置
US11714794B2 (en) Method and apparatus for reading data maintained in a tree data structure
CN111930692B (zh) 一种基于日志解析同步的事务合并执行方法及装置
JP2018526746A (ja) データベーストランザクションを最適化するための方法および装置
CN111858503B (zh) 一种基于日志解析同步的并行执行方法和数据同步系统
CN114063922A (zh) 一种主从库流复制加速方法及装置、设备及介质
CN112559626A (zh) 一种基于日志解析的ddl操作的同步方法和同步系统
CN105045563B (zh) 一种推测嵌套软件事务存储的冲突管理方法
CN111858504B (zh) 基于日志解析同步的操作合并执行方法和数据同步系统
US10437812B2 (en) Information processing method, information processing device, and medium
CN111930693A (zh) 一种基于日志解析同步的事务合并执行方法及装置
WO2024119980A1 (zh) 一种数据分析方法及相关设备
CN106294626A (zh) 一种并行重放文件系统重做日志的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 430000 16-19 / F, building C3, future technology building, 999 Gaoxin Avenue, Donghu New Technology Development Zone, Wuhan, Hubei Province

Applicant after: Wuhan dream database Co.,Ltd.

Address before: 430000 16-19 / F, building C3, future technology building, 999 Gaoxin Avenue, Donghu New Technology Development Zone, Wuhan, Hubei Province

Applicant before: WUHAN DAMENG DATABASE Co.,Ltd.

CB02 Change of applicant information
CB03 Change of inventor or designer information

Inventor after: Sun Feng

Inventor after: Huang Haiming

Inventor after: Yu Yuanlan

Inventor before: Sun Feng

Inventor before: Fu Quan

Inventor before: Huang Haiming

Inventor before: Yu Yuanlan

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant