CN112905696A - 基于事务标识的多机房同步方法、计算设备及存储介质 - Google Patents

基于事务标识的多机房同步方法、计算设备及存储介质 Download PDF

Info

Publication number
CN112905696A
CN112905696A CN202110176523.1A CN202110176523A CN112905696A CN 112905696 A CN112905696 A CN 112905696A CN 202110176523 A CN202110176523 A CN 202110176523A CN 112905696 A CN112905696 A CN 112905696A
Authority
CN
China
Prior art keywords
data
write
machine room
log record
synchronization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110176523.1A
Other languages
English (en)
Other versions
CN112905696B (zh
Inventor
冯威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ireader Technology Co Ltd
Original Assignee
Ireader Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ireader Technology Co Ltd filed Critical Ireader Technology Co Ltd
Priority to CN202110176523.1A priority Critical patent/CN112905696B/zh
Publication of CN112905696A publication Critical patent/CN112905696A/zh
Application granted granted Critical
Publication of CN112905696B publication Critical patent/CN112905696B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/275Synchronous replication

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于事务标识的多机房同步方法、计算设备及存储介质。该方法包括:读取第一机房的日志文件中的第一写数据日志记录,判断第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致;若是,则根据第一写数据日志记录在第二机房中执行写同步数据操作,并在第二机房的日志文件中记录写同步数据操作的第二写数据日志记录及其事务标识,其中,第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符;若否,则忽略第一写数据日志记录的同步,打破了循环复制,解决了多机房双向同步中的复制回环的问题,由于判断过程简单,进一步提升了数据同步效率。

Description

基于事务标识的多机房同步方法、计算设备及存储介质
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于事务标识的多机房同步方法、计算设备及存储介质。
背景技术
随着业务量的增长、业务范围的扩大,单机房往往不能提供稳定可靠的服务,此种情况下,部署多机房是较为普遍的选择。与此同时,各个机房中的数据保持一致同步,才能单独对外提供准确一致的服务。
多机房数据同步通常都是基于机房数据库的写数据日志记录实现的。任何对机房数据库的数据写操作都会在日志文件中产生一条写数据日志记录,在另一个机房进行重放写数据日志记录,就完成了一条数据的同步。但这种同步方式在双向同步的机制下存在循环复制的问题,即,另一个机房完成数据同步后,同样会在日志文件中产生一条写数据日志记录,从而造成无限回环问题。
目前,解决回环问题所采用的方案是在数据操作语句中增加预设标记,由此标识数据是同步而来,上述方案不仅需要解析具体的数据,而且导致数据传输量过大,影响同步效率,因此,亟需一种高效的、能够解决多机房双向同步中的循环复制问题的技术方案。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于事务标识的多机房同步方法、计算设备及存储介质。
根据本发明的一个方面,提供了一种基于事务标识的多机房同步方法,方法适用于第一机房与第二机房之间的双向同步,方法包括:
读取第一机房的日志文件中的第一写数据日志记录,判断第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致;
若是,则根据第一写数据日志记录在第二机房中执行写同步数据操作,并在第二机房的日志文件中记录写同步数据操作的第二写数据日志记录及其事务标识,其中,第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符;
若否,则忽略第一写数据日志记录的同步。
根据本发明的另一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行以下操作:
读取第一机房的日志文件中的第一写数据日志记录,判断第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致;
若是,则根据第一写数据日志记录在第二机房中执行写同步数据操作,并在第二机房的日志文件中记录写同步数据操作的第二写数据日志记录及其事务标识,其中,第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符;
若否,则忽略第一写数据日志记录的同步。
根据本发明的又一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述基于事务标识的多机房同步方法对应的操作。
根据本发明提供的方案,通过判断读取的第一机房的日志文件中的第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致,来识别事务是第一机房的本地事务或是源自于第二机房的事务,进而来确定是否执行数据同步,从而打破了循环复制,解决了多机房双向同步中的复制回环的问题,由于判断过程简单不需要解析具体数据,进一步地提升了数据同步效率;另外,由于不需要在数据操作语句中增加预设标记,从而有效控制了数据量,数据传输量比较小。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其它的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的基于事务标识的多机房同步方法的流程示意图;
图2示出了根据本发明另一个实施例的基于事务标识的多机房同步方法的流程示意图;
图3示出了根据本发明一个实施例的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的基于事务标识的多机房同步方法的流程示意图。该方法适用于第一机房与第二机房之间的双向同步,例如,涉及到机房A和机房B,机房A同步数据给机房B时,机房A称为第一机房,机房B称为第二机房;机房B同步数据给机房A时,机房B称为第一机房,机房A称为第二机房。如图1所示,该方法包括以下步骤:
步骤S101,读取第一机房的日志文件中的第一写数据日志记录。
本实施例提供的基于事务标识的多机房同步方法具体由同步组件执行,这里以同步组件将第一机房的数据同步给第二机房为例进行说明,具体地,任何对第一机房的数据写操作都会在日志文件中产生记录,即,第一写数据日志记录。在进行数据同步时,需要读取第一机房的日志文件中的第一写数据日志记录。其中,数据写操作可以是数据插入操作(insert操作)、数据更新操作(update操作)、数据删除操作(delete操作)等。
步骤S102,判断第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致,若是,则执行步骤S103;若否,则执行步骤S104。
在读取第一机房的日志文件中的第一写数据日志记录之后,并不是直接根据第一写数据日志记录在第二机房中执行写同步数据操作,而是先做如下判断:判断第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致,通过上述判断能够识别出在第一机房执行的与第一写数据日志记录关联的数据写操是针对第一机房的本地事务或是源自于第二机房的事务,即,数据是直接写入到第一机房,或是复制于第二机房,进而能够确定即将同步给第二机房的数据是否为第二机房已经拥有的数据。
具体地,在第一机房中执行的一次数据写操作被称为一次事务,例如,insert操作、update操作、delete操作、表结构变更操作等其它数据写操作都是一次事务,因此,在第一机房的日志文件中记录数据写操作的第一写数据日志记录时,会记录第一写数据日志记录的事务标识,其中,事务标识用于标识唯一标识一个事务,为了能够识别出事务产生自哪个机房,定义了事务标识包含域标识符,域标识符用于唯一标识一个机房,每个机房的域标识符都是唯一的,第一写数据日志记录的事务标识所包含的域标识符定义了事务来源,因此,可以通过域标识符来确定第一写数据日志记录对应的数据是否需要同步至第二机房,例如,判断第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致,若一致,则可以确定在第一机房执行的与第一写数据日志记录关联的写数据操是针对第一机房的本地事务,需要进行数据同步;若不一致,则可以确定在第一机房执行的与第一写数据日志记录关联的写数据操是源自于第二机房的事务,第二机房已经拥有相应数据。
步骤S103,根据第一写数据日志记录在第二机房中执行写同步数据操作,并在第二机房的日志文件中记录写同步数据操作的第二写数据日志记录及其事务标识,其中,第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符。
在判断出第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符一致的情况下,可以确定在第一机房执行的与第一写数据日志记录关联的写数据操是针对第一机房的本地事务,需要进行数据同步。
具体地,根据第一写数据日志记录在第二机房中执行写同步数据操作,通过执行写同步数据操作,实现了第二机房复制直接针对于第一机房的数据写操作对应的数据,另外,还需要在第二机房的日志文件中记录写同步数据操作的第二写数据日志记录及其事务标识,从而完成了第一机房和第二机房之间的数据同步。需要说明的是,本步骤所记录的写同步数据操作的第二写数据日志记录是由于从第一机房同步数据而产生的,为了区分出该事务不是第二机房的本地事务,第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符,从而与第二机房的本地事务区别开。
步骤S104,忽略第一写数据日志记录的同步。
在判断出第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符不一致的情况下,可以确定在第一机房执行的与第一写数据日志记录关联的写数据操是源自于第二机房的事务,即数据是从第二机房同步过来的,第二机房已经拥有相应的数据,无需再进行数据同步,因此,可以忽略第一写数据日志记录的同步。
根据本发明上述实施例提供的方法,通过判断读取的第一机房的日志文件中的第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致,来识别事务是第一机房的本地事务或是源自于第二机房的事务,进而来确定是否执行数据同步,从而打破了循环复制,解决了多机房双向同步中的复制回环的问题,由于判断过程简单不需要解析具体数据,进一步地提升了数据同步效率;另外,由于不需要在数据操作语句中增加预设标记,从而有效控制了数据量,数据传输量比较小。
图2示出了根据本发明另一个实施例的基于事务标识的多机房同步方法的流程示意图。该方法适用于第一机房与第二机房之间的双向同步,如图2所示,该方法包括以下步骤:
步骤S201,读取第一机房的日志文件中的第一写数据日志记录。
步骤S202,判断第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致,若是,则执行步骤S203;若否,则执行步骤S206。
图2所示实施例中的步骤S201-步骤S202与图1所示实施例中的步骤S101-步骤S102类似,这里不再详细赘述。其中,第一机房和第二机房为MariaDB机房,事务标识为GTID,日志文件为Binlog文件。
举例说明,第一机房的域标识符为0,第二机房的域标识符为1,当用户直接向第一机房写入数据时,第一机房的日志文件中的第一写数据日志记录的事务标识所包含的域标识符为0;当数据是由第二机房同步给第一机房的,第一机房的日志文件中的第一写数据日志记录的事务标识所包含的域标识符为1。
因此,在读取第一机房的日志文件中的第一写数据日志记录后,可以判断第一写数据日志记录的事务标识所包含的域标识符是否为0,若第一写数据日志记录的事务标识所包含的域标识符为0,说明事务产生在第一机房,需要同步数据至第二机房;若第一写数据日志记录的事务标识所包含的域标识符为1,说明事务产生在第二机房,后来被同步到第一机房,第二机房已拥有相应的数据,无需执行数据同步。
可选地,事务标识除了包含域标识符外,还可以包含其它标识符,例如,节点标识符及数据标识符,节点标识符用于标识数据产生自机房中的哪个节点,一个节点用于为一个或多个服务提供数据支持;数据标识符用于标识是当前节点下的数据版本信息,数据标识符会随着数据的变化次数而递增。本实施例中,在保证标识性的前提下,为了节省字段空间,可以采用ipv4的后2段和端口号来表征节点标识符,例如节点标识符的一种示例为:【10.100.20.218:3313=202183313】。举例说明,0-202183313-1是:第一机房,节点20.218:3313的第一条数据;1-901613313-1是:第二机房,节点90.161:3313的第一条数据。
步骤S203,调用同步组件的多个写线程执行写同步数据操作,任一写线程判断第一写数据日志记录是否为针对机房切换请求而写入的屏障数据对应的写数据日志记录;若是,则执行步骤S204;若否,则执行步骤S205。
在判断出第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符一致的情况下,可以确定在第一机房执行的与第一写数据日志记录关联的数据写操是针对第一机房的本地事务,需要进行数据同步。
具体地,在步骤S201中可能读取了多条第一机房的日志文件中的第一写数据日志记录,为了提高同步效率,可以调用同步组件的多个写线程执行写同步数据操作。
本实施例采用了双机房机制,在机房提供服务过程中很可能出现机房切换需求,例如,由第一机房切换至第二机房,为了保证机房之间数据完全一致,针对机房执行了只读操作,即Readonly操作,该操作禁止向机房写入数据,为了便于同步组件和第二机房获知已完成对第一机房中数据的同步,向第一机房写入屏障数据,屏障数据为第一机房的最后一条数据,通常情况下,只有管理端才能够写入屏障数据。
任一写线程执行写同步数据操作时,需要判断第一写数据日志记录是否为针对机房切换请求而写入的屏障数据对应的写数据日志记录,例如,判断第一写数据日志记录是否包含管理端标识,若是,则确定第一写数据日志记录为针对机房切换请求而写入的屏障数据对应的写数据日志记录;若否,则确定第一写数据日志记录不是针对机房切换请求而写入的屏障数据对应的写数据日志记录。
步骤S204,暂停将屏障数据写入至第二机房对应的第二事务数据表中,向其它写线程发送数据同步状态查询请求;在接收到其它写线程响应数据同步状态查询请求而发送的同步完成消息后,将屏障数据写入至第二机房对应的第二事务数据表中,并在第二机房的日志文件中记录写同步数据操作的第二写数据日志记录及其事务标识,其中,第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符。
在判断出第一写数据日志记录为针对机房切换请求而写入的屏障数据对应的写数据日志记录的情况下,表明该写线程已经完成除屏障数据外的其它数据的同步,若在其它写线程未完成数据同步的情况下,就将屏障数据写入至第二机房,会被误以为全部数据已完成同步,因此,该写线程会暂停执行将屏障数据写入至第二机房对应的第二事务数据表的操作,并向其它写线程发送数据同步状态查询请求,以询问其它写线程是否完成数据同步,其它写线程在完成数据同步后,会响应数据同步状态查询请求,返回同步完成消息,以通知接收到屏障数据同步任务的写线程,其完成了数据同步,当接收到的同步完成消息与其它写线程数量相同时,可以确定其它写线程全部同步完成,从而将屏障数据写入至第二机房对应的第二事务数据表中,并在第二机房的日志文件中记录写同步数据操作的第二写数据日志记录及其事务标识,其中,第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符。写同步数据操作的第二写数据日志记录及其事务标识的记录方法与图1所示实施例中步骤S103中介绍的记录方法类似,这里不再赘述。
步骤S205,根据第一写数据日志记录的表标识将第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中,并在第二机房的日志文件中记录写同步数据操作的第二写数据日志记录及其事务标识,其中,第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符。
具体地,需要同步到第二机房的第一写数据日志记录可能会很多,数据可能需要写入到第二机房不同的第二事务数据表中,表和表之间一般没有依赖关系,每个第二事务数据表对应有唯一的表标识,表标识用于表示数据所应写入的第二事务数据表,第一写数据日志记录包括:时间戳信息、数据操作类型、表标识、操作字段、字段信息等,因此,可以根据第一写数据日志记录的表标识将第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。写同步数据操作的第二写数据日志记录及其事务标识的记录方法与图1所示实施例中步骤S103中介绍的记录方法类似,这里不再赘述。
继续上面举例进行说明第二写数据日志记录的事务标识的记录方法:第一机房的第一写数据日志记录的GTID为0-202183313-1,数据被同步给第二机房的节点,该节点的节点标识符为901613313,该数据是第二机房的第1条数据,因此,第二写数据日志记录的GTID为:0-901613313-1,说明数据产生在第一机房,后来被同步组件同步到第二机房。
步骤S206,忽略第一写数据日志记录的同步。
在判断出第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符不一致的情况下,可以确定在第一机房执行的与第一写数据日志记录关联的写数据操是源自于第二机房的事务,即数据是从第二机房同步过来的,第二机房已经拥有相应的数据,无需再进行数据同步,因此,可以忽略第一写数据日志记录的同步。
在本发明一种可选实施方式中,当数据长时间未同步时,同步组件与机房之间的连接会被断开,而且,当同步组件出现故障时,数据同步也会中断,为了实现数据及时同步,可以通过如下方法来来保证连接不会被断开并及时检测出同步组件是否出现故障:
每隔预设时间段,向第一机房发送写时间数据请求,以供第一机房执行对应的写时间数据操作,在第一机房的第一健康检测数据表中写入健康检测时间戳;将写时间数据操作同步给第二机房,以供第二机房在第二健康检测数据表中更新健康检测时间戳;定时监测第二机房的第二健康检测数据表,若第二健康检测数据表记录的健康检测时间戳与当前时间之间的时间间隔大于预设时间阈值,则确定同步组件出现故障。
具体地,同步组件除了能够同步数据外,还具有写时间数据的功能,因此,同步组件可以每隔预设时间段向第一机房发送写时间数据请求,为了能够与用户写入的数据区分开,第一机房接收到写时间数据请求后,是在第一机房的第一健康检测数据表中写入健康检测时间戳,健康检测时间戳是时间信息,用于检测同步组件的健康状况;为了能够实现对同步组件的健康检测,需要将写时间数据操作同步给第二机房,第二机房执行时间数据的同步操作,在第二健康检测数据表中更新健康检测时间戳,若同步组件是正常的,同步组件会对第二健康检测数据表中的健康检测时间戳及时更新,若同步组件出现故障,就会出现第二健康检测数据表中的健康检测时间戳更新不及时的问题,因此,可以定时监测第二机房的第二健康检测数据表,若第二健康检测数据表记录的健康检测时间戳与当前时间之间的时间间隔大于预设时间阈值,则确定同步组件出现故障;若第二健康检测数据表记录的健康检测时间戳与当前时间之间的时间间隔小于或等于预设时间阈值,则确定同步组件正常,由此实现了及时发现同步组件出现故障,从而能够及时对同步组件进行修复。
为了避免第二健康检测数据表中的健康检测时间戳回环同步给第一机房,可以按照所介绍的第二写数据日志记录的事务标识的记录方法,来记录写时间数据操作的日志记录及其事务标识,例如,在第二机房的日志文件中记录写时间数据操作的第二写数据日志记录及其事务标识,其中,第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符,这里不再详细赘述。
根据本发明上述实施例提供的方法,通过判断读取的第一机房的日志文件中的第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致,来识别事务是第一机房的本地事务或是源自于第二机房的事务,进而来确定是否执行数据同步,从而打破了循环复制,解决了多机房双向同步中的复制回环的问题,由于判断过程简单不需要解析具体数据,进一步地提升了数据同步效率;另外,由于不需要在数据操作语句中增加预设标记,从而有效控制了数据量,数据传输量比较小;当发生机房切换时,通过屏障数据来保证机房间数据一致性。
本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于事务标识的多机房同步方法。
可执行指令具体可以用于使得处理器执行以下操作:
读取第一机房的日志文件中的第一写数据日志记录,判断第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致;
若是,则根据第一写数据日志记录在第二机房中执行写同步数据操作,并在第二机房的日志文件中记录写同步数据操作的第二写数据日志记录及其事务标识,其中,第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符;
若否,则忽略第一写数据日志记录的同步。
在一种可选的实施方式中,可执行指令还使处理器执行以下操作:
每隔预设时间段,向第一机房发送写时间数据请求,以供第一机房执行对应的写时间数据操作,在第一机房的第一健康检测数据表中写入健康检测时间戳;
将写时间数据操作同步给第二机房,以供第二机房在第二健康检测数据表中更新健康检测时间戳;
定时监测第二机房的第二健康检测数据表,若第二健康检测数据表记录的健康检测时间戳与当前时间之间的时间间隔大于预设时间阈值,则确定同步组件出现故障。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作:
调用同步组件的多个写线程执行写同步数据操作,根据第一写数据日志记录的表标识将第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
在一种可选的实施方式中,可执行指令还使处理器执行以下操作:
任一写线程判断第一写数据日志记录是否为针对机房切换请求而写入的屏障数据对应的写数据日志记录;
若是,则暂停将屏障数据写入至第二机房对应的第二事务数据表中,向其它写线程发送数据同步状态查询请求;在接收到其它写线程响应数据同步状态查询请求而发送的同步完成消息后,将屏障数据写入至第二机房对应的第二事务数据表中;
若否,则根据第一写数据日志记录的表标识将第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
在一种可选的实施方式中,第一机房和第二机房为MariaDB机房,事务标识为GTID。
图3示出了根据本发明一个实施例的计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图3所示,该计算设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。
其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。
通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器302,用于执行程序310,具体可以执行上述基于事务标识的多机房同步方法实施例中的相关步骤。
具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。
处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序310具体可以用于使得处理器302执行以下操作:
读取第一机房的日志文件中的第一写数据日志记录,判断第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致;
若是,则根据第一写数据日志记录在第二机房中执行写同步数据操作,并在第二机房的日志文件中记录写同步数据操作的第二写数据日志记录及其事务标识,其中,第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符;
若否,则忽略第一写数据日志记录的同步。
在一种可选的实施方式中,程序310还使处理器302执行以下操作:
每隔预设时间段,向第一机房发送写时间数据请求,以供第一机房执行对应的写时间数据操作,在第一机房的第一健康检测数据表中写入健康检测时间戳;
将写时间数据操作同步给第二机房,以供第二机房在第二健康检测数据表中更新健康检测时间戳;
定时监测第二机房的第二健康检测数据表,若第二健康检测数据表记录的健康检测时间戳与当前时间之间的时间间隔大于预设时间阈值,则确定同步组件出现故障。
在一种可选的实施方式中,程序310进一步使处理器302执行以下操作:
调用同步组件的多个写线程执行写同步数据操作,根据第一写数据日志记录的表标识将第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
在一种可选的实施方式中,程序310还使处理器302执行以下操作:
任一写线程判断第一写数据日志记录是否为针对机房切换请求而写入的屏障数据对应的写数据日志记录;
若是,则暂停将屏障数据写入至第二机房对应的第二事务数据表中,向其它写线程发送数据同步状态查询请求;在接收到其它写线程响应数据同步状态查询请求而发送的同步完成消息后,将屏障数据写入至第二机房对应的第二事务数据表中;
若否,则根据第一写数据日志记录的表标识将第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
在一种可选的实施方式中,第一机房和第二机房为MariaDB机房,事务标识为GTID。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其它形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
本发明公开了:A1.一种基于事务标识的多机房同步方法,所述方法适用于第一机房与第二机房之间的双向同步,所述方法包括:
读取第一机房的日志文件中的第一写数据日志记录,判断所述第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致;
若是,则根据所述第一写数据日志记录在第二机房中执行写同步数据操作,并在所述第二机房的日志文件中记录所述写同步数据操作的第二写数据日志记录及其事务标识,其中,所述第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符;
若否,则忽略所述第一写数据日志记录的同步。
A2.根据A1所述的方法,其中,所述方法还包括:
每隔预设时间段,向第一机房发送写时间数据请求,以供第一机房执行对应的写时间数据操作,在第一机房的第一健康检测数据表中写入健康检测时间戳;
将所述写时间数据操作同步给第二机房,以供第二机房在第二健康检测数据表中更新健康检测时间戳;
定时监测第二机房的第二健康检测数据表,若第二健康检测数据表记录的健康检测时间戳与当前时间之间的时间间隔大于预设时间阈值,则确定同步组件出现故障。
A3.根据A1或A2所述的方法,其中,所述根据所述第一写数据日志记录在第二机房中执行写同步数据操作进一步包括:
调用同步组件的多个写线程执行写同步数据操作,根据所述第一写数据日志记录的表标识将所述第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
A4.根据A3所述的方法,其中,在根据所述第一写数据日志记录的表标识将所述第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中之前,所述方法还包括:任一写线程判断第一写数据日志记录是否为针对机房切换请求而写入的屏障数据对应的写数据日志记录;
若是,则暂停将屏障数据写入至第二机房对应的第二事务数据表中,向其它写线程发送数据同步状态查询请求;在接收到其它写线程响应所述数据同步状态查询请求而发送的同步完成消息后,将屏障数据写入至第二机房对应的第二事务数据表中;
若否,则根据所述第一写数据日志记录的表标识将所述第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
A5.根据A1或A2所述的方法,其中,所述第一机房和所述第二机房为MariaDB机房,所述事务标识为GTID。
B6.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
读取第一机房的日志文件中的第一写数据日志记录,判断所述第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致;
若是,则根据所述第一写数据日志记录在第二机房中执行写同步数据操作,并在所述第二机房的日志文件中记录所述写同步数据操作的第二写数据日志记录及其事务标识,其中,所述第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符;
若否,则忽略所述第一写数据日志记录的同步。
B7.根据B6所述的计算设备,其中,所述可执行指令还使所述处理器执行以下操作:
每隔预设时间段,向第一机房发送写时间数据请求,以供第一机房执行对应的写时间数据操作,在第一机房的第一健康检测数据表中写入健康检测时间戳;
将所述写时间数据操作同步给第二机房,以供第二机房在第二健康检测数据表中更新健康检测时间戳;
定时监测第二机房的第二健康检测数据表,若第二健康检测数据表记录的健康检测时间戳与当前时间之间的时间间隔大于预设时间阈值,则确定同步组件出现故障。
B8.根据B6或B7所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
调用同步组件的多个写线程执行写同步数据操作,根据所述第一写数据日志记录的表标识将所述第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
B9.根据B8所述的计算设备,其中,所述可执行指令还使所述处理器执行以下操作:
任一写线程判断第一写数据日志记录是否为针对机房切换请求而写入的屏障数据对应的写数据日志记录;
若是,则暂停将屏障数据写入至第二机房对应的第二事务数据表中,向其它写线程发送数据同步状态查询请求;在接收到其它写线程响应所述数据同步状态查询请求而发送的同步完成消息后,将屏障数据写入至第二机房对应的第二事务数据表中;
若否,则根据所述第一写数据日志记录的表标识将所述第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
B10.根据B6或B7所述的计算设备,其中,所述第一机房和所述第二机房为MariaDB机房,所述事务标识为GTID。
C11.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如A1-A5中任一项所述的基于事务标识的多机房同步方法对应的操作。

Claims (10)

1.一种基于事务标识的多机房同步方法,所述方法适用于第一机房与第二机房之间的双向同步,所述方法包括:
读取第一机房的日志文件中的第一写数据日志记录,判断所述第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致;
若是,则根据所述第一写数据日志记录在第二机房中执行写同步数据操作,并在所述第二机房的日志文件中记录所述写同步数据操作的第二写数据日志记录及其事务标识,其中,所述第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符;
若否,则忽略所述第一写数据日志记录的同步。
2.根据权利要求1所述的方法,其中,所述方法还包括:
每隔预设时间段,向第一机房发送写时间数据请求,以供第一机房执行对应的写时间数据操作,在第一机房的第一健康检测数据表中写入健康检测时间戳;
将所述写时间数据操作同步给第二机房,以供第二机房在第二健康检测数据表中更新健康检测时间戳;
定时监测第二机房的第二健康检测数据表,若第二健康检测数据表记录的健康检测时间戳与当前时间之间的时间间隔大于预设时间阈值,则确定同步组件出现故障。
3.根据权利要求1或2所述的方法,其中,所述根据所述第一写数据日志记录在第二机房中执行写同步数据操作进一步包括:
调用同步组件的多个写线程执行写同步数据操作,根据所述第一写数据日志记录的表标识将所述第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
4.根据权利要求3所述的方法,其中,在根据所述第一写数据日志记录的表标识将所述第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中之前,所述方法还包括:任一写线程判断第一写数据日志记录是否为针对机房切换请求而写入的屏障数据对应的写数据日志记录;
若是,则暂停将屏障数据写入至第二机房对应的第二事务数据表中,向其它写线程发送数据同步状态查询请求;在接收到其它写线程响应所述数据同步状态查询请求而发送的同步完成消息后,将屏障数据写入至第二机房对应的第二事务数据表中;
若否,则根据所述第一写数据日志记录的表标识将所述第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
5.根据权利要求1或2所述的方法,其中,所述第一机房和所述第二机房为MariaDB机房,所述事务标识为GTID。
6.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
读取第一机房的日志文件中的第一写数据日志记录,判断所述第一写数据日志记录的事务标识所包含的域标识符与第一机房对应的域标识符是否一致;
若是,则根据所述第一写数据日志记录在第二机房中执行写同步数据操作,并在所述第二机房的日志文件中记录所述写同步数据操作的第二写数据日志记录及其事务标识,其中,所述第二写数据日志记录的事务标识所包含的域标识符被设定为第一机房对应的域标识符;
若否,则忽略所述第一写数据日志记录的同步。
7.根据权利要求6所述的计算设备,其中,所述可执行指令还使所述处理器执行以下操作:
每隔预设时间段,向第一机房发送写时间数据请求,以供第一机房执行对应的写时间数据操作,在第一机房的第一健康检测数据表中写入健康检测时间戳;
将所述写时间数据操作同步给第二机房,以供第二机房在第二健康检测数据表中更新健康检测时间戳;
定时监测第二机房的第二健康检测数据表,若第二健康检测数据表记录的健康检测时间戳与当前时间之间的时间间隔大于预设时间阈值,则确定同步组件出现故障。
8.根据权利要求6或7所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
调用同步组件的多个写线程执行写同步数据操作,根据所述第一写数据日志记录的表标识将所述第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
9.根据权利要求8所述的计算设备,其中,所述可执行指令还使所述处理器执行以下操作:
任一写线程判断第一写数据日志记录是否为针对机房切换请求而写入的屏障数据对应的写数据日志记录;
若是,则暂停将屏障数据写入至第二机房对应的第二事务数据表中,向其它写线程发送数据同步状态查询请求;在接收到其它写线程响应所述数据同步状态查询请求而发送的同步完成消息后,将屏障数据写入至第二机房对应的第二事务数据表中;
若否,则根据所述第一写数据日志记录的表标识将所述第一写数据日志记录对应的数据并行写入至第二机房对应的第二事务数据表中。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-5中任一项所述的基于事务标识的多机房同步方法对应的操作。
CN202110176523.1A 2021-02-09 2021-02-09 基于事务标识的多机房同步方法、计算设备及存储介质 Active CN112905696B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110176523.1A CN112905696B (zh) 2021-02-09 2021-02-09 基于事务标识的多机房同步方法、计算设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110176523.1A CN112905696B (zh) 2021-02-09 2021-02-09 基于事务标识的多机房同步方法、计算设备及存储介质

Publications (2)

Publication Number Publication Date
CN112905696A true CN112905696A (zh) 2021-06-04
CN112905696B CN112905696B (zh) 2021-11-19

Family

ID=76124429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110176523.1A Active CN112905696B (zh) 2021-02-09 2021-02-09 基于事务标识的多机房同步方法、计算设备及存储介质

Country Status (1)

Country Link
CN (1) CN112905696B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116010172A (zh) * 2023-02-28 2023-04-25 天翼云科技有限公司 一种数据同步方法、数据库、数据同步装置和产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104376017A (zh) * 2013-08-15 2015-02-25 阿里巴巴集团控股有限公司 在数据库之间进行数据同步的方法及系统
US20190042638A1 (en) * 2017-08-01 2019-02-07 Salesforce.Com, Inc. High availability database through distributed store
CN110659256A (zh) * 2019-09-30 2020-01-07 掌阅科技股份有限公司 多机房同步方法、计算设备及计算机存储介质
CN112035418A (zh) * 2020-08-28 2020-12-04 掌阅科技股份有限公司 多机房同步方法、计算设备及计算机存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104376017A (zh) * 2013-08-15 2015-02-25 阿里巴巴集团控股有限公司 在数据库之间进行数据同步的方法及系统
US20190042638A1 (en) * 2017-08-01 2019-02-07 Salesforce.Com, Inc. High availability database through distributed store
CN110659256A (zh) * 2019-09-30 2020-01-07 掌阅科技股份有限公司 多机房同步方法、计算设备及计算机存储介质
CN112035418A (zh) * 2020-08-28 2020-12-04 掌阅科技股份有限公司 多机房同步方法、计算设备及计算机存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116010172A (zh) * 2023-02-28 2023-04-25 天翼云科技有限公司 一种数据同步方法、数据库、数据同步装置和产品

Also Published As

Publication number Publication date
CN112905696B (zh) 2021-11-19

Similar Documents

Publication Publication Date Title
CN110659256B (zh) 多机房同步方法、计算设备及计算机存储介质
US8909662B2 (en) Message based mobile object with native PIM integration
CN104778102A (zh) 一种主备切换方法及系统
CN104202375A (zh) 同步数据的方法及系统
CN111049928B (zh) 数据同步方法、系统、电子设备及计算机可读存储介质
CN110673941B (zh) 多机房中微服务的迁移方法、电子设备及存储介质
JP5686034B2 (ja) クラスタシステム、同期制御方法、サーバ装置および同期制御プログラム
CN108628717A (zh) 一种数据库系统及监控方法
CN105824846B (zh) 数据迁移方法及装置
CN108319617B (zh) 确定数据库主从差异的方法、装置及切换控制方法、装置
WO2017113694A1 (zh) 文件同步方法、装置及系统
CN110888889A (zh) 一种数据信息更新方法、装置及设备
CN108140035B (zh) 分布式系统的数据库复制方法及装置
CN113704790A (zh) 一种异常日志信息汇总方法及计算机设备
CN112052230A (zh) 多机房数据同步方法、计算设备及存储介质
CN112905696B (zh) 基于事务标识的多机房同步方法、计算设备及存储介质
CN107864209B (zh) 数据写入的方法、装置及服务器
CN114218193A (zh) 数据迁移方法、装置、计算机设备和可读存储介质
CN112035418A (zh) 多机房同步方法、计算设备及计算机存储介质
CN109471901B (zh) 一种数据同步方法及装置
CN112486718A (zh) 数据库故障自动切换方法、装置和计算机存储介质
WO2018010603A1 (zh) 基于视频云存储系统的存储模式升级方法、装置和系统
CN109918439B (zh) 数据同步方法及其应用的环路检测方法和相关装置
CN117370454A (zh) 数据处理方法
CN112000850A (zh) 进行数据处理的方法、装置、系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant